首页 / ChatGPT 旨在成为更优秀的科研助理。

ChatGPT 旨在成为更优秀的科研助理。

2025/2/4 03:03:14
OpenAI 推出 ChatGPT 深度研究工具,帮助用户进行多步骤研究,收集信息并提供详细的引文摘要。该工具可接受文本、图像和文档作为输入,花费 5 到 30 分钟筛选信息并生成结果。尽管 OpenAI承认该功能仍处于初期阶段,可能会出现“幻觉”等问题,但它声称其深度研究功能利用了更先进的推理模型,在基准测试中表现优于其他模型,例如 GPT-4o。 ChatGPT 深度研究工具目前仅限于 ChatGPT Pro 级别用户,每月费用高达 200 美元,而谷歌 Gemini 的类似功能每月费用为 20 美元。
ChatGPT 旨在成为更优秀的科研助理。

随着 Operator 的发布,尽管目前状态还算不上理想,ChatGPT 已不仅仅是一个聊天机器人。OpenAI 希望继续沿此路线发展,最新的加入是能够进行深度研究的工具。这并不是一个全新的概念,OpenAI 有几个理由相信它会更好。

ChatGPT刚刚添加了一个名为“深度研究”的新工具。这个新功能目前仅限于聊天机器人最昂贵的 Pro 级别,它使 ChatGPT 可以超越简单的文本生成,并充当自主的研究助理,能够规划和执行多步骤研究流程来收集信息并提供详细的引文摘要。

用户可以使用文本、图像甚至上传 PDF 或电子表格等文档提出问题。然后进行深度研究,花费 5 到 30 分钟时间仔细筛选信息,必要时回溯,并对实时数据做出反应以形成其答复。结果显示在聊天窗口中,包括其过程摘要和侧边栏显示的引用。OpenAI 声称该工具的未来迭代版本还将能够在其回复中嵌入图像和图表——目前它只使用文本。

这不是一个完全新概念。例如,谷歌的 Gemini 已经有一个名为“深度研究”的功能,其工作方式相对类似。它会搜索多个来源,并花几分钟时间编译和准备一份基于这些来源信息详细的报告/文章。我已经试用过几次,发现它运作良好且相当完善——它进行多步研究过程,其中包括查看用户评论、引用多个网站(有时甚至 How-To Geek)、观看 YouTube 视频,并将找到的数据进行比较并综合到一份单一报告中。此外,它可与谷歌的 Gemini 高级订阅一起使用,每月费用为 20 美元,而 ChatGPT Pro 的每月费用则高达 200 美元。

OpenAI 承认在推出类似功能方面落后于其他公司,并提供了一些理由,认为它比其他聊天机器人更值得使用。OpenAI 表示,其深度研究功能并非仅仅是网站聚合器,而是旨在达到研究分析师水平的工具。该公司发布的一段演示视频展示了该工具分析过去三年零售行业变化的能力,生成的响应包括要点和表格。这款深度研究功能使用了 OpenAI 的推理模型,而 Gemini 使用的是普通 Gemini 1.5 Pro(它可能很快会切换到 Gemini 2.0 Pro)。

OpenAI 也强调了该深度研究功能在名为“人类最后的考试”的基准测试中的表现,当配备浏览和 Python 工具时,它在专家级问题上的准确率达到了 26.6%。这远远超过了其他模型,包括 GPT-4o,后者在同一测试中仅得 3.3%。我们需要看看 ChatGPT 编制的报告与 Gemini 编制的报告之间的准确率差异有多大。即使如此,我们认为价值 10 倍的功能不会产生 10 倍更好的报告,至少对于大多数人们可能使用它的事情来说是这样,但我们可能会被惊叹。

OpenAI 也提到,至少在这个功能的初始版本中,可能会出现一些问题。这些问题包括潜在的“幻觉”(捏造事实)、难以区分权威信息和谣言以及评估自身回答确定性的挑战。这是人工智能面临的一般性问题,没有人能够完全克服它,但随着时间的推移,这种情况很可能会得到改善。尽管如此,如果你打算使用这个功能,最好还是仔细核实其输出是否准确。