ChatGPT 旨在成为更优秀的科研助理。

随着 Operator 的发布,尽管目前状态还算不上理想,ChatGPT 已不仅仅是一个聊天机器人。OpenAI 希望继续沿此路线发展,最新的加入是能够进行深度研究的工具。这并不是一个全新的概念,OpenAI 有几个理由相信它会更好。
ChatGPT刚刚添加了一个名为“深度研究”的新工具。这个新功能目前仅限于聊天机器人最昂贵的 Pro 级别,它使 ChatGPT 可以超越简单的文本生成,并充当自主的研究助理,能够规划和执行多步骤研究流程来收集信息并提供详细的引文摘要。
用户可以使用文本、图像甚至上传 PDF 或电子表格等文档提出问题。然后进行深度研究,花费 5 到 30 分钟时间仔细筛选信息,必要时回溯,并对实时数据做出反应以形成其答复。结果显示在聊天窗口中,包括其过程摘要和侧边栏显示的引用。OpenAI 声称该工具的未来迭代版本还将能够在其回复中嵌入图像和图表——目前它只使用文本。
这不是一个完全新概念。例如,谷歌的 Gemini 已经有一个名为“深度研究”的功能,其工作方式相对类似。它会搜索多个来源,并花几分钟时间编译和准备一份基于这些来源信息详细的报告/文章。我已经试用过几次,发现它运作良好且相当完善——它进行多步研究过程,其中包括查看用户评论、引用多个网站(有时甚至 How-To Geek)、观看 YouTube 视频,并将找到的数据进行比较并综合到一份单一报告中。此外,它可与谷歌的 Gemini 高级订阅一起使用,每月费用为 20 美元,而 ChatGPT Pro 的每月费用则高达 200 美元。
OpenAI 承认在推出类似功能方面落后于其他公司,并提供了一些理由,认为它比其他聊天机器人更值得使用。OpenAI 表示,其深度研究功能并非仅仅是网站聚合器,而是旨在达到研究分析师水平的工具。该公司发布的一段演示视频展示了该工具分析过去三年零售行业变化的能力,生成的响应包括要点和表格。这款深度研究功能使用了 OpenAI 的推理模型,而 Gemini 使用的是普通 Gemini 1.5 Pro(它可能很快会切换到 Gemini 2.0 Pro)。
OpenAI 也强调了该深度研究功能在名为“人类最后的考试”的基准测试中的表现,当配备浏览和 Python 工具时,它在专家级问题上的准确率达到了 26.6%。这远远超过了其他模型,包括 GPT-4o,后者在同一测试中仅得 3.3%。我们需要看看 ChatGPT 编制的报告与 Gemini 编制的报告之间的准确率差异有多大。即使如此,我们认为价值 10 倍的功能不会产生 10 倍更好的报告,至少对于大多数人们可能使用它的事情来说是这样,但我们可能会被惊叹。
OpenAI 也提到,至少在这个功能的初始版本中,可能会出现一些问题。这些问题包括潜在的“幻觉”(捏造事实)、难以区分权威信息和谣言以及评估自身回答确定性的挑战。这是人工智能面临的一般性问题,没有人能够完全克服它,但随着时间的推移,这种情况很可能会得到改善。尽管如此,如果你打算使用这个功能,最好还是仔细核实其输出是否准确。
分类
最新文章
- <p><strong>Satechi SM3 机械键盘测评:安静高效的生产力利器</strong></p>
- This old mobile phone has become a fire hazard right before my eyes.
- <p>苹果日历的邀请函:与苹果待办事项有10种不同之处</p>
- <p><strong>苹果的工作:</strong> 2025 年苹果会发布一个与谷歌 Workspace 竞争的产品吗?</p>
- <p>苹果不太可能会举办特别活动来宣布 iPhone SE 4。</p>
- Today's New York Times Crossword Puzzle Clues and Answers (#608)
- Ubuntu 20.04 LTS 的支持即将到期。
- <p>读书清单太长了吗?让 AI 为您朗读。</p>
- This is my holy grail Blu-ray player.
- <p>Apple will release new products next week. Here's what's coming.</p>