ChatGPT有了新对手:Meet DeepSeek

中国初创公司DeepSeek以其新的人工智能聊天机器人震撼了硅谷最大的玩家,该聊天机器人的性能与OpenAI的ChatGPT相当,但开发成本要低得多。
截至本文撰写时,DeepSeek 已经在苹果应用商店上超越了 ChatGPT,成为美国、英国、中国以及多个其他国家和地区最受欢迎的免费应用程序。它像一个典型的聊天机器人一样运作:你输入一个问题,其开源模型会生成答案。底层的 DeepSeek-V3 模型拥有 6710 亿个参数,使应用能够在解决问题之前“思考”。
不同于OpenAI的模型,该模型只能在其自己的服务器上运行,DeepSeek可以在更高性能的本地计算机和许多GPU加速的服务器上运行。该公司声称其模型在特定基准测试中与OpenAI的o1模型相当。与其他许多其他AI聊天机器人不同,DeepSeek还会透明地显示其推理过程以及它是如何得出答案的。然而,作为一款中国应用,DeepSeek会屏蔽某些话题,如天安门广场。
该应用于1月20日发布,并在Google的Play商店中可用。DeepSeek因其能够匹配或超越现有AI模型而迅速走红。其周一发布的研究论文揭示了DeepSeek-V3训练的经济效率。
克里斯托弗·齐布雷格 / 如何科技虽然其声称尚未得到验证,DeepSeek显然仅使用了2048块专门的Nvidia H800芯片来训练R1,而OpenAI的领先模型则使用了超过16,000块Nvidia芯片进行训练。DeepSeek表示,大幅减少用于AI训练的最新GPU数量,使其能够以560万美元的价格训练出R1。相比之下,OpenAI在其同类规模的GPT-4模型上花费了超过1亿美元。然而,该公司尚未将DeepSeek的能源消耗与竞争对手进行量化比较。
R1本身基于DeepSeek的V3大型语言模型(LLM),该公司声称其与OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet相匹配。在美政府对用于人工智能训练的先进Nvidia芯片实施贸易制裁的情况下,DeepSeek的这一成就尤为引人注目。随着像Nvidia、OpenAI、Meta和微软这样的最大人工智能玩家在人工智能数据中心上花费数十亿美元,本周我们将看到许多关于美国在人工智能领域领先地位的疑问。
我们很期待看到DeepSeek的突破如何影响特朗普政府的“星门”项目——该项目得到了OpenAI、软银和Oracle的支持,旨在在未来四年内投资500亿美元建设新的AI基础设施和数据中心供OpenAI使用。随着OpenAI从非营利组织转变为营利性组织,事情将会特别有趣,因为DeepSeek已经开源了其AI模型。
Meta 也开源了一些其人工智能技术的方面,例如 Lama LLM。然而,DeepSeek 是一个备受关注的新面孔,而开发者可以自由地在 DeepSeek 的技术支持上进行构建,这可能会让 OpenAI 竞争起来。
分类
最新文章
- <p><strong>Satechi SM3 机械键盘测评:安静高效的生产力利器</strong></p>
- This old mobile phone has become a fire hazard right before my eyes.
- <p>苹果日历的邀请函:与苹果待办事项有10种不同之处</p>
- <p><strong>苹果的工作:</strong> 2025 年苹果会发布一个与谷歌 Workspace 竞争的产品吗?</p>
- <p>苹果不太可能会举办特别活动来宣布 iPhone SE 4。</p>
- Today's New York Times Crossword Puzzle Clues and Answers (#608)
- Ubuntu 20.04 LTS 的支持即将到期。
- <p>读书清单太长了吗?让 AI 为您朗读。</p>
- This is my holy grail Blu-ray player.
- <p>Apple will release new products next week. Here's what's coming.</p>