国产开源大Claude-3.5-Sonnet。
在数学、代码和推理能力方面,DeepSeek-V3 在 math500、AIME2024 及 Codeforces 等多个主流基准测试中,不仅碾压阿里和 Meta 的最新开源模型,同时超越 GPT-4o 和 Claude-3.5-Sonnet。
更令人惊讶的是,DeepSeek-V3 的训练成本竟然只用了不到 600 万美元,相比之下,OpenAI 的 GPT-4o 的训练成本高达 1.1 亿美元,是 DeepSeek-V3 的 18 倍之多。
AI 大牛点赞,推动 AGI 提前到来
DeepSeek-V3 的出色表现,让多位 AI 大牛纷纷点赞。OpenAI 创始人成员 Andrej Karpathy 表示,会仔细阅读 DeepSeek-V3 的技术本文,并称其为“非常棒的技术本文”。阿里前副总裁贾扬清、MetaAI 科学家田渊栋、英伟达高级研究科学家 Jim Fan 等也对这款模型表示认可。
有网友认为,DeepSeek-V3 是全球最佳开源大模型,甚至认为这将推动 AGI(通用人工智能)比预期更早且能以更低成本实现。
如何超越闭源模型?
此前,业内不少观点认为,开源模型无法追赶闭源模型。但开源的 DeepSeek-V3 则证明,开源和闭源模型的差距可以缩小,并完全有希望超越闭源模型。
DeepSeek-V3 的成功,与其在架构、算法、数据以及训练策略等方面的创新密不可分。它采用了一种新的 MoE 架构,使得模型可以更高效地利用计算资源。同时,它还引入了一些新的算法和训练策略,提高了模型的性能。
展望未来
DeepSeek-V3 的出现,标志着国产 AI 技术的又一重大突破。它证明,中国 AI
企业已经具备了与
国际巨头竞争的
实力。
未来,DeepSeek-V3 将开源其代码和模型,以推动 AI 技术的进一步发展。随着更多研究人员和工程师的加入,这款模型有望取得更大的突破,为人类社会创造更多的
价值。
发表评论