手握万卡的新黑马大模型界拼多多雷军挖走95后天才 (万卡怎么玩)

科技资讯 2025-01-01 19:58:56 浏览次

国产开源大Claude-3.5-Sonnet。在数学、代码和推理能力方面，DeepSeek-V3 在 math500、AIME2024 及 Codeforces 等多个主流基准测试中，不仅碾压阿里和 Meta 的最新开源模型，同时超越 GPT-4o 和 Claude-3.5-Sonnet。更令人惊讶的是，DeepSeek-V3 的训练成本竟然只用了不到 600 万美元，相比之下，OpenAI 的 GPT-4o 的训练成本高达 1.1 亿美元，是 DeepSeek-V3 的 18 倍之多。

AI 大牛点赞，推动 AGI 提前到来

DeepSeek-V3 的出色表现，让多位 AI 大牛纷纷点赞。OpenAI 创始人成员 Andrej Karpathy 表示，会仔细阅读 DeepSeek-V3 的技术本文，并称其为“非常棒的技术本文”。阿里前副总裁贾扬清、MetaAI 科学家田渊栋、英伟达高级研究科学家 Jim Fan 等也对这款模型表示认可。有网友认为，DeepSeek-V3 是全球最佳开源大模型，甚至认为这将推动 AGI（通用人工智能）比预期更早且能以更低成本实现。

如何超越闭源模型？

此前，业内不少观点认为，开源模型无法追赶闭源模型。但开源的 DeepSeek-V3 则证明，开源和闭源模型的差距可以缩小，并完全有希望超越闭源模型。 DeepSeek-V3 的成功，与其在架构、算法、数据以及训练策略等方面的创新密不可分。它采用了一种新的 MoE 架构，使得模型可以更高效地利用计算资源。同时，它还引入了一些新的算法和训练策略，提高了模型的性能。