12月26日,Deepseek在AI圈内一鸣惊人,宣布全新系列模型DeepSeek-V3首个版本上线并开源。官方称,DeepSeek-V3在多项评测中超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,在性能上媲美世界顶尖闭源模型GPT-4o和Claude-3.5-Sonnet。
深度学习:低成本高性能
令人瞩目的是,DeepSeek-V3的总训练成本仅为557.6万美元,而GPT-4o等模型的训练成本约为1亿美元。这不仅展示了DeepSeek的强大,也为人工智能的发展带来了新的AI界拼多多",得益于其低廉的推理成本。今年5月发布的DeepSeekV2开源模型,推理成本约为每百万token 1块钱,远低于其他模型。这种低成本源于DeepSeek提出的MLA架构,大幅降低了显存占用率。
天才少女罗福莉加盟小米
12月27日,有媒体报道95后天才少女罗福莉将加入小米。而这位少女正是来自Deepseek。随后,雷军千万年薪挖角天才少女的报道也引发热议。事实上,早在12月20日就有类似报道,但并未引起关注。
DeepSeek-V3的出现和罗福莉的加盟,让这家公司成为近期AI圈最具话题性的焦点。随着人工智能的发展,DeepSeek未来可期。
发表评论