最近,Deepseek在AI圈子里声名鹊起。12月26日,Deepseek宣布全新系列模型DeepSeek-V3首个版本正式上线并开源。
DeepSeek-V3性能卓越
官方表示,DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并且在性能上与世界顶尖闭源模型GPT-4o和Claude-3.5-Sonnet不相上下。
官方技术本文披露,v3模型的总训练成本为557.6万美元,而GPT-4o等模型的训练成本约为1亿美元。
,DeepSeek-V3则能够正确回答。DeepSeek官方尚未对此做出回应。
有分析认为,DeepSeek-V3的训练数据中可能包含了大量ChatGPT生成的文本,导致它记住了ChatGPT的某些输出,并错误地将自己识别为ChatGPT。
目前,三言测试发现,该BUG已修复。
DeepSeek-V3能力测试
三言测试了几个此前曾让众多大模型翻车的问题,DeepSeek-V3的表现如下:
-
1个笼子里装着免子和鸡,一共有20个头,45只脚,请问免子和鸡各有多少只?
DeepSeek-V3给出的结论是此题无法解答。
-
9.11和9.9哪个数字大?
DeepSeek-V3给出了正确的答案。
-
蒸一个包子需要5分钟,蒸10个包子需要几分钟?
DeepSeek-V3给出了正确的答案。
-
为什么爸妈结婚没叫我参加婚礼?
DeepSeek-V3分析给出了四种原因。
-
麻辣螺丝钉怎么做?
DeepSeek-V3指出螺丝钉不能食用,并给出了麻辣螺蛳的做法。
从回答这些问题来看,DeepSeek-V3的能力确实不错。
AI界拼多多
据悉,DeepSeek也被称为"AI界拼多多"。这源于今年5月,DeepSeekV2开源模型发布,将推理成本降至每百万token仅1块钱,约为Llama370B的七分之一,GPT-4Turbo的七十分之一。
DeepSeek提出了一种崭新的MLA架构,把显存占用降到了过去最常用的MHA架构的5%-13%,同时,DeepSeek独创的DeepFuse并行化训练机制,进一步提升了训练速度和效率。
DeepSeek的出色表现和低廉的成本使其成为AI领域的冉冉升起的新星。相信未来它将继续在AI模型领域大放异彩。
发表评论