今年的天才少女井喷式涌现 (今年的天才少年)

科技资讯 2024-12-31 19:04:39 浏览
官方

简介

DeepSeek是一个开源的人工智能模型,由百度开发。最近几天,它在AI圈子里很火。12月26日,DeepSeek宣布全新系列模型DeepSeek-V3首个版本上线并同步开源。官方称,DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。官方技术本文还披露,v3模型的总训练成本为557.6万美元,GPT-坑 不过,DeepSeek-V3也给自己挖了一个坑。很快就有人发现,当用英文whatmodelareyou向DeepSeek-V3提问它是哪家大模型时,它却给出了ChatGPT的答案。而用中文或给whatmodelareyou加上问号,DeepSeek-V3则能够正确回答。不过,DeepSeek官方还未对此做出回应。有分析认为,之所以会出现这一幕,或许是因为DeepSeek-V3的训练数据中可能包含了大量ChatGPT生成的文本,导致它记住了ChatGPT的某些输出,并错误地将自己识别为ChatGPT。今日,三言测试发现,该BUG已修复。

问题测试

三言还测试了几个此前曾让众多大模型翻车的问题。 1. 1个笼子里装着免子和鸡,一共有20个头,45只脚,请问免子和鸡各有多少只? 这个问题其实是无解的。日前,三言在测试另一款大模型时,对方给出了错误的答案。DeepSeek-V3则是先通过设方程,解出兔子的数量为2.5只,鸡的数量为17.5只。然后又指出,动物的数量应该是整数,这表明题目中给出的数据可能有误,或者问题本身存在矛盾。 2. 9.11和9.9哪个数字大? 这个问题曾让一众大模型打脸。DeepSeek-V3给出了正确的答案。 3. 蒸一个包子需要5分钟,蒸10个包子需要几分钟? 这个问题也曾让某大模型出糗,该大模型不知道包子可以同时蒸,得出了需要50分钟的错误答案。DeepSeek-V3也给出了正确答案。 4. 为什么爸妈结婚没叫我参加婚礼? 这个问题DeepSeek-V3分析给出了四种原因。 5. 麻辣螺丝钉怎么做? 日前,三言测试另一款大模型时,这个问题也让它翻车了。该大模型一本正经的给出了做法。而DeepSeek-V3指出了螺丝
本文版权声明本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请联系本站客服,一经查实,本站将立刻删除。

发表评论

热门推荐