天才少女井喷年今年涌现的巾帼英才 (天才少女井喷图片)

科技资讯 2025-01-01 00:24:54 浏览次

一、DeepSeek-V3 惊艳亮相面，则是其低廉的训练成本。很多大佬也对 DeepSeek-V3 给出了高度评价。比如，Meta 科学家田渊栋称， DeepSeek-V3 的训练看上去是黑科技，这是非常伟大的工作。MenloVenture 的投资人表示：53 页的技术本文是黄金。
不过，DeepSeek-V3 也给自己挖了一个坑。很快就有人发现，当用英文 whatmodelareyou 向 DeepSeek-V3 提问它是哪家大模型时，它却给出了 ChatGPT 的答案。而用中文或给 whatmodelareyou 加上问号，DeepSeek-V3 则能够正确回答。不过，DeepSeek 官方还未对此做出回应。有分析认为，之所以会出现这一幕，或许是因为 DeepSeek-V3 的训练数据中可能包含了大量 ChatGPT 生成的文本，导致它记住了 ChatGPT 的某些输出，并错误地将自己识别为 ChatGPT。今日，三言测试发现，该 BUG 已修复。
三言还测试了几个此前曾让众多大模型翻车的问题。

1个笼子里装着免子和鸡，一共有20个头，45只脚，请问免子和鸡各有多少只？这个问题其实是无解的。日前，三言在测试另一款大模型时，对方给出了错误的答案。DeepSeek-V3 则是先通过设方程，解出兔子的数量为 2.5 只，鸡的数量为 17.5 只。然后又指出，动物的数量应该是整数，这表明题目中给出的数据可能有误，或者问题本身存在矛盾。

9.11 和 9.9 哪个数字大？这个问题曾让一众大模型打脸。DeepSeek-V3 给出了正确的答案。

蒸一个包子需要 5 分钟，蒸 10 个包子需要几分钟？这个问题也曾让某大模型出糗，该大模型不知道包子可以同时蒸，得出了需要 50 分钟的错误答案。DeepSeek-V3 也给出了正确的答案。

为什么爸妈结婚没叫我参加婚礼？这个问题 DeepSeek-V3 分析给出了四种原因。

麻辣螺丝钉怎么做？日前，三言测试另一款大模型时，这个问题也让它翻车了。该大模型一本正经的给出了做法。而 DeepSeek-V3 指出了螺丝钉不能食用，并给出了麻辣螺蛳的做法。

从回答这些问题来看，DeepSeek-V3 的能力确实还不错。

四、DeepSeek 被称为 AI 界拼多多

据悉，DeepSeek 还被称为 AI 界拼多多。这源于今年 5 月，DeepSeekV2 开源模型发布，将推理成本被降到每百万 token 仅 1 元钱，约等于 Llama370B 的七分之一，GPT-4Turbo 的七十分之一。当时，DeepSeek 就被冠以 AI 界拼多多之称。据悉，这背后是 DeepSeek 提出了