宣告新时代的到来 中国公司颠覆硅谷霸主地位 显卡革命 (宣告新时代的异世界的黑暗幻想)

科技资讯 2025-01-03 13:01:39 浏览

在西方还沉浸在圣诞假期,疯狂过年的时候,咱们中国企业给人家放了个新年二踢脚,给人家脑瓜子崩得嗡嗡得。

DeepSeek横空出世

前有宇树科技的机器狗视频让大家惊呼,还要啥波士顿动力。紧接着又来了个国产大模型DeepSeek,甚至有股做空英伟达的味道。

近日,DeepSeek刚刚公布最新版本V3。与大洋彼岸那个自称Open,却越来越Close的公司产品不同,这个V3是开源的。

开源还不是他最重要的标签,DeepSeek-V3还兼具了性能国际一流,技术力牛逼,价格击穿地心三个特点,这一套不解释连招打得业内大模型厂商们都有点晕头转向了。

V3一发布,OpenAI创始成员Karpathy直接看嗨了,甚至发出了灵魂提问,难道说大模型们压根不需要大规模显卡集群?我估计老黄看到这头皮都得发麻了吧。

同时,Meta的AI技术官也是直呼DeepSeek的成果伟大。知名AI评测博主TimDettmers,直接吹起来了,表示DeepSeek的处理优雅elegant。

而在这些技术出身的人,看着V3的成绩送去赞扬的时候,也有些人急了。比如奥特曼就搁那说,复制比较简单啦,很难不让人觉得他在内涵DeepSeek。

DeepSeek的诞生

更有意思的是,做到这些的公司既不是什么大厂,也不是纯血AI厂商。DeepSeek公司中文名叫深度求索,他们本来和AI没任何关系。

就在大模型爆火之前,他们其实是私募机构幻方量化的一个团队。而深度求索能够实现弯道超车,既有点必然,也好像有点运气的意思。

早在2019年,幻方就投资2亿元搭建了自研深度学习训练平台萤火虫一号,到了2021年已经买了足足1万丈英伟达A100显卡的算力储备了。

要知道,这个时候大模型没火,万卡集群的概念更是还没出现。而正是凭借这部分硬件储备,幻方才拿到了AI大模型的入场券,最终卷出了现在的V3。

你说好好的一个量化投资领域的大厂,干嘛要跑来搞AI呢?深度求索的CEO梁文锋在接受采访的时候给大家聊过,并不是什么看中AI前景。

而是在他们看来,通用人工智能可能是下一个最难的事之一,对他们来说,这是一个怎么做的问题,而不是为什么做的问题。

就是抱着这么股莽劲,深度求索才搞出了这次的大新闻,下面给大家具体讲讲V3有啥特别的地方

V3的特别之处

性能强悍

目前来看,在V3面前,开源模型几乎没一个能打的。还记得去年年中,小扎的Meta推出模型Llama3.1,当时就因为性能优秀而且开源,一时间被捧上神坛结果在V3手里,基本是全面落败。

而在各种大厂手里的闭源模型,那些大家耳熟能详的什么GPT-4o、Claude3.5Sonnet啥的,V3也能打得有来有回。

你看到这,可能觉得不过如此,也就是追上了国际领先水平嘛,值得这么吹吗?残暴的还在后面。

训练成本低廉

大家大概都知道了,现在的大模型就是一个通过大量算力,让模型吃各种数据的炼丹过程。在这个炼丹期,需要的是大量算力和时间往里砸。

所以在圈子里有了一个新的计量单位GPU时,也就是用了多少块GPU花了多少个小时的训练时间。GPU时越高,意味着花费的时间、金钱成本就越高,反之就物美价廉了。

池光耀

前面说的此前开源模型王者,Llama3.1405B,训练周期花费了3080万GPU时。可性能更强的V3,只花了不到280万GPU时。

以钱来换算,DeepSeek搞出V3版本,大概只花了4000多万人民币。而Llama3.1405B的训练期间,Meta光是在老黄那买了16000多个GPU,保守估计至少都花了十几亿人民币。

至于另外的那几家闭源模型,动辄都是几十亿上百亿大撒币的。你别以为DeepSeek靠的是什么歪门邪道,人家是正儿八经的有技术傍身的。

技术

DeepSeek的技术

为了搞清楚DeepSeek的技术咋样,咱们特地联系了语核科技创始人兼CTO池光耀,他们主力发展企业向的agent数字人,早就是DeepSeek的铁粉了。

池光耀:"DeepSeek的技术牛逼之处在于,他们完全在打高维战,有非常强的技术底蕴撑着。一个模型训练得怎么样,最终还得看两点,训练效率和收敛效率,V3在这两个方面都很突出。"

池光耀还表示,DeepSeek有一个很强的技术团队,很多都是国际顶尖水平,而且他们对于底层技术的不断创新,才是他们能够在短时间内取得如此成就的根本原因。

结语

DeepSeek的横空出世,再次证明了中国企业在AI领域的创新能力越来越强。在全球大模型竞争愈发激烈的今天,DeepSeek的表现不仅给中国企业提振了信心,也给全球AI行业带来了新的思考。

未来,DeepSeek能否继续保持领先地位,我们拭目以待。

本文版权声明本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请联系本站客服,一经查实,本站将立刻删除。

发表评论

热门推荐