近日,国产大模型DeepSeek在全球火爆,并带火了一位95后AI天才少女——罗福莉。据证券时报报道,雷军亲自出手挖人,向罗福莉支付了千万元级别的薪酬。
罗福莉的辉煌履历
- 本科毕业于北京师范大学计算机专业
- 硕士毕业于北京大学计算语言学专业
- 2019年,在国际人工智能顶级会议ACL上发表8篇本文,登上知乎热搜
- 硕士毕业后,曾任职于阿里达摩院、幻方量化和DeepSeek
- 参与研发了MoE大模型DeepSeek-V2
小米发力AI大模型
罗福莉被挖入小米,是小米全面发力AI大模型的标志。2023年4月,小米成立了AI实验室大模型团队,并表示将不断探索AI相关的用户场景,发挥自身技术优势,并与合作伙伴合作。
今年11月,小米成立了专门的AI平台部,由小米元老级技术大牛张铎担任负责人。张铎将带领团队搭建GPU万卡集群,规模比大模型团队成立时的6500张GPU大幅增加。
小米研发投入超千亿
小米集团总裁卢伟冰透露,预计2024年小米研发费用将达到240亿元,2025年将攀升至300亿元。从2022年至2026年的五年内,小米的研发投入将超过1000亿元,主要聚焦于AI、OS、芯片三大底层技术的研发。
雷军亲自领导
小米集团董事长雷军亲自领导了建设万卡GPU集群的计划。在AI团队建设方面,小米自2016年组建AI团队以来,经过多次扩展,相关领域人员规模已达3000多人。
小米股价创下新高
在二级市场上,加码AI算力成为小米近期上涨的主要驱动因素。12月27日,小米股价创下2022年以来新高,盘中触及34.95港元/股。
雷军的战略思考
雷军表示,小米做大模型的思路与很多公司不同,选择专注于轻量化和本地部署。对于小米这样兼顾手机和造车业务的公司而言,如何在烧钱的大模型领域平衡成本,是雷军考虑的核心问题。而罗福莉拥有DeepSeek-V2的研发经验,可能正是雷军看好她的原因。
发表评论