阿里云副总裁谈DeepSeek开源周 为什么开源?
2025-02-27 10:58:04“AI下半场的竞争又回到了传统的系统领域”,2月26日,阿里云智能集团副总裁、数据库产品事业部负责人李飞飞在2025阿里云PolarDB开发者大会上谈到对DeepSeek近日开源周相关发布的看法,他认为,随着DeepSeek的火爆,一个背后趋势是,AI的下半场竞争又回到了传统的系统领域,是分布式系统工程的事情。
“AI的第一波浪潮来自于做模型、算法、Transformer等机制的研究,但当AI进入下半场,大家会发现在模型的算法和框架上实际没有太大的创新和突破,大的模型框架算法过去两年没有大的变化。如今花昂贵的钱去招一个很懂算法的人所带来的收益可能不如去招一帮干数据库、分布式系统干了很多年的人。”李飞飞表示。
对于DeepSeek开源周的相关发布,他分析,DeepSeek的一系列优化包括FlashMLA的分段配置等,是把Linux、OS、Kernel里的思路放在GPU的缓存上又去实现了一遍。这些东西在数据库系统里已经实现了很多年,只不过今天在GPU的新的硬件框架上,DeepSeek的创新产生巨大的价值,它可能带来的是硬件结构的巨大变化。
此外,李飞飞还预测,未来,大模型预训练一定是中心化和寡头化的,全世界可能只有几家。尤其是目前还没看到世界任何一家大模型商业模式实现闭环的情况下,这就是一个烧钱的无底洞,除非有一天它突破了AGI的门槛,自己成为印钞机。但DeepSeek横空出世让开源模型具备了复杂的逻辑推理能力,同时带来推理成本的大幅下降。目前,阿里云正在GPU加CPU的异构资源池上做优化,未来,数据库要研发的关键能力也是要将昂贵的GPU尽可能地省下来做最珍贵的计算和缓存,将次要的计算和缓存推到CPU加内存和存储的三层池化中,让在线推理变得更低成本。