财中社2月5日电 中信证券发表研报称,DeepSeek V3以及R1大模型以其低成本+高性能+开源等特点引发全球关注,其通过模型层面的创新,在芯片受限/低算力投入的背景下达到了全球顶尖闭源模型的性能水平。认为DeepSeek是生态级的突破,有望带动国内AI全产业的快速发展,同时其开源与低成本的特性亦有望赋能AI应用厂商,加速推动端侧AI落地。此外,DeepSeek有望驱使全球AI算力军备竞赛进一步升级,带动北美CSP厂商资本开支持续增长。
随着杭州深度求索人工智能公司于2024年12月和2025年1月发布DeepSeek V3与R1等模型,DeepSeek以高性能、低成本以及开源等特点引发了全球范围内的广泛关注与讨论:DeepSeek V3模型在多项基准测试中优于GPT-4o等主流闭源模型,R1模型在多项基准测试中性能与OpenAI o1模型相当,而且DeepSeek V3的训练成本仅560万美元,远低于同类产品数亿美元的投入规模。根据Appfigures数据,在2025年1月27日,DeepSeek APP登顶美国地区免费APP下载排行榜,超越了ChatGPT。根据AIcpb数据,截至2月4日,DeepSeek日活用户数超越了2000万人。如Meta CEO、OpenAI CEO等人都对DeepSeek系列模型的高性能与高性价比等优势给予了高度评价。DeepSeek通过MOE(Mixture of Experts)上的创新、MLA算法(Multi-head Latent Attention)以及MTP策略(Multi-Token Prediction)等方法在模型层面显著提高了算力与内存的使用效率,从在显著降低成本的前提下提高了在复杂问题中的模型性能。认为DeepSeek开源模型的亮眼表现证明了开源模型的发展潜力,同时也体现了部分中国大模型厂商全球领先的实力。
在DeepSeek 在算力芯片受限的不利因素下,达到OpenAI等顶级模型的水平,是国内AI生态级的突破,有望推动国内厂商的AI技术进步和投入加大,带动全产业链发展。华为昇腾云、腾讯云、阿里云、百度智能云等CSP厂商都陆续地在其云服务平台上线了DeepSeek的大模型,华为昇腾、海光信息、天数智芯等AI算力芯片厂商也均适配DeepSeek,我们看好DeepSeek对于国内算力产业链的拉动。中信证券认为在DeepSeek等厂商的推动下:
AIDC景气度向好:国内AIDC龙头,凭借在廊坊、平湖、佛山和惠州等地超大型AIDC的加速布局,有望承接各类AI厂商的需求,持续受益。
国内交换机龙头亦有望受益:头部互联网企业数据中心交换机主流供应商有望受益。
国产算力芯片与服务器的放量有望推动国内光模块与高速线模组的旺盛需求
DeepSeek的爆火有望将带动国产算力芯片和服务器的放量,推动国产温控设备的放量以及液冷渗透率的提升,国内头部温控厂商有望受益。
DeepSeek专注于大模型、不做垂类和应用,将对AI软件、AI硬件等应用厂商赋能,认为将有望加速国内外AI应用的快速发展。同时物联网端侧AI作为AI应用的重要载体之一,在Deepseek所带来的模型小型化和开源化的趋势下有望迎来加速落地。Counterpoint预测,未来端侧AI将驱动蜂窝模组出货增长,且2023年自带算力的AI蜂窝模组仅占全球蜂窝模组出货的6%,这一比例将在2030年提升至25%。Counterpoint还预测AI蜂窝模组的出货量将在23-27年之间达到73%的复合增长率。物联网蜂窝模组龙头,在端侧AI方面布局较为前瞻。
中信证券认为DeepSeek的模型优异表现有望推动海外大模型厂商军备竞赛的升级,同时其高性能/低成本的特点有望引发杰文斯悖论(Jevons Paradox,指的是当技术进步使某种资源的使用效率提高时,该资源的总体消耗量反而会增加),大模型训练/推理效率的提升亦有望提高全球算力基础设施的需求量。Meta CEO在 2024年第四季度 财报里表示,DeepSeek的崛起会加强对 Meta AI 战略和投资的信心,并将算力基础设施的建设看作其战略优势,同时将2025财年资本开支预期提高到600~650亿美金,同比+53~66%。全球AI竞争加剧,海外算力产业链将保持持续旺盛需求,从而带动高速光模块的持续增长。
如果您有新闻线索,请联系我们:newsroom@caizhongshe.cn
重要提示:本文仅代表作者个人观点,并不代表财中社立场。本文著作权归财中社所有。未经允许,任何单位或个人不得在任何公开传播平台上使用本文内容;经允许进行转载或引用时,请注明来源。联系请发邮件至czs@caizhongshe.cn。