
3月5日,国盛证券发表研究报告称,DeepSeek在过去一周持续发布开源项目,其中DeepSeek-V3/R1推理系统优化和成本计算的文章引发行业和市场高度关注,国盛证券表示基于规模跨节点专家并行的方案,通过计算和通信重叠,尽可能的做到负载均衡,其公布的理论成本利润率达到惊人的545%。
利润率为理论天花板,输入负载压力大。DeepSeek给出的毛利率是在不考虑运维过程中可能遇到的问题、不考虑用户体验的基础上的理论值,充分证明在推理端大规模集群的高效率。关注到其24小时输入token数量大于输出token,且KVCache击中率高达56.3%,认为与长文本上下文对话、问答搜索以及问题类型有关,导致输入token大于输出token。同时,输入的负载预测相对较难,输入大幅增加,等待时长大幅度增长。
训推一体符合商业规律,大集群效率提升空间巨大。DeepSeek集群同时承担了推理和训练的工作,企业或组织在有限的资金背景下,建设一个能满足各种需求的训推一体集群更符合商业规律,而极高的利润率,能帮助其在硬件折旧期限内便实现回本,这将给算力投入方继续投资的信心。同时,大集群可以进行7*24h的进行性能和价值压榨,通用性GPU为主的AI大集群,在计算和通信的硬件能力上都大幅度提升,效率提升空间相较CPU集群更大。
DeepSeek的开源风暴掀开了公有云的下一个黄金十年。公有云在过去十几年云计算的发展中,充分证明了自己在效率、经济性和商业价值上的正确性,AI时代则将进一步提升公有云的优势,云厂商建设越来越大的集群来实现更好的规模效应,企业和用户通过公有云或类似按需订阅服务,能够廉价便接的使用到最强大的模型。当前绝大部分需求是文生文的token,多模态尚未真正开启scaling law,随着模型能力的进一步提升,需求将进一步井喷,算力建设将复刻云计算的黄金十年。
重要提示:本文仅代表作者个人观点,并不代表财中社立场。本文著作权归财中社所有。未经允许,任何单位或个人不得在任何公开传播平台上使用本文内容;经允许进行转载或引用时,请注明来源。联系请发邮件至czs@caizhongshe.cn。