首页双碳行业研报双碳行业研报券商研报DeepSeek开启盈利新时代!关注应用、云厂及国产算力、数据库投资机遇-250303-中泰证券-16页
绿碳知识人

文档

2355

关注

0

好评

0
PDF

DeepSeek开启盈利新时代!关注应用、云厂及国产算力、数据库投资机遇-250303-中泰证券-16页

阅读 814 下载 831 大小 1.74M 总页数 16 页 2025-03-18 分享
价格:¥ 9.90
下载文档
/ 16
全屏查看
DeepSeek开启盈利新时代!关注应用、云厂及国产算力、数据库投资机遇-250303-中泰证券-16页
还有 16 页未读 ,您可以 继续阅读 或 下载文档
1、本文档共计 16 页,下载后文档不带水印,支持完整阅读内容或进行编辑。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

5、有任何问题,文件需求请联系WX:baomafenxiang520

中泰证券ZHONGTAI SECURITIES计算机证券研究报告/行业点评报告2025年03月03日评级:报告摘要工程优化能力:算力效率联升,极敌发挥Hopper架构性能,DeepSeek宣布以“完全公开透明”方式开源5个生产级代码库,从注意力机制、通信库、矩阵计算库、并行优化策略和数据存储系统方面极致压榨算卡性能。执业证书编号:S0740524030002■Day1:FlashMLA解码内核,专为Hopper架构H8O0GPU优化,通过多层注意机(MLA)并化,3000GB/s580 TFLOPS算Email:sunxz@zts.com.cn该技术可支撑高并发实时生成任务,单卡推理效率达行业平均水平的8倍,为AI规模化应用降低算力瓶颈。基本状况Day2:全球首个MoE专用通信库DeepEP,深度融合Vink与RDMA技术,上市公司数361节点间通信延迟降至微秒级,其“专家小组分工”机制动态分配GPU资源,空闲时自动降频,配合FP8调度与计算-通信重叠策略,填补分布式训练工具链空行业总市值(亿元)45.969.02白。行业流通市值(亿元)39.634.33Day3:开薄DeepGEMM矩阵库,以300行核心代码实现FP8精度通用矩阵运算,JIT译动态适配Hopper张量核心,算力峰值达1350 TFLOPS。轻量化设行业-市场走势对比计支持边缘设备部署,验证FP8商用可行性,为低耗A提供标准化工具,推动行业向高效集约化迭代。计算机■Day4:开源三项并行优化枝术,DualPipe算法实现前向/反向计算100%重叠;40%EPLB动态平衡MoE专家负载,提升GPU利用率。V3模型预训练仅耗278.826%万H800GPU小时(成本557万美元),较同类产品节省算力资源,代码生成12%与数学推理性能超越GPT-40,2Day5:并行文件系铣3FS,基于RDMA网络与高速SSD构建共享存储层,180节点集群读取吞吐量达6.6TiB/s,单客户端KVCache查询峰值40+GiB/s,配合SmallPond分布式排序方案,110.5TiB数据排序耗时30分14秒3.66TiB/份钟),DeepSeek开潭周带来四大深远形响:1)通过云厂商部署、私有云部署与端侧部署三类模式,加速A全场景渗透。2)在杰文斯悖论驱动下,其算力效率跃升与多模态技术突破进一步刺激全球算力需求扩张。3)推动数据库向新型基相关报告础设施升级。4)商业化层面,开源生态与分层收费模式显著降低企业应用成本国产应用厂商盈利空间全面打开,1、《量子计算:“量”力而行,下一代计算革命伊始》2025-02-23商业进展重喜:估测成本利润率达545%,A1 Infra价值重估,3月1日,DeepSeek2、《国家数据集团组建在即,数据拔露其通过硬件优化(全H800GPU集群+FP8BF16精度),与动态资源调度,要素市场化改革步入深水期》在保障服务质量的同时实现了545%的成本利润率,验证了从算法到工程的全链路突2025-02.16◆新品着势待发:R2模型有望于2025年5月前发布。DeepSeek被曝加速推进第二代大模型R2研发,或将提前至5月前发布,迭代周期从R1的13个月压编至3-4个月,创行业新纪录。投资建议:1)官方技术解读表明,通过部署DeepSeek的服务,理论上收益和利润率可以达到很高。DS的惊艳收益有望促进应用爆发,建议关注金山办公同花顺、合合信息、莹石网络等:2)应用爆发带来的庞大推理需求,以及未来图像+声音+视频的全面智能体会支撑起更多业务场景,大型云厂具备规模、infra优势,能够以更低的成本支持高并发的业务需求。海外高性能芯片供应受限,国产算力结合算法架构创新有望弯道超车。建议关注阿里巴巴,海光信息,中科暖光,神州数码等:3)通过将结构化和非结构化数据集成在高性能、分布式的命名空间,实现实时分析能力,传统数据库有望升级为新型数据基础设施,建议关注达梦数据、星环科技、海量数据等。风险提示:技术优化边际递减风险;开源生态依赖风险;商业场景错配风险;行业竞争超速风险;研究报告中使用的公开资料可能存在信息滞后或更新不及时的风险。请务必阅读正文之后的重要声明部分中泰证券ZHONGTAI SECURITIES行业点评报告内容目录一、工程优化能力:算力效率肤升,极致发挥Hopper架构性能…31.1Day1:FlashMLA-针对Hopper优化的高效多层注意力解码内核..31.2Day2:DeepEP-打破分布式训练瓶颈的高效通信库通信库41.3Day3:DeepGEMM-专为FP8矩阵乘法设计的开源库.61.4D创4:三项并行优化技术-突破超大规模模型训练效率瓶颈…71.5Day5:3FS&Small pond联袂加速数据处理1.6DS开源周四大影响研判11二、商业进展盈喜:估测成本利润率达545%,A1 Infra价值重估.…12三、新品着势特发:R2棋型有望于2025年5月前发布….15.15图表目录图表1:DeepSeek Day1内容.3图表2:FlashMLA的意义..3图表3:FlashMLA应用界面4☒表4:DeepSeek Day2内容图表5:DeepEP的意义浅析.5图表6:专家小组分工示意…图表7:优化NVLink传输路径图表9:DeepGEMM的意义浅析6图表10:DeepGEMM界面.图表11:DeepSeek Day4内容..8图表12:三项策略核心内容8图表13:DualPipe介绍8图表14:EPLB原理示意…9图表15:DeepSeek Day5内容10图表16:3FS的意义…10图表17:3 FSGithub界面..10图表18:3FS峰值吞吐量测试…11图表9:smallpond灰度排序测试.11图表20:DeepSeek Daye6内容.13图表21:DeepSeek如何实现高效运行14图表22:用于推理服务的H800节点数量.14-2-请务必阅读正文之后的重要声明部分
返回顶部