周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?

  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利...

  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利润率等关键数据,引发行业震动。

  数据显示,若按理论定价计算,其单日成本利润率高达545%,这一数字刷新了全球AI大模型领域的盈利天花板。

  业内分析指出,DeepSeek的开源策略与成本控制能力正在打破AI领域的资源垄断。DeepSeek此次“透明化”披露,不仅展示了其技术实力与商业潜力,更向行业传递明确信号:AI大模型的盈利闭环已从理想照进现实。

  DeepSeek最新发布

  3月1日,DeepSeek于知乎开设官方账号,发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息。

  文章写道:“DeepSeek-V3/ R1推理系统的优化目标是:更大的吞吐,更低的延迟。”

  为实现这两个目标,DeepSeek的方案是使用大规模跨节点专家并行(EP),但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时以及进行负载均衡。

  值得注意的是,文章还率先披露了DeepSeek的理论成本和利润率等关键信息。

  根据DeepSeek官方披露,DeepSeek V3和R1的所有服务均使用H800 GPU,使用和训练一致的精度,即矩阵计算和dispatch 传输采用和训练一致的FP8格式,core-attention计算和combine传输采用和训练一致的BF16,最大程度保证了服务效果。

  另外,由于白天的服务负荷高,晚上的服务负荷低,因此DeepSeek实现了一套机制,在白天负荷高的时候,用所有节点部署推理服务。晚上负荷低的时候,减少推理节点,以用来做研究和训练。

  在最近24小时(2025年2月27日12:00至28日12:00)的统计周期内:GPU租赁成本按2美元/小时计算,日均成本为87072美元;若所有输入/输出token按R1定价(输入1元/百万token、输出16元/百万token)计算,单日收入可达562027美元,成本利润率高达545%。

周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?

  不过,DeepSeek官方坦言,实际上没有这么多收入,因为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。

  DeepSeek的高利润率源于其创新的推理系统设计,核心包括大规模跨节点专家并行(EP)、计算通信重叠与负载均衡优化三大技术支柱:专家并行(EP)提升吞吐与响应速度,针对模型稀疏性(每层仅激活8/256个专家),采用EP策略扩展总体批处理规模(batch size),确保每个专家获得足够的计算负载,显著提升GPU利用率;部署单元动态调整(如Prefill阶段4节点、Decode阶段18节点),平衡资源分配与任务需求。

  计算与通信重叠隐藏延迟,Prefill阶段通过“双batch交错”实现计算与通信并行,Decode阶段拆分attention为多级流水线,最大限度掩盖通信开销。

  全局负载均衡避免资源浪费,针对不同并行模式(数据并行DP、专家并行EP)设计动态负载均衡器,确保各GPU的计算量、通信量及KVCache占用均衡,避免节点空转。

  简单来说,EP就像是“多人协作”,把模型中的“专家”分散到多张GPU上进行计算,大幅提升Batch Size,榨干GPU算力,同时专家分散,降低内存压力,更快响应。

  DeepSeek在工程层面进一步压缩成本。昼夜资源调配:白天高峰时段全力支持推理服务,夜间闲置节点转用于研发训练,最大化硬件利用率;缓存命中率达56.3%:通过KVCache硬盘缓存减少重复计算,在输入token中,有3420亿个(56.3%)直接命中缓存,大幅降低算力消耗。

  影响多大?

  有分析称,DeepSeek此次披露的数据,不仅验证了其技术路线的商业可行性,更为行业树立了高效盈利的标杆:其模型训练成本仅为同类产品的1%—5%,此前发布的DeepSeek-V3模型训练成本仅557.6万美元,远低于OpenAI等巨头;推理定价优势方面,DeepSeek-R1的API定价仅为OpenAI o3-mini的1/7至1/2,低成本策略加速市场渗透。

  业内分析指出,DeepSeek的开源策略与成本控制能力正在打破AI领域的资源垄断。DeepSeek此次“透明化”披露,不仅展示了其技术实力与商业潜力,更向行业传递明确信号:AI大模型的盈利闭环已从理想照进现实,标志着AI技术从实验室迈向产业化的关键转折。

  中信证券认为,Deepseek在模型训练成本降低方面的最佳实践,料将刺激科技巨头采用更为经济的方式加速前沿模型的探索和研究,同时将使得大量AI应用得以解锁和落地。算法训练带来的规模报酬递增效应以及单位算力成本降低对应的杰文斯悖论等,均意味着中短期维度科技巨头继续在AI算力领域进行持续、规模投入仍将是高确定性事件。

  本周以来,DeepSeek开启“开源周”,给人工智能领域扔下数颗“重磅炸弹”。回顾DeepSeek这五天开源的内容,信息量很大,具体来看:

  周一,DeepSeek宣布开源FlashMLA。FlashMLA是DeepSeek用于Hopper GPU的高效MLA解码内核,并针对可变长度序列进行了优化,现已投入生产;

  周二,DeepSeek宣布开源DeepEP,即首个用于MoE模型训练和推理的开源EP通信库,提供高吞吐量和低延迟的all-to-all GPU内核;

  周三,DeepSeek宣布开源DeepGEMM。其同时支持密集布局和两种MoE布局,完全即时编译,可为V3/R1模型的训练和推理提供强大支持等;

  周四,DeepSeek宣布开源Optimized Parallelism Strategies。其主要针对大规模模型训练中的效率问题;

  周五,DeepSeek宣布开源Fire-Flyer文件系统(3FS),以及基于3FS的数据处理框架Smallpond。

  因此,有网友评论称:“《DeepSeek-V3/R1推理系统概览》技术文章是‘开源周彩蛋’,直接亮出了底牌!”

  至此,DeepSeek“开源周”的连载或许要告一段落了,但DeepSeek后续动作依然值得持续关注。

  来源:券商中国

  声明:数据宝所有资讯内容不构成投资建议,股市有风险,投资需谨慎。

  责编:林丽峰

本文来自作者[丹艳庆]投稿,不代表发展号立场,如若转载,请注明出处:https://fastcode.vip/txbk/202510-2238.html

(88)

文章推荐

  • 御龙在天q币怎么领御龙在天怎么充值6元

    御龙在天到底怎么玩参加血战到底活动也是一种不错的选择,吃个经验丹也能获得不少经验。30分时,你可以去下邳或小沛找到血战引练者,打死后就会自动传送你进入副本。建议组队,因为副本里的怪很多,不组队的话你很快就能出来了。总的来说,每天都完成这些任务的话,肯定能快速升级。御龙在天神龙祈愿的具体玩法如下:

    2025年03月01日
    91
  • 承德疫情最新情况(河北承德公布6例感染者轨迹)

    2022年8月27日0时-2022年8月29日24时,承德高新区新增6例新冠肺炎无症状感染者,均为隔离点检出。所有追踪到的密切接触者已全部采取集中隔离医学观察,各项防控措施正有序进行。根据疫情防控形势需要,经专家组研判,现将这6例无症状感染者的活动轨迹公布如下:无症状感染者003:8月23日,白天在

    2025年03月24日
    82
  • 地下城女机械师加点地下城女机械师装备选择

    dnf女机械师怎么加点?1、对于DNF女机械师的加点,推荐如下:核心技能加点优先级为机械飞升与机械装甲强化,其次是辅助技能加点如快速射击强化和移动速度提升。最后,根据剩余技能点,可以适当分配到其他技能上。下面详细解释这些加点的选择原因。2、首先,我们要优先加满女机械师的主要输出技能,如G系列改造和

    2025年03月25日
    105
  • 天津机动车限行(天津尾号限行)

    3月21日天津市公安局网站发布天津市公安局关于继续实施机动车限行交通管理措施的通告全文如下↓为有效缓解道路交通拥堵,降低能源消耗,改善空气环境质量,依据《中华人民共和国道路交通安全法》有关规定,经市人民政府批准,自2025年3月31日至2026年3月29日,我市继续实施机动车限行交通管理措施。现通告

    2025年03月25日
    76
  • 蜂王浆产品蜂王浆产品蓝帽的批文是什么

    哪个牌子的蜂王浆冻干粉最好1、老山牌是中国蜂产品的十大品牌之一,一直有着良好的信誉。2、武汉市葆春蜂王浆有限责任公司,是知名的蜂王浆品牌,湖北名牌产品,湖北省和武汉市著名商标,是蜂产品诚信企业,中国蜂产品行业领先企业。3、品牌A的蜂王浆冻干粉是最好的。品牌A的蜂王浆冻干粉之所以好,原因有以下几点:

    2025年04月06日
    81
  • 山西省眼科医院山西省眼科医院专家名单

    太原儿童医院和山大附属医院和山西省眼科医院分别在哪啊山西省太原市杏花岭区府东街。根据查询百度地图可知,山西省眼科医院位于山西省太原市杏花岭区府东街,于1978年在原山西省工农兵医院的基础上创建而成,是华北地区最早开设的省级眼科专科医院。府东街。根据查询百度地图得知,山西省眼科医院地址为山西省太原市

    2025年04月06日
    85
  • 山西运城疫情最新情况(山西运城昨日新增6例确诊病例及83例无症状感染者)

    来源:健康运城官微2022年12月4日0-24时,运城市新增6例新冠病毒肺炎确诊病例(轻型),其中盐湖区3例,万荣县1例,永济市1例,新绛县1例;新增83例无症状感染者,其中:盐湖区28例,永济市13例,夏县8例,芮城县5例,绛县5例,万荣县4例,稷山县4例,河津市4例,临猗县3例,闻喜县3例,垣

    2025年04月18日
    72
  • 中银国际:福耀玻璃次季净利润有望创新高 升目标价至72港元 维持“买入”评级

      中银国际发布研报称,预计福耀玻璃(03606)次季收入同比增长13%至14%,达到107至108亿元人民币(下同),主要得益于国内汽车玻璃收入提速(预计同比增长超15%)以及海外汽车玻璃销售的稳步增长。中银国际维持福耀玻璃“买入”评级,目标价从65港元上调至72港元(基于2025年20倍预期市

    2025年07月15日
    38
  • 渝农商行:拟聘任谭彬为董事会秘书

      9月8日金融一线消息,重庆农村商业银行股份有限公司发布第五届董事会第六十一次会议决议公告,会议审议通过《关于聘任重庆农村商业银行股份有限公司董事会秘书的议案》。  根据决议,渝农商行同意聘任谭彬为该行董事会秘书,其任职自取得上海证券交易所董事会秘书资格证书且监管机构核准任职资格之日起生效。 

    2025年09月08日
    20
  • 美国将对重型卡车、厨柜和品牌及专利药品征收关税 10月1日起实施

      美国总统唐纳德·特朗普宣布针对重型卡车、厨柜和浴室柜以及软垫家具征收新的行业特定关税,进一步扩大通过提高进口税来提振国内产业的贸易议程。  特朗普周四在TruthSocial平台上发帖宣布,计划自10月1日起对进口重型卡车征收25%的关税。他写道:“为了保护我们伟大的重型卡车制造商免受不公平

    2025年09月26日
    9

发表回复

本站作者后才能评论

评论列表(4条)

  • 丹艳庆
    丹艳庆 2025年10月01日

    我是发展号的签约作者“丹艳庆”!

  • 丹艳庆
    丹艳庆 2025年10月01日

    希望本篇文章《周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?》能对你有所帮助!

  • 丹艳庆
    丹艳庆 2025年10月01日

    本站[发展号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 丹艳庆
    丹艳庆 2025年10月01日

    本文概览:  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利...

    联系我们

    邮件:发展号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们