梁文锋署名!DeepSeek再发论文

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   近日,DeepSeek团队发布了新论文,以DeepSeek-V3为代表,深入解读DeepSee...

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  近日,DeepSeek团队发布了新论文,以DeepSeek-V3为代表,深入解读DeepSeek在硬件架构和模型设计方面的关键创新,为实现具有成本效益的大规模训练和推理提供思路。其中,DeepSeek创始人兼CEO梁文锋是署名作者之一。

  DeepSeek在论文中提到,论文期望跨越硬件架构和模型设计,采用双重视角来探索其之间错综复杂的相互作用,以实现具有成本效益的大规模训练和推理。

  论文侧重探讨了三大方向:一是硬件驱动的模型设计,分析硬件功能如何影响DeepSeek-V3中的架构选择;二是硬件和模型之间的相互依赖关系,硬件功能如何塑造模型创新,以及大模型不断变化的需求如何推动对下一代硬件的需求;三是硬件开发的未来方向,探索未来硬件和模型架构的协同设计,力图打造可扩展、经济高效的AI系统。

梁文锋署名!DeepSeek再发论文

  揭秘DeepSeek模型设计原则

  DeepSeek模型设计原则有哪些?论文聚焦内存效率、成本控制、推理速度等方面开展内容。

  面对大量的内存资源需求,源头优化内存使用是关键策略。在内存效率方面,多头潜在注意力(MLA)则通过压缩键值(KV)缓存显著降低了内存消耗。FP8混合精度训练技术将内存消耗显著降低了一半。除了MLA之外,DeepSeek还提出了其他几种方法来减少KV缓存的大小,包括共享KV、量化压缩等。

  论文提到,“对于大模型推理,用户请求通常涉及多轮对话。KV缓存通过缓存先前处理的token的键和值向量来解决这一挑战,无需为后续token重新计算。”

  在成本控制方面,DeepSeek开发了DeepSeekMoE。混合专家(MoE)架构拥有两大优势。一是降低训练成本,通过选择性激活专家参数来降低计算成本。根据论文,DeepSeek-V3包含6710亿参数,但每token仅激活370亿参数,训练成本为250GFLOPS/Token。这表明,MoE模型在计算资源消耗量少一个数量级的情况下,实现了与密集模型相当甚至更优的性能。

  二是利于个人使用和本地部署。由于每个请求只激活了一个参数子集,其能够大大减少内存和计算需求。

梁文锋署名!DeepSeek再发论文

  在提高推理速度方面,DeepSeek通过引入高带宽纵向扩展网络、重叠计算和通信、多token预测框架等方法提高推理速度。

  其中,推理速度既包括系统级最大吞吐量,也包括单请求延迟。为了最大限度地提高吞吐量,DeepSeek-V3从一开始就被构建为利用双微批处理重叠,有意将通信延迟与计算重叠。

梁文锋署名!DeepSeek再发论文

  软硬件协同突破效率极限

  基于设计原则,DeepSeek细化了在低精度训练、互连优化、网络拓扑等方面的具体细节。

  据介绍,在低精度技术突破方面,DeepSeek通过采用FP8混合精度训练,将模型内存占用直接减少50%。DeepSeek还提出LogFMT对数空间量化方案,能在相同比特下实现更高精度。

  在互连优化方面,DeepSeek提出了硬件感知并行策略,摒弃传统张量并行(TP),转而采用流水线并行(PP)和专家并行(EP),开源DeepEP库提升EP效率。

  在网络拓扑方面,DeepSeek推出的两层多层胖树(MPFT)网络拓扑,通过8个独立平面实现故障隔离与负载均衡,相比传统三层拓扑大大降低成本。

  六大关键探索未来AI基础设施

  未来,下一代AI基础设施将如何升级?DeepSeek从硬件架构的角度提出六大方向,直面未来挑战并提出解决方案,涉及内存、互连、网络、计算等核心领域。

  一是鲁棒性挑战。聚焦通过更先进的错误检测与纠正机制,以此解决硬件故障和静默数据损坏等问题。

  二是CPU(中央处理器)瓶颈与互联限制。通过优化CPU与加速器之间的协同等,来满足突破传统接口的限制,实现高速、无瓶颈的节点内部通信。

  三是智能网络技术,重点关注封装内光互联、自适应路由、高效的容错协议、动态资源管理等方向,以此实现兼顾低延迟和智能感知能力需求的网络。

  四是内存语义通信与排序。DeepSeek主张硬件支持为内存语义通信提供内置顺序保证。这种一致性应在编程层(如通过获取/释放语义)和接收方硬件层强制执行,以此提升通信效率。

  五是网络计算融合。如何将计算和压缩能力下沉到网络中?论文称,在网络硬件中集成自动分组复制、硬件级归约功能,并支持LogFMT压缩,降低通信带宽需求。

  六是以内存为中心的架构创新。目前,模型规模的指数级增长已超过高带宽内存(HBM)技术的进步,这种差距造成内存瓶颈。论文推荐了DRAM(动态随机存取存储器)堆叠、晶圆级集成等前沿技术。

  “针对当前硬件在内存带宽、互连带宽和计算效率的瓶颈,团队提出未来硬件应重点发展精准低精度计算单元、Scale-Up/Scale-Out(纵向扩展/横向扩展)收敛架构及低延迟智能网络,并强调通过硬件原生支持通信压缩、内存语义排序和故障容错机制,提升系统鲁棒性。”论文称,这些成果为下一代AI系统的软硬件协同创新提供了实用蓝图,有望推动AI在复杂场景中的规模化应用。

本文来自作者[乙青柏]投稿,不代表发展号立场,如若转载,请注明出处:https://fastcode.vip/txbk/202509-31177.html

(47)

文章推荐

  • dota赏金猎人出装dota683赏金猎人出装

    dota赏金猎人出装1、DOTA游戏中,赏金猎人有两种出装方法,取决于团队配置与战略需求。首先,当对面脆皮多而我方团队不缺乏后期作战能力时,可以选择爆发流的出装方式。具体出装顺序为秘法战鼓、红杖、虚灵刀。这种出装方式旨在迅速消耗脆皮英雄的生命值,一旦时机成熟,能够轻易打破敌方防线,迅速击溃对手。2

    2025年02月26日
    114
  • directx随意卸directx90怎么卸载

    用什么办法可以卸载Directx9.0c1、要卸载Directx0,首先在计算机的开始菜单中选择设置选项。接着,打开控制面板,在控制面板中找到并点击“添加/删除程序”工具。在添加/删除程序界面中,你可以看到已经安装的程序列表,找到并选择Directx0的程序。点击“卸载”按钮,按照屏幕提示操作,系

    2025年03月25日
    106
  • 大枣的功效大枣的功效与作用禁忌和食用方法

    中药大枣的功效与作用1、健脾益胃大枣可以起到健脾养胃的作用,对于脾胃虚弱和腹痛均有调理作用。脾胃功能差的人服用可以帮助增加食欲,改善胃胀胃酸等胃部不良症状,还可以与党参或者白术等中草药一同使用,疗效会更加显着。2、大枣,作为一味传统中药材,不仅因其甘甜的口感深受人们喜爱,更因其独特的药效而被广泛

    2025年03月30日
    65
  • 凤凰甘油一号凤凰甘油一号可以长年涂抹身体吗

    百雀羚凤凰甘油一号的使用体验如何?百雀羚凤凰甘油一号是否适合直接涂抹在脸部?答案是可以的。甘油作为一种多功能的保湿成分,具有独特的吸湿特性。其两面性在保湿过程中发挥着重要作用。当皮肤周围的环境较为干燥时,甘油能够吸收皮肤表面的水分,帮助锁住肌肤的水分。相反,当环境湿度较高时,它则会从空气中吸收水分

    2025年03月31日
    100
  • 大朗什么时候解封(全域低风险东莞大朗最后一处解封)

    据“莞香花开”4日晚消息1月5日零时起东莞全域低风险!↓↓根据国家和省关于应对新冠肺炎疫情分区分级防控的工作要求,经东莞市新冠肺炎防控指挥部同意,自2022年1月5日零时起,东莞市大朗镇长塘社区长塘花街二街(133号、143号、163号)由中风险地区调整为低风险地区。调整后,东莞市全域均为低风险地区

    2025年04月03日
    72
  • markermarker条带图

    marker中文意思是什么?marker释义:n.标记;做记号的工具;做记号的人;记分员词汇搭配:markerpen标记笔reflectivemarker反射标志markerbuoy标志浮标markermethod标示法双语例句:Youcanseetheblade

    2025年04月23日
    60
  • 上海疫情最新情况最新消息今天(上海本土新增39加327)

    上海市卫健委今早(12月8日)通报:2022年12月7日0—24时,上海新增本土新冠肺炎确诊病例39例和无症状感染者327例。新增境外输入性新冠肺炎确诊病例9例和无症状感染者73例。本土病例情况2022年12月7日0—24时,上海新增本土新冠肺炎确诊病例39例。治愈出院24例。病例1—病例17,居住

    2025年04月27日
    53
  • 里昂:因内地竞争加剧 降维他奶国际目标价至9.4港元

      里昂发布研报称,维他奶国际(00345)周二(24日)公布截至今年3月底止全年业绩,纯利2.35亿港元,同比升101.7%;收入62.74亿港元,同比升0.9%,2025财年净利润,较该行预测低4%。另外,因中国内地饮料行业竞争加剧,该行基于不变的8.1%加权平均资本成本(WACC),下调现金

    2025年06月25日
    36
  • 全球市场又回到“黄金为王”?

      来源:华夏ETF  9月伊始,美联储降息预期升温,国际金价抬头,突破4月前高;  9月6日凌晨,非农就业数据再度走低,现货黄金历史上首次站上了3600美元/盎司,再度刷新历史新高。  黄金又行了吗?近期有哪些利好?  一、黄金重回上行?   自4月22日创下新高以来,黄金市场存在一定

    2025年09月07日
    7
  • 摩根大通CEO杰米·戴蒙:美国经济正在走弱

      摩根大通首席执行官杰米·戴蒙表示,美国劳工部周二发布的一份报告证实,美国经济正在放缓。  劳工部将截至2025年3月的非农就业数据从最初的估计下调了91.1万个。这是华尔街对经济下滑预期的偏高,也是20多年来最大的修正。  “我认为经济正在走弱,”戴蒙说。“我不知道它是在走向衰退,还是只是

    2025年09月10日
    2

发表回复

本站作者后才能评论

评论列表(4条)

  • 乙青柏
    乙青柏 2025年09月12日

    我是发展号的签约作者“乙青柏”!

  • 乙青柏
    乙青柏 2025年09月12日

    希望本篇文章《梁文锋署名!DeepSeek再发论文》能对你有所帮助!

  • 乙青柏
    乙青柏 2025年09月12日

    本站[发展号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 乙青柏
    乙青柏 2025年09月12日

    本文概览:  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   近日,DeepSeek团队发布了新论文,以DeepSeek-V3为代表,深入解读DeepSee...

    联系我们

    邮件:发展号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们