DeepSeek的一串“符号”背后:对国产芯片意味着什么?

  “UE8M0 FP8是针对即将发布的下一代国产芯片设计。”   这是深度求索公司8月份在新发布新模型DeepSeek V3.1的文档中所留下的一个关键信息。   整个8月下...

  “UE8M0 FP8是针对即将发布的下一代国产芯片设计。”

  这是深度求索公司8月份在新发布新模型DeepSeek V3.1的文档中所留下的一个关键信息。

  整个8月下旬,这串“符号”成为国产芯片与算力行业在资本市场狂欢的“财富密码”。然而,对于非行业专业投资者来说,只有一头雾水,很难明白这串略显晦涩的代码到底意味着什么,可以让市场如此兴奋。

  “UE8M0 FP8”到底是什么意思?为什么它能引发资本市场对国产芯片的高度关注?而我们又需注意哪些不确定性?21世纪经济报道记者采访了数位AI和算力行业人士,并尝试为这三个问题找到一些解答。

  极致的效率追求

  首先“UE8M0 FP8”是什么意思?

  “FP”即“浮点”,是计算机二进制计算的基础单位,与“INT”整数计算相对应,常以科学计数法表达数据,适用于图形处理、科学计算、深度学习等应用场景。“FP8”即代表8位浮点,以此类推,FP16、FP32分别代表16位和32位浮点。而每个浮点位又分别用于记录符号(+、-)、“E”阶数(指数)、“M”尾数(小数)等关键数据信息,“通过科学计数法计算的方式”来记录数据。

  所以,“UE8M0 FP8”,即代表无符号、8位指数、0位尾数的参数格式。

  一个恰如其分的比喻是,“指数位E”是人工智能丈量世界的尺的刻度,它既能测量微观世界的尘埃,也能丈量宏观世界的山河——但是,它需要符号位和尾数“M”来帮它确认精度。而在主流的参数格式FP8、FP16、FP32等中,其主流参数格式对应的指数位分别为4位、5位和8位。

  其中,“FP32”是科学计算、模型训练和推理的金标准,但因浮点位数高,计算资源耗费巨大,常用“混合”了FP16、FP8的混合精度进行高效化替代。

  而“UE8M0”,就仿佛一个“百招会不如一招鲜”的高手,将自己所有的技能点全部聚焦到自己的量程之上,由此达到和FP32同样的数据范围。

  “E8M0是用8位表示指数部分,尾数部分为0,所以Scale(标度)的值范围上和FP32差不多,因为FP32也是8位表示指数部分,可以保证量化范围大,有利于模型训练的数值稳定。”前全球头部数据库企业高管许天(化名)告诉记者:“所以我理解E8M0对比FP32速度更快,对比E5M2类的FP8数值范围更大,训练更稳定。”

  当然,纯粹的“UE8M0”,自然会以舍弃精度作为代价。但是,由于Transformer架构(一种采用注意力机制的深度学习架构)下的AI大模型,其关键自注意力机制原本就依赖于浮点的大量程,因此 “UE8M0”创造了一种“牺牲局部精度,换取全局稳定”的人工智能计算格式。

  “UE8M0 FP8指的是一种为中国市场而特别定制的模型格式,能有效降低计算功耗,基于芯片规格的限制,此格式对中国的芯片厂商比较友好。”Omdia首席分析师苏廉节告诉记者。“相比之下,海外的厂商是直接采用标准的FP,如E3M4或E5M2等。”

  为“中国AI+”而生

  那么“UE8M0 FP8”为何适用于国产芯片?

  毫无疑问,受制于技术积淀时间较短,而基于中国标准的算力生态建设还需完善,因此,国产算力硬件在制程、速率、电耗等标准上存在较大的提升空间。

  而采用“UE8M0 FP8”格式深度适配国产芯片,并不仅仅是一项技术上的选择,更是基于国产芯片的发展现状、实际产业需求以及特定应用场景所共同推动的结果。本质上是一次用算法创新弥补硬件短板,用生态协同构建自主路线的战略考量。

  比如,国产芯片在先进制程(如7nm及以下)的制造和封装技术上与国际顶尖水平存在差距,直接影响了芯片的算力密度。主流的矩阵乘法和卷积等编码方式需要耗费极大算力以保留精度,而UE8M0的纯指数编码格式,将计算简化为指数移位和加法操作,大幅降低了大量算力负荷。

  与此同时,长期以来AI领域由英伟达CUDA生态主导,导致国产芯片往往需要兼容CUDA,且难以充分发挥自身硬件特性,也很难开拓性地建立自己的生态系统。

  而“UE8M0”作为一种更加开源、未被单一厂商绑定的格式,可能成为国产芯片重建生态体系的关键。

  无独有偶,虽然未来“UE8M0 FP8”仍然会基于混合精度模式驱动语言类大模型应用,但是广义的人工智能又绝非“大语言模型”这么简单。比如,在今年年初DeepSeekV2问世之后,不仅人们在生活之中开始处处使用大语言模型交互,而且更多的企事业单位也对DeepSeek进行本地化、私有化部署,并通过语料后训练等用于各种专用用途。

  事实上,除大语言模型之外,明确定义的专用用途AI大模型更需具备大量程、高稳定、高效率的算力特点。

  比如,常被应用于自动驾驶和人形机器人具身智能的多模态VLA模型,满足高效计算、大内存带宽和极大动态范围的需求,特别是在处理多模态、大规模数据且部署在计算资源受限的边缘设备时,优势明显;而在工业质检、政务文档处理等场景,往往需要低延迟、高准确率的AI模型,并且对成本敏感。

  简而言之,在明确定义的专用场景之中,“UE8M0 FP8”能够发挥其高效、稳定的特点,在配合混合参数精度的情况下,很可能是更适合“中国速度”,以及千行百业“AI+”的参数格式。

  留意“不确定性”

  当然,这个“UE8M0”背后仍然蕴藏着不确定性,如人形机器人精确操作依赖高精度的VLA架构,如原生的中文大语言模型,也需要高精度来显得更为“智慧”。

  8月以来,随着DeepSeekV3.1的发布,AI芯片企业寒武纪股价8月涨幅高达110%。

  资料显示,寒武纪的算力芯片思元590及可能于未来发布的690系列芯片均原生支持FP8计算,而沐曦、燧原等国产AI芯片厂商也均表态其适配FP8计算。

  8月末,阿里巴巴公司也宣称,其即将推出自研的AI算力芯片,并且会适配英伟达的CUDA生态,但未明确其是否适配FP8参数格式。

  那么,DeepSeek所预言的下一代FP8芯片究竟归属哪家?21世纪经济报道记者咨询多位业内人士之后,仍未获得进一步的信息。记者获得的绝大部分说法是:各家均没有明确的迹象,显示其使用了“UE8M0 FP8”混合参数模型。

  “我认为这是DeepSeek在向国产芯片行业提出自己的标准,”另一位中资全球化数字科技企业高管告诉记者:“这一逻辑的根源是,DeepSeek已经在中国获得了绝对的行业地位和市占率,因此它有能力让芯片厂商根据自己的生态系统去定义芯片设计。”

  这位不具名高管还向记者透露,虽然国产芯片对英伟达Hooper架构系列芯片的追赶已初见成效,如寒武纪等公司宣称其新品能力在专用场景下的能力达到H100的80%,但随着英伟达Blackwell系列芯片的推出(其甚至采用了FP4的混合精度架构),以及特供中国B30a系列芯片的发货,国产芯片追赶国际一流芯片能力上仍有较长的路要走。

  不过,多数受访专家认为,国内企业芯片最终将获得成功,这需要仰赖其性能具备充分竞争优势。

  (文章来源:21世纪经济报道)

本文来自作者[千青]投稿,不代表发展号立场,如若转载,请注明出处:https://fastcode.vip/txbk/202509-47110.html

(8)

文章推荐

  • 美国高级官员:特朗普考虑终止对乌克兰的所有军事援助

      记者JohnHudson在社媒平台X上发帖称,美国一位不具名高级官员透露,特朗普政府考虑停止向乌克兰提供所有军事援助。  此前据报道,美国和乌克兰没有签署有关美国开发乌克兰自然资源的协议。

    2025年03月01日
    87
  • 何时卖出股票?比较“艺术化”!圆信永丰基金胡春霞:三种情况下会考虑卖出

    专题:2025女神节:致敬基金圈“她力量”解析女性投资理财  3月6日,消费行业蛇年有哪些投资机遇,白酒估值是否调整到位?哪些细分领域有确定性机会?知名基金博主揭幕者对话圆信永丰基金权益投资总监胡春霞为您解析>>视频直播  备注:公开数据过往管理产品年化回报5.45%,今年以来回报1

    2025年03月06日
    94
  • 成都特色美食加盟成都美食加盟排行榜前十名

    餐饮加盟店最火爆的项目20231、饮品加盟店:随着消费者对健康饮品需求的增长,饮品加盟店成为了投资的热点。茶饮店凭借其将传统与现代相结合的特色,吸引了众多消费者。加盟商通常可以享受到总部提供的产品配置和调试服务,确保饮品的高品质。市场上已经有许多有影响力的品牌,为加盟商带来了稳定的客源。2、萝卜牛

    2025年03月28日
    65
  • Moneta Markets亿汇:特朗普关税与低油价冲击美国能源交易

    5月23日,美国石油行业的并购活动在经历了两年的繁荣之后,如今因高质量目标减少、资本收紧和原油价格疲软而显著降温。MonetaMarkets亿汇表示,特朗普总统的关税政策和市场的不确定性进一步削弱了行业的信心和交易意愿。  MonetaMarkets亿汇进一步认为,2023年和2024年的

    2025年05月23日
    46
  • 获纳入港股通标的名单,布鲁可盘中涨超10%,蜜雪集团涨超8%,古茗涨超5%

      6月9日消息,布鲁可盘中涨超10%,蜜雪集团涨超8%,古茗涨超5%。    消息面上,布鲁可、古茗、蜜雪集团今日起正式进入港股通名单。据上交所公告,布鲁可、古茗、蜜雪集团被调入沪港通下港股通标的名单,变动将于6月9日周一起生效。

    2025年06月09日
    47
  • 汇川技术子公司联合动力创业板IPO过会 A股分拆上市现新信号

    汇川技术分拆子公司上市迎来重要进展。6月12日,上海证券报记者从深交所获悉,联合动力首次公开发行股票并在创业板上市申请获得深交所上市审核委员会审核通过。这是2025年首单“A拆A”IPO过会,传递了A股分拆上市新信号。在业内看来,A股分拆上市整体“降温”后,汇川技术分拆联合动力的案例颇具风向标意义

    2025年06月14日
    43
  • 高尔夫美巡赛任命NFL高管罗拉普为新任CEO

      世界顶级高尔夫巡回赛美巡赛(PGATour)官方周二宣布,任命美国国家橄榄球联盟(NFL)高管布莱恩-罗拉普(BrianRolapp)为下一任首席执行官,接替现任主席杰伊-莫纳汉(JayMonahan)。  莫纳汉将逐步移交日常管理职责,并于2026年底正式卸任。他在声明中表示,去年已

    2025年06月18日
    33
  • 停牌!301079,宣布重大资产重组

    此次交易预计构成重大资产重组,不会导致公司实际控制人的变更,不构成重组上市。邵阳液压(301079)6月22日晚公告,公司拟通过发行股份及支付现金方式购买重庆新承航锐科技股份有限公司(简称“新承航锐”)全部或部分股份并募集配套资金。本次交易不会导致公司实际控制人变更,最终交易对方、标的资产范围等具

    2025年06月22日
    26
  • 泽连斯基:乌克兰寻求在土耳其与俄罗斯代表举行会谈

      乌克兰总统沃洛迪米尔·泽连斯基在社交媒体平台X发帖表示,乌克兰寻求在土耳其与俄罗斯代表举行会谈,届时基辅将提出举行领导人峰会的可能性,并讨论战俘及被掳儿童的返还问题。  泽连斯基重申,结束冲突的有效谈判只能在国家领导人层面进行。  泽连斯基表示,乌克兰国家安全与国防委员会主席RustemU

    2025年07月22日
    17
  • 苹果挂绳卖479元,罗永浩:可以说脏话吗

      9月10日凌晨1点,2025苹果秋季新品发布会发布iPhone17系列。其中苹果手机斜挎挂绳卖479元引发网友热议。苹果客服对此回应称,挂绳采用再生PET环保材质和特殊的编制工艺,价格定价确实不便宜,用户可按需购买。  对此,罗永浩转发微博并表示:可以说脏话吗……

    2025年09月10日
    4

发表回复

本站作者后才能评论

评论列表(4条)

  • 千青
    千青 2025年09月12日

    我是发展号的签约作者“千青”!

  • 千青
    千青 2025年09月12日

    希望本篇文章《DeepSeek的一串“符号”背后:对国产芯片意味着什么?》能对你有所帮助!

  • 千青
    千青 2025年09月12日

    本站[发展号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 千青
    千青 2025年09月12日

    本文概览:  “UE8M0 FP8是针对即将发布的下一代国产芯片设计。”   这是深度求索公司8月份在新发布新模型DeepSeek V3.1的文档中所留下的一个关键信息。   整个8月下...

    联系我们

    邮件:发展号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们