分享好友 资讯首页 资讯分类 切换频道

DeepSeek提到的FP8到底是啥 引发AI圈热议(图)

2025-08-23 01:47200鼎巢网量子位

DeepSeek提到的FP8到底是啥 引发AI圈热议!DeepSeek V3.1发布后,一则官方留言在AI圈引起轰动。短短不到20个字的留言中提到新的架构和下一代国产芯片,信息量巨大。受此影响,国产芯片企业的股价纷纷上涨,例如寒武纪早盘盘中大涨近14%,总市值跃居科创板头名。半导体ETF也在半天内大涨5.89%。

许多人对UE8M0 FP8这一概念感到困惑。UE8M0 FP8可以拆分为两部分解释。UE8M0是MXFP8路径中的“缩放因子”,而MXFP8是Open Compute Project在2023年发布的8 bit微缩块格式。Open Compute Project是一个由Facebook(现Meta)、英特尔、Rackspace等发起的开源硬件协作计划,旨在通过共享数据中心及服务器设计推动行业效率提升。其成员包括微软、谷歌、亚马逊、AMD、英伟达以及国内的阿里、腾讯、百度等公司。

MXFP8基于FP8建立,将常规浮点格式压缩到8 bit。MXFP8的核心思想是将张量切成固定长度的“块”,为每个块指定一个2的整数次幂作为“缩放因子”,然后将块内所有数值除以这个系数后再写成FP8。这种块级的缩放方式保留了8 bit位宽,同时扩展了可用动态范围。UE8M0中的U表示无符号,E和M分别代表指数位和尾数位分配到的bit数。UE8M0指8个bit全部分配给了指数位。

采用全指数表示缩放因子的方式有多个好处。首先,处理器在根据缩放因子复原数据时只需移动指数位,无需进行浮点乘法、规格化或舍入逻辑,缩短了时钟关键路径。此外,UE8M0的动态范围覆盖2^(−127)到2^128,为后续块缩放提供了充足空间。它还能解决单尺度FP8无法同时处理大/小值的问题,减少了信息损失。

UE8M0 FP8更适配“下一代国产芯片”。目前,大部分已量产的国产AI加速器仍使用FP16/BF16 + INT8计算通路,未集成完整的FP8乘加单元。但摩尔线程MUSA 3.1 GPU、芯原VIP9000 NPU等新款国产芯片已在宣传资料中列出“原生 FP8”或“Block FP8”支持,并与多家厂商联合验证UE8M0格式。虽然下一代国产芯片在HBM/LPPDDR带宽方面仍有差距,但UE8M0让一组32个FP8数据只追加8bit缩放引子,相比传统FP32节省75%流量,成为重要优化方向。

打赏 0
任春生一审获刑12年 受贿案宣判
4月30日,北京市第二中级人民法院对上海保险交易所股份有限公司原党委书记、董事长任春生受贿案进行了公开宣判。法院判处任春生有期徒刑十二年,并处罚金人民币一百五十万元。追缴在案的受贿所得财物依法予以没收并上缴国库

0评论2026-04-3016

生猪产业监测预警专家咨询委员会成立 强化市场预期引导
农业农村部于4月28日召开生猪产业监测预警专家咨询委员会成立大会。会议指出,当前生猪产业供需关系发生深刻变化,加强产能综合调控十分必要。成立该委员会旨在凝聚行业共识、强化预警引导,探索政府在调控中的有效作用

0评论2026-04-3014

今年已累计安排两新设备更新资金1851亿元 助力多领域项目加速推进
国家发展改革委宣布,今年第二批915亿元超长期特别国债支持设备更新资金已下达

0评论2026-04-3015

这里的小麦出苗率提升近三成 大模型助力春耕
晨雾还未散尽,泥土清香扑面而来。河南省邓州市文渠镇农户段傲笛蹲在田埂上,往年他需要把手伸进泥土里才能感受干湿,决定农机是否下田。但现在,他只要在手机上点开“慧耕耘”小程序,“土壤墒情21%、适宜机械耕作”等提示就能让他心里有底

0评论2026-04-3015

五一出行客流全面迎来高峰 进出京客流创历史新高
“五一”假期临近,受旅游客流与市民出游交织叠加影响,本市将迎来全年交通流量高峰。预计铁路、民航、省际客运、公路自驾进出京日均487.9万人次,较2025年同期上升7.4%,创“五一”假期新高

0评论2026-04-3014

长沙孕妈在家测不到胎心紧急就医 专家:不及时处理可能脑瘫
近日,湖南省妇幼保健院产科联合麻醉科、新生儿科等多个学科,凭借快速反应和紧密协作,成功挽救了一名因胎儿窘迫而生命垂危的新生儿,充分彰显了我院在高危孕产妇救治方面的高效能力。4月17日上午,怀孕39+6周的王女士(化姓)因自己胎动减少,在家自...

0评论2026-04-3014