价值归集到模型层之后,产业如何收束成终局?本篇的判断是:算力正国家基础设施化,"国家队算力中心 + DeepSeek"构成主导供给;曾真实存在的"建而不用"利用率软肋,其架构根因正被昇腾 950 与 DeepSeek 的软硬协同系统性破解,2026–2027 兑现;而终局更可能是"分层共存"——无论通用层是 DeepSeek 还是华为盘古胜出,昇腾生态都受益。
算力的国家基础设施化
算力正演化为国家级公共基础设施,这是既有国策的延续而非推测:东数西算自 2022 年启动、布局八大枢纽,据媒体测算三年累计直接投资逾 1.5 万亿元、带动相关投资逾 5 万亿元(全产业链口径,官方枢纽节点对照口径较小);主管部门明确提出让算力"像水电一样"便捷使用。国际层面,"主权 AI"思潮提供同向框架。
在此之上,一个约 2 万亿元规模的国家算力战略正在推进,目标以本土技术为主(据报道占比不低于八成),实质排除海外高端芯片。须按原口径标注:公开信源(彭博,2026-06-09)将其表述为"计划形成中、未经证实"的草案,不应写成既定政策。政治经济偏好自主可控,"国家队算力中心 + DeepSeek"构成主导供给结构;其中"第五大运营商"是对该结构的类比性表述(标注为类比 / 推演)。
国产化:从规划转为实单
需求侧的核心瓶颈,已从"性能"转向"产能"。
昇腾 950PR 已于 2026 年 3 月首发、4 月起量产,全面出货预计 2026 下半年。据路透引述三位知情人士,华为 2026 年出货目标约 75 万颗;字节跳动 2026 年承诺采购约 56 亿美元(媒体按单价折算约 35 万颗、近华为全年产能一半),叠加阿里、腾讯订单,三家合计已超 50 万颗(多源汇总口径,非官方硬数字)。据《金融时报》,华为 2026 年 AI 芯片收入有望约 120 亿美元、同比增长至少 60%(华为内部目标,路透注明无法独立核实)。
同期,DeepSeek 已于 2026 年 6 月 16 日正式完成首轮外部融资逾 500 亿元(约 74 亿美元,投后估值逾 500 亿美元;据 The Information,未经官方确认),梁文锋经有限合伙绝对控股、商业投资人五年锁定无投票权,仅国家人工智能产业投资基金保留投票权,资金投向 AGI 研发、工程人才与专用硬件。
利用率软肋:不是"不能用",是架构
国产化拐点已现:截至 2025 年一季度,八大枢纽算力总规模约 215.5 EFLOPS、智算占比逾八成(国家数据局);2025 年中国 AI 加速卡出货约 400 万张,英伟达(NVDA)份额降至约 55%、国产升至约 41%(首次破四成),其中华为昇腾约 81.2 万张、国产第一(约 20%,IDC 口径)。
IDC 提供自建集群<30%、通用算力中心 10–15% 的基准;部分智算中心<40%;国产卡部分项目闲置率高达 80%、部分智算中心国产芯片利用率不足 20% 为不具名业内人士口径,未经证实。数值为利用率上限。
但利用率曾是真实软肋:据 IDC 与业内调研,自建集群平均利用率往往低于 30%、通用算力中心仅 10–15%;部分智算中心低于 40%;国产卡闲置更甚——部分项目闲置率高达 80%、部分智算中心国产芯片利用率不足 20%(后者为不具名业内人士口径)。这与"规划时假设满载"相去甚远,曾削弱把国家算力导向出口的经济基础。
软肋的主要技术根因在 910B/910C 的架构,而非"国产卡不能用"。
| 架构根因(910B/910C) | 软肋 | 昇腾 950 解法 |
|---|---|---|
| 计算范式 | 达芬奇 NPU(非 SIMT),CANN 生态不及 CUDA | 升级 SIMD/SIMT(CANN Next),缩小与 CUDA 差距 |
| 内存带宽 | 910B 约 400GB/s,推理 Decode 阶段瓶颈 | 自研 HBM,互联带宽 +2.5× 至 2TB/s |
| 数据精度 | 仅 FP16/BF16+INT8,无原生 FP8 | 原生 FP8 / MXFP8 / HiF8 / FP4 |
叠加政绩工程式过度上马、异构调度难等非架构因素,才共同形成"建而不用"。
昇腾 950 与 DeepSeek:软硬协同破解
解法之一是昇腾 950 系列从架构对症下药(以下规格均为华为厂商自报)。据华为全联接大会 2025 路线图,昇腾 950PR(Prefill / 推理,2026 量产)与 950DT(Decode / 训练,2026Q4)将微架构升级为 SIMD/SIMT(CANN Next 新增 SIMT),缩小与 CUDA 范式的差距;采用华为自研 HBM(950PR 用 HiBL 1.0、950DT 用 HiZQ 2.0),互联带宽提升约 2.5 倍至 2TB/s,正面解决 Decode 带宽瓶颈;原生支持 FP8/MXFP8/HiF8/FP4,并按 Prefill(吃算力)/ Decode(吃带宽)分工设计两款芯片。据厂商口径,自研低成本 HBM 使推理硬件成本下降逾 40%。配套的 Atlas 950 SuperPoD(8192 卡,2026Q4)、Atlas 960 SuperPoD(15488 卡,2027Q4)把超节点互联做成直接增量。
解法之二是 DeepSeek 的软硬协同。DeepSeek-V3.1 采用 UE8M0 FP8 精度(一组 32 个 FP8 仅追加 8bit 缩放因子,FP8 较 FP16 省 50–75% 显存),直击带宽瓶颈,被媒体广泛解读为面向下一代国产芯片(模型卡未点名,属媒体推断)。更关键的是,DeepSeek V4 已于 2026 年 4 月 24 日发布并开源(V4-Pro / V4-Flash,MIT),完成向昇腾 950 的迁移(从 CUDA 到 CANN);据报道,这一迁移是 V4 此前延期的主因之一(亦有内部决策、芯片供应等并存归因),也是"国产全栈跑通前沿模型"的标志性样本。
- 昇腾 950 规格(华为全联接大会 2025 自报):SIMD/SIMT、自研 HBM(HiBL 1.0 / HiZQ 2.0)、互联带宽 2TB/s(+2.5×)、原生 FP8/MXFP8/HiF8/FP4、Prefill/Decode 分工;950PR 2026-03 首发、4 月量产。
- 国产化拐点(国家数据局 / IDC):八大枢纽约 215.5 EFLOPS、智算逾八成;2025 国产 AI 加速卡份额约 41%(昇腾约 81.2 万张、国产第一)。
- DeepSeek V4 已于 2026-04-24 发布开源、完成向昇腾 950 迁移;首轮融资逾 500 亿元于 2026-06-16 完成(The Information,未经官方确认)。
- 75 万颗出货目标、字节 56 亿美元(≈35 万颗)、三家超 50 万颗、华为 120 亿美元收入等,为路透、金融时报、媒体折算或多源汇总口径,部分未经官方证实("有望""目标")。
- 约 2 万亿元国家算力战略为彭博草案("计划形成中、未经证实");"第五大运营商"为类比表述;自研 HBM 成本降逾 40% 为厂商口径、无第三方验证。
- "UE8M0 FP8 专为国产芯片设计"为媒体推断;"V4 延期主因为 CUDA→CANN 迁移"为主流但有争议的媒体综合(并存内部决策、芯片供应等归因)。
- 利用率软肋的架构根因,正被昇腾 950(SIMT+自研 HBM+Prefill/Decode 分工)与 DeepSeek(UE8M0 FP8+稀疏注意力+V4 迁移)的软硬协同系统性破解,方向已通。
- 但"完全解决"待两点兑现:节奏(950PR 2026 量产、950DT 2026Q4,替换 910B 贯穿 2026–2027);边界(国产 HBM 带宽与顶尖仍有差距,过度建设 / 异构调度需治理手段而非芯片本身解决)。
- 终局或为分层共存,"押昇腾生态"比"押单一模型"更稳。【推演】
"Token 出口枢纽":叙事还是现实
把国家集中算力导向出口型 Token 服务,目前更多是叙事而非商业现实。真正在出海的是"开源模型软实力",而非"中枢算力跨境售卖"。
a16z×OpenRouter《State of AI》给出 13% / 近 30%;2026-02 约 61% 为 OpenRouter 平台快照、媒体转述,限 Top10 token、集中于编码 / agentic 工作负载。系海外用户自行调用开源权重或第三方托管,非中国境内枢纽对外供给推理。
三重硬约束锁死短中期:先进芯片供给(昇腾年产能受限、主要内供)、国际信任与数据主权(目的国数据本地化法律与"中国枢纽供给推理"直接冲突)、跨境支付与时延。判断:短中期(1–3 年)高价值路径是"开源模型+本地化部署";"中国枢纽跨境卖 Token"宜作为长期愿景(2028 并网、产能释放后),而非当下现实。
备选终局:华为全栈、盘古与分层共存
除"国家队(昇腾 / 运营商)+ DeepSeek 作为模型层"的主线终局外,需并列华为正构筑的"全栈(昇腾算力 + 盘古模型 + 华为云)"备选终局。2026 年 6 月 12 日华为开发者大会,余承东(2025 年 9 月起主管华为 AI)宣布开源 openPangu 2.0(Pro 版总参 5050 亿 / 激活 180 亿,Flash 版 920 亿 / 激活 60 亿),强调昇腾算力亲和。
竞合而非零和:华为既是昇腾硬件龙头(向 DeepSeek、智谱、MiniMax 等供卡),又以盘古在模型层竞争;但余承东明确盘古"自留算力有限、要把昇腾大量支持国内企业",且盘古走政企 / 行业路线(政务、金融、制造、医疗、煤矿、钢铁、气象等 30+ 行业,主要经华为云交付),与 DeepSeek 的通用 / 开源 / Token 普惠路线短期错位大于冲突。
| 层级 | 主导者 | 路线 |
|---|---|---|
| 通用开源层 | DeepSeek 领先 | 通用 · 开源 · Token 普惠 |
| 政企行业层 | 华为盘古强势 | 政企 · 行业 30+ · 华为云交付 |
| 硬件层 | 昇腾通吃 | 算力底座 · 向各家供卡 |
对"终局论"的稳健推论是:无论通用层最终是 DeepSeek 还是盘古胜出,昇腾及其供应链都受益,"押昇腾生态"比"押单一模型"更稳。须中性标注:2025 年盘古曾陷开源模型"疑似套壳 / 洗水印"争议,双方各执一词、无最终定论,本文不作事实认定。
算力国家基础设施化已成定局;"建而不用"的利用率软肋,其架构根因正被昇腾 950 与 DeepSeek 的软硬协同破解、2026–2027 兑现;终局更可能是分层共存——无论 DeepSeek 还是盘古胜出,昇腾生态都受益。
- Q1昇腾 950PR 下半年实际出货能否逼近 75 万颗目标、八大枢纽利用率能否从约 30% 升至 60% 以上?
- Q2约 2 万亿元国家算力计划,会从“未经证实”的草案转为正式立项文件吗?
- Q3国产 HBM(如长鑫)的量产时点与良率能否坐实——这决定国产链能否闭环?
- Q4DeepSeek V4 随昇腾 950 超节点放量而大幅降价,会把推理需求与昇腾深度绑定吗?
- Q5终局是 DeepSeek 通用层胜出、华为盘古全栈胜出,还是如本框架所判——分层共存、昇腾通吃硬件层?
数据截至 2026/6/15(原报告口径),部分时点已联网更新至 2026/6(DeepSeek 首轮融资 6/16 正式完成、V4 于 4/24 发布开源)。昇腾 950 规格为华为厂商自报;出货 75 万颗、字节 56 亿美元、华为 120 亿美元收入等为路透 / 金融时报 / 媒体折算或多源汇总口径,部分未经官方证实;约 2 万亿元国家算力计划为彭博草案(未经证实);东数西算投资为媒体测算口径。引用以官方披露为准。本文为产业分析框架内容,不构成任何证券买卖要约或投资建议。
本文包含前瞻性陈述与示意性估算,仅供研究与信息参考,不构成对任何证券的买卖要约或投资建议。所引数据可能与最终披露存在差异,读者应独立核实并自行判断。