国家算力国家队："建而不用"的软肋，正被昇腾 950 与 DeepSeek 破解

价值归集到模型层之后，产业如何收束成终局？本篇的判断是：算力正国家基础设施化，"国家队算力中心 + DeepSeek"构成主导供给；曾真实存在的"建而不用"利用率软肋，其架构根因正被昇腾 950 与 DeepSeek 的软硬协同系统性破解，2026–2027 兑现；而终局更可能是"分层共存"——无论通用层是 DeepSeek 还是华为盘古胜出，昇腾生态都受益。

算力的国家基础设施化

算力正演化为国家级公共基础设施，这是既有国策的延续而非推测：东数西算自 2022 年启动、布局八大枢纽，据媒体测算三年累计直接投资逾 1.5 万亿元、带动相关投资逾 5 万亿元（全产业链口径，官方枢纽节点对照口径较小）；主管部门明确提出让算力"像水电一样"便捷使用。国际层面，"主权 AI"思潮提供同向框架。

在此之上，一个约 2 万亿元规模的国家算力战略正在推进，目标以本土技术为主（据报道占比不低于八成），实质排除海外高端芯片。须按原口径标注：公开信源（彭博，2026-06-09）将其表述为"计划形成中、未经证实"的草案，不应写成既定政策。政治经济偏好自主可控，"国家队算力中心 + DeepSeek"构成主导供给结构；其中"第五大运营商"是对该结构的类比性表述（标注为类比 / 推演）。

国产化：从规划转为实单

需求侧的核心瓶颈，已从"性能"转向"产能"。

约 75 万颗

华为 2026 昇腾出货目标（路透 · 三位知情人士）

约 56 亿美元

字节跳动 2026 采购承诺（媒体折算 ≈35 万颗）

逾 500 亿元

DeepSeek 首轮融资（2026/6/16 完成 · The Information）

昇腾 950PR 已于 2026 年 3 月首发、4 月起量产，全面出货预计 2026 下半年。据路透引述三位知情人士，华为 2026 年出货目标约 75 万颗；字节跳动 2026 年承诺采购约 56 亿美元（媒体按单价折算约 35 万颗、近华为全年产能一半），叠加阿里、腾讯订单，三家合计已超 50 万颗（多源汇总口径，非官方硬数字）。据《金融时报》，华为 2026 年 AI 芯片收入有望约 120 亿美元、同比增长至少 60%（华为内部目标，路透注明无法独立核实）。

同期，DeepSeek 已于 2026 年 6 月 16 日正式完成首轮外部融资逾 500 亿元（约 74 亿美元，投后估值逾 500 亿美元；据 The Information，未经官方确认），梁文锋经有限合伙绝对控股、商业投资人五年锁定无投票权，仅国家人工智能产业投资基金保留投票权，资金投向 AGI 研发、工程人才与专用硬件。

利用率软肋：不是"不能用"，是架构

国产化拐点已现：截至 2025 年一季度，八大枢纽算力总规模约 215.5 EFLOPS、智算占比逾八成（国家数据局）；2025 年中国 AI 加速卡出货约 400 万张，英伟达（NVDA）份额降至约 55%、国产升至约 41%（首次破四成），其中华为昇腾约 81.2 万张、国产第一（约 20%，IDC 口径）。

图 01利用率曾是真实软肋：远低于'规划满载'

自建集群平均<30%

部分智算中心<40%

部分国产芯片<20%

说明 · NOTE

IDC 提供自建集群<30%、通用算力中心 10–15% 的基准；部分智算中心<40%；国产卡部分项目闲置率高达 80%、部分智算中心国产芯片利用率不足 20% 为不具名业内人士口径，未经证实。数值为利用率上限。

但利用率曾是真实软肋：据 IDC 与业内调研，自建集群平均利用率往往低于 30%、通用算力中心仅 10–15%；部分智算中心低于 40%；国产卡闲置更甚——部分项目闲置率高达 80%、部分智算中心国产芯片利用率不足 20%（后者为不具名业内人士口径）。这与"规划时假设满载"相去甚远，曾削弱把国家算力导向出口的经济基础。

软肋的主要技术根因在 910B/910C 的架构，而非"国产卡不能用"。

架构根因（910B/910C）	软肋	昇腾 950 解法
计算范式	达芬奇 NPU（非 SIMT），CANN 生态不及 CUDA	升级 SIMD/SIMT（CANN Next），缩小与 CUDA 差距
内存带宽	910B 约 400GB/s，推理 Decode 阶段瓶颈	自研 HBM，互联带宽 +2.5× 至 2TB/s
数据精度	仅 FP16/BF16＋INT8，无原生 FP8	原生 FP8 / MXFP8 / HiF8 / FP4

叠加政绩工程式过度上马、异构调度难等非架构因素，才共同形成"建而不用"。

昇腾 950 与 DeepSeek：软硬协同破解

解法之一是昇腾 950 系列从架构对症下药（以下规格均为华为厂商自报）。据华为全联接大会 2025 路线图，昇腾 950PR（Prefill / 推理，2026 量产）与 950DT（Decode / 训练，2026Q4）将微架构升级为 SIMD/SIMT（CANN Next 新增 SIMT），缩小与 CUDA 范式的差距；采用华为自研 HBM（950PR 用 HiBL 1.0、950DT 用 HiZQ 2.0），互联带宽提升约 2.5 倍至 2TB/s，正面解决 Decode 带宽瓶颈；原生支持 FP8/MXFP8/HiF8/FP4，并按 Prefill（吃算力）/ Decode（吃带宽）分工设计两款芯片。据厂商口径，自研低成本 HBM 使推理硬件成本下降逾 40%。配套的 Atlas 950 SuperPoD（8192 卡，2026Q4）、Atlas 960 SuperPoD（15488 卡，2027Q4）把超节点互联做成直接增量。

解法之二是 DeepSeek 的软硬协同。DeepSeek-V3.1 采用 UE8M0 FP8 精度（一组 32 个 FP8 仅追加 8bit 缩放因子，FP8 较 FP16 省 50–75% 显存），直击带宽瓶颈，被媒体广泛解读为面向下一代国产芯片（模型卡未点名，属媒体推断）。更关键的是，DeepSeek V4 已于 2026 年 4 月 24 日发布并开源（V4-Pro / V4-Flash，MIT），完成向昇腾 950 的迁移（从 CUDA 到 CANN）；据报道，这一迁移是 V4 此前延期的主因之一（亦有内部决策、芯片供应等并存归因），也是"国产全栈跑通前沿模型"的标志性样本。

■ 事实 / FACTS

昇腾 950 规格（华为全联接大会 2025 自报）：SIMD/SIMT、自研 HBM（HiBL 1.0 / HiZQ 2.0）、互联带宽 2TB/s（+2.5×）、原生 FP8/MXFP8/HiF8/FP4、Prefill/Decode 分工；950PR 2026-03 首发、4 月量产。
国产化拐点（国家数据局 / IDC）：八大枢纽约 215.5 EFLOPS、智算逾八成；2025 国产 AI 加速卡份额约 41%（昇腾约 81.2 万张、国产第一）。
DeepSeek V4 已于 2026-04-24 发布开源、完成向昇腾 950 迁移；首轮融资逾 500 亿元于 2026-06-16 完成（The Information，未经官方确认）。

◧ 假设 / ASSUMPTIONS

75 万颗出货目标、字节 56 亿美元（≈35 万颗）、三家超 50 万颗、华为 120 亿美元收入等，为路透、金融时报、媒体折算或多源汇总口径，部分未经官方证实（"有望""目标"）。
约 2 万亿元国家算力战略为彭博草案（"计划形成中、未经证实"）；"第五大运营商"为类比表述；自研 HBM 成本降逾 40% 为厂商口径、无第三方验证。
"UE8M0 FP8 专为国产芯片设计"为媒体推断；"V4 延期主因为 CUDA→CANN 迁移"为主流但有争议的媒体综合（并存内部决策、芯片供应等归因）。

□ 观点 / OPINIONS

利用率软肋的架构根因，正被昇腾 950（SIMT＋自研 HBM＋Prefill/Decode 分工）与 DeepSeek（UE8M0 FP8＋稀疏注意力＋V4 迁移）的软硬协同系统性破解，方向已通。
但"完全解决"待两点兑现：节奏（950PR 2026 量产、950DT 2026Q4，替换 910B 贯穿 2026–2027）；边界（国产 HBM 带宽与顶尖仍有差距，过度建设 / 异构调度需治理手段而非芯片本身解决）。
终局或为分层共存，"押昇腾生态"比"押单一模型"更稳。【推演】

"Token 出口枢纽"：叙事还是现实

把国家集中算力导向出口型 Token 服务，目前更多是叙事而非商业现实。真正在出海的是"开源模型软实力"，而非"中枢算力跨境售卖"。

图 02中国开源模型在 OpenRouter 的 token 占比：软实力出海

2024 年底≈0

2025 全年均13%

部分周~30%

2026-02 峰值61%·Top10

说明 · NOTE

a16z×OpenRouter《State of AI》给出 13% / 近 30%；2026-02 约 61% 为 OpenRouter 平台快照、媒体转述，限 Top10 token、集中于编码 / agentic 工作负载。系海外用户自行调用开源权重或第三方托管，非中国境内枢纽对外供给推理。

三重硬约束锁死短中期：先进芯片供给（昇腾年产能受限、主要内供）、国际信任与数据主权（目的国数据本地化法律与"中国枢纽供给推理"直接冲突）、跨境支付与时延。判断：短中期（1–3 年）高价值路径是"开源模型＋本地化部署"；"中国枢纽跨境卖 Token"宜作为长期愿景（2028 并网、产能释放后），而非当下现实。

备选终局：华为全栈、盘古与分层共存

除"国家队（昇腾 / 运营商）+ DeepSeek 作为模型层"的主线终局外，需并列华为正构筑的"全栈（昇腾算力 + 盘古模型 + 华为云）"备选终局。2026 年 6 月 12 日华为开发者大会，余承东（2025 年 9 月起主管华为 AI）宣布开源 openPangu 2.0（Pro 版总参 5050 亿 / 激活 180 亿，Flash 版 920 亿 / 激活 60 亿），强调昇腾算力亲和。

竞合而非零和：华为既是昇腾硬件龙头（向 DeepSeek、智谱、MiniMax 等供卡），又以盘古在模型层竞争；但余承东明确盘古"自留算力有限、要把昇腾大量支持国内企业"，且盘古走政企 / 行业路线（政务、金融、制造、医疗、煤矿、钢铁、气象等 30+ 行业，主要经华为云交付），与 DeepSeek 的通用 / 开源 / Token 普惠路线短期错位大于冲突。

层级	主导者	路线
通用开源层	DeepSeek 领先	通用 · 开源 · Token 普惠
政企行业层	华为盘古强势	政企 · 行业 30+ · 华为云交付
硬件层	昇腾通吃	算力底座 · 向各家供卡

对"终局论"的稳健推论是：无论通用层最终是 DeepSeek 还是盘古胜出，昇腾及其供应链都受益，"押昇腾生态"比"押单一模型"更稳。须中性标注：2025 年盘古曾陷开源模型"疑似套壳 / 洗水印"争议，双方各执一词、无最终定论，本文不作事实认定。

最后判断 · BOTTOM LINE

算力国家基础设施化已成定局；"建而不用"的利用率软肋，其架构根因正被昇腾 950 与 DeepSeek 的软硬协同破解、2026–2027 兑现；终局更可能是分层共存——无论 DeepSeek 还是盘古胜出，昇腾生态都受益。

Q1昇腾 950PR 下半年实际出货能否逼近 75 万颗目标、八大枢纽利用率能否从约 30% 升至 60% 以上？
Q2约 2 万亿元国家算力计划，会从“未经证实”的草案转为正式立项文件吗？
Q3国产 HBM（如长鑫）的量产时点与良率能否坐实——这决定国产链能否闭环？
Q4DeepSeek V4 随昇腾 950 超节点放量而大幅降价，会把推理需求与昇腾深度绑定吗？
Q5终局是 DeepSeek 通用层胜出、华为盘古全栈胜出，还是如本框架所判——分层共存、昇腾通吃硬件层？