华为:昇腾超节点系列产品全面支持DeepSeek V4

2026-04-24 5 0

国外苹果ID 🔒点击进入购买✅ 海外各种账号

IT之家 4 月 24 日消息,今天上午,DeepSeek-V4 模型预览版正式上线并同步开源。

华为官方随后宣布,通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持 DeepSeek V4 系列模型

官方表示,昇腾 950 通过融合 kernel 和多流并行技术降低 Attention 计算和访存开销,大幅提升推理性能,结合多种量化算法,实现了高吞吐、低时延的 DeepSeek V4 。昇腾 A3 超节点系列产品也全面适配,同时为便于用户快速微调,提供了基于昇腾 A3 超节点的

IT之家获悉,基于 DeepSeek V4-Pro 模型,在 8K 输入场景,昇腾 950 超节点可实现 TPOT 约 20ms 时单卡 Decode 吞吐 4700TPS。DeepSeek V4-Flash 模型,8K 长序列输入场景下可实现 TPOT 约 10ms 时单卡 Decode 吞吐 1600TPS(上述 Benchmark 数据均基于 Offine 推理模式采集,不包含 Serving 调度和框架负载均衡影响)。

基于昇腾 A3 64 卡超节点结合大 EP 模式部署,DeepSeek V4-Flash 模型,8K/1K 输入输出场景,基于 vLLM 推理引擎可实现 2000+TPS 的单卡 Decode 吞吐,单卡吞吐持续提升。官方表示,针对 DeepSeek V4-Pro 模型,昇腾 A3 同步支持推理部署,性能持续优化中。

相关文章

联想拯救者手机Y70新一代搭载8000mAh电池,7年电池健康≧80%
告别“通用算力”谷歌为什么要做算力专属化?
天猫入局整车销售 联合长安推出首款甄选好车 启动百亿车补计划
深蓝汽车邓承浩:今年国内车市可能会出现微量下降
阿里云:4月30日10:00起 QoderTeams版新购价格调整为300RMB/席位月
“月球经济”蓄势待发?太空企业掌门:10年内人类将在月球“生活和工作”

发布评论