ascend-910b - 标签 - 军舰的日志

2025年12月1日星期一

未来 5 年公司智算需求预测

用半精度浮点数（FP16）计算能力评估服务器的智能计算能力，服务器算力=处理器芯片数x每时钟周期执行单精度浮点运算次数x处理器主频x处理器核数。

全球算力概览

中国算力概览

截至 2025 年 3 月底，我国智算规模达 748EFLOPS（FP16），近五年平均增速达 49%。

公司算力概览

昇腾 910B4 (32GB) 算力概览

配置级别	硬件描述	FP16 峰值算力	备注
单卡	昇腾 910B4 (32GB)	280 TFLOPS	单卡 FP16 算力峰值
单机	Atlas 800I A2 服务器 (8 x 910B4)	2240 TFLOPS ( $2.24 \text{ PFLOPS}$ )	服务器搭载 8 张 910B4 卡
集群	5 台 Atlas 800I A2 服务器	11.2 PFLOPS	由 5 台服务器组成的集群

NVIDIA T4 (16GB) 算力概览

配置级别	硬件描述	FP16 峰值算力	备注
单卡	NVIDIA T4	65 TFLOPS	使用混合精度 Tensor Cores
单机	4 卡服务器	260 TFLOPS	服务器搭载 4 张 T4 卡
集群	4 台 4 卡服务器	1.04 PFLOPS	由 4 台服务器组成的集群

总算力

2025-12-01 10:00

ai-computing 智算算力 fp16 ascend-910b nvidia-t4 pflops compute-prediction

2024年10月31日星期四

华为 Atlas A2 算力切分

算力切分

查询算力切分模式

sudo npu-smi info -t vnpu-mode

    vnpu-mode                      : docker

查询算力切分模板信息 sudo npu-smi info -t template-info +------------------------------------------------------------------------------------------+ |NPU instance template info is: | |Name AICORE Memory AICPU VPC VENC JPEGD | | GB PNGD VDEC JPEGE | |==========================================================================================| |vir10_3c_16g 10 16 3 4 0 12 | | 0 1 2 | +------------------------------------------------------------------------------------------+ |vir10_4c_16g_m 10 16 4 9 0 24 | | 0 2 4 | +---------------------------

2024-10-31 10:00

huawei atlas-a2 npu 算力切分 vnpu ascend-910b docker mindie llm

2 篇文章带有标签 “ascend-910b”

2025年12月1日 星期一

未来 5 年公司智算需求预测

2024年10月31日 星期四

华为 Atlas A2 算力切分

2025年12月1日星期一

2024年10月31日星期四