4 篇文章带有标签 “Atlas800”

2024年11月7日星期四

华为 Atlas A2 上使用 LLaMA-Factory 模型微调

云资源
- ModelArts
  - 开发环境
    - Notebook

自定义镜像：llama2
类型：ASCEND
规格：Ascend: 8*Ascend910 ARM: 192核 768GB
存储配置：云硬盘EVS
- 磁盘规格：200GB

工作目录：/home/ma-user/work

pip install --upgrade modelscope

编辑 download.py 文件

#模型下载
from modelscope import snapshot_download
model_dir = snapshot_download('Qwen/Qwen1.5-7B-Chat')

export MODELSCOPE_CACHE=/home/ma-user/work

python download.py

ll /home/ma-user/work/hub/Qwen/Qwen1___5-7B-Chat

修改配置文件：Qwen/Qwen1___5-7B-Chat/config.json

{
  "torch_dtype": "float16",
}

NPU 不支持 bfloat16，模型配置文件需要修改为 float16。

git clone https://github.com/hiyouga/LLaMA-Factory

❌ 网络不稳定，多试几次。

2024年11月7日 1 分钟 415 字

2024年10月31日星期四

华为 Atlas A2 算力切分

创建 vNPU 后查询可以看到 vNPU 的信息

2024年10月31日 1 分钟 152 字

Atlas800 NPU 910B4 MindIE LLM Atlas800 vNPU

2024年10月10日星期四

华为 Atlas 800I A2 服务器的大模型推理性能压测

❌ --stream 不要加，经常出问题。

--read-timeout: 网络读取超时
--parallel: 并发数
-n: 请求数

压测命令

evalscope perf \
    --api openai \
    --url 'http://127.0.0.1:1025/v1/chat/completions' \
    --model 'qwen' \
    --dataset openqa \
    --dataset-path './datasets/open_qa.jsonl' \
    --max-prompt-length 8000 \
    --stop '<|im_end|>' \
    --read-timeout=120 \
    --parallel 1 \
    -n 1

压测命令 evalscope perf \ --api openai \ --url 'http://127.0.0.1:1025/v1/chat/completions' \ --model 'qwen' \ --dataset openqa \ --dataset-path './datasets/Codefuse-Evol-Instruct-Clean-data.

2024年10月10日 10 分钟 2,109 字

EvalScope Atlas800 NPU MindIE vLLM Benchmark LLM

2024年10月8日星期二

在华为 Atlas 800I A2 服务器上搭建大模型推理服务

NPU	GPU
CANN	CUDA
MindSpore	PyTorch
MindFormer	Transformers
MindIE	vLLM

Qwen1.5-7B

git clone https://www.modelscope.cn/Qwen/Qwen1.5-7B-Chat.git

Qwen2-7B ❌

git clone https://www.modelscope.cn/Qwen/Qwen2-7B-Instruct.git

Qwen2-72B

git clone https://www.modelscope.cn/Qwen/Qwen2-72B-Instruct.git

DeepSeek-Coder-6.7B

git clone https://www.modelscope.cn/deepseek-ai/deepseek-coder-6.7b-instruct.git

StarCoder2-15B ❌

git clone https://www.modelscope.cn/AI-ModelScope/starcoder2-15b.git

CodeGeeX2-6B ❌

git clone https://www.modelscope.cn/ZhipuAI/codegeex2-6b.git

缺少软件包 sentencepiece。

因为 MindIE 不支持 bin 格式的模型，需要将模型转换为

2024年10月8日 1 分钟 207 字

Atlas800 NPU 910B4 MindIE LLM

4 篇文章带有标签 “Atlas800”

2024年11月7日 星期四