2 篇文章带有标签 “llm-benchmark”

2025年10月12日星期日

Jetson Thor 平台上 Qwen3 系列大模型性能基准测试分析

NVIDIA Jetson Thor 采用了 Blackwell 架构的 GPU。

性能基准测试分析

部署模型

vllm serve /models/Qwen/Qwen3-8B --served-model-name qwen3

运行性能基准测试

高负载

vllm bench serve \
    --base-url http://localhost:8000 \
    --model qwen3 \
    --tokenizer /models/Qwen/Qwen3-8B \
    --dataset-name random \
    --random-input-len 2048 \
    --random-output-len 128 \
    --num-prompts 100 \
    --max-concurrency 8

低负载

2025-10-12 06:00

2024年10月16日星期三

打包 Python 工程到 PyPI：构建 LLM 压测工具 evalscope-perf

创建 Python 工程 evalscope-perf

工程的目录结构

evalscope-perf/
├── evalscope_perf/
│   ├── __init__.py
│   └── main.py
├── README.md
├── LICENSE
├── pyproject.toml
└── setup.py

evalscope_perf/init.py

没有可以不写。

evalscope_perf/main.py import subprocess import re import typer import matplotlib.pyplot as plt from typing import List from typing_extensions import Annotated app = typer.

2024-10-16 10:00

python pypi packaging evalscope-perf setuptools twine typer cli llm-benchmark

2 篇文章带有标签 “llm-benchmark”

2025年10月12日 星期日

Jetson Thor 平台上 Qwen3 系列大模型性能基准测试分析

2024年10月16日 星期三

打包 Python 工程到 PyPI：构建 LLM 压测工具 evalscope-perf

2025年10月12日星期日

2024年10月16日星期三