whisper.cpp - 标签 - 军舰的日志

2025年11月1日星期六

大模型（语言、视觉语言、语音）推理服务部署与测试

计算能力（CC）定义了每种 NVIDIA GPU 架构的硬件特性和支持的指令。在下表中查找您的GPU的计算能力。

docker run -it --rm \
  --ipc=host \
  --net=host \
  --runtime=nvidia \
  --name=vllm-test \
  -v /models:/models \
  -v ~/.cache/huggingface:/root/.cache/huggingface \
  -v ~/.cache/modelscope:/root/.cache/modelscope \
  nvcr.io/nvidia/vllm:25.10-py3 \
  bash

默认情况下，如果模型未指向有效的本地目录，它将从 Hugging Face Hub 下载模型文件。要从 ModelScope 下载模型，请在运行命令之前进行如下设置：

export VLLM_USE_MODELSCOPE=true

vllm serve /models/Qwen/Qwen3-8B \
  --served-model-name qwen3 \
  --chat-template /models/Qwen/Qwen3-8B/qwen3_nonthinking.jinja

2025年11月1日 2 分钟 467 字

LLM 推理 CUDA vLLM SGLang llama.cpp whisper.cpp curl

2025年10月19日星期日

whisper.cpp 实战指南（Jetson Thor 平台）

git clone https://github.com/ggml-org/whisper.cpp.git
cd whisper.cpp

cmake -B build -DGGML_CUDA=1 -DCMAKE_CUDA_ARCHITECTURES="110"
cmake --build build -j --config Release

sh ./models/download-ggml-model.sh small
sh ./models/download-ggml-model.sh large-v3-turbo

tiny.en
tiny
base.en
base
small.en
small
medium.en
medium
large-v1
large-v2
large-v3
large-v3-turbo

./build/bin/whisper-cli -f samples/jfk.wav
./build/bin/whisper-cli -m /models/whisper.cpp/models/ggml-large-v3-turbo.bin -f samples/jfk.wav

2025年10月19日 1 分钟 102 字

JetsonThor Jetson Thor whisper whisper.cpp TTS NVIDIA

2 篇文章带有标签 “whisper.cpp”

2025年11月1日 星期六

大模型（语言、视觉语言、语音）推理服务部署与测试

2025年10月19日 星期日

whisper.cpp 实战指南（Jetson Thor 平台）

2025年11月1日星期六

2025年10月19日星期日