Xorbits Inference: 模型服务变得更容易 conda create -n xinference python=3.10.9 conda activate xinference pip install -U pip pip install xinference # GGML CMAKE_ARGS="-DLLAMA_METAL=on" pip install llama-cpp-python 安装 GGML 引擎 2024年5月8日 · 1 分钟 · 67 字 XinferenceLLMMacBookProM2Max