Xorbits Inference: 模型服务变得更容易 macOS 上安装(M2) conda create -n xinference python=3.10.9 conda activate xinference pip install -U pip pip install xinference # GGML CMAKE_ARGS="-DLLAMA_METAL=on" pip install llama-cpp-python 安装 GGML 引擎 使用 运行 Xinference 2024-05-08 00:00 · xinferencexorbits-inferencemodel-servingllmmacosapple-siliconchatboxdeploymentpython