40 篇文章带有标签 “Docker”

2025年7月31日星期四

华为 Atlas 800I A2 大模型部署实战（九）：Docker Swarm 分布式部署

该文本详细介绍了在华为 Atlas 800I A2 推理服务器集群上使用 Docker Swarm 部署大型语言模型（LLM）的实践过程。指导用户初始化 Docker Swarm 管理器节点并添加工作节点，以构建一个分布式计算环境。随后，文档展示了如何创建一个 Docker Stack 配置文件来部署两个不同的 LLM 服务（Qwen3-30B 和 Coder-32B），并说明了如何将容器映射到昇腾 NPU 设备。最后，文本提供了部署、检查服务状态以及故障排除（如禁用 firewalld）的命令，并指出此次实验部署未能成功❌。

AI 服务器：华为 Atlas 800I A2 推理服务器 X 5

组件	规格
CPU	鲲鹏 920（5250）
NPU	昇腾 910B4（8X32G）
内存	1024GB
硬盘	系统盘：450GB SSDX2 RAID1 数据盘：3.5TB NVME SSDX4
操作系统	openEuler 22.03 LTS

我们选择 172.16.33.106 作为 manager 节点。

docker swarm init --advertise-addr 172.16.33.106

执行后，会输出一段 docker swarm join 命令，类似下面这样：

2025年7月31日 2 分钟 475 字

昇腾 NPU 910B4 Atlas800IA2 vllm-ascend vLLM LLM Docker

2025年7月30日星期三

华为 Atlas 800I A2 大模型部署实战（八）：GPUStack 实现 GPU 集群化管理

本文章详细介绍了华为 Atlas 800I A2 推理服务器上部署大型AI模型的实践过程，重点围绕GPUStack这一开源GPU集群管理工具。文章首先阐述了GPUStack的核心特性，包括其广泛的兼容性、对多种模型和推理框架的支持、灵活的部署能力以及智能管理功能。随后，文档提供了在主服务器和从服务器上安装、配置和使用GPUStack的详尽步骤，并展示了如何通过NFS实现模型文件的统一存储，以优化多服务器集群中的模型调度效率。文中还包含了GPUStack用户界面的截图，帮助读者直观理解其各项功能。

AI 服务器：华为 Atlas 800I A2 推理服务器 X 5

组件	规格
CPU	鲲鹏 920（5250）
NPU	昇腾 910B4（8X32G）
内存	1024GB
硬盘	系统盘：450GB SSDX2 RAID1 数据盘：3.5TB NVME SSDX4
操作系统	openEuler 22.03 LTS

GPUStack 是一款开源的 GPU 集群管理器，专为运行 AI 模型设计，其核心特点如下：

广泛的兼容性：支持多厂商 GPU，覆盖苹果 Mac、Windows 电脑及 Linux 服务器，还能适配多种推理后端（如 vLLM、Ascend MindIE 等），并可同时运行多个版本的推理后端，满足不同模型的运行需求。

2025年7月30日 5 分钟 1,350 字

昇腾 NPU 910B4 Atlas800IA2 vllm-ascend vLLM LLM Docker

2025年7月19日星期六

华为 Atlas 800I A2 大模型部署实战（三）：MindIE 安装与部署 LLM

本文章提供了在 openEuler 操作系统上安装 Docker 的具体步骤，并指导用户下载、导入 MindIE 镜像，以及准备 LLM 模型文件。最后，文档展示了如何通过 Docker 容器运行和配置 MindIE 服务，并提供了通过 cURL 命令测试服务的示例，还包含了使用 Docker Compose 部署的详细配置。

AI 服务器：华为 Atlas 800I A2 推理服务器

组件	规格
CPU	鲲鹏 920（5250）
NPU	昇腾 910B4（8X32G）
内存	1024GB
硬盘	系统盘：450GB SSDX2 RAID1 数据盘：3.5TB NVME SSDX4
操作系统	openEuler 22.03 LTS

MindIE（Mind Inference Engine，昇腾推理引擎）是华为昇腾针对AI全场景业务的推理加速套件。通过分层开放AI能力，支撑用户多样化的AI业务需求，使能百模千态，释放昇腾硬件设备算力。向上支持多种主流AI框架，向下对接不同类型昇腾AI处理器，提供多层次编程接口，帮助用户快速构建基于昇腾平台的推理业务。

2025年7月19日 4 分钟 1,106 字

昇腾 NPU 910B4 Atlas800IA2 MindIE Docker openEuler

2025年7月1日星期二

Docker AI 功能详解与应用

本文档详细介绍了 Docker AI 的新功能，旨在通过集成人工智能提升开发者的体验。主要亮点包括 Docker Model Runner，它简化了 AI 模型的管理和部署，支持从各种注册表拉取和运行模型，并通过兼容 OpenAI 的 API 提供服务。此外，MCP Toolkit 实现了容器化 MCP 服务器的无缝设置和管理，而 Ask Gordon 则作为嵌入式 AI 助手，在 Docker Desktop 和 CLI 中提供上下文帮助，包括改进 Dockerfile 和故障排除等。这些功能共同旨在简化 AI 驱动型应用程序的开发和部署。

✅ Enable Docker AI (启用 Docker AI)
- 在 Docker Desktop 和命令行（CLI）中启用 “Ask Gordon” 功能。
✅ Enable Docker Model Runner (启用 Docker 模型运行器)
- 启用 GPU 加速的推理引擎，用于运行 AI 模型。
✅ Enable Docker MCP Toolkit (启用 Docker MCP 工具套件)
- 在 Docker Desktop 中启用 “MCP Toolkit” 功能。

registry-mirrors: https://registry.cn-hangzhou.aliyuncs.

2025年7月1日 3 分钟 826 字

Docker MCPToolkit MCP MCPServer AskGordon ModelRunner OpenAI API LLM

2023年5月21日星期日

Docker 构建多平台镜像

docker run 当您在使用此镜像时 docker service，Docker 会根据节点的平台选择正确的镜像。

有个缺点：必须发布到 Docker Hub 或者私有仓库，因为 Docker 不支持多架构的本地镜像。

查看构建器 docker buildx ls NAME/NODE DRIVER/ENDPOINT STATUS BUILDKIT PLATFORMS mybuilder * docker-container mybuilder0 desktop-linux running v0.9.3 linux/arm64, linux/amd64, linux/riscv64, linux/ppc64le, linux/s390x, linux/386, linux/mips64, linux/arm/v7, linux/arm/v6 default docker default default running v0.11.

2023年5月21日 2 分钟 447 字

Docker buildx multi-platform

2023年5月18日星期四

macOS Docker

今天用 Docker 构建镜像，突然就挂了。重启 Docker，发现 Docker 无法启动了。

2023年5月18日 1 分钟 214 字

Uninstall macOS Docker

2023年5月13日星期六

构建容器化 Python 应用程序

这里使用 Ultralytics Serving 作为示例，它是一个基于 FastAPI 和 Ultralytics YOLOv8 的模型推理服务。

Tag	Python Version	OS Version	Size
3.10	3.10	Debian GNU/Linux 11 (bullseye)	861MB
3.10-slim	3.10	Debian GNU/Linux 11 (bullseye)	114MB
3.10-alpine	3.10	Alpine Linux 3.15.0	44.7MB

2023年5月13日 4 分钟 1,063 字

Dockerfile Docker Cache pip apt venv wheel 知识扩展

2023年4月29日星期六

在 Hugging Face 上搭建 ChatGPT 聊天机器人

import openai
import tiktoken


class Conversation:
    def __init__(self, prompt, model="gpt-3.5-turbo", temperature=0.8, max_tokens=250):
        self.prompt = prompt
        self.model = model
        self.temperature = temperature
        self.max_tokens = max_tokens

        self._init_messages()

    def _init_messages(self):
        self.messages = [{"role": "system", "content": self.prompt}]
// ...

2023年4月29日 1 分钟 287 字

ChatGPT HuggingFace Docker Chatbot

2023年4月10日星期一

命令 alias

zsh 中使用单引号（'），不对特殊符号进行解析，使用双引号（"）会对特殊符号进行解析，如：$

docker rmi none

alias docker.rmi.none='docker rmi --force $(docker images -q --filter "dangling=true")'

2023年4月10日 1 分钟 45 字

Command Shell zsh Docker alias

基于 FastAPI 开发 Ultralytics Serving

.vscode/launch.json

{
    "version": "0.2.0",
    "configurations": [
        {
            "name": "Python: FastAPI",
            "type": "python",
            "request": "launch",
            "module": "uvicorn",
            "args": [
                "app.main:app",
                "--reload"
            ],
            "jinja": true,
            "justMyCode": true
        }
    ]
}

--reload 修改后可以自动加载，适用于开发。
Debug FastAPI in VS Code IDE
Debug FastAPI application in VSCode

docker build docker buildx build 如何构建多架构 Docker 镜像？

2023年4月10日 2 分钟 503 字

FastAPI SwaggerUI Ultralytics YOLO Docker OpenCV PyTorch Python

2022年3月24日星期四

基于健康码识别的 FastAPI 同步和异步函数的基准测试

健康码识别服务使用了 FastAPI 进行开发的，本周主要工作是为了对健康码识别的服务进行性能调优。接口函数使用了 async 关键字，但是内部的实现并没有使用 await。由于改写成异步代码需要时间，这里并没有改写代码，只是删除了 async 关键字。部署服务使用了 uvicorn 和 gunicorn+uvicorn 两种方法。

基准测试工具使用的是 ab

4 个进程可以发挥到最佳效果
8 个进程已经到了上限了
在部署这种密集计算的应用下，gunicorn + uvicorn 并没有比 uvicorn 强，但如果您需要管理进程，它们就是最佳组合。
通过基准测试发现，最大的瓶颈不是 GPU，而且 CPU，GPU 一张卡的负载还没有 40 核 CPU 的负载高。

异步（使用了 async 关键字）函数，在压测的过程中基本上不会失败（Failed）,同步函数，在压测过程中会经常失败，随着并发数的增加而增加。目前还没有找到原因

2022年3月24日 2 分钟 430 字

Linux FastAPI async gunicorn uvicorn ab Docker 工作日志测试

2022年2月28日星期一

MinIO Quickstart

使用容器的方式部署 MinIO

2022年2月28日 1 分钟 121 字

MinIO Docker docker-compose mkdir Storage

2022年2月17日星期四

OpenResty 内执行 Lua 脚本

OpenResty 是一款基于 NGINX 和 LuaJIT 的 Web 平台。

查看镜像的标签 $ sudo docker inspect openresty/openresty:centos | jq '.[].Config.Labels' { "maintainer": "Evan Wies <evan@neomantra.net>", "org.label-schema.build-date": "20210915", "org.label-schema.license": "GPLv2", "org.label-schema.name": "CentOS Base Image", "org.label-schema.schema-version": "1.0", "org.label-schema.

2022年2月17日 1 分钟 123 字

OpenResty Nginx Lua Docker inspect jq curl

2022年2月8日星期二

构建基于 ONNXRuntime 的推理服务

2022年2月8日 1 分钟 71 字

ONNX ONNXRuntime GPU CUDA Docker Dockerfile pip AI

2021年10月21日星期四

安装Kubernetes 1.21.5

删除 Kubernetes 旧版本，安装 Kubernetes 1.21.5。

重启服务

systemctl daemon-reload
systemctl restart docker

2021年10月21日 1 分钟 195 字

Docker timedatectl hostnamectl apt curl cat kubeadm export

2021年7月27日星期二

Docker 网络

2021年7月27日 1 分钟 2 字

ifconfig route Docker

2021年7月22日星期四

Docker SDK for Python Examples

import docker
import tarfile
import tempfile
import os

def simple_tar(path):
    f = tempfile.NamedTemporaryFile()
    t = tarfile.open(mode='w', fileobj=f)
    abs_path = os.path.abspath(path)
    t.add(abs_path, arcname=os.path.basename(path))
    t.close()
    f.seek(0)
    return f

client = docker.from_env()
// ...

2021年7月22日 1 分钟 38 字

Python Docker

2021年7月18日星期日

minikube

# minikube delete
🔄  正在使用 kubeadm 卸载 Kubernetes v1.17.3…
🔥  正在删除 none 中的“minikube”…
💀  Removed all traces of the "minikube" cluster.

rm -rf ~/.minikube/
rm -rf ~/.kube/
rm -f /usr/local/bin/minikube

解决办法：

minikube start --force --driver=docker

2021年7月18日 1 分钟 120 字

minikube Docker curl rpm yum Kubernetes

2021年7月4日星期日

ConfigMap和Secret：配置应用程序

指令	解释
ENTRYPOINT	容器启动时调用的命令
CMD	传递给 ENTRYPOINT 指定命令的参数

编写 Dockerfile

FROM busybox
ADD date.sh /date.sh
RUN chmod +x /date.sh
ENTRYPOINT ["/date.sh"]
CMD ["1"]

参数默认值为 1，在运行容器可以设置参数覆盖默认值。

构建镜像

docker build -t wangjunjian/date:args .

启动镜像

$ docker run wangjunjian/date:args
Tue Aug 3 13:08:04 UTC 2021
Tue Aug 3 13:08:05 UTC 2021

设置参数覆盖默认睡眠时间

$ docker run wangjunjian/date:args 3
Tue Aug 3 13:08:46 UTC 2021
Tue Aug 3 13:08:49 UTC 2021

覆盖默认的命令

$ docker run --entrypoint=/bin/sh wangjunjian/date:args
/ #

少量参数的设置可以使用上面的数组表示，当参数过多时可以使用下面的方式，如果参数是数值型需要使用引号。

    args:
    - str
    - "3"

2021年7月4日 8 分钟 2,112 字

ConfigMap Secret Docker Dockerfile docker-registry kubectl command env

2021年7月3日星期六

Kubernetes中的卷：将磁盘挂载到容器

2021年7月3日 1 分钟 400 字

volume kubectl date Docker Dockerfile port-forward nfs Kubernetes

40 篇文章带有标签 “Docker”

2025年7月31日 星期四

2025年7月30日 星期三

2025年7月19日 星期六

2025年7月1日 星期二

2023年5月21日 星期日

2023年5月18日 星期四

2023年5月13日 星期六

2023年4月29日 星期六

2023年4月10日 星期一

2022年3月24日 星期四

2022年2月28日 星期一

2022年2月17日 星期四

2022年2月8日 星期二

2021年10月21日 星期四

2021年7月27日 星期二

2021年7月22日 星期四

2021年7月18日 星期日

2021年7月4日 星期日

2021年7月3日 星期六