Jetson AGX Orin大模型部署挑战与系统升级
这些文档主要围绕着在 NVIDIA Jetson AGX Orin 开发者套件上部署 多模态大型语言模型 (LLMs) 所面临的 系统升级挑战。核心问题在于,当前系统的 JetPack、Ubuntu、CUDA 和 GPU 驱动版本 过低,无法满足 vLLM 和 Ollama 等主流推理框架对 更高 CUDA 和驱动版本 的要求。文章详细阐述了 升级至 JetPack 6.0 是解决兼容性问题的关键,但这将强制要求 将 Ubuntu 升级到 22.04,从而导致 需要重装系统 和 可能与 ROS1 产生兼容性问题 等一系列复杂挑战。此外,文档还探讨了 替代推理引擎和云端推理 等备选方案,但最终建议进行 系统全面升级 以实现长期兼容性和性能优化。
系统信息
- 硬件环境:ARM64 架构,具体为 NVIDIA Jetson AGX Orin 开发者套件。
当前系统配置
- 软件环境:
- Ubuntu版本:20.04
- GPU驱动版本:515
- JetPack版本:5.1.4
- CUDA版本:11.4
- Python版本:3.8
- 机器人操作系统:ROS1(Robot Operating System 1)
系统升级需求
- Ubuntu版本:22.04
- GPU驱动版本:535
- JetPack版本:>=6.0
- CUDA版本:>=12.2
- Python版本: 3.9 - 3.12