2 篇文章带有标签 “tensorrt-llm”

2025年7月13日星期日

英伟达全栈方案：LLM开发、推理与具身智能

NVIDIA 提供 TensorRT-LLM、Triton Inference Server 和 NVIDIA Inference Microservice (NIM) 等工具来优化和加速 AI 模型的推理，使模型运行速度提升高达 5 倍。这意味着您可以高效地部署和运行 LLM 以生成内容。同时，NVIDIA 还提供了用于 LLM 开发的工具和框架，如 NeMo，可以帮助开发者更轻松地创建和管理 LLM。

GROOT项目利用合成运动生成将人类演示转化为大量的训练数据，并通过 Isaac Lab 进行仿真训练，从而实现机器人学习。整个系统建立在 Jetson Thor 架构之上，并整合了 NVIDIA Omniverse 等工具，支持机器人数据的处理与生成、仿真与学习，以及简化扩展，最终目标是推进人形机器人技术的发展。

LLM 推理

LLM 开发

具身智能

参考资料

NVIDIA 从NIM到 AI infra 的全栈式解决方案概览

2025-07-13 20:00

2023年12月12日星期二

TensorRT-LLM 大模型推理

[TensorRT-LLM][TensorRT-LLM]

TensorRT-LLM 为用户提供了易于使用的 Python API 来定义大型语言模型 (LLM) 并构建包含最先进优化的 TensorRT 引擎，以便在 NVIDIA GPU 上高效地执行推理。 TensorRT-LLM 还包含用于创建执行这些 TensorRT 引擎的 Python 和 C++ 运行时的组件。

Build TensorRT-LLM

# TensorRT-LLM uses git-lfs, which needs to be installed in advance.
apt-get update && apt-get -y install git git-lfs

git clone https://github.com/NVIDIA/TensorRT-LLM.git
cd TensorRT-LLM
git submodule update --init --recursive
git lfs install
git lfs pull

make -C docker release_build

2023-12-12 08:00

tensorrt-llm triton-inference-server chatglm tensorrt nvidia docker inference deployment llm

2 篇文章带有标签 “tensorrt-llm”

2025年7月13日 星期日

英伟达全栈方案：LLM开发、推理与具身智能

2023年12月12日 星期二

TensorRT-LLM 大模型推理

2025年7月13日星期日

2023年12月12日星期二