2 篇文章带有标签 “tensorrt”

2023年12月12日星期二

TensorRT-LLM 大模型推理

[TensorRT-LLM][TensorRT-LLM]

TensorRT-LLM 为用户提供了易于使用的 Python API 来定义大型语言模型 (LLM) 并构建包含最先进优化的 TensorRT 引擎，以便在 NVIDIA GPU 上高效地执行推理。 TensorRT-LLM 还包含用于创建执行这些 TensorRT 引擎的 Python 和 C++ 运行时的组件。

Build TensorRT-LLM

# TensorRT-LLM uses git-lfs, which needs to be installed in advance.
apt-get update && apt-get -y install git git-lfs

git clone https://github.com/NVIDIA/TensorRT-LLM.git
cd TensorRT-LLM
git submodule update --init --recursive
git lfs install
git lfs pull

make -C docker release_build

2023-12-12 08:00

2022年5月2日星期一

NVIDIA 软件栈搭建

NVIDIA 软件栈

GPU Driver

NVIDIA 驱动程序下载

Ubuntu

搜索有效的显卡驱动

sudo ubuntu-drivers devices
#搜索匹配
sudo apt search nvidia-

安装驱动

sudo apt install nvidia-driver-510

重启系统

sudo reboot

查看

nvidia-smi

卸载驱动

sudo apt purge nvidia*

CUDA Toolkit

CUDA Toolkit 自带驱动。

CUDA Compatibility

下载

这里下载 run 格式安装包。

CUDA Toolkit 下载

安装

$ sudo sh cuda_xx.x.x_xxx.xx.xx_linux.run

deviceQuery $ ./deviceQuery ./deviceQuery Starting... CUDA Device Query (Runtime API) version (CUDART static linking) Detected 1 CUDA Capable device(s) Device 0: "NVIDIA GeForce GTX 1060 6GB" CUDA Driver Version / Runtime Version 11.6 / 11.

2022-05-02 08:00

nvidia cuda cudnn tensorrt nccl hpc gpu driver installation deep-learning

2 篇文章带有标签 “tensorrt”

2023年12月12日 星期二

TensorRT-LLM 大模型推理

2022年5月2日 星期一

NVIDIA 软件栈搭建

2023年12月12日星期二

2022年5月2日星期一