NVIDIA Driver 安装
困难重重 😭
服务器是 NVIDIA Tesla T4,系统是 Ubuntu 20.04,从 Kubernetes 集群中分离出来的,因 Tabby 请求 CUDA >= 11.7,需要重新安装新版本的驱动。
就两步就完成了,简单吧 😄
安装驱动
sudo sh NVIDIA-Linux-x86_64-535.129.03.run
日志查看错误信息
困难重重 😭
服务器是 NVIDIA Tesla T4,系统是 Ubuntu 20.04,从 Kubernetes 集群中分离出来的,因 Tabby 请求 CUDA >= 11.7,需要重新安装新版本的驱动。
就两步就完成了,简单吧 😄
安装驱动
sudo sh NVIDIA-Linux-x86_64-535.129.03.run
日志查看错误信息
13 号 上午 GPU 服务器突然不能访问了,可以通过 CPU 服务器访问 GPU 服务器。这一周一直在查找问题,这里记录一下过程。
traceroute cpu1
traceroute to cpu1 (172.16.33.157), 64 hops max, 52 byte packets
1 * * *
2 172.16.136.2 (172.16.136.2) 7.827 ms 4.712 ms 3.162 ms
3 * * *
4 cpu1 (172.16.33.157) 8.619 ms 4.205 ms 4.982 ms