安装前准备工作
1、确认GPU型号和操作系统版本
lspci | grep VGA # 查看集成显卡
lspci | grep NVIDIA # 查看NVIDIA显卡
- 前边的序号
00:01.0表示的是显卡的代号
# 查看指定显卡的详细信息
lspci -v -s 41:00.0
2、准备GPU驱动和CUDA软件包
- 查看系统的架构和版本
uname -m && cat /etc/redhat-release
- CUDA包下载:https://developer.nvidia.com/cuda-downloads
文章来源(Source):浅时光博客 - 驱动包下载地址:https://www.nvidia.cn/geforce/drivers/
- 如您需要老版本CUDA,请前往老版本CUDA下载
# cuda
wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda_11.7.1_515.65.01_linux.run
# NVIDIA驱动
wget https://cn.download.nvidia.com/XFree86/Linux-x86_64/515.76/NVIDIA-Linux-x86_64-515.76.run
3、检查服务器GPU识别情况
安装GPU驱动之前需要在操作系统下查看GPU卡是否能够完全识别,如不能识别需要进行重新插拔、对调测试等步骤进行硬件排查。
4、安装编译环境
注意:NVIDIA-Linux-x86_64-515.76.run版本在内核3.10上安装有问题;然后内核版本在4.4或者4.5版本正常,最新内核5.x也是有问题的
- cuda安装samples测试程序进行make时需要
g++,但安装cuda软件包时不需要
# 检查版本
gcc -v
g++ -v
# 软件包安装
yum -y install gcc gcc-c++ dkms
5、禁用系统自带的nouveau模块
# 检查nouveau模块是否加载,已加载则先禁用
lsmod | grep nouveau
# 如果没有blacklist-nouveau.conf文件则创建
vim /usr/lib/modprobe.d/blacklist-nouveau.conf
blacklist nouveau
options nouveau modeset=0
# 执行如下命令使内核生效(需要重启服务器后才可真正禁用nouveau)
dracut -force
6、修改系统运行级别为文本模式
# GPU驱动安装必须在文本模式下进行
systemctl set-default multi-user.target
7、重启系统
# 检查禁用nouveau模块配置与文本模式是否生效。
lsmod | grep nouveau
GPU驱动安装
1、root用户下进行GPU驱动
chmod +x NVIDIA-Linux-x86_64-450.80.02.run
./NVIDIA-Linux-x86_64-515.76.run --kernel-source-path=/usr/src/kernels/4.4.215-1.el7.elrepo.x86_64 --no-opengl-files --ui=none --no-questions --accept-license
2、配置GPU驱动内存常驻模式
nvidia-persistenced
# 设置开机自启动
vim /etc/rc.d/rc.local
# 在文件中添加一行
nvidia-persistenced
# 赋予/etc/rc.d/rc.local文件可执行权限
chmod +x /etc/rc.d/rc.local
#若无/etc/rc.d/rc.local,也可修改/etc/rc.local
vim /etc/rc.local
chmod +x /etc/rc.local
3、查看GPU驱动相关信息
- 安装完GPU驱动后查看GPU状态查看及相关配置。
nvidia-smi
CUDA安装
1、安装CUDA
安装CUDA时需注意,如果已经安装过GPU驱动,安装CUDA时就不要再选择GPU驱动安装了。
chmod +x cuda_11.7.1_515.65.01_linux.run
./cuda_11.7.1_515.65.01_linux.run --no-opengl-libs
- 新版本CUDA安装界面: 注意Driver选项,表示是否安装GPU驱动,如果已经安装了GPU驱动,这里不要再勾选。
2、配置环境变量
# 添加到/etc/profile文件中,对所有用户生效
vim /etc/profile
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
source /etc/profile
# 测试cuda安装是否正确,环境变量是否识别成功
nvcc -V
以上就是本次文章所有知识点,如果文章对你有帮助就动动你那发财的小手,点个赞留个言,给本站加点热度。谢谢支持!








必须 注册 为本站用户, 登录 后才可以发表评论!