系统运维

Linux下手动安装GPU驱动以及Cuda

浅时光博客 · 3月6日 · 2023年 2.5w 次已读

安装前准备工作


1、确认GPU型号和操作系统版本

lspci | grep VGA     # 查看集成显卡
lspci | grep NVIDIA  # 查看NVIDIA显卡
  • 前边的序号 00:01.0 表示的是显卡的代号
# 查看指定显卡的详细信息
lspci -v -s 41:00.0

2、准备GPU驱动和CUDA软件包

  • 查看系统的架构和版本
uname -m && cat /etc/redhat-release
# cuda
wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda_11.7.1_515.65.01_linux.run

# NVIDIA驱动
wget https://cn.download.nvidia.com/XFree86/Linux-x86_64/515.76/NVIDIA-Linux-x86_64-515.76.run

3、检查服务器GPU识别情况

安装GPU驱动之前需要在操作系统下查看GPU卡是否能够完全识别,如不能识别需要进行重新插拔、对调测试等步骤进行硬件排查。

4、安装编译环境

注意:NVIDIA-Linux-x86_64-515.76.run版本在内核3.10上安装有问题;然后内核版本在4.4或者4.5版本正常,最新内核5.x也是有问题的

  • cuda安装samples测试程序进行make时需要g++,但安装cuda软件包时不需要
# 检查版本
gcc -v
g++ -v

# 软件包安装
yum -y install gcc gcc-c++ dkms

5、禁用系统自带的nouveau模块

# 检查nouveau模块是否加载,已加载则先禁用
lsmod | grep nouveau
# 如果没有blacklist-nouveau.conf文件则创建
vim /usr/lib/modprobe.d/blacklist-nouveau.conf
blacklist nouveau
options nouveau modeset=0

# 执行如下命令使内核生效(需要重启服务器后才可真正禁用nouveau)
dracut -force

6、修改系统运行级别为文本模式

# GPU驱动安装必须在文本模式下进行
systemctl set-default multi-user.target 

7、重启系统

# 检查禁用nouveau模块配置与文本模式是否生效。
lsmod | grep nouveau

GPU驱动安装


1、root用户下进行GPU驱动

chmod +x NVIDIA-Linux-x86_64-450.80.02.run

./NVIDIA-Linux-x86_64-515.76.run --kernel-source-path=/usr/src/kernels/4.4.215-1.el7.elrepo.x86_64 --no-opengl-files --ui=none --no-questions --accept-license

2、配置GPU驱动内存常驻模式

nvidia-persistenced

# 设置开机自启动
vim /etc/rc.d/rc.local

# 在文件中添加一行
nvidia-persistenced
# 赋予/etc/rc.d/rc.local文件可执行权限
chmod +x /etc/rc.d/rc.local

#若无/etc/rc.d/rc.local,也可修改/etc/rc.local
vim /etc/rc.local
chmod +x /etc/rc.local

3、查看GPU驱动相关信息

  • 安装完GPU驱动后查看GPU状态查看及相关配置。
文章来源(Source):浅时光博客
nvidia-smi

CUDA安装


1、安装CUDA

安装CUDA时需注意,如果已经安装过GPU驱动,安装CUDA时就不要再选择GPU驱动安装了。

chmod +x cuda_11.7.1_515.65.01_linux.run
./cuda_11.7.1_515.65.01_linux.run --no-opengl-libs
  • 新版本CUDA安装界面: 注意Driver选项,表示是否安装GPU驱动,如果已经安装了GPU驱动,这里不要再勾选。

2、配置环境变量

# 添加到/etc/profile文件中,对所有用户生效
vim /etc/profile
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
source /etc/profile

# 测试cuda安装是否正确,环境变量是否识别成功
nvcc -V

以上就是本次文章所有知识点,如果文章对你有帮助就动动你那发财的小手,点个赞留个言,给本站加点热度。谢谢支持!


本文作者:浅时光博客
原文链接:https://www.dqzboy.com/11962.html
版权声明:知识共享署名-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)协议进行许可,转载时请以>超链接形式标明文章原始出处和作者信息
免责声明:本站内容仅供个人学习与研究,严禁用于商业或非法目的。请在下载后24小时内删除相应内容。继续浏览或下载即表明您接受上述条件,任何后果由用户自行承担。

0 条回应

必须 注册 为本站用户, 登录 后才可以发表评论!