一。写在前面(必看)1.本文档将指引您安装以下软件1.1 miniconda环境安装1.2 显卡驱动安装1.3 CUDA安装1.4 pytorch安装1.5 jupyter安装2.根据pytorch版本,确定CUDA版本,python版本
3.根据tensorflow版本,确定CUDA版本,CUDNN版本,python版本
二。环境安装一。安装前准备1.apt更新执行命令:apt update2.根据自己需要,修改apt镜像源(一般无需修改)3.确定python版本二。miniconda安装设置环境变量1.miniconda的选择根据您需要的python版本,下载miniconda2.miniconda安装我们以python3.9为例,进行演示。例如安装包名为:Miniconda3-py39_4.12.0-Linux-x86_64。请根据实际下载名称修改1.下载(根据需要二选一):官网下载:wget https://repo.anaconda.com/miniconda/Miniconda3-py39_4.12.0-Linux-x86_64.sh推荐闪电云内网下载:wget http://172.168.200.101/miniconda/Miniconda3-py39_4.12.0-Linux-x86_64.sh2.安装:sh Miniconda3-py39_4.12.0-Linux-x86_64.sh步骤:回车yes回车yes(切记,默认是no)#进入环境source ~/miniconda3/bin/activate三。显卡驱动安装
1.显卡驱动版本的选择使用命令:ubuntu-drivers devices 可以查看系统推荐的显卡版本。
我们一般选择最新版本。此处我们选择nvidia-driver-5502.显卡驱动安装使用命令:sudo apt-get install nvidia-driver-550四。CUDA安装
1.CUDA版本选择(根据需要二选一)闪电云版本列表:http://172.168.200.101/cuda/2.CUDA安装我们以比较通用的CUDA11.8为例进行演示cuda_11.8.0_520.61.05_linux名称根据实际版本修改官网下载:wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run推荐闪电云内网下载:wget http://172.168.200.101/cuda/cuda_11.8.0_520.61.05_linux.run2.安装1.执行安装命令:sudo sh cuda_11.8.0_520.61.05_linux.run(执行后大概需要20秒等待)1.1 选择continue1.2 输入accept1.3 用键盘上下键,配合空格键,选择安装包。我们只选择CUDA Toolkit 11.8即可
1.4 选择Install并回车1.5 等待安装完成2.添加环境变量:添加环境变量(如果在conda里)
echo "export PATH=/usr/local/cuda-11.8/bin${PATH:+:${PATH}}" >> ~/.bashrc
echo "export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}" >> ~/.bashrc
sudo ldconfig载入安装后的动态链接库
source ~/.bashrc 使环境变量生效
测试安装情况
nvcc -V
五。pytorch安装
1.版本选择我们以pytorch2.3.0为例进行演示2.安装命令
六。tensorflow安装1.安装clang(tensorflow2.13.0以下版本忽略)wget https://apt.llvm.org/llvm-snapshot.gpg.key
sudo apt-key add llvm-snapshot.gpg.key
#根据你的 Ubuntu 版本选择正确的仓库。假设你是使用 Ubuntu 22.04(Jammy),命令如下:
sudo add-apt-repository "deb https://apt.llvm.org/jammy/ llvm-toolchain-jammy-17 main"
#如果你使用的是其他版本,请将 jammy 替换为对应的代号(例如 focal 对应 20.04)。
sudo apt update
sudo apt install clang-17对应 20.04)。
sudo apt update
sudo apt install clang-17
sudo apt update
sudo apt install clang-17
2.安装cudnnwget "http://172.168.200.101/cudnn/cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xz" -O cudnn.tar.xztar xvf cudnn.tar.xzsudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include
sudo cp cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*3.安装tensorflowpip install tensorflow==2.17.0 -i https://mirrors.huaweicloud.com/artifactory/pypi-public/simple/4.验证安装python -c "import tensorflow as tf;print(tf.reduce_sum(tf.random.normal([1000, 1000])))"七。jupyter安装
1.安装pip install notebook -i https://mirrors.aliyun.com/pypi/simple/2.设置jupyter notebook --generate-config3.修改配置vim .jupyter/jupyter_notebook_config.py# jupyter_notebook_config.py
c.NotebookApp.ip = '0.0.0.0' # 绑定所有接口
c.NotebookApp.open_browser = False # 不自动打开浏览器
c.NotebookApp.port = 8888 # 监听端口
c.NotebookApp.allow_remote_access = True # 允许远程访问
4.启动后台启动nohup jupyter notebook --allow-root > jupyter.log 2>&1 &前台启动jupyter notebook --allow-root#查看tokenjupyter notebook list5.外部连接jupyter1.确定远程端口在闪电云官网,用户后台-->云示例 列表中查看 云主机的链接信息,例如:
SSH远程信息为:ry1.9gpu.com:36079,则jupyter的远程地址为:ry1.9gpu.com:37079(远程端口+1000)2.远程连接使用浏览器打开http://ry1.9gpu.com:37079执行jupyter notebook list查看token值:例如:
填写token值。即可也可更换域名,9gpu-com:8888为ry1.9gpu.com:37079,直接使用浏览器访问:http://ry1.9gpu.com:37079/?token=afc5270618faaddc9f8753a1086b4ca454d5628428e44d9d
一。写在前面(必看)
1.本文档将指引您安装以下软件
1.1 miniconda环境安装
1.2 显卡驱动安装
1.3 CUDA安装
1.4 pytorch安装
1.5 jupyter安装
2.根据pytorch版本,确定CUDA版本,python版本
二。环境安装
一。安装前准备
1.apt更新
执行命令:apt update
2.根据自己需要,修改apt镜像源(一般无需修改)
3.确定python版本
二。miniconda安装设置环境变量
1.miniconda的选择
根据您需要的python版本,下载miniconda
2.miniconda安装
我们以python3.9为例,进行演示。
例如安装包名为:Miniconda3-py39_4.12.0-Linux-x86_64。请根据实际下载名称修改
1.下载(根据需要二选一):
官网下载:wget https://repo.anaconda.com/miniconda/Miniconda3-py39_4.12.0-Linux-x86_64.sh
推荐闪电云内网下载:wget http://172.168.200.101/miniconda/Miniconda3-py39_4.12.0-Linux-x86_64.sh
2.安装:sh Miniconda3-py39_4.12.0-Linux-x86_64.sh
步骤:
回车
yes
回车
yes(切记,默认是no)
#进入环境
source ~/miniconda3/bin/activate
三。显卡驱动安装
1.显卡驱动版本的选择
使用命令:ubuntu-drivers devices 可以查看系统推荐的显卡版本。
我们一般选择最新版本。此处我们选择nvidia-driver-550
2.显卡驱动安装
使用命令:sudo apt-get install nvidia-driver-550
四。CUDA安装
1.CUDA版本选择(根据需要二选一)
闪电云版本列表:http://172.168.200.101/cuda/
2.CUDA安装
我们以比较通用的CUDA11.8为例进行演示cuda_11.8.0_520.61.05_linux名称根据实际版本修改
官网下载:wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run
推荐闪电云内网下载:wget http://172.168.200.101/cuda/cuda_11.8.0_520.61.05_linux.run
2.安装
1.执行安装命令:
sudo sh cuda_11.8.0_520.61.05_linux.run(执行后大概需要20秒等待)
1.1 选择continue
1.2 输入accept
1.3 用键盘上下键,配合空格键,选择安装包。我们只选择CUDA Toolkit 11.8即可
1.4 选择Install并回车
1.5 等待安装完成
2.添加环境变量:
添加环境变量(如果在conda里)
echo "export PATH=/usr/local/cuda-11.8/bin${PATH:+:${PATH}}" >> ~/.bashrc
echo "export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}" >> ~/.bashrc sudo ldconfig载入安装后的动态链接库
source ~/.bashrc 使环境变量生效
测试安装情况
nvcc -V
五。pytorch安装
1.版本选择
我们以pytorch2.3.0为例进行演示
2.安装命令
1.安装clang(tensorflow2.13.0以下版本忽略)
wget https://apt.llvm.org/llvm-snapshot.gpg.key
sudo apt-key add llvm-snapshot.gpg.key #根据你的 Ubuntu 版本选择正确的仓库。假设你是使用 Ubuntu 22.04(Jammy),命令如下:
sudo add-apt-repository "deb https://apt.llvm.org/jammy/ llvm-toolchain-jammy-17 main"
#如果你使用的是其他版本,请将 jammy 替换为对应的代号(例如 focal 对应 20.04)。 sudo apt update
sudo apt install clang-17对应 20.04)。 sudo apt update sudo apt install clang-17 sudo apt update
sudo apt install clang-17
2.安装cudnn
wget "http://172.168.200.101/cudnn/cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xz" -O cudnn.tar.xz
tar xvf cudnn.tar.xz
sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include
sudo cp cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
3.安装tensorflow
pip install tensorflow==2.17.0 -i https://mirrors.huaweicloud.com/artifactory/pypi-public/simple/
4.验证安装
python -c "import tensorflow as tf;print(tf.reduce_sum(tf.random.normal([1000, 1000])))"
七。jupyter安装
1.安装
pip install notebook -i https://mirrors.aliyun.com/pypi/simple/
2.设置
jupyter notebook --generate-config
3.修改配置
vim .jupyter/jupyter_notebook_config.py
# jupyter_notebook_config.py
c.NotebookApp.ip = '0.0.0.0' # 绑定所有接口
c.NotebookApp.open_browser = False # 不自动打开浏览器
c.NotebookApp.port = 8888 # 监听端口
c.NotebookApp.allow_remote_access = True # 允许远程访问
4.启动
后台启动
nohup jupyter notebook --allow-root > jupyter.log 2>&1 &
前台启动
jupyter notebook --allow-root
#查看token
jupyter notebook list
5.外部连接jupyter
1.确定远程端口
在闪电云官网,用户后台-->云示例 列表中查看 云主机的链接信息,例如:
SSH远程信息为:ry1.9gpu.com:36079,则jupyter的远程地址为:ry1.9gpu.com:37079(远程端口+1000)
2.远程连接
使用浏览器打开http://ry1.9gpu.com:37079
执行jupyter notebook list查看token值:例如:
填写token值。即可
也可更换域名,9gpu-com:8888为ry1.9gpu.com:37079,直接使用浏览器访问:
http://ry1.9gpu.com:37079/?token=afc5270618faaddc9f8753a1086b4ca454d5628428e44d9d