GPU服务研究学习...

发布时间 2023-04-24 17:23:09作者: Cong0ks

windows10 版本安装 CUDA ,首先需要下载两个安装包

CUDA toolkit(toolkit就是指工具包)
cuDNN

 

# 安装CUDA

教程

https://developer.nvidia.com/cuda-downloads

 

# 安装cuDNN

教程

https://developer.nvidia.com/cudnn

 

安装完毕后验证

# 查看Cuda版本
nvcc --version

 

# 查看GPU使用情况
nvidia-smi

 

字段名描述
Fan 风扇转速 (0%--100%) 风扇转速各适量,N/A 表示没有风扇
Temp GPU 温度 (GPU 温度过高会导致 GPU 频率下降) GPU 温度各适量,过高的温度可能导致 GPU 性能下降
Perf 性能状态 (从 P0(最大性能) 到 P12(最小性能)) GPU 性能状态各适量,P0 表示最大性能,P12 表示最小性能
Pwr GPU 功耗 GPU 功耗各适量,越高的功耗表示更高的性能
Persistence-M 持续模式的状态 (持续模式耗能大,但在新的 GPU 应用启动时花费时间更少) 持续模式状态各适量,持续模式会提高 GPU 的启动速度
Bus-Id GPU 总线 (domain:bus:device.function) GPU 总线 ID 各适量,用于确定 GPU 的总线关联
Disp.A Display Active GPU 显示是否初始化,为 1 表示 GPU 已初始化
Memory-Usage 显存使用率 显存使用率各适量,越高的使用率表示 GPU 需要更多的显存资源
Volatile GPU-Util GPU 使用率 GPU 使用率各适量,越高的使用率表示 GPU 性能越好
ECC 是否开启错误检查和纠正技术,0/DISABLED, 1/ENABLED 是否开启错误检查和纠正技术,0 表示禁用,1 表示启用
Compute M. 计算模式 (0/DEFAULT,1/EXCLUSIVE_PROCESS,2/PROHIBITED) 计算模式各适量,0 表示 DEFAULT,1 表示 EXCLUSIVE_PROCESS,2 表示 PROHIBITED

 

#查看 CUDA 设置的环境变量
set cuda

 

# 列出所有可用的 NVIDIA 设备信息
nvidia-smi -L

 

# 定时刷新,1秒1次
nvidia-smi dmon

 

# 监控应用对GPU的使用率,1秒1次
nvidia-smi pmon