
当服务器同时处理4张图片时,看下GPU的内存占用:
nvidia-smi
Wed Aug 10 10:00:51 2022
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 515.48.07 Driver Version: 515.48.07 CUDA Version: 11.7 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 NVIDIA GeForce ... Off | 00000000:03:00.0 Off | N/A |
| 38% 56C P0 N/A / 72W | 3952MiB / 4096MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| 0 N/A N/A 3847071 C+G /usr/local/bin/waifu2x 985MiB |
| 0 N/A N/A 3847073 C+G /usr/local/bin/waifu2x 985MiB |
| 0 N/A N/A 3847075 C+G /usr/local/bin/waifu2x 985MiB |
| 0 N/A N/A 3847077 C+G /usr/local/bin/waifu2x 985MiB |
+-----------------------------------------------------------------------------+
处理一张图片差不多需要占用1G的显存,超过了显存容量就会出现"处理错误,内核已转存的提示",问题应该是显存太低了,但4G的显存也不低了,....无语🤣🤣🤣,有没有更大更好更便宜的(或者性价比高的)显存呢?
博主目前使用的是 1050GTX Ti ,详细参数是:
--------------------------------------------------
中文名:英伟达1050Ti
显卡外文名:NVIDIA GeForce 1050Ti
核心型号:GP107
显 存:1050Ti(4G D5)
CUDA : 1050Ti(768个)
功 耗:75W //此款是低功耗,续航能力强,可以持久作战,(服务器需要)
架 构:Pascal架构
供 电:无需外接供电 //低功耗版
无意中发现一个很特别的系列:NVIDIA TESLA系列
用英伟达官方的话讲就是:
适用于服务器的 TESLA 数据中心 GPU
利用 NVIDIA® Tesla® GPU 更快速地处理要求最严格的高性能计算 (HPC) 和超大规模数据中心工作负载。现在,数据科学家和研究人员可以在能源勘探和深度学习等应用场合中解析 PB 级的数据,速度比使用传统 CPU 快几个数量级。Tesla 加速器亦有能力以前所未有的超快速度运行更大型的模拟。此外,Tesla 还能为虚拟桌面、应用程序和工作站提供超高性能和用户密度。
GeForce/Quadro/Tesla 三个系列的区别
GeForce属于普通消费级显卡,而Quadro和Tesla则归类为专业级显卡;
GeForce主要应用于游戏娱乐领域,而Quadro主要用于专业可视化设计和创作,
Tesla更偏重于深度学习、人工智能和高性能计算这块。
不过现在最新推出的Quadro RTX高端显卡,既可以用于传统图形应用,也可以加速深度学习、人工智能等工作负载。
GeForce和Quadro是用来做图形计算的,
Tesla是专门用来做数值计算的,没有图形功能和视频接口。(即HDmI或vga或dvi或dp通通没有)

Kepler (28nm 2013年) < Maxwell (22nm 2015年) < Pascal (16nm) < Volta (12nm) < Turing (12nm) 即:
k4 < m4 < p4 < v4 < t4


p4目前淘宝价格 8G:950-1100之间
m40目前淘宝价格 12G:1100-1200之间 24G:¥1180
p40目前淘宝价格 24G:1950-2100之间
t4目前淘宝价格 16G:8800-9500之间
//使用是需要注意的事项:
主板:精粤 x99-d34 双显卡
1.当使用显存大于4G的显示 或者使用 tesla的显卡时需要开启主板的 above 4g 功能,
在bios中的高级选项里进行设置
2.深度学习必须是同厂商的显卡 ,驱动是一带多 , 一个驱动支持多个显卡