GPU Utility Problem

udaysankar · November 4, 2014, 5:59am

±----------------------------------------------------------------------------+
| Compute processes: GPU Memory |
| GPU PID Process name Usage |
|=============================================================================|
| 0 5531 …/NAMD_2.8_Source/Linux-x86_64-g++.cudanet/namd2 71MB |
| 0 5527 …/NAMD_2.8_Source/Linux-x86_64-g++.cudanet/namd2 71MB |
| 1 5530 …/NAMD_2.8_Source/Linux-x86_64-g++.cudanet/namd2 72MB |
| 1 5526 …/NAMD_2.8_Source/Linux-x86_64-g++.cudanet/namd2 71MB |
| 2 5532 …/NAMD_2.8_Source/Linux-x86_64-g++.cudanet/namd2 71MB |
| 2 5528 …/NAMD_2.8_Source/Linux-x86_64-g++.cudanet/namd2 71MB |
| 3 5533 …/NAMD_2.8_Source/Linux-x86_64-g++.cudanet/namd2 72MB |
| 3 5529 …/NAMD_2.8_Source/Linux-x86_64-g++.cudanet/namd2 71MB |
±----------------------------------------------------------------------------+

But after 10-15 minutes the job slows down dramatically and the nvidia-smi shows 0 GPU utility.

±----------------------------------------------------------------------------+
| Compute processes: GPU Memory |
| GPU PID Process name Usage |
|=============================================================================|
| 0 5531 …/NAMD_2.8_Source/Linux-x86_64-g++.cudanet/namd2 71MB |
| 0 5527 …/NAMD_2.8_Source/Linux-x86_64-g++.cudanet/namd2 71MB |
| 1 5530 …/NAMD_2.8_Source/Linux-x86_64-g++.cudanet/namd2 72MB |
| 1 5526 …/NAMD_2.8_Source/Linux-x86_64-g++.cudanet/namd2 71MB |
| 2 5532 …/NAMD_2.8_Source/Linux-x86_64-g++.cudanet/namd2 71MB |
| 2 5528 …/NAMD_2.8_Source/Linux-x86_64-g++.cudanet/namd2 71MB |
| 3 5533 …/NAMD_2.8_Source/Linux-x86_64-g++.cudanet/namd2 72MB |
| 3 5529 …/NAMD_2.8_Source/Linux-x86_64-g++.cudanet/namd2 71MB |
±----------------------------------------------------------------------------+

Any suggestions.

Robert_Crovella · November 5, 2014, 2:45am

Are you running 2 MPI ranks per GPU?
Does this job ever recover?
What happens if you only run 1 MPI rank per GPU?

udaysankar · November 5, 2014, 7:08am

Same things happens.

Topic		Replies	Views
GPU Utilization Drops after Consecutive Executions CUDA Programming and Performance	28	5705	October 2, 2013
K20 with high utilization, but no compute processes. CUDA Setup and Installation	12	26614	March 19, 2015
Weird memory usage for idle GPU CUDA Programming and Performance	3	2235	December 19, 2013
Get GPU Usage CUDA Programming and Performance	1	14854	February 3, 2013
Only K40c is being utilized for computation out of two GPUs. Other one is K5200. CUDA Setup and Installation	4	1073	October 19, 2015
Nvidia-SMI reporting 0% gpu utilization Drivers - Linux, Windows, MacOS linux , nvidia-smi , linux-driver	2	4134	August 3, 2023
nvidia-smi GPU-Util abnormal CUDA Setup and Installation	2	1996	August 15, 2014
Severe CUDA performances regression on Kepler hardware (K20, K40, K80) using latest drivers (410.xx) Linux	18	1544	November 26, 2018
0% volatile GPU-util CUDA Programming and Performance cuda , ubuntu	1	9113	September 3, 2021
Nvidia-smi really slow to execute Linux ubuntu	4	11058	August 11, 2024

GPU Utility Problem

Related topics