cudnn dilated convolution low efficiency

dell3253 · May 29, 2019, 11:26am

Hi. I’m using cudnn for dilated convolution.

I use cudnnGetConvolutionForwardAlgorithm() and cudnnGetConvolutionForwardWorkspaceSize() and got
algo CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_PRECOMP_GEMM and workspace size 0.

The efficiency seems to be low compared to caffe, which implements dilated convolution via cublas gemm.

For a better performance, How can I improve my cudnn dilated convolution? Or should I switch to gemm? Thank you.

BTW, I’m using titanxp with cuda9.0 and cudnn7.4.1

Topic		Replies	Views
Cudnn may be slower? GPU-Accelerated Libraries	3	2652	September 28, 2015
Cudnn8.0.4 Convolution Occupy High Memory cuDNN	3	772	December 10, 2020
cuDNN: Problems finding conv forward algorithm cuDNN	4	1156	October 12, 2021
How can I query a limited-workspace algorithm with cudnnGetForwardAlgorithm_v7()? cuDNN	1	885	September 11, 2020
How do I use cudnn convolutions with cudnn 8.0? cuDNN	4	4371	September 8, 2020
Performance discrepancy between cudnn Convolution Bias Activation Forward and cudnn Convolution Forward cuDNN	1	687	April 7, 2020
Depthwise conv workspace size with cuDNN 7 Grouped Convolution cuDNN	1	909	June 5, 2020
cudnnGetConvolutionForwardAlgorithm observation and suggested change. cuDNN	0	1497	October 24, 2018
cuDNN 6 dilated convolution issue on Kepler boards GPU-Accelerated Libraries	1	1937	April 28, 2017
cuDNN runs pretty slow cuDNN	2	1004	April 24, 2023

cudnn dilated convolution low efficiency

Related topics