Topics tagged cublas

Topic	Replies	Views	Activity
Multiplying FP16 large matrices with cublasLtMatmul on RTX 3070 and V100 GPU-Accelerated Libraries cublas	0	11	March 31, 2025
NVIDIA_TF32_OVERRIDE=0 not disabling TF32 in cublas GPU-Accelerated Libraries cublas	8	3299	March 31, 2025
CUDA error: CUBLAS_STATUS_NOT_SUPPORTED on VLLM with gemma3-27 GPU-Accelerated Libraries cudnn , cublas , cusolver , cufft , cusparse , curand , llama	0	35	March 14, 2025
Tensor Core utilization in cuDSS GPU-Accelerated Libraries cublas , cudss	1	20	March 12, 2025
Can hopper support recent published 1D scaling of FP8 in cuBlasLt GPU-Accelerated Libraries cublas	1	23	February 26, 2025
cuSPARSE generic SpSM much slower than legacy csrsm2 GPU-Accelerated Libraries cublas , cusparse	3	73	February 18, 2025
Packed matrix format for cuSOLVER Cholesky (potrf) GPU-Accelerated Libraries cublas , cusolver	0	10	January 28, 2025
How to set a fixed tile size in cublas? GPU-Accelerated Libraries cuda , cublas	0	17	January 13, 2025
cublasLtMatmulAlgoGetHeuristic - How does this function select the kernel based on various parameters? GPU-Accelerated Libraries cuda , kernel , cublas	0	34	January 10, 2025
Some results in A100 with cuBLAS and cuBLASLt GPU-Accelerated Libraries cublas	1	36	January 9, 2025
cublasDdgmm vs. cublasSdgmm GPU-Accelerated Libraries cublas	2	26	January 7, 2025
How to make ONNX turned "ON" in OpenCV CMake for CUDA and cuDNN GPU acceleration? GPU-Accelerated Libraries opencv , cuda , cudnn , onnx , cublas , cufft , npp	3	207	December 31, 2024
cuBLASXt GPU-Accelerated Libraries cublas	2	21	December 18, 2024
About blasLt handle use GPU-Accelerated Libraries cublas	0	13	December 13, 2024
Error in cusolverMp syevd + hanging GPU-Accelerated Libraries cublas , cusolver	1	42	November 29, 2024
Out of core computation GPU-Accelerated Libraries cublas , cusparse	4	41	November 27, 2024
Using Batched matrix multiplication GPU-Accelerated Libraries cublas	2	42	October 31, 2024
Using cusolverDnSgesvd inside cuda graph APIs results in CUSOLVER_STATUS_INTERNAL_ERROR GPU-Accelerated Libraries cuda , cublas , cusolver , cusparse	3	657	October 10, 2024
NCCL support for complex data types GPU-Accelerated Libraries cublas , cusolver , nccl	0	41	September 18, 2024
Why hasn't CuBLAS implemented a tensor core complex MatMul? GPU-Accelerated Libraries cuda , cublas , cutensor	2	104	September 4, 2024
The best input layout settings in CuBlas GPU-Accelerated Libraries cublas	4	169	August 27, 2024
Do any SDKs have the matrix Covariance functions GPU-Accelerated Libraries camera , opencv , cuda , kernel , cublas	0	17	August 25, 2024
The Grouped_gemm failed to run on multiple-gpu environment GPU-Accelerated Libraries cublas	1	72	August 23, 2024
cuBLAS EVD function not satisfy AV = VD GPU-Accelerated Libraries cublas	5	44	August 21, 2024
Nvlink error : Undefined reference to 'cublasZgemm_v2' in ******.obj' GPU-Accelerated Libraries cublas	18	1960	July 29, 2024
Upgrading to CUDA 12.4 broke down the application GPU-Accelerated Libraries cublas , cusparse	13	1114	July 21, 2024
Is it necessary to tune cublas to get the best performance? GPU-Accelerated Libraries cublas	3	80	July 17, 2024
Predicate register as last operand in load instructions GPU-Accelerated Libraries cuda , kernel , cublas	0	104	June 27, 2024
FP8 Benchmark Program for RTX 4090 GPU-Accelerated Libraries cublas	0	633	June 17, 2024
cublasCreate is very slow (7min) on Jetson Orin GPU-Accelerated Libraries cuda , cublas	2	191	June 14, 2024