Topics tagged cublas

Topic	Replies	Views	Activity
Static CUDA Build with Opencv GPU-Accelerated Libraries cuda , cudnn , cublas	5	29	November 6, 2025
Switch from "sm90_xmma_gemm.._cublas"/ "void cutlass::Kernel<cutlass_80_tensorop_.." kernels with CUDA-12.1 to "nvjet_tst..." kernels with CUDA-12.8 GPU-Accelerated Libraries cudnn , cublas , cutlass	0	45	October 26, 2025
cuSPARSELt: Strict Output Layout Constraints for Optimal Performance in Sparse-Dense GEMM GPU-Accelerated Libraries cuda , cublas , cusparse	1	38	October 20, 2025
Exception Error cublasSgetrsBatched while cublasSgetrfBatched has no issues (cuda12.8) GPU-Accelerated Libraries cublas	0	33	September 24, 2025
Why is cuBLAS cublasDgemm slower than my naive GEMM kernel? GPU-Accelerated Libraries cuda , kernel , cublas , cutlass	1	48	September 15, 2025
cublasSgemm crash with multi-thread,multi-context on t4,cublas12.4.2 GPU-Accelerated Libraries cublas	0	31	September 2, 2025
Why am I 2:4 sparse slower than dense in the decode stage of LLaMA2‑7B? GPU-Accelerated Libraries cudnn , cublas , cusparse	0	46	August 1, 2025
cuSPARSE generic SpSM much slower than legacy csrsm2 GPU-Accelerated Libraries cublas , cusparse	5	208	June 30, 2025
Symmetric Matrix Inverse not correct with cusolverDnDsytri GPU-Accelerated Libraries cublas , cusolver	0	57	June 30, 2025
cuDNN vs cuBLAS performance on GEMMs GPU-Accelerated Libraries performance , cudnn , cublas , benchmarks	0	77	June 19, 2025
Calling cublasSnrm2 inside a graph with WHILE conditional node? GPU-Accelerated Libraries cuda , cublas	0	31	June 6, 2025
Nvlink error : Undefined reference to 'cublasZgemm_v2' in ******.obj' GPU-Accelerated Libraries cublas	19	2159	May 1, 2025
How to set a fixed tile size in cublas? GPU-Accelerated Libraries cuda , cublas	1	68	April 26, 2025
Seg fault on program end when using NVSHMEM and cuBLAS GPU-Accelerated Libraries cublas , nvshmem	2	109	April 19, 2025
[cublasdx] leading dimension for global memory tensor GPU-Accelerated Libraries cublas	0	33	April 18, 2025
It is about cublasDx library GPU-Accelerated Libraries cublas	0	39	April 12, 2025
Incorrect result of cublasLtMatmul with CUBLASLT_EPILOGUE_RELU when input is NaN GPU-Accelerated Libraries cublas	0	32	April 9, 2025
Multiplying FP16 large matrices with cublasLtMatmul on RTX 3070 and V100 GPU-Accelerated Libraries cublas	0	57	March 31, 2025
NVIDIA_TF32_OVERRIDE=0 not disabling TF32 in cublas GPU-Accelerated Libraries cublas	8	3582	March 31, 2025
CUDA error: CUBLAS_STATUS_NOT_SUPPORTED on VLLM with gemma3-27 GPU-Accelerated Libraries cudnn , cublas , cusolver , cufft , cusparse , curand , llama	0	285	March 14, 2025
Tensor Core utilization in cuDSS GPU-Accelerated Libraries cublas , cudss	1	71	March 12, 2025
Can hopper support recent published 1D scaling of FP8 in cuBlasLt GPU-Accelerated Libraries cublas	1	52	February 26, 2025
Packed matrix format for cuSOLVER Cholesky (potrf) GPU-Accelerated Libraries cublas , cusolver	0	43	January 28, 2025
cublasLtMatmulAlgoGetHeuristic - How does this function select the kernel based on various parameters? GPU-Accelerated Libraries cuda , kernel , cublas	0	70	January 10, 2025
Some results in A100 with cuBLAS and cuBLASLt GPU-Accelerated Libraries cublas	1	139	January 9, 2025
cublasDdgmm vs. cublasSdgmm GPU-Accelerated Libraries cublas	2	66	January 7, 2025
How to make ONNX turned "ON" in OpenCV CMake for CUDA and cuDNN GPU acceleration? GPU-Accelerated Libraries opencv , cuda , cudnn , onnx , cublas , cufft , npp	3	571	December 31, 2024
cuBLASXt GPU-Accelerated Libraries cublas	2	52	December 18, 2024
About blasLt handle use GPU-Accelerated Libraries cublas	0	35	December 13, 2024
Error in cusolverMp syevd + hanging GPU-Accelerated Libraries cublas , cusolver	1	91	November 29, 2024