Topics tagged cutlass

Topic	Replies	Views	Activity
H100 PCIe hgemm cannot reach peak performance GPU-Accelerated Libraries cublas , cutlass	4	279	May 6, 2024
GEMM stage on ampere GPU-Accelerated Libraries cutlass	0	291	March 12, 2024
[cuBLASDx] no instance of overloaded function "__half::__half" matches the specified type GPU-Accelerated Libraries cublas , cutlass	2	496	January 30, 2024
How to enable Tensor core for cublasSgemmBatched on H100? GPU-Accelerated Libraries cuda , kernel , cublas , cutlass	5	627	November 17, 2023
Cutlasss Functionality for SIMT GPU-Accelerated Libraries cutlass	1	337	October 30, 2023
Is there any official benchmark tool to test a GPU's FLOPS? GPU-Accelerated Libraries cublas , cutlass	3	2892	October 24, 2023
Cutlass not working in ARM-based machine GPU-Accelerated Libraries cublas , cutlass	1	464	April 12, 2023
What does "sliced1x4_nn" mean in matmul? GPU-Accelerated Libraries cublas , cutlass	0	659	June 17, 2022
What is "custom" "custom-back" size for SGEMM in cutlass? GPU-Accelerated Libraries cutlass	0	533	June 16, 2022
Where does cutlass' detailed GEMM kernel? GPU-Accelerated Libraries cutlass	4	959	June 16, 2022
How many threads and blocks does cutlass use? (When C is tall in official post) GPU-Accelerated Libraries cutlass	1	628	June 14, 2022
How to compile cutlass app using JIT GPU-Accelerated Libraries cutlass	1	851	May 23, 2022
Using CUTLASS to get inverse of a matrix GPU-Accelerated Libraries cutlass	1	1200	December 7, 2021
Understanding cutlass GEMM hierarchy GPU-Accelerated Libraries cutlass	1	3024	October 14, 2021