NVIDIA Developer Forums

Peak Performance INT1, INT4, INT8, INT16, INT32 for RTX3090 Tensorcore

Developer Tools CUDA Developer Tools

Daniel_Wong January 12, 2021, 1:22am 1

Hi,

is there any reference for the peak performance of INT1, INT4, INT8, INT16, INT32 for RTX3090 on Tensorcore?

Thanks!

Topic		Replies	Views	Activity
Blackwell Integer CUDA Programming and Performance	159	5458	October 31, 2025
ZOTAC GAMING GeForce RTX 3070 Twin Edge INT8 inference TensorRT tensorrt , ai , gpu , deep-learning	3	1995	November 15, 2021
Tensorrt inference runs slower in RTX4090 than RTX 3090 Ti TensorRT tensorrt	3	2199	January 10, 2023
Questions on RTX5090 Integer throughput CUDA Programming and Performance	3	313	August 27, 2025
Turing Tensor core int4 operation TensorRT	3	2916	December 11, 2018
Measuring T4 TensorCore Integer TOPS for roofline Nsight Compute	0	458	November 5, 2020
cuBLAS INT8 tensor core mode vs. FP16 mode GPU-Accelerated Libraries	0	923	February 15, 2019
Int8 TensorCores for Jetson Jetson AGX Xavier tensorrt	7	1394	April 26, 2023
Integer NTT on RTX 20xx, A100 vs RTX 30xx, 40xx, 50xx CUDA Programming and Performance	27	545	November 30, 2025
Question about core size and speed Jetson TK1 hw , cuda , kernel	8	813	October 18, 2021