Can someone tell me how to benchmark LLama_v2_7b model on jetson Orin AGX with different quantization methods?

sanchitpanwar196 · December 10, 2024, 5:15am

Can someone tell me how to benchmark LLama_v2_7b model on jetson Orin AGX with different quantization methods and also how to get perplexity score

edwli · January 14, 2025, 6:14pm

Hi, thanks for reaching out. This is the forum for NVIDIA AI Workbench. You could try to find the right forum here.

Topic		Replies	Views
How to benchmark AI processes on Jetson orin NX 8gb Jetson Orin NX jetson-inference	3	793	October 6, 2023
Running LLMs with TensorRT-LLM on Nvidia Jetson AGX Orin Dev Kit Jetson Projects jetson , generative_ai	1	465	December 8, 2024
Running LMdeploy inference engine on the NVIDIA Jetson AGX Orin Devkit Jetson Projects jetson , llama-31-8b-instruct , llama	2	101	January 14, 2025
LLM Performance Benchmarking: Measuring NVIDIA NIM Performance with GenAI-Perf Technical Blog nim , llama	1	5	May 6, 2025
CUDA benchmark Jetson AGX Orin cuda , benchmarks	2	1351	March 20, 2023
LLMs token/sec Jetson AGX Orin generative_ai	2	892	April 8, 2024
Model Performance Request Jetson Orin Nano jetson-inference	3	286	February 20, 2024
Problem: slow LLM inference speed on Jetson AGX Orin 64GB Jetson AGX Orin jetson-inference , generative_ai	2	110	April 8, 2025
GPU benchmark test Jetson AGX Xavier tools , gpu	2	911	September 20, 2023
Jetson AGX Orin Inference Performance Jetson AGX Orin jetson-inference	2	750	May 19, 2022