Running LLMs with TensorRT-LLM on Nvidia Jetson AGX Orin Dev Kit

shahizat · November 24, 2024, 7:33am

Greetings to all,

Below is the link to my latest post on deploying LLMs using the TensorRT-LLM on the Nvidia Jetson AGX Orin Developer Kit.

Thanks!

shahizat · December 8, 2024, 6:54pm

Running the LLaMA 3.1 8B Instruct model with the Activation-aware Weight Quantization (AWQ) technique improved inference speed.

Topic		Replies	Views
TensorRT-LLM for Jetson Jetson AGX Orin generative_ai	11	2343	July 7, 2025
TensorRT-LLM for Jetson Announcements generative_ai	0	165	November 13, 2024
Running LMdeploy inference engine on the NVIDIA Jetson AGX Orin Devkit Jetson Projects jetson , llama-31-8b-instruct , llama	2	130	January 14, 2025
Can TensorRT-LLM be used on Jetson Orin NX with JetPack 6.1? Jetson Orin NX tensorrt , generative_ai	6	245	December 17, 2024
Does TensorRT-LLM Supports on NVIDIA Jetson AGX Orin Edge Device? Jetson AGX Orin generative_ai	2	179	July 29, 2024
Deploying Triton Server with TensorRT-LLM on Jetson AGX Orin (JetPack 6.2) — Any Working Example? Jetson AGX Orin tensorrt , jetson-inference , inference-server-triton , generative_ai , llm	10	203	June 17, 2025
Nvidia jetson orin nano has tensorrt support? Jetson Orin Nano tensorrt	2	52	April 7, 2025
TensorRT for Large Language Models Jetson AGX Orin	2	590	September 11, 2023
Inquiry on any updated support for tensorrt-llm support nvidia orin AGX? Jetson AGX Orin tensorrt , generative_ai , llama	4	41	June 3, 2025
Running llama3.3 or llama4 on Jetson AGX Orin Developer Kit (64 GB) Jetson AGX Orin generative_ai	8	306	May 12, 2025