NVIDIA Developer Forums

Run VLLM in Spark

Accelerated Computing DGX Spark / GB10 User Forum DGX Spark / GB10

christopher_owen December 22, 2025, 7:15am 116

Any improvements in performance for gpt-oss-120b?

Topic		Replies	Views	Activity
vLLM container out of date for new models DGX Spark / GB10	10	1407	November 14, 2025
Install and Use vLLM for Inference on two Sparks does not work DGX Spark / GB10	159	3216	December 9, 2025
I'd like to learn how to use the latest vLLM on DGX Spark DGX Spark / GB10 cuda	9	1401	November 29, 2025
Run VLLM in Thor from VLLM Repository Jetson Thor	15	1286	November 29, 2025
vLLM on GB10: gpt-oss-120b MXFP4 slower than SGLang/llama.cpp... what’s missing? DGX Spark / GB10	38	1516	January 23, 2026
New bleeding-edge vLLM Docker Image: avarok/vllm-nvfp4-gb10-sm120 DGX Spark / GB10 Projects	35	1140	December 31, 2025
Help: Running NVFP4 model on 2x DGX Spark with vLLM + Ray (multi-node) DGX Spark / GB10 mistral-large	18	1214	December 25, 2025
Setting up vLLM, SGLang or TensorRT on two DGX Sparks DGX Spark / GB10	16	782	December 7, 2025
vLLM container 25.10-py3 fails to start Jetson Thor nvbugs , generative_ai	13	458	December 8, 2025
Announcing new VLLM container & 3.5X increase in Gen AI Performance in just 5 weeks of Jetson AGX Thor Launch Jetson Thor jetson , llama-31-8b-instruct , llama , nemotron	46	2877	December 14, 2025