Originally published at: NVIDIA Groq 3 LPX: Vera Rubin 플랫폼 저지연 추론 가속기 완전 분석 - NVIDIA Technical Blog
NVIDIA Groq 3 LPX, Vera Rubin 플랫폼 전용 랙 규모 저지연 추론 가속기. 315 PFLOPS·128 GB SRAM과 AFD 아키텍처로 GB200 NVL72 대비 35배 높은 TPS/MW와 10배 수익 기회를 실현합니다. LPU 아키텍처와 NVIDIA Dynamo 오케스트레이션을 살펴보세요.