NVIDIA NIM을 사용한 게임용 에이전트 LLM 및 VLM 추론 벤치마킹

Originally published at: https://developer.nvidia.com/ko-kr/blog/benchmarking-agentic-llm-and-vlm-reasoning-for-gaming-with-nvidia-nim/

런던대학교 유니버시티칼리지(UCL)의 DARK(Dark, Acting, and Reasoning with Knowledge) 연구실은 NVIDIA NIM 마이크로서비스를 활용해 새로운 게임 환경을 활용한 벤치마크 도구 BALROG(Benchmarking Agentic LLM and VLM Reasoning On Games)를 개발했습니다. BALROG는 다양한 게임 환경에서 복잡하고 장기적인 상호작용 과제를 통해 모델의 자율적 사고 능력을 평가하도록 설계됐습니다. DARK 연구실 팀은 벤치마크 과정을 간소화하기 위해 NVIDIA NIM을 활용했으며, 2025년 2월…