NVIDIA Dynamo, 비용 효율적인 대규모 추론을 위한 AWS 서비스 지원 추가

Originally published at: NVIDIA Dynamo, 비용 효율적인 대규모 추론을 위한 AWS 서비스 지원 추가 - NVIDIA Technical Blog

이제 AWS의 개발자와 솔루션 아키텍트는 NVIDIA Blackwell 기반 Amazon EC2 P6를 포함한 NVIDIA GPU 기반 Amazon EC2 인스턴스에서 NVIDIA Dynamo를 사용할 수 있으며, 기존 EKS 및 EFA 통합에 더해 Amazon S3 지원도 새롭게 추가되었습니다. 이번 업데이트는 LLM 서비스를 더 높은 성능, 확장성, 비용 효율성으로 운영할 수 있도록 지원합니다. NVIDIA Dynamo: 생성형 AI를 위한 확장 가능한…