성능 효율성이 뛰어난 NVIDIA AI 파운데이션 모델의 맘바챗

smoon · February 16, 2024, 8:31am

Originally published at: 성능 효율성이 뛰어난 NVIDIA AI 파운데이션 모델의 맘바챗 - NVIDIA Technical Blog

이번 주에는 브라우저에서 직접 체험해볼 수 있는 NVIDIA에 최적화된 Mamba-Chat 모델을 소개합니다. 이 포스팅은 최신 커뮤니티와 NVIDIA가 제작한 모델을 쉽게 접할 수 있도록 하는 데 중점을 둔 프로그램인 모델 먼데이즈의 일환입니다. 이 모델들은 NVIDIA에서 TensorRT-LLM을 사용하여 최적화했으며, 쉽게 커스터마이징하고 배포할 수 있도록 .nemo 파일로 제공됩니다. NVIDIA AI 파운데이션 모델 및 엔드포인트는 엔터프라이즈 애플리케이션에서 경험, 커스터마이징…