Originally published at: NVIDIA NeMo를 사용한 최첨단 멀티모달 생성형 AI 모델 개발 - NVIDIA Technical Blog
생성형 AI는 텍스트 기반 모델에서 멀티모달 기능으로 빠르게 확장되며, 이미지 캡션 생성과 시각적 질문 응답 같은 작업을 수행해 보다 인간과 유사한 AI로 발전해 왔습니다. 이제 커뮤니티는 텍스트와 이미지를 넘어 비디오로 영역을 넓혀가며 다양한 산업에 새로운 가능성을 열고 있습니다. 비디오 AI 모델은 로봇 공학, 자동차, 소매업 등에서 혁신을 이끌고 있습니다. 예를 들어, 로봇 공학에서는 복잡하고 변동이…