Originally published at: https://developer.nvidia.com/ko-kr/blog/nvidia-nemo-accelerates-llm-innovation-with-hybrid-state-space-model-support/
오늘날의 거대 언어 모델(LLM)은 2017년에 도입된 트랜스포머 모델 아키텍처를 기반으로 합니다. 2017년 이후로 AI 컴퓨팅 성능이 빠르게 발전하여 더 큰 트랜스포머 기반 LLM을 제작할 수 있게 되면서 기능이 대폭 향상되었는데요. 고급 트랜스포머 기반 LLM은 지능형 챗봇, 컴퓨터 코드 생성, 칩 설계와 같은 많은 흥미로운 애플리케이션을 지원하고 있습니다. 최첨단 LLM을 트레이닝하려면 효율적이고 다용도의 소프트웨어 스택이 필요합니다.…