DeepSeek-R1 및 추론 시간 스케일링을 통한 GPU 커널 생성 자동화

Originally published at: DeepSeek-R1 및 추론 시간 스케일링을 통한 GPU 커널 생성 자동화 - NVIDIA Technical Blog

AI 모델이 점점 더 정교한 문제를 해결하기 위해 기능을 확장하면서, 테스트 시간 확장 또는 추론 시간 확장이라는 개념이 등장하고 있습니다. 이 기술은 AI가 추론 중에 추가적인 컴퓨팅 리소스를 할당하여 여러 가지 가능한 결과를 평가한 후, 가장 적합한 신경망을 선택함으로써 모델의 성능을 향상시키는 방식입니다. 이를 통해 AI는 인간이 복잡한 문제를 분석하고 해결하는 방식과 유사하게, 전략적이고 체계적인…