Originally published at: 단일 호출 API를 통한 CUB 사용 환경의 효율화 - NVIDIA Technical Blog
C++ 템플릿 라이브러리인 CUB는 고성능 GPU 프리미티브 알고리즘을 위한 필수 도구입니다. 하지만 메모리 예측과 할당을 분리하는 기존의 2단계 API는 사용법이 번거로울 수 있습니다. 이러한 프로그래밍 모델은 유연성을 제공하지만, 종종 반복적인 상용구(Boilerplate) 코드를 양산하는 결과를 초래합니다. 본 포스팅에서는 CUDA 13.1에서 도입된 새로운 CUB 단일 호출 API로의 변화에 대해 설명합니다. 이 API는 성능 저하 없이 내부적으로 메모리를…