NVIDIA Streaming Sortformer를 사용하여 회의, 통화 및 음성 앱에서 실시간으로 발언자 식별하기

Originally published at: NVIDIA Streaming Sortformer를 사용하여 회의, 통화 및 음성 앱에서 실시간으로 발언자 식별하기 - NVIDIA Technical Blog

회의, 통화, 복잡한 공간, 음성 지원 앱 등 어디에서나 기술이 직면하는 핵심 질문은 “누가 언제 말했는가?”라고 할 수 있는데요. 수십 년 동안, 실시간 전사에서 ‘누가 언제 말했는가’라는 질문에 정확히 답하는 것은 특수 장비나 오프라인 배치 처리 없이는 거의 불가능했습니다. NVIDIA Streaming Sortformer는 이러한 문제를 해결하는 오픈소스 프로덕션급 화자 분리(diarization) 모델입니다. 실제 많은 사람들이 이야기하는 환경에서…