Originally published at: GPU로 아파치 스파크에서 아파치 파켓 스캔 가속화하기 - NVIDIA Technical Blog
산업 전반의 기업에서 데이터 규모가 커짐에 따라 아파치 파켓(Apache Parquet)은 데이터 저장을 위한 주요 포맷으로 자리 잡았습니다. 아파치 파켓은 대규모의 효율적인 데이터 처리를 위해 설계된 컬럼형 스토리지 형식입니다. 행이 아닌 열 단위로 데이터를 구성하는 파켓은 전체 데이터 행을 스캔하는 대신 쿼리에 필요한 열만 읽을 수 있어 고성능 쿼리 및 분석을 가능하게 합니다. 파켓의 효율적인 데이터…