摘要 |
컬럼-인덱스 데이터 포맷을 이용하여 빅데이터를 효율적으로 처리 및 분석하는 시스템 및 방법이 개시된다. 컴퓨터로 구현되는 처리 시스템에서 빅데이터를 처리하는 방법은, 상기 빅데이터의 컬럼(column) 단위로 데이터를 정렬하여 딕셔너리를 생성하는 단계, 상기 정렬된 데이터들을 데이터들의 크기에 따라 상기 딕셔너리마다 적어도 하나 이상의 데이터 블록들로 분류하는 단계, 상기 데이터 블록들마다의 첫 번째 데이터의 값들을 데이터 블록들의 순서에 따라 포함하는 인덱스를 상기 딕셔너리마다 생성하는 단계 및 상기 빅데이터의 로우 순서대로 컬럼 별 컬럼 아이디를 생성하는 단계를 포함할 수 있다. |