发明名称 SYSTEM AND METHOD FOR ANALYZING CLUSTER RESULT OF MASS DATA
摘要 본 발명은 대용량 데이터의 클러스터 결과 분석 시스템 및 방법에 관한 것으로, 대용량 데이터의 클러스터의 결과를 평가할 수 있는 유의성 검증 지표인 실루엣 계수를 계산하기 위하여, 하둡이라는 오픈 소스 맵리듀스(mapreduce) 프레임워크를 이용하였으며, 이를 구현하기 위해, 클러스터링된 데이터를 블럭으로 나누고, 모든 블럭에 대하여 인풋 스플리트를 생성한 후, 생성된 인풋 스플리트를 다량의 컴퓨터에 할당하여, 각각의 컴퓨터는 할당받은 인풋 스플리트에 포함된 블럭의 데이터만을 메모리에 저장하여 레코드별 실루엣 계수를 계산하고, 계산된 실루엣 계수만을 지표 계수 연산 장치에 제공하여, 클러스터에 대한 실루엣 계수를 구하도록 함으로써, 대용량 데이터에 대한 클러스터링 결과를 빠르고 객관적으로 분석할 수 있다는 효과가 있다.
申请公布号 KR101700340(B1) 申请公布日期 2017.01.26
申请号 KR20120035995 申请日期 2012.04.06
申请人 에스케이플래닛 주식회사 发明人 이채현;김민성;이준섭
分类号 G06F17/00 主分类号 G06F17/00
代理机构 代理人
主权项
地址