摘要 |
본 발명은 문서 중복 및 유사도를 검출하기 위한 장치, 이를 위한 방법 및 이 방법이 기록된 컴퓨터 판독 가능한 기록 매체에 관한 것으로, 이러한 본 발명은 각 테이블 내에서 중복되지 않는 특징값을 가지는 상수 K개의 테이블로 이루어진 검출 데이터베이스를 저장하는 저장부와, 복수의 단어를 포함하는 문서로부터 상기 K개의 특징값으로 이루어진 특징벡터를 도출하는 특징벡터모듈과, 상기 문서로부터 도출된 특징값과 상기 검출 데이터베이스의 대응하는 테이블의 특징값을 비교하여 중복되는 특징값의 비율에 따라 문서의 유사도를 산출하는 유사도처리모듈을 포함하는 것을 특징으로 하는 문서 중복 및 유사도를 검출하기 위한 장치와, 이를 위한 방법 및 이 방법이 기록된 컴퓨터 판독 가능한 기록 매체를 제공한다. |