摘要 |
<p>본 발명은 데이터베이스에 저장된 웹문서에 대응하는 웹문서 출처표시들을 소정 기준으로 묶는 출처표시 클러스터링 단계; 상기 출처표시 클러스터링 결과에 대하여 유사한 문서끼리 묶는 유사문서 클러스터링 단계; 상기 출처표시 클러스터링 단계 및 상기 유사문서 클러스터링 단계로부터 각각 생성된 피쳐(feature)들을 이용하여 변수를 분류하는 단계; 상기 변수 분류 단계의 결과를 이용하여 정규식을 생성하는 단계; 및 상기 생성된 정규식을 이용하여 웹문서를 수집하는 단계를 포함하는 포함하는 검색결과 제공 방법 및 시스템에 관한 발명이다.</p> |