摘要 |
본 발명은 형태소 분석기를 위한 미등록 명사 추정 장치 및 방법에 관한 것으로, 상세하게는, 미리 형태소들을 등록하고 등록된 정보를 이용하여 형태소 분석을 수행할 때 등록되지 않은 미등록어의 경우에는 정상적으로 분석하지 못하는 문제점을 해결하기 위하여, 미등록 명사가 포함된 어절의 경우에 좌측부분L과 우측부분R로 나누고 우측부분R이 기분석 사전에 존재하면 좌측부분의 길이, 우측부분의 길이 및 제안된 수학식을 이용하여 좌측부분의 빈도 점수를 계산하며, 기분석 사전에서 검색된 우측부분이 빈도, 계산된 좌측부분의 빈도 점수, 및 좌측부분과 우측부분 간 조합 가능성 정도를 곱하여 후보 점수를 계산함으로써 가장 높은 점수의 미등록 명사 추정 후보를 미등록 명사로 추정하는 형태소 분석기를 위한 미등록 명사 추정 장치 및 방법을 개시한다. |