发明名称 Indexextraktion von Dokumenten
摘要 Systeme, Verfahren und Programme, die in einem computerlesbaren Medium ausgeführt sind, sind für eine Indexextraktion vorgesehen. Eine Mehrzahl von Grundwahrheitsdokumenten sind in einer Datenbank gespeichert, wobei die Grundwahrheitsdokumente in einer Mehrzahl von Klassifizierungen organisiert sind. Es werden Versuche durchgeführt, Indizes von einem Dokument automatisch zu extrahieren, auf der Basis einer Klassifizierung, die dem Dokument zugeordnet ist. Das Dokument wird von einer ersten der Klassifizierungen zu einer zweiten der Klassifizierungen neu klassifiziert, während dem Verlauf der automatischen Extraktion der Indizes durch Herstellen einer Zuordnung zwischen dem Dokument und zumindest einem der Grundwahrheitsdokumente. Die Indizes werden von dem Dokument manuelle extrahiert auf ein Versagen hin, die Indizes automatisch zu extrahieren. Das Dokument wird als eines der Grundwahrheitsdokumente in einer Datenbank gespeichert, falls die Indizes manuell extrahiert werden.
申请公布号 DE102005032744(A1) 申请公布日期 2006.12.14
申请号 DE200510032744 申请日期 2005.07.13
申请人 HEWLETT-PACKARD DEVELOPMENT CO. 发明人 SIMSKE, STEVEN J.;WRIGHT, DAVID W.
分类号 G06F17/30 主分类号 G06F17/30
代理机构 代理人
主权项
地址