摘要 |
1. Способ разметки множества электронных документов, содержащий: ! семантическую разметку электронных документов в соответствии с предопределенной моделью предметной области, представленной в форме предметной онтологии, таким образом создавая результаты разметки, представленные в формате Языка Онтологий Веб (OWL); и ! сохранение результатов разметки и ссылок на размеченные электронные документы, представленных Универсальными Ресурсными Указателями (URL), в хранилище Среды Описания Ресурсов (RDF). ! 2. Способ по п.1, в котором семантическая разметка электронных документов в соответствии с предопределенной моделью предметной области, представленной в форме предметной онтологии, дополнительно содержит: ! ручную разметку электронных документов, написанных на естественном языке, путем извлечения Именованных Сущностей и Отношений между Именованными Сущностями в соответствии с предопределенной моделью предметной области, представленной в форме предметной онтологии; ! разметку электронных документов, написанных на естественном языке, способом автоматического извлечения информации; и ! объединение одинаковых и/или похожих Именованных Сущностей и Отношений, извлеченных из обработанных электронных документов. ! 3. Способ по п.1, в котором сохранение результатов разметки и ссылок в RDF-хранилище дополнительно содержит: ! объединение Именованных Сущностей и Отношений, извлеченных из обработанных электронных документов, с одинаковыми и/или похожими Именованными Сущностями и Отношениями, уже сохраненными в RDF-хранилище; и ! сохранение результатов объединения и их ссылок в RDF-хранилище в виде множества триплетов. ! 4. |