摘要 |
1. Способ автоматизированного восстановления сценария текста на естественном языке, заключающийся в том, что:- представляют текст, в котором восстанавливают сценарий, в цифровой форме для последующей автоматической и (или) автоматизированной обработки;- осуществляют индексацию текста в цифровой форме, получая:- элементарные единицы первого уровня, включающие в себя по меньшей мере слова,- элементарные единицы второго уровня, каждая из которых представляет собой нормализованную словоформу,- элементарные единицы третьего уровня, каждая из которых представляет собой последовательность следующих друг за другом слов в упомянутом тексте,- элементарные единицы четвертого уровня, каждая из которых является семантически значимым объектом и его атрибутом, и- элементарные единицы пятого уровня, каждая из которых представляет собой триаду либо из двух семантически значимых объектов и семантически значимого отношения между ними, либо семантически значимый объект и его атрибут и связывающее их семантически значимое отношение;- выявляют частоты встречаемости элементарных единиц четвертого уровня;- сохраняют в базе данных сформированные элементарные единицы второго, третьего, четвертого и пятого уровней с выявленными частотами встречаемости, а также полученные индексы вместе со ссылками на конкретные предложения данного текста;- формируют из упомянутых триад семантическую сеть таким образом, что первая элементарная единица четвертого уровня последующей триады связывается с такой же второй элементарной единицей четвертого уровня предыдущей триады;- осуществляют, в процессе итеративной процедуры, перенормиров� |