发明名称 Способ потоковой обработки текстовых сообщений
摘要 Способ потоковой обработки текстовых сообщений, заключающийся в том, что получают текстовые сообщения на естественных языках из информационного канала, осуществляют лингвистическую обработку слов каждого сообщения, формируют тезаурус каждого текстового сообщения, осуществляют статистическую обработку слов в тезаурусе сообщения, сохраняют текстовое сообщение и тезаурус в хранилище, автоматически определяют принадлежность текстового сообщения одной категории из заранее определенного списка категорий, при этом определяют начальную информативность текстового сообщения, сохраняют ее в хранилище вместе с текстовым сообщением, периодически проводят обновление значений информативности, хранящихся в базе данных текстовых сообщений с учетом прошедшего с момента их появления времени, и удаляют те текстовые сообщения, информативность которых опустилась ниже заранее установленного порога; при обработке каждого текстового сообщения обновляют значения классификационных признаков категорий, отличающийся тем, что формируют таблицы биграмм в соответствии с используемыми естественными языками, определяют классифицируемый признак с использованием полученной таблицы биграмм, разбивает полученные текстовые сообщения на три основные категории с использованием классификационного признака.
申请公布号 RU2015102437(A) 申请公布日期 2016.08.10
申请号 RU20150102437 申请日期 2015.01.26
申请人 Федеральное государственное казенное военное образовательное учреждение высшего профессионального образования "Военно-космическая академия имени А.Ф. Можайского" Министерства обороны Российской Федерации 发明人 Татарка Максим Васильевич;Сазонов Константин Викторович;Фомин Александр Игоревич
分类号 G06F17/21 主分类号 G06F17/21
代理机构 代理人
主权项
地址