发明名称 信息处理装置、信息处理方法、程序和记录介质
摘要 在此公开了一种用于分析文本数据的信息处理装置,包括:获取部件,用于获取文本数据;词素信息登记部件,用于登记在语形学地分析文本数据中使用的词素信息;语形学分析部件,用于分析由获取部件获取的文本数据;复合词处理规则登记部件,用于登记用于创建未被登记在词素信息登记部件中的复合词的复合词处理规则;以及复合词处理部件,用于通过使用被登记在复合词处理规则登记部件中的复合词处理规则,来将由语形学分析部件创建的语形学分析信息中所包括的词素组合为未被登记在词素信息登记部件中的复合词,并用于检测所创建的复合词。
申请公布号 CN101308492A 申请公布日期 2008.11.19
申请号 CN200810100216.X 申请日期 2008.05.16
申请人 索尼株式会社 发明人 小林贤一郎
分类号 G06F17/27(2006.01) 主分类号 G06F17/27(2006.01)
代理机构 北京市柳沈律师事务所 代理人 黄小临
主权项 1.一种用于分析文本数据的信息处理装置,包括:获取部件,用于获取所述文本数据;词素信息登记部件,用于登记在语形学地分析所述文本数据中使用的词素信息;语形学分析部件,用于根据由所述词素信息登记部件登记的所述词素信息来分析由所述获取部件获取的所述文本数据,并用于创建以构成所述文本数据的词素的表格的形式的语形学分析信息;复合词处理规则登记部件,用于登记用于创建未被登记在所述词素信息登记部件中的复合词的复合词处理规则;以及复合词处理部件,用于通过使用被登记在所述复合词处理规则登记部件中的所述复合词处理规则,来将由所述语形学分析部件创建的所述语形学分析信息中所包括的所述词素组合为未被登记在所述词素信息登记部件中的所述复合词,并用于检测所创建的复合词。
地址 日本东京都