发明名称 |
文本挖掘方法和文本挖掘装置 |
摘要 |
本发明涉及文本挖掘方法和文本挖掘装置。文本挖掘方法包括:提取文档中的多个关键词;计算代表每个关键词的特定属性的分值;按照多个关键词在文档中的出现顺序对计算出的分值进行排列,以得到代表文档的分值序列;以及利用分值序列进行与文本挖掘相关联的操作。 |
申请公布号 |
CN103678355B |
申请公布日期 |
2017.03.01 |
申请号 |
CN201210335708.3 |
申请日期 |
2012.09.11 |
申请人 |
富士通株式会社 |
发明人 |
杨宇航;夏迎炬;于浩 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
朱胜;王娜丽 |
主权项 |
一种文本挖掘方法,包括:提取文档中的多个关键词;计算代表每个关键词的特定属性的分值;将所述文档转换为分值序列,其中,按照所述多个关键词在所述文档中出现的先后顺序对计算出的分值进行排列,以得到保留关键词顺序信息的代表所述文档的分值序列;以及利用所述分值序列进行与文本挖掘相关联的操作。 |
地址 |
日本神奈川县 |