发明名称 |
一种文本的关键词提取的方法和装置 |
摘要 |
本发明提供一种文本的关键词提取的方法,所述方法包括:对所述文本进行分词,以得到所述文本对应的词;对所述词进行词性标注;为所述词加入统计信息;对所述词执行索引化;将所述词的词性标注信息、统计信息和索引信息输入深度学提取模型,以获取所述词的重要性权重;以及根据所述重要性权重,选取对应的至少一个词作为所述文本的关键词。对应上述方法,本发明还提供一种文本的关键词提取的装置。 |
申请公布号 |
CN106502994A |
申请公布日期 |
2017.03.15 |
申请号 |
CN201611075005.6 |
申请日期 |
2016.11.29 |
申请人 |
上海智臻智能网络科技股份有限公司 |
发明人 |
贾祯;白杨;朱频频 |
分类号 |
G06F17/27(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
上海专利商标事务所有限公司 31100 |
代理人 |
徐伟 |
主权项 |
一种文本的关键词提取的方法,其特征在于,所述方法包括:对所述文本进行分词,以得到所述文本对应的词;对所述词进行词性标注;为所述词加入统计信息;对所述词执行索引化;将所述词的词性标注信息、统计信息和索引信息输入深度学习提取模型,以获取所述词的重要性权重;以及根据所述重要性权重,选取对应的至少一个词作为所述文本的关键词。 |
地址 |
201803 上海市嘉定区金沙江西路1555弄398号7层 |