发明名称 |
一种热点事件名称的确定方法及装置 |
摘要 |
本发明实施例提供了一种热点事件名称的确定方法及装置。所述方法的具体实施方式包括:根据热点事件的种子名称,获取包含种子名称的每个文档标题;根据所述文档标题中包含的设定符号,将所述文档标题划分为至少一个文档标题片段,当所述文档标题片段中包含所述种子名称的所有分词和至少一个动词时,将所述文档标题片段确定为热点事件名称候选片段;对所述热点事件名称候选片段进行分词,获得所述热点事件名称候选片段对应的每个分词,根据所述热点事件名称候选片段对应的每个分词以及预设概率公式,确定所述热点事件名称候选片段的出现概率,并确定热点事件的名称。本实施例能够提高热点事件名称对热点事件进行描述时的准确性。 |
申请公布号 |
CN105824803A |
申请公布日期 |
2016.08.03 |
申请号 |
CN201610200849.2 |
申请日期 |
2016.03.31 |
申请人 |
北京奇艺世纪科技有限公司 |
发明人 |
王亮 |
分类号 |
G06F17/27(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京柏杉松知识产权代理事务所(普通合伙) 11413 |
代理人 |
马敬;项京 |
主权项 |
一种热点事件名称的确定方法,其特征在于,应用于终端,所述方法包括:获得热点事件的种子名称,并获取包含所述种子名称的每个文档标题;当包含所述种子名称的文档标题的数量大于预设数量阈值时,针对每个文档标题,根据所述文档标题中包含的设定符号,将所述文档标题划分为至少一个文档标题片段,当所述文档标题片段中包含所述种子名称的所有分词和至少一个动词时,将所述文档标题片段确定为热点事件名称候选片段,所述设定符号包括逗号、句号、分号和空格中的一种或多种;针对每个热点事件名称候选片段,对所述热点事件名称候选片段进行分词,获得所述热点事件名称候选片段对应的每个分词,根据所述热点事件名称候选片段对应的每个分词以及预设概率公式,确定所述热点事件名称候选片段的出现概率;根据每个热点事件名称候选片段的出现概率,确定热点事件的名称。 |
地址 |
100080 北京市海淀区北一街2号鸿城拓展大厦10、11层 |