发明名称 |
一种基于互动问答社区-百度知道的地理位置实体的完整性表达方法 |
摘要 |
本发明涉及一种基于互动问答社区-百度知道的地理位置实体的完整性表达方法,包括以下步骤:步骤1):通过数据处理提取缺陷地理位置实体defectLoc;步骤2):对提取的defectLoc生成问题:“某defectLoc属于哪个区”,通过百度知道进行检索;步骤3):根据检索的结果提取特征,计算defectLoc属于各个区域的得分,并构建出defectLoc的所属区域特征向量;步骤4):利用规则对defectLoc进行完整化处理。本发明以微博城市投诉文本为基础,针对其中的地理位置实体表达不规范、非结构化的特点,使得工作人员很难进行统计分析工作,本发明提出一种基于百度知道的地理位置实体的完整性表达方法,对缺陷地理位置实体完整化具有较高的准确率,可以很好地满足实际应用的需要。 |
申请公布号 |
CN105468791A |
申请公布日期 |
2016.04.06 |
申请号 |
CN201610001346.2 |
申请日期 |
2016.01.05 |
申请人 |
北京信息科技大学;北京市新技术应用研究所 |
发明人 |
吕学强;刘克会;董志安 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种基于互动问答社区‑百度知道的地理位置实体的完整性表达方法,其特征在于,包括以下步骤:步骤1):通过数据处理提取缺陷地理位置实体;其中,缺陷地理位置实体为区域缺失或者区域模糊的地理位置实体,记为defectLoc;步骤2):对步骤1)提取的defectLoc生成问题:“某defectLoc属于哪个区”,通过百度知道进行检索;步骤3):根据步骤2)检索的结果提取特征,计算defectLoc属于各个区域的得分,并构建出defectLoc的所属区域特征向量;步骤4):利用规则对defectLoc进行完整化处理,实现地理位置实体完整性表示。 |
地址 |
100192 北京市海淀区清河小营东路12号 |