发明名称 |
使用基于本体的文本挖掘用于非结构化数据的知识提取方法 |
摘要 |
提供一种用于从车辆维护报告系统中的维护修理逐字段中提取数据的方法。每个维护修理逐字段包括技术人员对于部件、与部件有关的症状以及与症状有关的修理行为的评述。每个维护修理逐字段包括涉及与至少一个车辆部件相关的识别问题的信息。提供诊断和预测本体数据库,所述诊断和预测本体数据库通过车辆部件分类、车辆部件子类分类和关系分类而构造,其中关系分类包括症状关系和行为关系。使用诊断和预测本体数据库来重构每个维护修理逐字段。从重构维护修理逐字段根据用户输入标准来提取信息的组合。确定在重构维护修理逐字段中提取的每个组合的频率。针对每种组合成簇维护修理逐字段。 |
申请公布号 |
CN102314483A |
申请公布日期 |
2012.01.11 |
申请号 |
CN201110190819.5 |
申请日期 |
2011.07.08 |
申请人 |
通用汽车环球科技运作有限责任公司 |
发明人 |
D.拉帕塔克 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
中国专利代理(香港)有限公司 72001 |
代理人 |
彭武 |
主权项 |
一种用于从车辆维护报告系统的维护修理逐字段中提取数据的方法,每个维护修理逐字段包括技术人员对于部件、与部件有关的症状以及与症状有关的修理行为的评述,所述方法包括步骤:从车辆维护报告系统收集维护修理逐字段,每个维护修理逐字段包括涉及与至少一个车辆部件相关的识别问题的信息;提供诊断和预测本体数据库,所述诊断和预测本体数据库通过车辆部件分类、车辆部件子类分类和关系分类而构造,其中关系分类包括症状关系和行为关系;使用诊断和预测本体数据库来重构每个维护修理逐字段;从重构维护修理逐字段根据用户输入标准来提取信息的组合;确定在重构维护修理逐字段中提取的每个组合的频率;以及针对每种组合成簇维护修理逐字段。 |
地址 |
美国密执安州 |