摘要 |
一种领域诠释资料(domain metadata)撷取方法,包含下列步骤:A)接收与一领域相关的复数个领域相关网页;B)分析该等领域相关网页之网页语法,以得到复数个第一诠释资料属性(attribute);C)基于一统计式语言模型,自该等领域相关网页得到复数个关键片语(keyphrase),并以该等关键片语作为复数个第二诠释资料属性;D)根据该等第一、二诠释资料属性对应至一组都柏林核心集栏位(Dublin Core Field)的结果,由该等领域相关网页撷取出复数笔领域相关的诠释资料;以及E)将该等领域相关的诠释资料输出至一载体。 |