发明名称 资料索引建立之方法及其资料搜寻方法
摘要 本发明建立资料索引之方法系将文字资料之文字进行撷取字词,撷取字词之方式是以两个字为一组开始在针对相连之任三个字中,共撷取两个字词,其中之一字词为该三个字中之前两字,另一字词为该三个字中之后两字。而本发明资料搜寻之方法系将查询字串建立以两个字为一组的比对字词,其基本规则为对一个字数为n个之字串,会建立(n-1)个比对字词,其中每一比对字词之字数为两个,且每一比对字词为查询字串中之相邻两字所组成,再藉由比对字词与资料索引之比对,找出符合包括所有比对字词之资料索引。
申请公布号 TWI234091 申请公布日期 2005.06.11
申请号 TW090120951 申请日期 2001.08.24
申请人 网路家庭国际资讯股份有限公司 发明人 吴遵先;吴俊莹
分类号 G06F17/30 主分类号 G06F17/30
代理机构 代理人 陈启桐 台北市大安区和平东路2段42号13楼之1;廖和信 台北市大安区和平东路2段42号13楼之1
主权项 1.一种资料索引建立之方法,系为一文字资料建立资料索引以方便快速检索该文字资料,该方法包括下列步骤:(A)读取欲建立资料索引之文字资料;以及(B)从该文字资料中进行撷取字词以及储存必要之字词于资料索引中,其中步骤(B)进行之原则为:撷取之字词为两个字为一组;在针对相连之任三个字中,共撷取两个字词,其中之一字词为该三个字中之前两字,另一字词为该三个字中之后两字;以及当正在撷取之字词在资料索引中尚未有储存相同之字词时,则储存该正在撷取之字词,使得储存于资料索引之字词皆符合唯一性。2.如申请专利范围第1项所述之资料索引建立之方法,其中更包括将日期资料储存于资料索引中。3.如申请专利范围第1项所述之资料索引建立之方法,其中该文字资料系经过去除符号之程序。4.如申请专利范围第1项所述之资料索引建立之方法,其中该文字资料包括有中文。5.如申请专利范围第1项所述之资料索引建立之方法,其中在进行步骤(B)时,更包括进行撷取单一字以及储存必要之单一字于资料索引中,其中当正在撷取之单一字若在资料索引中尚未有储存相同之单一字时,则储存该正在撷取之单一字,使得储存于资料索引之单一字皆符合唯一性。6.一种资料搜寻方法,系到复数之资料索引寻找有无合乎查询字串之方法,其中该复数资料索引系由申请专利范围第1项所述之资料索引建立之方法所建立,且该查询字串至少包含两个字,该方法包括下列步骤:(A)接收查询字串之输入;(B)建立至少一个比对字词,其中:每一比对字词之字数为两个;以及每一比对字词为查询字串中之相邻两字所组成,其中:当查询字串之字数为n个时,比对字词之数目基本为(n-1)个,除非(n-1)个比对字词中有重复之比对字词,则将重复之比对字词删除,使得所有之比对字词符合唯一性;以及(C)进行比对字词与资料索引之比对,以找出同时具有所有比对字词之资料索引。7.如申请专利范围第6项所述之资料搜寻方法,其中进行步骤(C)时,若任一资料索引包括有所有之比对字词时,再以查询字串与该任一资料索引所对应之文字资料进行全文比对,以更确认该文字资料是否包含该查询字串。8.如申请专利范围第7项所述之资料搜寻方法,其中更包括显示搜寻结果之步骤(D)。9.如申请专利范围第8项所述之资料搜寻方法,其中该复数之资料索引更包括日期资料。10.如申请专利范围第9项所述之资料搜寻方法,其中步骤(D)会以日期资料作为显示寻找到之资料之依据。图式简单说明:第1图为本发明关于资料索引建立之流程图。第2图为本发明关于资料搜寻之流程图。第3图为本发明关于资料索引之实施例。
地址 台北市大安区敦化南路2段105号12楼