发明名称 一种数字出版物词汇抽取、显示方法和系统
摘要 本发明涉及一种数字出版物词汇抽取、显示方法和系统,包括:输入数字出版物;统计数字出版物中的词汇总量以及每一个词汇的词频,将数字出版物中所有的词汇按照词频大小进行排序,并添加词汇信息形成总词汇表和添加词汇的相关信息形成相关数据表;或将词频词典中的词汇按照词频大小进行排序,按照排序后词频词典中的词汇顺序依次在数字出版物中抽取相应的词汇,得到总词汇表和相关数据表;根据总词汇表确定词频段的个数和各个词频段包括的词汇数量并显示;将各个词频段所包括的词汇对应的词汇信息和相关信息组成数据包,用于下载学。本发明能够减少阅读中由于生词造成的语言障碍,改善阅读质量和提高词汇学效率。
申请公布号 CN105224664A 申请公布日期 2016.01.06
申请号 CN201510645332.X 申请日期 2015.10.08
申请人 孙继兰 发明人 孙继兰
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京轻创知识产权代理有限公司 11212 代理人 杨立
主权项 一种数字出版物词汇抽取、显示方法,其特征在于,包括以下步骤:步骤1,输入数字出版物;步骤2,统计数字出版物中的词汇总量以及每一个词汇的词频,将所述数字出版物中所有的词汇按照词频大小进行排序,并添加词汇信息形成总词汇表和添加词汇的相关信息形成相关数据表;或将词频词典中的词汇按照词频大小进行排序,按照排序后词频词典中的词汇顺序依次在所述数字出版物中抽取相应的词汇,得到总词汇表和相关数据表,所述总词汇表中记录所有的词汇以及词汇信息,所述相关数据表中记录所有词汇的相关信息;步骤3,根据总词汇表确定词频段的个数和各个词频段包括的词汇数量并显示;步骤4,将各个词频段所包括的词汇对应的词汇信息和相关信息组成数据包,用于下载学习。
地址 100070 北京市丰台区三环新城7号院9号楼四单元1702