发明名称 一种最佳内容重构的无障碍快速阅读方法
摘要 基于最佳内容重构的无障碍快速阅读方法,从互联网上抓取网页后,针对每个网页进行如下操作:首先提取该网页中的文章,将文章表示成句子向量;然后通过词性标注的方法仅仅抽取句子中名词与介词,将文章表示成句子部分集合,基于最佳内容重构的方法抽取少量的句子部分作为文章摘要;最后通过文章摘要与文章原文之间的自由切换阅读的方式帮助视力障碍人士实现跳读,快速阅读。本方法的优点在于:实现自动文章摘要抽取,同时摘要与原文词序一致性保证可以实现摘要与原文间自由切换,真正实现快速阅读。
申请公布号 CN105677911A 申请公布日期 2016.06.15
申请号 CN201610109811.4 申请日期 2016.02.29
申请人 浙江大学 发明人 卜佳俊;王灿;孙忠汉;于智;王炜
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州天正专利事务所有限公司 33201 代理人 王兵;黄美娟
主权项 一种基于最佳内容重构的无障碍快速阅读方法,从互联网抓取网页后,针对每个网页进行以下操作:1)提取网页中的文章<img file="FDA0000931003480000011.GIF" wi="630" he="87" />其中D为文章的句子向量集合,<img file="FDA0000931003480000012.GIF" wi="66" he="87" />为句子向量表示文章d的第i个句子;2)利用词性标注的方法对集合D中的句子进行名词,介词的抽取得到句子部分集合<img file="FDA0000931003480000013.GIF" wi="647" he="101" />其中句子部分<img file="FDA0000931003480000014.GIF" wi="62" he="95" />为句子向量<img file="FDA0000931003480000015.GIF" wi="58" he="85" />抽取名词、介词所得,然后将任意的句子部分<img file="FDA0000931003480000016.GIF" wi="59" he="93" />表示成TF向量<img file="FDA0000931003480000017.GIF" wi="86" he="94" />则句子部分P可以表示为TF矩阵<img file="FDA0000931003480000018.GIF" wi="623" he="101" />3)使用最佳内容重构的方法根据TF矩阵S从P选取k个句子部分组成集合<img file="FDA0000931003480000019.GIF" wi="605" he="95" />作为文章的摘要,其中<img file="FDA00009310034800000110.GIF" wi="59" he="101" />是选取出的第i个句子部分,X是P的真子集。4)根据Skimming快速阅读框架要求将k个句子部分中的名词与介词按照原文中出现的顺序排列作为摘要文本;通过读屏软件自由切换摘要与原文的功能实现视力障碍人士快速阅读。
地址 310027 浙江省杭州市西湖区浙大路38号