基于眼球跟踪的网页图像个性化搜索方法,申请号CN200810121651.0-传众专利搜索

发明名称	基于眼球跟踪的网页图像个性化搜索方法
摘要	本发明公开了一种基于眼球跟踪的网页图像个性化搜索方法。该方法包括以下步骤：1)利用眼球跟踪装置，获取用户对网页图像关注时间的样本信息；2)对获取到的用户关注时间样本进行校正；3)对未知网页图像，运用决策树的方法动态选择合适的图像相似度算法；4)基于图像相似度来预测未知网页图像的用户关注时间；5)利用用户关注时间结合传统搜索技术生成个性化的网页图像搜索结果。本发明有效地通过眼球跟踪装置获取到了用户的个人阅读兴趣，将用户的喜好结合在网页图像搜索过程中，使得最终的图像搜索排名结果更加接近用户期待的理想排名。
申请公布号	CN101382940B	申请公布日期	2012.01.04
申请号	CN200810121651.0	申请日期	2008.10.23
申请人	浙江大学	发明人	徐颂华;江浩;刘智满;潘云鹤
分类号	G06F17/30(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	杭州求是专利事务所有限公司 33200	代理人	张法高
主权项	1.一种基于眼球跟踪的网页图像个性化搜索方法，其特征在于包括以下步骤：1)利用眼球跟踪装置，获取用户对网页图像关注时间的样本信息；2)对获取到的用户关注时间样本进行校正；3)对未知网页图像，运用决策树的方法动态选择合适的图像相似度算法；4)基于图像相似度来预测未知网页图像的用户关注时间；5)利用用户关注时间结合传统搜索技术生成个性化的网页图像搜索结果；所述的利用眼球跟踪装置，获取用户对网页图像关注时间的样本信息步骤包括：(a)在网页图像搜索结果页面上，搜索引擎通常会在搜索结果页面上为每个网页图像提供缩略图；利用眼球跟踪装置，追踪用户眼球的移动位置，从而来记录用户在某个网页图像缩略图上花的时间；(b)在被打开的网页图像页面上，记录用户眼球装置在该图像各子区域处移动的时间；设图像I由互不相交的等尺寸的矩形图像子区域R<sub>1</sub>，R<sub>2</sub>...R<sub>n</sub>构成，每当眼球跟踪装置当前位置位于坐标(x，y)处时，设(x<sub>i</sub>，y<sub>i</sub>)为子区域R<sub>i</sub>内距离(x，y)最近的点，则子区域R<sub>i</sub>的用户关注时间<img file="FSB00000628357500011.GIF" wi="199" he="56" />增加<img file="FSB00000628357500012.GIF" wi="618" he="140" />其中参数σ的值预设为1cm，且i＝1，2，……n；(c)对于此网页图像的关注时间就是观看该图像缩略图的时间加上观看该图像各子区域处的图像页面的时间之和；如果之后用户的眼球跟踪装置又重新在该图像某子区域或缩略图上移动，那么该网页图像的用户关注时间会相应增加；所述的对获取到的用户关注时间样本进行校正步骤包括：(d)对获取到的用户关注时间样本通过校正公式<img file="FSB00000628357500013.GIF" wi="824" he="89" />进行校正，其中<img file="FSB00000628357500014.GIF" wi="173" he="52" />是从步骤(a)～(c)中收集到的用户关注时间，t<sub>basic</sub>(u)是用户用来判断此图像是否值得一读的时间，<img file="FSB00000628357500015.GIF" wi="166" he="59" />则是校正后的对该网页图像I的用户关注时间；所述的对未知网页图像，运用决策树的方法动态选择合适的图像相似度算法步骤包括：(e)任意挑选5个已有的图像相似度算法A1，A2，...，A5；并从步骤(a)～(d)收集到的样本集中任意挑选其中90％的图像作为训练集，另10％的图像作为测试集；(f)对训练集与样本集中的每个图像中的每个图像子区域R，提取出特征向量F(R)：首先使用已有的非负矩阵的因素分解方法对训练集中的图像子区域进行聚类，每个图像子区域都将获得几个分值，每个分值表示的是该图像子区域对某一聚类集合的依附程度，选择最高的3个依附分值和相应聚类集合编号作为特征向量：F(R)＝(N<sub>1</sub>(R)，f<sub>1</sub>(R)，N<sub>2</sub>(R)，f<sub>2</sub>(R)，N<sub>3</sub>(R)，f<sub>3</sub>(R))其中N<sub>1</sub>(R)，N<sub>2</sub>(R)，N<sub>3</sub>(R)是有最高依附分值的三个聚类集合编号，f<sub>1</sub>(R)，f<sub>2</sub>(R)，f<sub>3</sub>(R)则是对应的依附分值；(g)对于训练集与测试集中每个图像子区域R，分别用每个图像相似度算法A<sub>i</sub>，i＝1，2，……5，预测算法预测它的关注时间，然后分别和真实关注时间进行相减，得到误差error；从A<sub>1</sub>～A<sub>5</sub>中找到其中误差error最小的算法A<sub>opt(R)</sub>；(h)使用一个决策树来学习每个图像子区域R的特征向量F(R)与具有最小误差error的算法A<sub>opt(R)</sub>之间的关系；即以图像特征向量、算法编号分别作为决策树的输入输出，并使用训练集中的样本对决策树进行训练，当决策树的输出在测试集中样本上的平均误差最小时，保存此时的决策树；(i)用训练好的决策树为未知网页图像I<sub>x</sub>中的每个图像子区域选择最合适的图像相似度算法；所述的基于图像相似度来预测未知网页图像的用户关注时间步骤包括：(j)用Sim(R<sub>o</sub>，R<sub>l</sub>)来表示图像子区域R<sub>0</sub>和图像子区域R<sub>1</sub>之间的相似度，同时Sim(R<sub>o</sub>，R<sub>l</sub>)∈[0，1]，在计算两个图像子区域的相似度之前，将它们的图像尺寸归一化为同样大小；(k)把每个已通过眼球跟踪获取到用户关注时间的网页图像子区域样本集表示为{t<sub>att</sub>(u，R<sub>i</sub>)\| i＝1，...n}，其中n是当前用户阅读过的图像子区域的个数，阅读过的图像子区域表示为R<sub>i</sub>(i＝1，...，n)，当用户遇到一个新的图像I<sub>x</sub>的时候，设I<sub>x</sub>由矩形图像子区域R<sub>1</sub>(x)，R<sub>2</sub>(x)...R<sub>m</sub>(x)构成，对其中每个图像R<sub>j</sub>(x)和样本集中的所有图像进行相似度计算，挑选出k个具有最高相似度的图像，把k设为min(10，m)，挑选出来的图像为R<sub>i</sub>(i＝1，...，k)，用以下这个公式来预测R<sub>j</sub>(x)的用户关注时间， <img file="FSB00000628357500031.GIF" wi="1494" he="167" />其中γ用来控制Sim(R<sub>j</sub>(x)，R<sub>i</sub>)的值占的比重，ε是一个很小的正整数用来防止表达式的分母为0，函数δ(，)用来去除一些相似度非常低的图像，它被定义为：<img file="FSB00000628357500032.GIF" wi="1481" he="142" />(1)计算新图像I<sub>x</sub>的用户关注时间，使用如下公式：<img file="FSB00000628357500033.GIF" wi="1251" he="113" />所述的利用用户关注时间结合传统搜索技术生成个性化的网页图像搜索结果步骤包括：(m)当用户提交一个查询请求时，服务端首先将查询重定向至传统图像搜索引擎，并获得返回的前n个网页图像，对于返回的每个页面，系统将在该用户的样本集中查找k个与图像相似度最高的样本，并用步骤(j)～(1)中的方法预测该网页图像的关注时间；(n)对于传统的排序，系统会生成一个关注时间偏差，那就是在传统排序中，排名越高的图像，获得更高的关注时间偏差，用如下公式定义这个偏差<img file="FSB00000628357500034.GIF" wi="715" he="139" />其中rank(I)表示的图像I在传统图像搜索引擎的排序的排名，参数κ<sub>d</sub>用来控制关注时间随排名下降的坡度；(o)从图像I的关注时间t<sub>att</sub>(u，I)和偏差<img file="FSB00000628357500035.GIF" wi="214" he="71" />获得图像I的总关注时间：<img file="FSB00000628357500036.GIF" wi="809" he="67" />参数κ<sub>overall</sub>是一个用户变量，用来控制该用户希望个性化的排名占的比重；(p)最终排序将按照总关注时间的倒序排列，生成搜索结果。
地址	310027 浙江省杭州市浙大路38号