发明名称 一种时空轨迹相似度计算方法及系统
摘要 本发明公开一种时空轨迹相似度计算方法及系统,所述方法包括:步骤1,定义距离转角率,刻画用户兴趣点的特征;步骤2,根据经验阈值,识别用户兴趣点;根据轨迹的用户兴趣点计算其公共兴趣点;步骤3,计算分段之间的相似度以及不相似度,其中所述分段为两个公共兴趣点之间的分段;通过定义分段时间、相似分段、相似路线,计算轨迹之间的相似度以及不相似度,从而得到轨迹相似度。
申请公布号 CN102722541B 申请公布日期 2015.06.17
申请号 CN201210162995.2 申请日期 2012.05.23
申请人 中国科学院计算技术研究所 发明人 叶剑;朱珍民;张筱旋;王冠男;姚昱旻;杜静
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京律诚同业知识产权代理有限公司 11006 代理人 祁建国;梁挥
主权项 一种时空轨迹相似度计算方法,其特征在于,包括:步骤1,定义距离转角率,刻画用户兴趣点的特征;步骤2,根据经验阈值,识别用户兴趣点;根据轨迹的用户兴趣点计算其公共兴趣点;步骤3,计算分段之间的相似度以及不相似度,其中所述分段为两个公共兴趣点之间的分段;通过定义分段时间、相似分段、相似路线,计算轨迹之间的相似度以及不相似度,从而得到轨迹相似度;其中,所述步骤1还包括:步骤21,定义p<sub>i‑1</sub>、p<sub>i</sub>到p<sub>i+1</sub>的距离转角率LATatio(p(i‑1),p(i),p(i+1)),其中p<sub>i‑1</sub>、p<sub>i</sub>、p<sub>i+1</sub>分别为用户兴趣点,i为兴趣点序号;距离转角率公式如下:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>LATatio</mi><mrow><mo>(</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>,</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mo>)</mo></mrow><mo>=</mo><mi>LARatio</mi><mrow><mo>(</mo><mover><mi>v</mi><mo>&RightArrow;</mo></mover><mrow><mo>(</mo><msub><mi>p</mi><mrow><mi>i</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>,</mo><msub><mi>p</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>,</mo><mover><mi>v</mi><mo>&RightArrow;</mo></mover><mrow><mo>(</mo><msub><mi>p</mi><mi>i</mi></msub><mo>,</mo><msub><mi>p</mi><mrow><mi>i</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>)</mo></mrow><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mn>1</mn><mo>-</mo><mi>cos</mi><mrow><mo>(</mo><msub><mi>&theta;</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow><mrow><mi>&epsiv;</mi><mo>+</mo><mo>|</mo><mo>|</mo><mover><mi>v</mi><mo>&RightArrow;</mo></mover><mrow><mo>(</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>,</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mo>)</mo></mrow><mo>|</mo><mo>|</mo></mrow></mfrac></mrow>]]></math><img file="FDA0000684885560000011.GIF" wi="1762" he="150" /></maths>其中,θ<sub>i</sub>为兴趣点列i的角度,ε是满足下述条件的任意一个常量:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mn>0</mn><mo>&lt;</mo><mi>&epsiv;</mi><mo>&lt;</mo><mi>min</mi><mo>{</mo><mo>|</mo><mo>|</mo><mover><mi>v</mi><mo>&RightArrow;</mo></mover><mrow><mo>(</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>,</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mo>)</mo></mrow><mo>|</mo><mo>|</mo><mo>}</mo></mrow>]]></math><img file="FDA0000684885560000012.GIF" wi="647" he="104" /></maths>且<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>&epsiv;</mi><mo>+</mo><mi>min</mi><mo>{</mo><mo>|</mo><mo>|</mo><mover><mi>v</mi><mo>&RightArrow;</mo></mover><mrow><mo>(</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>|</mo><mo>|</mo><mo>}</mo><mo>&lt;</mo><munder><mi>min</mi><mi>sec</mi></munder><mo>{</mo><mo>|</mo><mo>|</mo><mover><mi>v</mi><mo>&RightArrow;</mo></mover><mrow><mo>(</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>|</mo><mo>|</mo><mo>}</mo></mrow>]]></math><img file="FDA0000684885560000013.GIF" wi="1140" he="106" /></maths>其中,<img file="FDA0000684885560000014.GIF" wi="371" he="82" />是向量<img file="FDA0000684885560000015.GIF" wi="320" he="82" />的模,<img file="FDA0000684885560000016.GIF" wi="498" he="110" />是<img file="FDA0000684885560000017.GIF" wi="320" he="82" />的第二小值;如果<img file="FDA0000684885560000018.GIF" wi="516" he="107" />ε满足以下不等式:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><mn>0</mn><mo>&lt;</mo><mi>&epsiv;</mi><mo>&lt;</mo><munder><mi>min</mi><mi>th</mi></munder><mo>{</mo><mo>|</mo><mo>|</mo><mover><mi>v</mi><mo>&RightArrow;</mo></mover><mrow><mo>(</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>|</mo><mo>|</mo><mo>}</mo></mrow>]]></math><img file="FDA0000684885560000019.GIF" wi="648" he="107" /></maths>且<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><mi>&epsiv;</mi><mo>+</mo><munder><mi>min</mi><mi>sec</mi></munder><mo>{</mo><mo>|</mo><mo>|</mo><mover><mi>v</mi><mo>&RightArrow;</mo></mover><mrow><mo>(</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>|</mo><mo>|</mo><mo>}</mo><mo>&lt;</mo><munder><mi>min</mi><mi>th</mi></munder><mo>{</mo><mo>|</mo><mo>|</mo><mover><mi>v</mi><mo>&RightArrow;</mo></mover><mrow><mo>(</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>|</mo><mo>|</mo><mo>}</mo></mrow>]]></math><img file="FDA00006848855600000110.GIF" wi="1098" he="108" /></maths>其中,sec和th分别表示第二和第三,因此<img file="FDA00006848855600000111.GIF" wi="489" he="107" />是<img file="FDA00006848855600000112.GIF" wi="318" he="86" />的第三小值,<img file="FDA00006848855600000113.GIF" wi="54" he="73" />为向量;所述步骤2还包括:步骤41,如果ratio>ρ,这里ρ是一个经验阈值,则认为兴趣点p(i)和p(i+1)是同一个兴趣点,IS(j)表示轨迹中的j个兴趣点;为了计算轨迹的相异程度,用IP(j)表示IS(j),IP(j)=(Long(j),Lat(j),T(j))是IS(j)中兴趣点的加权平均,其中j是兴趣点的编号,<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><mi>Long</mi><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><mi>is</mi></msub></msubsup><mfrac><mrow><mi>rati</mi><msub><mi>o</mi><mi>i</mi></msub></mrow><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><mi>is</mi></msub></msubsup><mi>ratio</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow></mfrac><mo>&CenterDot;</mo><mi>long</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000684885560000021.GIF" wi="802" he="157" /></maths><maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><mi>Lat</mi><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><mi>is</mi></msub></msubsup><mfrac><mrow><mi>rati</mi><msub><mi>o</mi><mi>i</mi></msub></mrow><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><mi>is</mi></msub></msubsup><mi>ratio</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow></mfrac><mo>&CenterDot;</mo><mi>lat</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000684885560000022.GIF" wi="728" he="156" /></maths><maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><mi>T</mi><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><mi>is</mi></msub></msubsup><mfrac><mrow><mi>rati</mi><msub><mi>o</mi><mi>i</mi></msub></mrow><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><mi>is</mi></msub></msubsup><mi>ratio</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow></mfrac><mo>&CenterDot;</mo><mi>t</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000684885560000023.GIF" wi="626" he="158" /></maths>其中ratio<sub>i</sub>为兴趣点i的距离转角率,ratio(i)为兴趣点(i)的距离转角率,n<sub>is</sub>为第j个兴趣点所涉及的距离转角率的个数,long(i)为兴趣点i的精度,lat(i)为兴趣点i的纬度,t(i)为兴趣点i的时间,Long(j)为兴趣点j的精度,Lat(j)为兴趣点j的纬度,T(j)为兴趣点j的时间;步骤42,如果两个兴趣点IP(i)和IP(j)之间的距离小于d<sub>p</sub>,称这两个兴趣点为公共兴趣点CoIP,d<sub>p</sub>根据具体赋值而变化;所述步骤3还包括:步骤51,位于CoIP(i)和CoIP(i+1)中间的部分为tra(1)中的分段,记做seg<sub>tra</sub>(i);下述公式计算分段的不相似程度:dif<sub>vector</sub>(seg<sub>i</sub>(tra<sub>1</sub>),seg<sub>i</sub>(tra<sub>2</sub>))=Vdif<sub>vector</sub>(seg<sub>i</sub>(tra<sub>1</sub>),seg<sub>i</sub>(tra<sub>2</sub>))+|n1<sub>in</sub>‑n2<sub>in</sub>|其中,Vdif<sub>vector</sub>(seg<sub>i</sub>(tra<sub>1</sub>),seg<sub>i</sub>(tra<sub>2</sub>))=||vq<sub>1</sub>(seg<sub>i</sub>(tra<sub>1</sub>))‑vq<sub>1</sub>(seg<sub>i</sub>(tra<sub>2</sub>))||+||vq<sub>2</sub>(seg<sub>i</sub>(tra<sub>1</sub>))‑vq<sub>2</sub>(seg<sub>i</sub>(tra<sub>2</sub>))||Vdif<sub>vector</sub>为相似路线,tra<sub>1</sub>为兴趣点列1,tra<sub>2</sub>为兴趣点列2,seg<sub>i</sub>(tra<sub>1</sub>)为兴趣点列1的分段,seg<sub>i</sub>(tra<sub>2</sub>)为兴趣点列2的分段,n1<sub>in</sub>为兴趣点列1中两个正常兴趣点之间非公共兴趣点的数量,n2<sub>in</sub>为兴趣点列2中两个正常兴趣点之间非公共兴趣点的数量,其中公共兴趣点形成轨迹分段,将轨迹各分段分为2个分区,相邻两个分段构成4个分区,Vq1()和Vq2()分别为连接1、3分区和2、4分区的向量,Vq1()和Vq2()的走向与轨迹走向相同。
地址 100080 北京市海淀区中关村科学院南路6号