发明名称 基于格式塔心理学准则和多标签图割最小化的城市建筑可视化的方法
摘要 为了使大规模城市建筑的可视化结果尽可能符合人们空间认知,本发明提出基于格式塔心理学准则和多标签图割最小化的城市建筑可视化的方法。首先,基于格式塔心理学邻近性、相似性和规则性等准则,实现城市建筑轮廓图的预聚类,为了解决建筑轮廓图聚类间的冲突,利用多标签图割建立能量优化函数,最优化求解计算城市建筑优化分组;通过不同层次的聚类阈值,实现了每一组内建筑轮廓的多细节层次综合;利用索引树SceneTree实现了多层次细节模型的快速索引,利用并行计算技术实现大规模城市场景的快速可视化;与已有方法相比,本发明对大规模复杂城市建筑模型具有很高的综合精度和可视化效率,在城市导航、空间位置服务等方面具有广阔的应用前景。
申请公布号 CN104063893B 申请公布日期 2017.03.08
申请号 CN201410146260.X 申请日期 2014.04.14
申请人 北京师范大学 发明人 张立强;王跃宾;张良
分类号 G06T17/00(2006.01)I;G06T15/00(2011.01)I 主分类号 G06T17/00(2006.01)I
代理机构 代理人
主权项 基于格式塔心理学准则和多标签图割最小化的城市建筑可视化的方法,其特征在于,包括如下步骤:步骤一:建筑潜在格式塔聚类的提取对街区内的建筑集合G={B<sub>0</sub>,B<sub>1</sub>,...,B<sub>n</sub>}依据格式塔心理学邻近性、相似性和规则性准则进行聚类分析,把属于同一类型的建筑划分为一类;邻近性:用建筑轮廓多边形之间的邻近距离衡量建筑间的邻近性程度,把距离小于阈值t<sub>p</sub>的建筑归为一类G<sub>P</sub>:G<sub>P</sub>={(B<sub>i</sub>,B<sub>j</sub>)|d(B<sub>i</sub>,B<sub>j</sub>)<t<sub>p</sub>}   (1)相似性:两栋建筑轮廓多边形面积大小比值应在阈值<img file="FSB0000157701440000011.GIF" wi="35" he="52" />和<img file="FSB0000157701440000012.GIF" wi="41" he="52" />之内,得到聚类G<sub>S1</sub>;如果它们最小外包矩形长和宽有很大差异,比较两栋建筑轮廓多边形的最小外包矩形,得到聚类G<sub>S2</sub>;最后得到相似性的一类G<sub>S</sub>:<maths num="0001"><math><![CDATA[<mrow><msub><mi>G</mi><mrow><mi>S</mi><mn>1</mn></mrow></msub><mo>=</mo><mo>{</mo><mrow><mo>(</mo><msub><mi>B</mi><mi>i</mi></msub><mo>,</mo><msub><mi>B</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>|</mo><msub><mi>t</mi><msub><mi>s</mi><mn>2</mn></msub></msub><mo>&lt;</mo><msub><mi>S</mi><msub><mi>B</mi><mi>i</mi></msub></msub><mo>/</mo><msub><mi>S</mi><msub><mi>B</mi><mi>j</mi></msub></msub><mo>&lt;</mo><msub><mi>t</mi><msub><mi>s</mi><mn>1</mn></msub></msub><mo>}</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FSB0000157701440000013.GIF" wi="1378" he="75" /></maths><maths num="0002"><math><![CDATA[<mrow><msub><mi>G</mi><mrow><mi>S</mi><mn>2</mn></mrow></msub><mo>=</mo><mo>{</mo><mrow><mo>(</mo><msub><mi>B</mi><mi>i</mi></msub><mo>,</mo><msub><mi>B</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>|</mo><mfrac><mrow><mi>R</mi><mrow><mo>(</mo><msub><mi>H</mi><mi>i</mi></msub><mo>,</mo><msub><mi>H</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>+</mo><mi>R</mi><mrow><mo>(</mo><msub><mi>W</mi><mi>i</mi></msub><mo>,</mo><msub><mi>W</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow><mn>2</mn></mfrac><mo>&gt;</mo><msub><mi>t</mi><msub><mi>s</mi><mn>2</mn></msub></msub><mo>}</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FSB0000157701440000014.GIF" wi="1572" he="112" /></maths> G<sub>S</sub>=G<sub>S1</sub>∩G<sub>S2</sub>   (4)其中,W和H表示建筑轮廓多边形的最小外包矩形的宽度和高度,并且<maths num="0003"><math><![CDATA[<mrow><mi>R</mi><mrow><mo>(</mo><mi>a</mi><mo>,</mo><mi>b</mi><mo>)</mo></mrow><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><mi>a</mi><mo>/</mo><mi>b</mi></mrow></mtd><mtd><mrow><mi>i</mi><mi>f</mi><mi> </mi><mi>a</mi><mo>&lt;</mo><mi>b</mi></mrow></mtd></mtr><mtr><mtd><mrow><mi>b</mi><mo>/</mo><mi>a</mi></mrow></mtd><mtd><mrow><mi>o</mi><mi>t</mi><mi>h</mi><mi>e</mi><mi>r</mi><mi>w</mi><mi>i</mi><mi>s</mi><mi>e</mi></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow>]]></math><img file="FSB0000157701440000015.GIF" wi="1210" he="136" /></maths>对于规则性特征,侧重于建筑线状方向一致性;建筑主朝向一致,主朝向的夹角应小于阈值t<sub>o</sub>,得到聚类G<sub>R1</sub>;另外,计算聚类中初始建筑B<sub>0</sub>的中心到当前建筑B<sub>i</sub>中心的方向d<sub>i</sub>,与建筑B<sub>i</sub>的中心到聚类中上一幢建筑B<sub>i‑1</sub>重心的方向d<sub>i‑1</sub>,对于d<sub>i</sub>和d<sub>i‑1</sub>间夹角θ<sub>dir</sub>,只要θ<sub>dir</sub><ε<sub>dir</sub>,则认为B<sub>i</sub>满足线状方向一致性,得到聚类G<sub>R2</sub>:<maths num="0004"><math><![CDATA[<mrow><msub><mi>G</mi><mrow><mi>R</mi><mn>1</mn></mrow></msub><mo>=</mo><mo>{</mo><mrow><mo>(</mo><msub><mi>B</mi><mi>i</mi></msub><mo>,</mo><msub><mi>B</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>|</mo><msub><mi>&theta;</mi><mrow><mo>(</mo><msub><mi>O</mi><msub><mi>B</mi><mi>i</mi></msub></msub><mo>,</mo><msub><mi>O</mi><msub><mi>B</mi><mi>j</mi></msub></msub><mo>)</mo></mrow></msub><mo>&lt;</mo><msub><mi>t</mi><mi>o</mi></msub><mo>}</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow>]]></math><img file="FSB0000157701440000016.GIF" wi="1259" he="81" /></maths> G<sub>R</sub>=G<sub>R1</sub>∩G<sub>R2</sub>   (7)以B<sub>0</sub>为起始建筑,初始时G={B<sub>0</sub>},将满足上述所定义的格式塔心理学邻近性、相似性和规则性准则的建筑B<sub>1</sub>,...,B<sub>n</sub>加入G中,将集合G中元素个数不小于3的保留下来;步骤二:基于多标签图割最小化的建筑格式塔聚类的优化基于多标签图割对格式塔心理学准则的上述特征集成,通过能量函数式8最小化解决上述冲突;<maths num="0005"><math><![CDATA[<mrow><mi>E</mi><mrow><mo>(</mo><mi>f</mi><mo>)</mo></mrow><mo>=</mo><munder><mo>&Sigma;</mo><mrow><mi>p</mi><mo>&Element;</mo><mi>P</mi></mrow></munder><msub><mi>D</mi><mi>p</mi></msub><mrow><mo>(</mo><msub><mi>f</mi><mi>p</mi></msub><mo>)</mo></mrow><mo>+</mo><munder><mo>&Sigma;</mo><mrow><mi>p</mi><mo>,</mo><mi>q</mi><mo>&Element;</mo><mi>N</mi></mrow></munder><msub><mi>V</mi><mrow><mi>p</mi><mo>,</mo><mi>q</mi></mrow></msub><mo>+</mo><munder><mo>&Sigma;</mo><mrow><mi>l</mi><mo>&Element;</mo><mi>L</mi></mrow></munder><msub><mi>h</mi><mi>l</mi></msub><mo>&CenterDot;</mo><msub><mi>&delta;</mi><mi>l</mi></msub><mrow><mo>(</mo><mi>f</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>8</mn><mo>)</mo></mrow></mrow>]]></math><img file="FSB0000157701440000021.GIF" wi="1630" he="101" /></maths>上式(8)中,<img file="FSB0000157701440000022.GIF" wi="459" he="140" />p、q表示两栋不同的建筑,f<sub>p</sub>表示一种格式塔心理学准则,D<sub>p</sub>(f<sub>p</sub>)表示数据代价,V<sub>p,q</sub>(f<sub>p</sub>,f<sub>q</sub>)表示平滑代价,<img file="FSB0000157701440000023.GIF" wi="223" he="95" />用来表示标注代价;为了便于衡量不同格式塔心理学准则所描述的代价值,把每个元素所对应的代价值统一映射到0‑1之间;邻近性格式塔心理学准则的数据代价:赋给一元素邻近性的代价值表示为:D<sub>p</sub>(f<sub>p</sub>)=min d(p,q)p,q∈G<sub>p</sub>   (9)即,D<sub>p</sub>(f<sub>p</sub>)等于集合G<sub>p</sub>中任意两栋建筑之间距离的最小值;相似性格式塔心理学准则的数据代价:获得相似性分组G<sub>s</sub>中元素的平均面积<img file="FSB0000157701440000024.GIF" wi="112" he="56" />计算每个元素p的面积与平均面积差值的绝对值,数据代价表示为:<maths num="0006"><math><![CDATA[<mrow><msub><mi>D</mi><mi>p</mi></msub><mrow><mo>(</mo><msub><mi>f</mi><mi>p</mi></msub><mo>)</mo></mrow><mo>=</mo><mo>|</mo><mrow><msub><mi>S</mi><mi>P</mi></msub><mo>-</mo><msub><mover><mi>S</mi><mo>&OverBar;</mo></mover><mrow><mi>a</mi><mi>r</mi><mi>e</mi><mi>a</mi></mrow></msub></mrow><mo>|</mo><mo>,</mo><mi>p</mi><mo>&Element;</mo><msub><mi>G</mi><mi>s</mi></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>10</mn><mo>)</mo></mrow></mrow>]]></math><img file="FSB0000157701440000025.GIF" wi="1292" he="88" /></maths>其中,<img file="FSB0000157701440000026.GIF" wi="90" he="55" />表示集合元素的平均面积;规则性格式塔心理学准则的数据代价:计算规则性分组G<sub>R</sub>中所有建筑元素轮廓多边形的重心,通过最小二乘法把这些坐标线性拟合为一条直线,求得重心坐标到拟合直线的距离,作为对应建筑规则性格式塔分组的代价值,具体表示为:D<sub>p</sub>(f<sub>p</sub>)=d(p,l)p∈G<sub>R</sub>   (11)其中,l表示元素重心所拟合的直线;平滑代价描述了集合所有元素之间的空间关系;当元素p,q之间的平滑代价值越小,空间关系就越紧密,属于同一类格式塔心理学准则的可能性就越大;考虑建筑轮廓之间的空间位置关系,所以,V<sub>p,q</sub>(f<sub>p</sub>,f<sub>q</sub>)=d(p,q)<sup>‑1</sup>   (12)这里,d(p,q)表示建筑元素p,q轮廓多边形之间的邻近距离,平滑代价的值也映射到0到1之间;标注代价表示对过于复杂分组的惩罚表示为<maths num="0007"><math><![CDATA[<mrow><msub><mi>F</mi><mrow><mi>l</mi><mi>a</mi><mi>b</mi><mi>e</mi><mi>l</mi><mi>cos</mi><mi>t</mi></mrow></msub><mo>=</mo><munder><mo>&Sigma;</mo><mrow><mi>l</mi><mo>&Element;</mo><mi>L</mi></mrow></munder><msub><mi>h</mi><mi>l</mi></msub><mo>&CenterDot;</mo><msub><mi>&delta;</mi><mi>l</mi></msub><mrow><mo>(</mo><mi>f</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>13</mn><mo>)</mo></mrow></mrow>]]></math><img file="FSB0000157701440000031.GIF" wi="1134" he="100" /></maths>式(13)中,L表示不同的格式塔心理学准则分组,h<sub>l</sub>表示标签label的标注代价,而δ<sub>l</sub>(f)是一个指示性函数:<maths num="0008"><math><![CDATA[<mrow><msub><mi>&delta;</mi><mi>l</mi></msub><mrow><mo>(</mo><mi>f</mi><mo>)</mo></mrow><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mrow><mo>&Exists;</mo><mi>p</mi><mo>:</mo><msub><mi>f</mi><mi>p</mi></msub><mo>=</mo><mi>l</mi></mrow></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mrow><mi>o</mi><mi>t</mi><mi>h</mi><mi>e</mi><mi>r</mi><mi>w</mi><mi>i</mi><mi>s</mi><mi>e</mi></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>14</mn><mo>)</mo></mrow></mrow>]]></math><img file="FSB0000157701440000032.GIF" wi="1147" he="140" /></maths>所有的标注代价映射到0到1之间;对于邻近性,<img file="FSB0000157701440000033.GIF" wi="472" he="119" />S<sub>ConvexHull</sub>表示集合所有元素所构成凸包的面积,<img file="FSB0000157701440000034.GIF" wi="128" he="109" />表示集合所有元素的面积之和;对于相似性,h<sub>l</sub>表示为<img file="FSB0000157701440000035.GIF" wi="874" he="75" />表示集合所有建筑元素轮廓多边形面积与平均面积差值的方差;对于规则性,h<sub>l</sub>表示为h<sub>l</sub>=p∈G<sub>R</sub> var(d(p,l)),var(d(p,l))表示集合内所有建筑轮廓多边形重心到拟合直线的距离的方差;步骤三:城市建筑轮廓的综合对于规则分组,由步骤一获得满足潜在格式塔心理学准则性聚类分组G<sub>R1</sub>,由步骤二获得多标签图割优化分类结果G<sub>R2</sub>;求出G<sub>R1</sub>、G<sub>R2</sub>两者交集G<sub>R</sub>=G<sub>R1</sub>∩G<sub>R2</sub>,在G<sub>R</sub>中,若存在两个分组子集合G<sub>a</sub>和G<sub>b</sub>,<img file="FSB0000157701440000036.GIF" wi="187" he="63" />则保留G<sub>b</sub>,删除G<sub>a</sub>,G<sub>R</sub>即为待合并的建筑轮廓的集合;类似的,计算潜在格式塔相似性聚类分组G<sub>S</sub>和邻近性分组G<sub>P</sub>;在G<sub>R</sub>、G<sub>S</sub>、G<sub>P</sub>中,分别把每一子集中的轮廓合并成一个多边形,下面给出了任一子集G<sub>i</sub>轮廓的合并过程:(1)计算G<sub>i</sub>中所有轮廓的凸包多边形C<sub>H</sub>;(2)C<sub>H</sub>中,在相邻且属于不同原始轮廓的两个顶点间,插入离这两顶点连线距离最近的原始轮廓的凸顶点;(3)C<sub>H</sub>中,在相邻且属于同一原始轮廓的两个顶点间,插入原始轮廓顶点;(4)重复上述步骤,直到完成所有多边形顶点的遍历,形成最后的合并结果;给出不同的格式塔聚类阈值t<sub>p</sub>、t<sub>s</sub>、t<sub>o</sub>,能够控制G<sub>R</sub>、G<sub>S</sub>、G<sub>P</sub>中每一子集的轮廓数量,从而生成不同细节层次的建筑综合结果;在二维轮廓图基础上加入对应建筑高度值,生成建筑的三维模型,合并后建筑高度Z为:<maths num="0009"><math><![CDATA[<mrow><mi>Z</mi><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mfrac><msub><mi>S</mi><mi>i</mi></msub><mover><mi>S</mi><mo>&OverBar;</mo></mover></mfrac><mo>=</mo><mo>&times;</mo><msub><mi>h</mi><mi>i</mi></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>15</mn><mo>)</mo></mrow></mrow>]]></math><img file="FSB0000157701440000041.GIF" wi="990" he="132" /></maths>式(15)中,S<sub>i</sub>为建筑i的面积,<img file="FSB0000157701440000042.GIF" wi="43" he="65" />为合并组建筑的平均面积,h<sub>i</sub>为建筑i的高度;步骤四:大规模城市建筑可视化为了便于存储和渲染综合后的大场景城市建筑,构建一种树结构SceneTree管理和索引不同的细节层次模型;SceneTree遍历时,先对索引树进行遍历,根据当前视点和视线方向确定街区ID Block ID,由Block ID检索出落在视景体内的街区;根据视点到视景体内每个街区的距离,计算对应街区的轮廓综合后的细节层次,确定G<sub>R</sub>、G<sub>S</sub>、G<sub>P</sub>中相应待合并的子集,视线动态的渲染与可视化;随着视点的变化,显示的数据不断的进行更新;利用并行计算技术,将数据绘制和数据装载分离;包含两个主要的进程:一个负责绘制和SceneTree的遍历,简称为T1,一个负责I/O管理和数据预取,简称为T2;这两个进程异步并行运行;T1根据当前视点计算当前可见视域,并遍历SceneTree,选择合适的结点,向T2发出命令;当T2接收到命令后,将在当前视域范围内,但不在内存中的结点装载入内存;当一块数据被装载入内存后,T1即可其进行绘制,而不需等待其他数据的装载;这种方法,在不影响对城市建筑群进行空间表达的前提下,有效地提高了渲染的速度。
地址 100875 北京市海淀区新街口外大街19号科技处