发明名称 一种基于经验分布函数的不等组距直方图的绘制方法
摘要 本发明给出了一种基于经验分布函数的不等组距直方图的绘制方法;该方法针对等组距直方图不能充分反映样本的分布特征,以及可能出现与实际情况相悖等问题,利用经验分布函数是分布函数有效拟合的性质,提出了基于经验分布函数的不等组距直方图的绘制方法;该方法的具体步骤是:1.计算样本的顺序统计量;2.确定直方图的最大上界、最小下界及组数k;3.根据经验分布函数均分纵坐标为k组;4.求k组纵坐标对应的横坐标分界点,并确定k组横坐标组距;5.计算落入各组区间的样本频数及频率;6.绘制基于经验分布函数的不等组距直方图。通过图示法以及比较均方积分误差(MISE),均表明本发明的直方图有更精确的拟合效果。
申请公布号 CN103218837A 申请公布日期 2013.07.24
申请号 CN201310140500.0 申请日期 2013.04.22
申请人 北京航空航天大学 发明人 杨军;刘秀亭;余欢;赵宇
分类号 G06T11/00(2006.01)I 主分类号 G06T11/00(2006.01)I
代理机构 北京慧泉知识产权代理有限公司 11232 代理人 王顺荣;唐爱华
主权项 1.一种基于经验分布函数的不等组距直方图的绘制方法,其特征在于:该方法具体步骤如下:步骤一:采用统计抽样方法从总体中收集到n个样本数据x<sub>1</sub>,x<sub>2</sub>,...,x<sub>n</sub>,将其按从小到大的顺序重新排列为x<sub>(1)</sub>≤x<sub>(2)</sub>≤...≤x<sub>(n)</sub>,由此得到样本数据的顺序统计量x<sub>(1)</sub>,x<sub>(2)</sub>,...,x<sub>(n)</sub>,其中x<sub>(i)</sub>,1≤i≤n为样本的第i个顺序统计量;步骤二:确定直方图的最小下界L、最大上界U及组数k,具体确定方法如下:最大上界<maths num="0001"><![CDATA[<math><mrow><mi>U</mi><mo>=</mo><msub><mi>x</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow></msub><mo>+</mo><mfrac><mrow><msub><mi>x</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></msub><mo>+</mo><msub><mi>x</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow></msub></mrow><mn>2</mn></mfrac><mo>,</mo></mrow></math>]]></maths>最小下界<maths num="0002"><![CDATA[<math><mrow><mi>L</mi><mo>=</mo><msub><mi>x</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msub><mo>-</mo><mfrac><mrow><msub><mi>x</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msub><mo>+</mo><msub><mi>x</mi><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></msub></mrow><mn>2</mn></mfrac><mo>,</mo></mrow></math>]]></maths>确保满足L&lt;x<sub>(1)</sub>,U&gt;x<sub>(n)</sub>,即所有的样本数据均落在L和U之间;组数的确定使用Moore公式:<img file="FDA00003082326600013.GIF" wi="216" he="102" />C=1~3,其中参数n为样本量,C为常数,取值为1~3;步骤三:计算样本数据的经验分布函数F<sub>n</sub>(x),F<sub>n</sub>(x)的值域为[0,1],将纵坐标区间[0,1]均分为k组,则纵坐标分组点为<img file="FDA00003082326600014.GIF" wi="76" he="119" />相应的各纵坐标分组为<img file="FDA00003082326600015.GIF" wi="208" he="118" />j=1,2,...,k;其中,经验分布函数F<sub>n</sub>(x)的定义为:<maths num="0003"><![CDATA[<math><mrow><msub><mi>F</mi><mi>n</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mn>0</mn><mo>,</mo></mtd><mtd><mi>x</mi><mo>&lt;</mo><msub><mi>x</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msub></mtd></mtr><mtr><mtd><mfrac><mi>i</mi><mi>n</mi></mfrac><mo>,</mo></mtd><mtd><msub><mi>x</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msub><mo>&le;</mo><mi>x</mi><mo>&lt;</mo><msub><mi>x</mi><mrow><mo>(</mo><mi>i</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msub><mo>,</mo><mi>i</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>n</mi><mo>-</mo><mn>1</mn><mo>;</mo></mtd></mtr><mtr><mtd><mn>1</mn><mo>,</mo></mtd><mtd><mi>x</mi><mo>&GreaterEqual;</mo><msub><mi>x</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow></msub></mtd></mtr></mtable></mfenced></mrow></math>]]></maths>步骤四:利用步骤三中所述的经验分布函数F<sub>n</sub>(x)的广义逆<img file="FDA00003082326600017.GIF" wi="168" he="72" />计算纵坐标分组点<img file="FDA00003082326600018.GIF" wi="48" he="120" />对应的广义逆函数值<img file="FDA00003082326600019.GIF" wi="166" he="121" />j=1,2,...,k-1,依此确定直方图横坐标分组边界点b<sub>j</sub>以及组距Δx<sub>j</sub>,j=1,2,...,k;其中,F<sub>n</sub>(x)的广义逆函数的计算公式为:<img file="FDA000030823266000110.GIF" wi="579" he="81" />表示满足条件F(t)≥x的下确界;依此确定的直方图横坐标分组边界点为:<maths num="0004"><![CDATA[<math><mrow><msub><mi>b</mi><mi>j</mi></msub><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mi>L</mi><mo>,</mo></mtd><mtd><mi>j</mi><mo>=</mo><mn>0</mn></mtd></mtr><mtr><mtd><msup><msub><mi>F</mi><mi>n</mi></msub><mrow><mo>-</mo><mn>1</mn></mrow></msup><mrow><mo>(</mo><mfrac><mi>j</mi><mi>k</mi></mfrac><mo>)</mo></mrow><mo>,</mo></mtd><mtd><mi>j</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>k</mi><mo>-</mo><mn>1</mn><mo>,</mo></mtd></mtr><mtr><mtd><mi>U</mi><mo>,</mo></mtd><mtd><mi>j</mi><mo>=</mo><mi>k</mi></mtd></mtr></mtable></mfenced></mrow></math>]]></maths>而组距为Δx<sub>j</sub>=b<sub>j</sub>-b<sub>j-1</sub>,j=1,2,...,k;步骤五:根据落入横坐标各组区间[b<sub>j-1</sub>,b<sub>j</sub>),j=1,2,...,k的样本数据统计各组的样本频数Δr<sub>j</sub>、频率<img file="FDA00003082326600022.GIF" wi="215" he="119" />以及组高<img file="FDA00003082326600023.GIF" wi="233" he="135" />j=1,2,...,k;其中,b<sub>j</sub>为步骤四中定义的直方图横坐标分组边界点;步骤六:根据上述步骤中定义的组数k,以[b<sub>j-1</sub>,b<sub>j</sub>),j=1,2,...,k为分组横坐标,以Δh<sub>j</sub>,j=1,2,...,k为纵坐标绘制基于经验分布函数的不等组距频率直方图。
地址 100191 北京市海淀区学院路37号