发明名称 增强子在全基因组相互作用研究方法
摘要 本发明涉及一种增强子在全基因组相互作用研究方法,属于基因技术领域。该方法步骤为:(1)数据转换:采用UCSC网站liftover软件把增强子数据转换成hg18,对1760个增强子长度和分布进行统计分析。(2)数据过虑:过虑掉两个染色质片段距离小于100kb的数据,得到hESC细胞系、IMR90细胞系以及它们的重复实验基因表达数据,求平均值。(3)数据注释:将过虑好的数据比对到增强子数据中,统计不同细胞能捕获到的增强子数。(4)结果分析:比较增强子在全基因组范围相互位点数据。本发明能很好地得到细胞核内染色质三维构象的信息,能知道基因的表达调控信息,鉴定一些未知调控序列,这些技术在鉴定全基因组上的长距离作用起着十分重要的作用。
申请公布号 CN103646192A 申请公布日期 2014.03.19
申请号 CN201310584990.3 申请日期 2013.11.14
申请人 漯河医学高等专科学校 发明人 马永超;卑占宇;徐松涛;罗晓冰;常陆林;范文娟;吴华
分类号 G06F19/18(2011.01)I 主分类号 G06F19/18(2011.01)I
代理机构 代理人
主权项 一种增强子在全基因组相互作用研究方法,其特征在于:具体包括以下步骤:(1)数据转换:采用UCSC网站liftover软件把增强子数据转换成hg18;对1760个增强子长度和分布进行统计分析得到统计分布图,从中发现,增强子的长度大多小于2kbp,在各染色体上的分布不均匀;(2)数据过虑:过虑掉两个染色质片段距离小于100kb的数据,得到hESC细胞系、IMR90细胞系以及它们的重复实验基因表达数据,求两个数据的平均值作为基因表达的量;根据基因或者转录本的表达量,把基因分为:低表达(表达值<50)、中表达(50<表达值<=500)、高表达(表达值>500),针对每类基因数量进行统计;(3)数据注释:将过虑好的数据比对到增强子数据中,统计不同细胞实验能捕获到的增强子数,发现测序读序(read)数越多能捕获到的增强子也越多,但是当测序读序数达到一定数量时,增加大量的测序读序似乎对于捕获增强子的作用不显著;(4)结果分析:比较4组增强子在全基因组范围相互位点数据,在较大片段范围内(IMbp),四个实验组数据重合度比较高,在更精细的范围内(1kb),4个实验组数据有着较大的区别,但是同一细胞系的重复试验差别小于不同细胞系;将与增强子作用的位点进行注释,得到相应数据,与增强子作用次数最多的是基因(Genes,大约占0.39%),其次是重复序列序列(大约占0.20%),再次是基因上游20K的位置(Up20k,约占17%),再次是基因组其他序列(N0,约占13%),再次是基因下游的20K(Down20k,约占9%),最少的增强子(Enhancer,约占0.2%);在4个实验中,重复序列L1和增强子相互作用频率是最高的,L1是一个富含AT的重复序列,包含了RNA聚合酶III的内部启动子;另外在基因上游20K区域也是个高频区,大多数的基因的启动子都位于这个区域,很多增强子都是直接与启动子相互作用,从而调节基因的表达。
地址 462000 河南省漯河市大学路148号漯河医学高等专科学校