发明名称 一种组织特异性基因及调控因子数据存储方法
摘要 本发明公开了一种组织特异性基因及调控因子数据存储方法,通过建立包括组织库、基因库、基因别名库、组织特异性基因库及组织特异性基的组织库的组织特异性基因及调控因子数据库来实现数据存储,该方法包括以下步骤:利用文献挖掘的形式在Pubmed文献数据库抽取出组织特异性基因;将查到的组织信息添加到组织库中;利用基因的名字在EMBL、Genebank、NCBI中检索基因的信息,并把此信息添加到基因库对应的条目中;利用从Transfac、EPD及compel数据库中查找基因的调控信息生成基因调控因子XML文件;与现有技术相比,本发明能够使利用现代计算技术挖掘基因表达及调控网络织组特异性内在机制的研究者,方便获取组织特异性基因序列及相应调控因子的数据,充分利用组织特异性基因分析工具,提高研究的质量和效率。
申请公布号 CN101847181A 申请公布日期 2010.09.29
申请号 CN201010160978.6 申请日期 2010.04.30
申请人 天津大学 发明人 赵菲菲;宫秀军;刘新觅
分类号 G06F19/00(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F19/00(2006.01)I
代理机构 天津市北洋有限责任专利代理事务所 12201 代理人 李素兰
主权项 一种组织特异性基因及调控因子数据存储方法,通过建立包括组织库、基因库、基因别名库、组织特异性基因库及组织特异性基的组织库的组织特异性基因及调控因子数据库来实现数据存储,该方法包括以下步骤:利用文献挖掘的形式在医学文献数据库抽取出组织特异性基因;将查到的组织信息添加到组织库中;利用基因的名字在DNA数据库、核酸以及蛋白质序列、基因序列、蛋白序列功能性数据库中检索基因的信息,并把此信息添加到基因库对应的条目中;利用从转录因子、它们在基因组上的结合位点和与DNA结合的profiles的数据库、真核生物启动子数据库及复合元件数据库中查找基因的调控信息生成基因调控因子XML文件;其中,组织库包括数据库中所有组织信息,内容包括自增型变量的唯一组织代码、组织的名字、组织的类别和组织的描述;基因库包括数据库中所有组织特异性的基因信息,内容包括自增型变量的唯一基因代码、基因的名字、基因对应的调控因子xml文件和基因的核酸序列;基因别名库中存储关于基因库中每个基因的全部或部分别名;组织特异性基因库把组织库中的组织和对此组织有特异性表达的基因相关联,内容包括组织基因的自增型变量的唯一关联关系代码、对应组织库中的自增型变量的唯一组织代码、对应基因库中的自增型变量的唯一基因代码、关联关系的描述、验证此关联关系在pmd中文章的代码pmd_idhe和对应此基因在此组织中的表达量;组织特异性基因库中的每个条目都分别对应一个基因调控因子XML文件,该文件的访间路径被存储在基因库中,该文件用于描述基因在组织中的所有调控因子信息,包括转录起始点的类型及在此基因核酸序列中的位置、转录因子绑定位点在此核酸序列中的位置、转录因子的功能描述、特异性的调控此组织特异性基因表达的所有加强子(enhancer)在此核酸系列中的位置、长度及功能描述,特异性的调控此组织特异性基因表达的所有沉默子(sliencer)在此核酸系列中的位置、长度及功能描述,基因转录控制区域模式特征,转录因子对基因转录的调控机制。
地址 300072 天津市南开区卫津路92号