发明名称 |
基于组件式带假结长链RNA二级结构的识别方法及装置 |
摘要 |
本发明公开一种基于组件式带假结长链RNA二级结构的识别方法及装置,采用平衡能能量方法预测RNA二级结构,不仅完善了多分支环能量计算,而且加入了初步假结能量,使得能量计算更为精确,并且更加贴近实际,提高了包含假结的RNA二级结构预测的准确性。解决了当前二级结构识别软件局限关注于全局结构的准确性以及解决了当前忽略长链RNA中具有生物功能、局部结构保守的功能组件重要性的方面,因此在序列增长的情况下,仍可以有效的对RNA二级结构进行识别。充分利用软硬件结合的方法,不仅提高了预测的时空复杂度,而且本发明的装置可以实现在任何装有本发明客户端软件的机器上实现即插即用。 |
申请公布号 |
CN103593587A |
申请公布日期 |
2014.02.19 |
申请号 |
CN201310582463.9 |
申请日期 |
2013.11.20 |
申请人 |
吉林大学 |
发明人 |
刘元宁;张浩;艾露露;段云娜;李志;胡明刚;马知行;李阳 |
分类号 |
G06F19/18(2011.01)I |
主分类号 |
G06F19/18(2011.01)I |
代理机构 |
吉林长春新纪元专利代理有限责任公司 22100 |
代理人 |
陈宏伟 |
主权项 |
一种基于组件式带假结长链RNA二级结构的识别方法,包括以下步骤:1)通过上位机的输入单元输入RNA序列并通过RS‑232串口传至RNA二级结构识别装置的内存储单元,并进一步将数据读到缓存单元中;2)局部组件处理单元从缓存单元中读出RNA序列,并利用滑窗设定的大小截取组件序列,组件式滑窗尺寸的变化范围设为50nt‑200nt;3)对于上述截取的组件序列,茎区预测单元利用带假结的前后缀匹配最长茎区分解方法求出所有可能的茎区集合;4)结合RNA能量处理单元中的茎区平衡能能量模型,建立能量转移概率矩阵和观察值矩阵,对茎区预测单元求出的所有茎区求取能量值;5)局部最优结构折叠单元中,对预测出的并已经带有能量的茎区进行折叠,在折叠过程中不断寻找茎区能量和长度的最优组合,最后得到折叠的局部最优RNA二级结构,将得到的局部结构暂存于内存单元中;6)再次从缓存单元中读出序列信息,局部组件处理单元继续对组件滑窗进行移动,若对所有组件已处理完成,则从内存储单元中取出所有局部最优结构的集合,交给最优结构获取单元理,若对所有组件未处理完成,则按上述步骤3~6重新预测新的局部最优RNA的二级结构;7)通过最优结构获取单元,利用组装结构算法对各局部最优结构进行拼接,获取平衡能能量最优的全局RNA二级结构;8)将得到的全局最优RNA二级结构存于外存储单元中,并可通过RS‑232串口传回到上位机的显示单元上进行输出显示。 |
地址 |
130011 吉林省长春市前进大街2699号 |