发明名称 蛋白质序列特征可视化提取方法
摘要 本发明涉及一种蛋白质序列特征可视化提取方法,主要包括首先对蛋白质序列中每个氨基酸进行数字编码,通过编码模型将蛋白质字符序列转换成反映蛋白质序列理化性质的三个数字序列,再基于偏序理论构建三个哈斯矩阵,通过变换将这三个哈斯矩阵转换成一个改进的哈斯矩阵,这个改进的哈斯矩阵中的元素由“0”、“1”、“2”、“3”、“4”、“5”、“6”、和“7”八个数字构成,再将改进的哈斯矩阵转换为8种颜色的图像,得到具有蛋白质全序列特征可视化图形。本发明方法具有全序列分析、直观性和普适性的特点,从生成的可视化序列图像中可得到不同蛋白质序列具有的特征。
申请公布号 CN101826132B 申请公布日期 2012.10.10
申请号 CN201010100242.X 申请日期 2010.01.22
申请人 景德镇陶瓷学院 发明人 肖绚;王普
分类号 G06F19/26(2011.01)I 主分类号 G06F19/26(2011.01)I
代理机构 景德镇市高岭专利事务所 36120 代理人 程雷
主权项 1.一种蛋白质序列特征可视化提取方法,其特征在于依次包括如下步骤:1)对蛋白质序列中的氨基酸进行数字编码,通过编码模型将蛋白质字符序列转换成反映蛋白质序列理化性质的三条不同的数字序列,所述的编码模型如下表:<img file="FSB00000820734100011.GIF" wi="1676" he="1528" />所示的氨基酸数字编码模型;2)基于偏序理论构建三个反映蛋白质序列单个性质的哈斯矩阵,这三个哈斯矩阵中的元素只有“0”和“1”二个数字,再通过变换将这三个哈斯矩阵转换成一个改进的哈斯矩阵,这个改进的哈斯矩阵中的元素由“0”、“1”、“2”、“3”、“4”、“5”、“6”、“7”八个数字构成;3)将上述八个数字中的“0”表示黑色,“1”表示蓝色,“2”表示绿色,“3”表示蓝绿色,“4”表示红色,“5”表示洋红色,“6”表示黄色,“7”表示白色,通过可视化技术,将上述改进的哈斯矩阵转换为八种颜色的图像,得到具有蛋白质全序列特征的可视化图像。
地址 333403 江西省景德镇市湘湖镇