发明名称 用于将数据与生物序列关联的方法和装置
摘要 本发明涉及一种用于将数据与生物序列关联的方法和装置。所述方法包括:在网络中标识对数据的一个或多个引用,所述数据具有大于预定阈值的相关性级别;将所述一个或多个引用与一个或多个探测序列关联,所述一个或多个探测序列对应于与所述数据有关的生物序列的片段;根据一个或多个准则对所述一个或多个探测序列进行排序;以及至少根据每个引用的排序,为所述一个或多个探测序列分配与所述目标生物序列的片段的亲和性级别。
申请公布号 CN103699558B 申请公布日期 2017.04.05
申请号 CN201310445223.4 申请日期 2013.09.26
申请人 国际商业机器公司 发明人 J·R·克泽罗斯基;C·A·皮茨克维尔;J·M·维本;周如洪
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京市中咨律师事务所 11247 代理人 于静;张亚非
主权项 一种用于将数据与目标生物序列关联的方法,包括:在网络中搜索一个或多个存储器,以便获得对数据的引用或者获得数据,其中:所述引用包括以下至少之一:指针、指示数据位置或提供有关数据信息的地址;所述数据包括以下至少之一:文档、分析工具和传记数据;在网络中标识一个或多个指针或地址,所述一个或多个指针或地址指向或引用具有大于预定阈值的相关性级别的数据;基于确定相关性级别大于预定阈值,由处理器将所述一个或多个指针或地址与一个或多个探测序列关联,所述一个或多个探测序列对应于与所述数据有关的生物序列的片段;将所述一个或多个探测序列与以下至少之一相关联:文档、分析工具和传记数据;由所述处理器根据一个或多个准则对所述一个或多个探测序列进行排序,所述排序包括确定所述一个或多个探测序列的每一个和所述指针或地址指向或引用的生物序列的相似性,以及以下操作中的至少之一:确定所述指针或地址的每一个的源的重要性、确定所述指针或地址的每一个的普及性、以及确定所述指针或地址的每一个指向或引用的生物序列的历史适用性,其中:所述确定所述一个或多个探测序列的每一个和所述指针或地址指向或引用的生物序列的相似性包括确定所述指针或地址的每一个和所述生物序列的补充物之间的匹配;所述确定所述指针或地址的每一个的源的重要性包括以下操作中的至少一个:确定所述文档的作者的引用数量、确定所述文档的作者所属的组织、以及确定由所述分析工具执行的分析类型;所述确定所述指针或地址的每一个的普及性包括以下操作中的至少一个:确定所述文档的引述数量和所述分析工具的使用频率;所述确定所述指针或地址的每一个指向或引用的生物序列的历史适用性包括以下操作中的至少一个:确定结合所述生物序列而引述所述文档的频率,以及确定使用所述分析工具来分析所述生物序列的频率;以及由所述处理器至少根据所述多个指针或地址的每个的排序,为所述一个或多个探测序列分配与所述目标生物序列的片段的亲和性级别。
地址 美国纽约