摘要 |
Grupo de moléculas de ácidos nucleicos codificantes de un grupo de proteínas repetitivas, comprendiendo cada proteína repetitiva un dominio repetitivo, que comprende un conjunto de módulos repetitivos consecutivos y un módulo de caperuza N-terminal y/o C-terminal que presenta una secuencia de aminoácidos diferente de cualquiera de dichos módulos repetitivos, en el que dichos módulos repetitivos presentan el mismo plegamiento y se apilan estrechamente para crear una estructura superhelicoidal que presenta un núcleo hidrofóbico común, en el que cada uno de dichos módulos repetitivos se deriva de una o más unidades repetitivas de una familia de proteínas repetitivas naturales, en el que dichas unidades repetitivas comprende residuos esqueléticos y residuos de interacción diana, en el que dichas proteínas repetitivas difieren en por lo menos una posición aminoácida de un residuo de interacción diana de los módulos repetitivos, y en el que dicha derivación de cada uno de dichos módulos repetitivos se lleva a cabo mediante un procedimiento que comprende las etapas siguientes: (a) identificar dichas unidades repetitivas, (b) determinar un motivo de secuencia repetitiva mediante análisis estructural y de secuencias de dichas unidades repetitivas, en el que dicho motivo de secuencia repetitiva comprende posiciones de residuo esquelético y posiciones de residuo de interacción diana, que corresponden a las posiciones de los residuos esqueléticos y los residuos de interacción diana en dichas unidades repetitivas, y (c) construir el módulo repetitivo, de manera que comprende el motivo de secuencia repetitiva de (b). |