Bioquímica de las Macromoléculas
Evolución de estructura y función proteica Romina Hidalgo
proto prefijo proto prefijo del gr. prôtos gr. prôtos,, que significa primero. proteico, ca adj. Que Que cambia cambia con frecue frecuencia ncia de forma forma,, por alusión a Proteo; dios marino que habiendo recibido de su padre Neptuno el don de la profecía, para librarse de los que lo acosaban con sus preguntas cambiaba de forma cuando quería.
1
Evolución de estructura y función proteica
Introducción: Todos los organismos vivos son similares a nivel molecular, 20 aminocidos isómero ! y los mismos nucleótidos con la "#ri$osa% Esto est de acuerdo con la teoría de que todos poseen un ancestro com&n que 'a$ía adquirido esas características% (e asume que la diversidad a niveles mas altos de organi)ación es el resultado de la evolución divergente, y los procesos $ioquímicos ms $sicos 'an sido conservados, porque una alteración 'u$iera sido letal% !a comparación de las secuencias de *"+ y de proteínas es la manera mas aceptada para la reconstrucción de los procesos de evolución% Esto es porque la información contenida en esas secuencias es muy amplia% Una cadena de sólo 1000 nucleótidos (como para codificar una proteína promedio) puede existir como cualquiera de 41000 (10600 ) secuencias diferentes. !as variaciones evolutivas de una proteína, aportan muc'a información so$re la proteína en sí misma% !a evolución divergente 'acia distintas especies resulta en variaciones de la misma proteína, con esencialmente la misma función $iológica pero diferente secuencia% !as diferencias y similitudes en la secuencia reflean la estricte) necesaria para estructura y función para esa proteína% !as relaciones evolutivas nos dan indicios del rol $iológico de pro teínas no caracteri)adas% -roteínas que son muy similares en estructura y secuencia pueden llevar a ca$o funciones distintas, y proteínas con estructuras distintas pueden tener funciones idénticas% (e sa$e que la función y la estructura tridimensional estn íntimamente relacionadas% Entender la evolución de la función puede aportar datos para el dise.o de proteínas con funciones nuevas%
Mutaciones y estructura proteica !as consecuencias de las mutaciones so$re la estructura, depende de la u$icación de los nucleótidos afectados en el gen, incluso puede ser inocua% !as mutaciones pueden cortar el polipéptido, o reempla)ar un aminocido por otro% !a importancia de este cam$io tendr relación con la similitud química de los aminocidos, y ser muc'o mayor si afecta a modificaciones post traduccionales, como el clivae proteolítico% /nserciones y deleciones, afectan el marco de lectura, y este tipo de mutaciones produce una cadena peptídica irreconoci$le% Mutaciones en regiones no codificantes puede alterar la cantidad de proteína sinteti)ada, e incluso el splicing, afectando dramticamente a la proteína% !uego de la eistencia de material genético funcional, su compleidad 'a$ría aumentado mas fcilmente de$ido a la duplicación de genes eistentes que por generación de nuevo material genético% on dos copias de cada gen disponi$les, una copia puede proveer la función original necesaria, y la otra acumular las mutaciones que alteran esa función% (i esta copia alterada eventualmente sirve para una nueva función, pro$a$lemente quede retenida en el genoma y pasado a las siguientes generaciones% !os genes que ocupan el mismo locus en diferentes especies, y las proteínas producto de esos genes, se llaman ortólogos, mientras que genes de diferentes loci, pero relacionados por duplicación de genes son designados parálogos% !a filogenia de las especies puede reconstruirse solo comparando los genes ortólogos% las diferencias entre genes parlogos de diferentes especies no est relacionada con el tiempo desde la divergencia, sino con el tiempo desde la duplicación de los genes%
2
Bioquímica de las Macromoléculas
"efiniciones Término omólogo
*nlogo
4rtólogos -arlogos 5esiduos funcionales
"efinición (urgieron de una proteína ancestral en com&n, y su relación evolutiva es evidente por similitudes en la secuencia, la estructura y3o en la función (on similares de alguna forma, pero no 'ay evidencias de ancestro com&n% *nlogos estructurales comparten el mismo plegamiento, y anlogos funcionales la misma función% (on genes equivalentes en diferentes especies que surgieron de un ancestro com&n por especiación% (urgieron por duplicación de genes dentro de un genoma, y tienen funciones diferentes, pero generalmente relacionadas% /ncluyen residuos de unión, en contacto con sustrato y cofactor, y residuos catalíticos que intervienen en el mecanismo en)imtico%
Elongación proteica por duplicación intragénica -arte o toda la secuencia de aminocidos es duplicada si se mantiene el marco de lectura% !as porciones duplicadas pueden acumular cam$ios por mutaciones y divergir% (e o$serva este fenómeno en proteínas con dos mitades de secuencia muy similares, y en la estructura tridimensional, dos dominios gemelos 6como el caso de las ferredoinas, al$&mina, fi$rinógeno y colgeno7%
Fusión de genes "ado que eisten un n&mero limitado de plegamientos, y una cantidad inmensura$le de actividades requeridas para la vida, la construcción modular 'a sido un importante mecanismo para originar funciones nuevas% !a fusión de genes ocurre mas frecuentemente en eucariotas que en procariotas, pro$a$lemente porque las dos regiones codificantes de *"+ tienen que estar unidas eactamente con el mismo marco de lectura si ocurre en intrones% "os regiones codificantes pueden ser eficientemente fusionadas por recom$inación genética con un intrón entre ellas que puede ecisionarse fcilmente% !a eistencia de intrones en el genoma pareciera facilitar la fusión, duplicación y rearreglo de segmentos de genes% ay evidencias que indican que las proteínas mosaico surgieron a partir del s'uffling de intrones y eones% !a fusión de genes no est restringida a los eucariotas, y tam$ién ocurre en procariotas, donde como no 'ay intrones, la fusión de$e ser precisa% -or eemplo, en la $iosíntesis del triptofano se requieren cinco reacciones que son catali)adas por cinco actividades en)imticas diferentes, las cuales en alguna $acterias ocurren en cinco en)imas diferentes, codificadas por diferentes genes% En otras $acterias, como Esc'eric'ia coli, dos pares de estos genes estn fusionados para producir dos polipéptidos $ifuncionales% En cada polipéptido $ifuncional, las dos actividades en)imticas estn dirigidas por regiones separadas de la cadena polipeptídica, que son 'omólogas a las correspondientes proteínas de otras $acterias% El método 8mi and matc'9 pro$a$lemente sea la ruta ms rpida para nuevas funciones genéticas% !a fusión de genes puede generar funciones totalmente nuevas, como en las que el sitio activo se u$ica entre dos o ms sitios distintos% !a fusión genética no necesariamente modifica la función proteica, y la multiplicidad de dominios puede ser refleo de la organi)ación del genoma% El algunos sistemas de proteínas, sin em$argo, la eistencia de dos o ms centros catalíticos dentro de una sola cadena es $eneficioso ya que facilita la canali)ación de los intermediarios o sustratos en pasos sucesivos en el meta$olismo%
:
Evolución de estructura y función proteica
Reclutamiento de genes (e refiere a la adquisición de nuevas funciones por un gen eistente% (eg&n el reclutamiento, genes multifuncionales son sueto de dos o ms presiones de selección, resultando en limitaciones en la adaptación% Estas presiones pueden llevar a uno de tres cam$ios; mutaciones locales para aumentar una función sin comprometer la otra% separación de la función 6por duplicación y especiali)ación7% reversión del reclutamiento%
Protein Data Bank (PDB) omo la estructura est muc'o ms conservada que la secuencia, estos datos facilitan la identificación de relaciones evolutivas que estn ocultas a nivel de la secuencia% estos estudios sostienen que el mínimo n&mero de familias proteicas es finito con un mínimo estimado en 1000 diferentes plegamientos% ay dos puntos de vista para clasificar estructura; filogenético con un r$ol filogenético, relacionando las distintas familias de acuerdo a su relación evolutiva% teóricamente 'ay un &nico resultado 8correcto9% fenotípico descripción de la estructura 6clase, arquitectura y tipo de plegamiento7% Esta descripción no es a$soluta, pero muy &til%
Dominios !as proteínas mas grandes tienen dominios reconoci$les, pensados como unidades evolutivas, unidades estructurales compactas% 'ay evidencia de que se pueden plegar independientemente% pueden formar proteínas multimodulares e incluso, un dominio insertarse en otro% Todos los esquemas de clasificación de proteínas apuntan a dividirlas seg&n los dominios, pero la información estructural es muy incompleta 6a la mayoría de las proteínas no se les 'a determinado la estructura7%
lasificación de dominios proteicos *T; !os dominios son asignados por herencia 6para proteínas con secuencia muy similar a otra que ya esté en la $ase de datos7 o por consenso 6si en tres algoritmos diferentes se deduce la misma estructura7 o manualmente 6si los algoritmos no aportan la misma respuesta7% (4-; !as asignaciones son 'ec'as manualmente y las proteínas pertenecen a un dominio sólo si uno de los dominios eiste independiente en la $ase de datos%6!a serín proteinasa es 2 $arriles β en *T y un solo dominio en (4-7% "*!/ y <*(T; (on totalmente automati)ados% !as proteínas se consideran de la misma familia de 'omólogas si cumplen una de estas condiciones; evidencia de similitud de secuencia significativa% • evidencia de similitud de estructura significativa% • • evidencia de similitud funcional, u$icación y configuración del sitio activo%
=
Bioquímica de las Macromoléculas
Relaciones Estructura/ Función enzimática
lase y función En cuanto al contenido de estructura secundaria 6el amplio nivel de estructura7, se 'a encontrado dominancia de α 3β en en)imas en comparación con no en)imas% esto reflea la importancia de dominios de unión a nucleótidos en la función celular, y puede sugerir m<iples eventos de duplicación para el uso meta$ólico% !a clase donde predomina α no es a$undante en en)imas, y esto se puede de$er a la in'a$ilidad de los grupos polares dentro de la 'élice a estar involucrados en unión o catlisis, ya que sus puentes de 'idrógeno estn satisfec'os 6en los $ordes de las 'oas β los grupos para formar puentes de 'idrógeno estn accesi$les7% El primer n&mero E define el tipo de en)ima 6oidorreductasa, transferasa, etc%7% +o se encontró una relación clara entre este n&mero y la clase% (in em$argo, para varios ligandos comunes 6'emo, "+*, car$o'idratos, nucleótidos7 se encontró una nota$le tendencia ciertas clases de proteínas definidas por requerimientos estereoquímicos para unión de ligando% !a actividad en)imtica dependería del arreglo específico de unos pocos residuos en el sitio activo%
Plegamiento y función ay evidencias para creer que eiste un n&mero limitado de plegamientos en la naturale)a, pro$a$lemente de$ido a las limitaciones fisicoquímicos del plegamiento proteico% onsecuentemente, familias de en)imas diferentes evolutivamente con funciones no relacionadas pueden compartir una estructura com&n, y la similitud estructural no necesariamente implica una relación evolutiva% !a mayoría de los plegamientos tienen una familia 'omóloga relacionada, y puede ser considerado esencialmente como un plegamiento funcional% !os plegamientos ms comunes son; 5ossman> α 3β> del tipo inmunoglo$ulina> $arril α 3β 6T/M7> y el α no#$undle represor de "+*% El $arril T/M eemplifica la versatilidad funcional de algunas estructuras, asociado a por lo menos seis funciones catalíticas% Esta versatilidad se de$e pro$a$lemente a que los residuos del sitio activo se locali)an invaria$lemente en el etremo car$oilo de las 'e$ras β o en los loops siguientes, por lo que el sitio activo puede estar en uno de los oc'o motivos α 3β%
?
Evolución de estructura y función proteica
Familias !omólogas y función !a función descri$e el rol de una proteína como un todo, y no siempre es posi$le identificar cada su$función con cada dominio constituyente% En algunas en)imas el sitio activo se puede asignar a un dominio inequívocamente, pero en otras, varios dominios cumplen el rol de la actividad catalítica% !a aplicación de un plegamiento en diversas funciones celulares de$e 'a$er simplificado los procesos meta$ólicos durante la evolución% omo es de esperarse, familias en las que la función en)imtica no est conservada, su estructura tiene una diversidad muc'o mayor%
"n#logos funcionales En el otro etremo, es com&n encontrar en)imas con la misma actividad con estructura diferente% -ro$a$lemente estos anlogos funcionales 'ayan surgido de la duplicación de sitios activos eistentes que asumen nuevos roles catalíticos de$ido a peque.as modificaciones% Esta 'ipótesis se refuer)a cuando se encuentra una en)ima en un n&mero reducido de especies, y la familia de donde proviene ampliamente distri$uida% !a identificación de anlogos en)imticos provee muc'a información so$re la evolución de rutas meta$ólicas, y la diversidad $ioquímica de los grandes genomas, que contiene mayor rique)a en parlogos y anlogos% +ota$lemente, ninguna de las en)imas involucradas en la replicación del "+* tiene un ortólogo com&n en *rc'aea, acteria y !u"ar#a, por lo que se cree que el ancestro com&n a los tres dominios ms antiguo puede no 'a$er tenido genoma de "+*% !os anlogos funcionales son eemplos de la convergencia funcional y tam$ién del mecanismo de convergencia, tipificado por las serín#proteasas% (u actividad catalítica est dada de la orientación espacial de unos pocos aminocidos, y no es raro que esta misma conformación del sitio activo se encuentre en diferentes contetos estructurales% /ncluso se cree que las com$inaciones catalíticas sean un n&mero limitado que se repite durante la evolución%
@
Bioquímica de las Macromoléculas
Mecanismos de la evolución funcional !a secuencia genética cam$ia, cam$iando la estructura tridimensional, y por lo tanto la función% -osi$les caminos a nuevas funciones; +ueva función proteica •
nuevo gen A nueva proteína A nueva función
•
moonlig'ting; el mismo producto génico puede tener distintas funciones en distintos am$ientes, la función es dependiente del p, locali)ación celular, ligandos disponi$les, etc%
•
mutaciones; mutaciones locales que llevan a una actividad distinta, pero relacionada con la original%
•
oligomeri)ación; nuevas funciones con oligómeros idénticos, relacionados, o muy diferentes entre sí%
•
duplicación; nuevo producto génico con nueva función%
•
construcción modular 6mi and matc'7, nuevas
actividades al unirse dos genes% "ctividad catal$tica y especificidad de sustrato !a actividad catalítica y la especificidad por el sustrato caracteri)an las propiedades funcionales de las en)imas% (us determinantes estructurales pueden ser independientes, esto le confiere una ventaa evolutiva a la en)ima, ya que la actividad puede ser modificada sin comprometer la especificidad por el sustrato, y viceversa% !as en)imas primitivas pro$a$lemente tuvieron un amplio rango de actividades y3o especificidad por el sustrato, y se fueron especiali)ando al incorporar en la evolución grupos funcionales adicionales% Especificidad de sustrato Est directamente determinada por la naturale)a de los residuos de unión, aprovec'ndose las propiedades de los 20 aminocidos% /ncluso la especificidad puede ser redise.ada en la$oratorio por mutaciones puntuales% !os loops superficiales generalmente contienen los determinantes estructurales para la especificidad de sustrato, y esto facilita la rpida divergencia evolutiva y la adaptación, ya que puede variar la estructura del loop sin afectar el plegamiento glo$al de la proteína% !a naturale)a química de los residuos involucrados en la interacción no es necesariamente el &nico determinante de la especificidad% se 'an encontrado que la mutación de algunos residuos leanos le dan forma al sitio activo para la complementariedad del sustrato%
%ecanismo catal$tico *lgunas familias en)imticas presentan gran divergencia en sus actividad catalítica, como tam$ién en su especificidad por el sustrato% El estudio detallado de su estructura y sus características $ioquímicas revelaron que las diferentes actividades y sus reacciones asociadas compartían cofactor, nucleófilo o mecanismo de reacción% on el descu$rimiento de proteínas 'omólogas que catali)an un paso $ioquímico com&n en los contetos de diferentes reacciones glo$ales, se vió que los residuos esenciales para dic'a actividad se conservan durante la
Evolución de estructura y función proteica
evolución, mientras que los grupos funcionales adicionales determinan el destino del intermediario de reacción, como la especificidad por el sustrato%
Evolución de rutas meta&ólicas +o se conoce cuntas proteínas ancestrales diferentes 'u$o originalmente, pero puede que 'aya sido una sola% !as 'omologías distantes se notan mas en la estructura tridimensional 6muy conservada7 que en la estructura primaria% /ndicadores de 'omología entre proteínas que divergieron 'ace muc'o tiempo, sugiere que la mayoría de las proteínas catali)an 'oy las vías meta$ólicas pueden 'a$er surgido de la duplicación de unos pocos genes% ay una teoría que dice que las en)imas de las rutas $iosintéticas surgieron en el orden opuesto en el que estn en la ruta por un proceso de duplicación de genes% !a proteína que 'oy es <ima en la ruta $iosintética tiene un sitio de unión para el sustrato presente en la 8sopa9 original% si el gen para esta proteína fuese duplicado, la proteína del segundo gen podría mantener el sitio de unión para el mismo sustrato y desarrollar la capacidad de producirlo como un producto de otros componentes de la sopa primordial% ay muc'os casos donde en)imas de distintas rutas meta$ólicas con función catalítica similar pero afinidad por diferentes sustratos presentan 'omologías% En este <imo caso, la evolución de las duplicadas alteró la especificidad por el sustrato, pero mantuvo el mecanismo catalítico%
'ecuencias naturales separadas por grandes distancias En)imas termofílicas comparten sólo 20#:0C de su secuencia aminoacídica con una de am$ientes ms fríos% -ara sa$er cules aminocidos son importantes en la adaptación se determinarían por sustitución de cada uno, lo cual, por las com$inaciones posi$les, sería imposi$le% 4tra dificultad es identificar qué propiedades son de$idas a las presiones evolutivas, cómo era la en)ima primitiva% *dems algunos organismos estn suetos a compleas com$inaciones de presiones de selección% +o todas las diferencias entre las propiedades en)imticas son refleo de la adaptación, las mutaciones neutrales son neutrales con respecto al fitness pero no necesariamente a todos los comportamientos en)imticos% Relevancia &iológica vs fisicou$mica !as en)imas son productos evolutivos y si $ien estn suetos a las leyes físicas y químicas, el proceso evolutivo tiene mayores limitaciones% la evolución selecciona las funciones en)imticas $iológicas relevantes%
D
Bioquímica de las Macromoléculas
Evolución en la&oratorio Es una 'erramienta reciente para estudiar la función y adaptación en)imtica, que nos permite o$servar adaptación $ao condiciones controladas% omo se pueden definir las presiones evolutivas, se pueden eplorar funciones no naturales, y distinguir lo $iológicamente relevante de lo físicamente posi$le% pasos; • generar diversidad 6mutagénesis al a)ar y3o recom$inación in vitro7 • identificar variantes meoradas El gen que codifica para la proteína se altera y se determina el efecto so$re el organismo, por lo que se estudia su función in vivo% *lteraciones genéticas de la estructura de la proteína tiene la ventaa de ser etremadamente específicas% uando la proteína est $ien caracteri)ada genéticamente, lo ideal es 'acer mutagénesis sitio dirigida% *lternativamente, cuando se conoce poco de la proteína o del gen, se pueden seleccionar el efecto fisiológico deseado luego de mutagénesis al a)ar% 4tra alternativa es interrumpir el gen de interés con una secuencia de inserción% !uego de 'a$er generado distintas mutaciones del mismo gen, se eligen aquellas que alteran la estructura y3o la función de la proteína% +o 'ay procedimientos generales para esta selección porque el procedimiento a utili)ar es necesariamente específico para cada gen y proteína y tam$ién depende del organismo% (in em$argo, las mutaciones que alteran la función de la proteína normal usualmente son seleccionados inicialmente% (i la mutación es letal para el organismo, pero que act&en sólo $ao ciertas condiciones, como las mutaciones 8letal condicional9> las ms usadas son las que dan sensi$ilidad a temperatura% !uego de la primer elección, los genes mutados que revierten el efecto de la primer mutación pueden ser seleccionados> unas pocas revierten la primer mutación, pero otras son mutaciones en otros lugares, y se puede aislar la proteína% Mutaciones que afectan una función en particular, se puede de$er a una alteración de residuos específicos, o indirectamente, in'i$iendo la síntesis de la proteína o destruyendo su estructura terciaria% !a naturale)a de las mutaciones que son seleccionadas por este procedimiento, como tam$ién las que producen proteínas suficientemente normales para evitar el proceso de selección, es muy importante para estudiar la estructura y función proteica%
Evolución de estructura y función proteica
Bibliografa: • Finc' !+, Gris'in, +<% Evolution of protein structures and functions $urr %pin &truct iol
2002, 12;=00#=0D% • T'ornton HM, 4rengo * , Todd *E, -earl IMG% Protein folds* functions and evolution ' ol
iol 1, 2:;:::#:=2% • Todd *E, 4rengo *, T'ornton HM% Evolution of protein function* from a structural
perpective $urr %pin $hem iol 1, :;?=D#??@% • Jood T, -earson J5% Evolution of protein secuences and structures% H Mol Biol 1,
21;#?% • *rnold I, Jintrode -!, Miya)aKi F, Gers'enson *% Ho+ en,ymes adapt- lessons from
directed evolution rends iochem &ciences 2001, 2@;100#10?%
10