Proyectos
FORMALIZACIÓN DE UN MODELO TERMODINAMICO E INFORMATICO PARA ESTUDIAR LAS PROTEÍNAS E INVESTIGAR LA RELACION ESTRUCTURA FUNCION EN POLIPÉPTIDOS
Resumen
La relación entre la secuencia lineal y la estructura tridimensional, y entre la estructura tridimensional y la función, para el caso de las proteínas constituye uno de los problemas centrales de la biología molecular no solo por el interés teórico que despierta sino por las posibles aplicaciones a nivel de la biotecnología de obtención de biomoléculas con la capacidad de cumplir una actividad especifica de interés. Por otro lado, dentro de las ciencias de la complejidad han surgido propuestas para estimar y medir la complejidad en términos de la entropía de Shannon (H) y de la complejidad algorítmica de Chaitin (K). No obstante, estas propuestas son eminentemente teóricas, y hoy en día su desarrollo es insuficiente para buscar su aplicabilidad al nivel de la secuencia lineal de aminoácidos y, especialmente, al nivel de la estructura terciaria de una proteína. Este trabajo pretender mostrar que la resolución del problema estructura-función, estrechamente vinculado al problema de la relación entre secuencia primaria y estructura tridimensional, esta íntimamente asociada a la actividad informativa de las proteínas. Es decir, lejos de considerarlas como moléculas pasivas deben verse como moléculas procesadoras y usuarias de la información. El estudio de los sistemas informativamente activos se puede abordar desde la perspectiva de los sistemas complejos, por tanto se busca demostrar formalmente que las medidas de complejidad si tienen un sentido físico real, el cual permite abordar la relación estructura función a través de la medición de parámetros estructurales propios de las proteínas y que corresponden a H y K. La entropía de Shannon en este caso correspondería a los plegamientos posibles que puede sufrir una secuencia primaria para dar una(s) estructura(s) secundaria y terciaria en condiciones específicas en términos de la distribución de probabilidad de los estados o conformaciones posibles para una estructura determinada. La complejidad algorítmica de Chaitin presentaría dos aspectos, primero como una medida de la complejidad de la estructura terciaria (Kstr) y segundo como medida de la complejidad de la secuencia lineal de aminoácidos (Kseq). Aunque existen trabajos que sugieren la utilización de una u otra medida como descriptores estructurales de biomoléculas, en ningún caso se introducen consideraciones funcionales, es decir donde la descripción se hace de acuerdo a parámetros que ¿flexibilizan¿ la estructura hasta donde el reconocimiento molecular cruzado y el desempeño funcional se cumplen en unas condiciones similares a las de funcionamiento celular. En otras palabras, donde se haga una descripción las estructuras necesarias para el reconocimiento molecular. Por otra parte, Zurek (1989, 1990) propone un uso combinado de ambas medidas argumentando que la relación entre estas dos magnitudes permite explicar los aprovechamientos energéticos que ejercen los sistemas complejos, entendidos como ¿demonios de Maxwell¿, en su interacción con el entorno. Este modelo ha sido formulado a un nivel teórico en el campo de la teoría de la información y la termodinámica, y su pertinencia para el entendimiento de los sistemas biológicos ha sido argumentada por Andrade (2000). Sin embargo, este modelo requiere de una formalización rigurosa que permita prever su aplicación futura a la resolución de problemas concretos. De ahí la importancia de avanzar en esta formalización que en este caso no es una tarea exclusivamente matemática en el sentido de demostrar como se pasa de H a K manipulando símbolos de acuerdo a ciertas reglas, sino sobre todo debe apoyarse en datos empíricos tomados de proteínas para mostrar como estas transformaciones ocurren en la naturaleza. A nivel molecular se pueden identificar dos escalas de temporalidad en que esta conversión de información tiene lugar: 1. En el tiempo evolutivo a nivel global por acumulación de mutaciones detectables en la secuencia lineal aminoácidos. 2. En el tiempo que transcurre a nivel celular y local durante el plegamiento que conduce a estructuras especificas y funcionales. Es decir que para el caso de las proteínas su evolución y plegamiento se verían como instancias complementarias de un mismo proceso de recolección, procesamiento y uso de la información. Con el fin de fundamentar esta hipótesis, es necesario utilizar datos estructurales y de secuencias para proponer una medida del contenido de información mutua entre la estructura tridimensional y la secuencia lineal de las proteínas. Este trabajo busca diseñar e implementar metodologías que permitan calcular Kstr y Kseq generando matrices de datos y buscando las regularidades estadísticas que permitan la compresión de los datos. Este trabajo abre una vía de estudio al problema del plegamiento proteico, problema crucial de la biología molecular del presente. Contribuir a la resolución de este problema llevaría en un futuro al diseño de algoritmos computacionales que permitan para una secuencia dada de aminoácidos predecir las estructuras secundaria y terciaria más probables responsables del reconocimiento molecular y la posible funcionalidad de secuencias todavía desconocidas. Se trata de una línea de punta en investigación básica que permitiría poner a nuestro país y a la universidad a tono con las perspectivas que abre la ciencia del siglo XXI. Igualmente, permitiría contribuir al aprovechamiento de la información disponible en las bases de datos moleculares de acceso público como: GenBank, Protein Data Bank, CATH, SCOP, etc, para buscar una interpretación de los mismos. Hoy en día es casi más relevante el estudio de los datos ya producidos y almacenados relativos a secuencias génicas y estructuras proteicas que la obtención de nuevos datos; puesto que si no se avanza en el estudio de las proteínas, la información sobre secuencias genómicas se hará prácticamente imposible de interpretar.
Convocatoria
Nombre de la convocatoria:Convocatoria 2004 Para Proyectos De Investigación - Sede San Andrés
Modalidad:Convocatoria 2004 Para Proyectos De Investigación - Sede San Andrés
Responsable