Los resultados experimentales de los ensayos de genómica funcional son las consecuencias de las dependencias entre elementos funcionales del genoma, sus ácidos nucleicos y productos proteicos. Existen varios enfoques para identificar las relaciones entre los componentes celulares basados en análisis diferenciales de los elementos medidos y la agrupación de dichos elementos en módulos, así como métodos que intentan inferir estados y trayectorias celulares.
En este proyecto estudiamos técnicas de aprendizaje de máquina de múltiples vistas y sus aplicaciones a conjuntos de datos multi-ómicos. Buscamos demostrar la capacidad de estos métodos para identificar patrones, priorizar vacíos en información y aprovechar la redundancia inherente en los datos existentes. Se busca proponer nuevos análisis integradores sobre los grandes repositorios de datos ómicos existentes, útiles para explorar modelos de función celular y de procesamiento de información en la célula.
Los algoritmos y modelos existentes para la identificación de procesos celulares en datos multi-omicos presentan limitaciones para integrar colecciones de experimentos heterogéneos. Así mismo, las técnicas de modelamiento de sistemas celulares están limitadas por la complejidad del sistema objetivo, y aunque se han construido modelos predictivos, su falta de interpretabilidad limita su utilidad. La dificultad principal es la identificabilidad de los modelos propuestos a partir de los datos debido a factores ambientales y genéticos, y la dificultad para distinguir la causalidad de la correlación y el ruido en la mayoría de los conjuntos de datos. Sin embargo, debería ser posible explotar la redundancia, la alta correlación y la no negatividad de los datos multi-ómicos.
El impacto potencial del crecimiento en el volumen, la variedad y la complejidad de los datos ómicos en aplicaciones como el cáncer y la medicina de precisión, podría lograrse mediante el uso de modelos integradores adecuados. El aprendizaje de múltiples vistas podría ayudar a escalar las dificultades inherentes de trabajar con datos ómicos de alta dimensionalidad al explotar la complementariedad, causalidad y heterogeneidad mutuas presentes en los datos multi-ómicos. |