Proyectos
Implementación de un motor de busqueda en línea para espectros de Resonancia Magnética Nuclear
Resumen
Como lo escribe el editorial de Nature [Editorial, 2009], más que nuevos portales web anunciados ruidosamente (Europeana, Geoportail) es necesario la creación de repositorios de datos en formatos únicos que puedan ser integrados fácilmente dentro de sistemas más grandes a futuro. La creación de estos repositorios libres debe permitir un acceso más democrático a la información y permitir así el desarrollo de herramientas para extraer nuevos conocimentos de la enorme cantidad de información almacenada con el fin de predecir propiedades de compuestos nuevos en el caso que nos interesa. La primera fase del proyecto (convocatoria renata anterior) ha permitido automatizar la transferencia de los datos generados por el espectrómetro RMN, usando un formato único y universal (JCAMP-DX, IUPAC), directamente a una base de datos en línea y crear un applet java que permite procesar los datos y visualizar los espectros en línea. El servicio está disponible, para toda la comunidad, en modo de producción en la dirección http://co.mynmrdb.org. El espectrómetro de la Universidad del Valle ha sido acoplado a la base de datos en abril de este año y se planea conectar el equipo de la Universidad Industrial de Santander tan pronto este instalado. Finalmente se haría la conexión del equipo de la Universidad Nacional durante el transcurso de este año. De esta manera, todos los espectros generados al nivel nacional serán almacenados en nuestra base de datos (servidor en Bogotá) en un formato único. Para hacer una analogía, es como si cada vez que un usuario saca un fotocopia, en vez de ser impresa, la copia se manda directamente dentro de una base de datos, a la cuenta del usuario. Luego, desde cualquier navegador internet se puede modificar, compartir, borrar e imprimir. De esta manera se superó el obstáculo más grande para la creación de bases de datos: la buena voluntad de los usuarios, ya que los espectros ingresan a la base de datos independientemente de los usuarios. Sin embargo, todavía depende del usuario llenar adecuadamente y completar la información correspondiente al espectro de manera que la información sea útil para una tercera persona. En la actualidad es posible que un mismo espectro aparezca bajo distintos nombres o no tenga ningún nombre válido. Igualmente, es posible que un usuario ya haya estudiado el mismo o un compuesto muy similar y que ya se encuentre el espectro elucidado en la base de datos, por lo que no sería necesario volver a hacer el trabajo. Por estas tres razones es necesario un motor de búsqueda en línea que permita buscar espectros similares dentro de una base de datos accesible por la red desde cualquier laboratorio del mundo. Eso permitiría verificar si ya existe una espectro similar dentro de la base de datos para detectar duplicados que aparezcan con nombre distintos, para encontrar un espectro similar que ya haya sido elucidado de manera a obtener la estructura sin más esfuerzos. Finalmente, a partir de las medidas de similitudes entre espectros del repositorio se podrían desarrollar herramientas de predicción automáticas útiles para resolver problemas de la industrias químicas y farmacéuticas del mundo. Queremos con su apoyo implementar y desarrollar herramientas (algoritmos) que permiten buscar muy rápidamente espectros similares en bases de datos en línea de gran tamaño y adicionalmente desarrollar e implementar algoritmos para mejorar nuestra capacidad de predecir muy rápidamente desplazamientos químicos. Queremos resaltar aquí que todos los desarrollos que se proponen a continuación y que pueden parecer abstractos serán implementados dentro del sistema existente (applet y base de datos) accesible para los usuarios de todo el mundo a través de la red. Es importante resaltar que el atractivo de nuestro sistema reposa sobre la idea de una base de datos única en un formato único por lo que es absolutamente necesario desarrollar herramientas de búsqueda para que esta base de datos sea manejable y útil para los usuarios. Al respecto mencionamos que la dirección técnica de MestreLab, productores y distribuidores del software MestRec Nova (60'000 usuarios en el mundo) se ha comprometido verbalmente (3 Meeting Iberoamericano de RMN, Angra de Reis, Brazil, 4-8 de mayo 2009) a integrar el acceso a nuestra base de datos en su última versión del software, precisamente con el fin de permitir búsquedas por espectros. Finalmente queremos mencionar que nuestra base de datos ya está siendo referenciada en blogs internacionales (http://zusammen.metamolecular.com/2009/03/09/sixty-four-free-chemistry-databases-serialized).
Convocatoria
Nombre de la convocatoria:Proyectos Jornada Docente
Modalidad:Proyectos Jornada Docente
Responsable