Proyectos
CARACTERIZACION DE GRANDES FLUJOS DE DATOS DINAMICOS MEDIANTE TECNICAS DE AGRUPACION
Resumen
Se propone el desarrollo de un algoritmo de agrupación para minar flujos de datos dinámicos basado en los algoritmos de agrupación gravitacional INCRAIN [23], agrupación evolutiva ECSAGO [31], y agrupación basada en optimización analítica TRAC-STREAMS [26] (propuestos por los profesores Gómez, León y Nasraoui). Aunque estos algoritmos han sido previamente utilizados para minería de datos convencional, minería de texto y minería web, con resultados relativamente exitosos, no fueron diseñados para minar flujos de datos. En esta dirección, este proyecto pretende estudiar los detalles técnicos y operativos de estos algoritmos, compararlos y equipararlos con los propuestos en la literatura de minería de flujos de datos, para proponer una extensión y/o combinación de dichos algoritmos de tal forma que el algoritmo propuesto pueda minar flujos de datos bajo las restricciones que los flujos de datos presentan, es decir, datos que son generados de manera masiva y rápida (no es posible almacenarlos en su totalidad), que son dinámicos y que evolucionan rápidamente (por lo que los análisis de los datos deben ser generados en tiempos razonables para que sean útiles). Para validar dicha propiedad de minar flujos de datos (complejidad y calidad de los resultados), se usarán conjuntos de datos sintéticos, construidos y/o obtenidos de generadores dispuestos en la red. Finalmente, el algoritmo propuesto se aplicará a datos reales, posiblemente datos generados por navegaciones WEB, datos genéticos (ADN) o provenientes de imágenes satelitales.
Convocatoria
Nombre de la convocatoria:CONVOCATORIAS DE COLCIENCIAS
Modalidad:Proyectos financiados por Colciencias
Responsable