Proyectos
METODOLOGIA ESTADISTICA EN EL ANALISIS DE DATOS LONGITUDINALES Y MEDIDAS REPETIDAS
Resumen
En el estudio del diseño de experimentos se usan modelos superparametrizados y modelos de medias de celdas; en estos casos la estructura de los datos puede ser balanceada o desbalanceada y aún de acuerdo con la naturaleza del problema y la complejidad del experimento, puede haber información faltante, es decir, presencia de celdas vacías. La presencia de celdas vacías generalmente no es planeada por el investigador, pues estas se presentan más por consecuencias ajenas al experimento que por las condiciones mismas del material experimental. Cuando hay presencia de celdas vacías, no todas las medias de celdas asociadas son estimables y las hipótesis sobre combinaciones lineales de medias pueden no tener ningún interés práctico o no tener solución dentro de la teoría general de las hipótesis lineales. Analizar datos con estructura desbalanceada en un modelo a N-vías de clasificación es un problema al que frecuentemente se enfrentan los investigadores. Éstos en la mayoría de los casos desconocen la forma correcta de realizar tales análisis. Ignorar este problema lleva a los experimentadores a cometer errores tales como: asumir el análisis de unos datos desbalanceados como si fueran balanceados, es decir, pensar en estar probando unas hipótesis cuando en realidad se están probando otras muy distintas, esto conlleva por lo tanto, en un análisis incorrecto de la información. Surge entonces la necesidad de reconocer las hipótesis a ser probadas cuando se presenta dicho problema y ver si estas son de interés para el investigador. Para dar solución a la presencia de celdas vacías o datos faltantes, se han propuesto en la literatura estadística varias salidas; se pueden citar principalmente las siguientes: repetir el experimento bajo las mismas condiciones iniciales, estimar los datos faltantes minimizando la suma de cuadrados del error introduciendo variables auxiliares o usando métodos iterativos de estimación y analizar los datos tal como están, es decir, realizar un análisis de la información en presencia de celdas vacías. La estimación de celdas vacías es un mecanismo utilizado frecuentemente por investigadores, sin embargo algunos procedimientos de estimación pueden contaminar la distribución original de los datos, concluyendo sobre datos que no tienen el mismo comportamiento de los datos originales. De igual forma se puede estar sobrestimando o subestimando las sumas de cuadrados, causas que pueden incurrir consecuentemente en la potencia de las pruebas estadísticas, llevando esto consigo a la toma de decisiones equivocadas. En algunos experimentos en el área de la biología, agronomía, genética, química, entre otras, se tienen información en donde no se cumplen los supuestos de simetría, no se cumple la homogeneidad de varianzas (puede haber problemas de sobre dispersión) , hay violación de los supuestos de normalidad, los cuales pueden obviarse mediante una apropiada transformación de los datos; sin embargo esta no es siempre una buena salida para el análisis La alternativa entonces, es hacer uso de modelos Lineales Generalizados, los cuales pueden estudiarse en Nelder & MaCullag (1989); Dobson (1993)., Demetrio (2003) entre otros. También se pueden usar técnicas No Paramétricas como las que propone Desu & Raghavarao (2003). En estudios multifactoriales, estudios de información experimental o no experimental con medidas repetidas y aún para ajustar Curvas de Crecimiento, el trabajar con medias de celdas conlleva a una reparametrización apropiada, lo cual se traduce en una mejor interpretación de la información y en consecuencia a un mejor análisis de la misma .Sin embargo , en nuestro medio estos desarrollos son incipientes. Esta , la razón que nos lleva a hacer esta propuesta de investigación , en donde se lleve a cabo el análisis de información para datos provenientes de ensayos experimentales en medidas repetidas y curvas de crecimiento, estudiadas en Crowder & Hand (1990), Andrade & Singer (1986), Pothoff & Roy (1964) entre otros. Se hace prioritario que se consolide un grupo de investigación que contribuya al desarrollo y difusión de estas metodologías, las cuales son ampliamente aplicadas en investigaciones provenientes de ensayos clínicos, biológicos, genéticos, en agricultura y muchas otras áreas del conocimiento . Adicionalmente, en este proyecto, la idea es proponer una metodología para la estimación de las celdas vacías e imputación de datos faltantes en diseños con distribución asimétrica, realizadas con base al modelo de medias de celdas modificado, puesto que cuando hay presencia de celdas vacías, este modelo resulta apropiado ya que se impone directamente sobre el modelo la restricción de no interacción y de esta forma es posible llevar a cabo la estimación de las celdas vacías.
Convocatoria
Nombre de la convocatoria:DINAIN 2003: Apoyo A Docentes Jóvenes Con Título De Ph.D. ó Doctorado Equivalente
Modalidad:DINAIN 2003: Apoyo A Docentes Jóvenes Con Título De Ph.D. ó Doctorado Equivalente
Responsable