La toma de datos en las ganaderías se ha vuelto una rutina necesaria para alcanzar la optimización y mejoras productivas dentro de los hatos; sin embargo, en Colombia los ganaderos solo recolectan información puntual de características de que por mucho tiempo han sido de interés productivo, sin tener en cuenta que podrían medirse otras características o simplemente, tener una mayor volumen de medidas, como por ejemplo, los pesajes a diferentes edades que dan un reflejo de cómo crece el animal, lo que podría llevar a mejor toma de decisiones productivas. Es por ello, que se hace necesario implementar una estrategia que ayude a aumentar la disponibilidad de información. Este trabajo tiene como objetivo identificar un método que tenga buen desempeño para imputar datos. Este estudio se enfocará en la estimación de pesos a edades de 4 y 24 meses de la ganadería San Juan de Bedouth, por medio de imputación de datos. Se contará con una base de datos de aproximadamente 15000 animales con información de pesajes a diferentes edades y factores que determinan dicho peso. Se trabajará con las metodologías de Machine Learning (Redes Neuronales y K vecinos más cercanos) y Modelos Mixtos, modelos que se entrenarán en el software Rproject. Con estas metodologías se pretende hacer una predicción de pesajes faltantes en los animales, previo entrenamiento de los modelos a ser utilizados (75% de la base de datos) y posterior validación de los resultados con una la base de datos de prueba (25% de la base de datos). Para identificar la metodología que realiza una mejor predicción de datos faltantes, se utilizarán las métricas de acuracia, correlación entre valores reales y predichos y por medio de la matriz de confusión, que además reportará información de sensibilidad y especificidad de cada modelo utilizado. Con base en estos resultados se podrá determinar si estas metodologías o por lo menos una de ellas, es eficiente a la hora de hacer imputación de datos para crecimiento de bovinos Brahman, en la hacienda objeto de estudio. |