El análisis estadístico de los datos de conteo enfrenta desafíos particulares debido a su naturaleza. Estas variables aleatorias discretas suelen presentar distribuciones asimétricas, una alta proporción de ceros y, con frecuencia, sobre-dispersión (cuando la varianza supera significativamente la media), lo que dificulta la aplicación de métodos estadísticos convencionales. Estas características limitan el uso de modelos tradicionales como la regresión de Poisson, especialmente en escenarios con alta variabilidad en los datos.
Por ello, es fundamental seleccionar modelos estadísticos adecuados para su análisis. La elevada dispersión puede afectar las estimaciones de los parámetros y, en consecuencia, influir en las decisiones basadas en los resultados. Además, una elección inadecuada de la distribución puede generar interpretaciones erróneas sobre los patrones subyacentes. Ante esta situación, el modelo de regresión binomial negativa se presenta como una alternativa más apropiada para abordar la sobre-dispersión en los datos de conteo, permitiendo una inferencia más robusta que el modelo Poisson. Esta metodología se ejemplifica con datos reales del contexto colombiano y que tiene que ver con el consumo de drogas psicoactivas en jóvenes. |