Infecciones
Tipo de lactancia 0 1
Materna 0.965 0.035
Artificial 0.944 0.056
Mixta 0.963 0.037
<NA> 0.962 0.038
Pearson's Chi-squared test
data: tab
X-squared = 70.156, df = 2, p-value = 5.832e-16
Interpretación p-valor: existe evidencia de asociación
V de Cramer = 0.042
Interpretación: asociación insignificante o nula
6 Lactancia vs infecciones
6.1 Relación entre la prevalencia de leche materna y las infecciones
6.1.1 Sin diferenciar entre tipo de infecciones (respiratorias o digestivas)
La variable ‘Tipo de lactancia’ es una variable categórica de tres niveles y la variable ‘Infecciones’ es de dos niveles. No tenemos en cuenta los casos sin información del tipo de lactancia. Deberíamos imputar previamente esos valores (valorar con Esmeralda)
Medimos si la aparición de infecciones está relacionada con el tipo de lactancia.
Métodos{.underline}
La asociación entre el tipo de lactancia y la presencia de infecciones se midió mediante el test de la chi-cuadrado de Pearson, adecuado para variables categóricas. Se verifican los supuestos del test a partir de las frecuencias esperadas y, en caso de no cumplirse, se empleará el test exacto de Fisher. También se estima el tamaño del efecto mediante la V de Cramer, con el objetivo de cuantificar la magnitud de la asociación independientemente del tamaño muestral.
Resultados{.underline}
El test mostró evidencia de asociación estadística (p-valor = mirar p-valor arriba). Existe evidencia estadística de asociación entre el tipo de lactancia y la presencia de infecciones. La interpretación final debe basarse en el tamaño del efecto, ya que en muestras grandes la significación estadística puede sobreestimar la relevancia clínica del hallazgo. (Ref.) El tamaños del efecto muestra que mirar interpretación arriba.
Se valora ahora si la distribución del número de infecciones cambia según el tipo de lactancia. En caso de encontrar diferencias en las distribuciones se realizarán comparaciones post hoc entre pares de grupos.
Métodos{.underline}
Dado que la variable número de infecciones es de naturaleza de conteo, no se asume a priori la normalidad de la variable y su distribución se describe a través de mediana y rango intercuartílico. Además, a los valores superiores a 5 se les asigna el valor 5 en la base de datos.
Para evaluar la asociación de la variable de conteo número de infecciones con la variable categórica tipo de lactancia, se plantea un modelo de regresión de Poisson. A partir de este modelo se estiman los Incidence Rate Ratios (IRR) y sus intervalos de confianza al 95 %. Previamente, se comprueba el supuesto de equidispersión, es decir, que la media y la varianza de la variable de conteo sean aproximadamente iguales. En caso de detectarse sobredispersión, se emplea un modelo de regresión binomial negativa y se calculan sus IRR e intervalos de confianza al 95 %. De forma únicamente exploratoria, se emplea el test no paramétrico de Kruskal–Wallis para comparar la distribución del número de infecciones entre los grupos de lactancia.
Resultados{.underline}
Distribución de niños con y sin infecciones por año. (Más información en la pestaña ‘Análisis exploratorio’)
# A tibble: 2 × 6
tiene_infecciones `2018` `2019` `2020` `2021` `2022`
<fct> <dbl> <dbl> <dbl> <dbl> <dbl>
1 0 0.947 0.957 0.983 0.954 0.965
2 1 0.053 0.043 0.017 0.046 0.035
Distribución del número de infecciones.
# A tibble: 1 × 11
`1` `2` `3` `4` `5` `6` `7` `8` `9` `11` `12`
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 0.478 0.29 0.139 0.051 0.023 0.01 0.004 0.003 0.001 0.001 0.002
Distribución del número de infecciones (valores mayores a 5 se les asigna un 5).
# A tibble: 1 × 5
`1` `2` `3` `4` `5`
<dbl> <dbl> <dbl> <dbl> <dbl>
1 0.478 0.29 0.139 0.051 0.043
Mediana e IQR del número de infecciones por tipo de lactancia (solo casos donde el número de infecciones es > 0 para minimizar la distorsión del >90 % de los casos con cero infecciones).
| Characteristic |
Overall N = 1,5681 |
Materna N = 8481 |
Artificial N = 4271 |
Mixta N = 2931 |
p-value2 |
|---|---|---|---|---|---|
| n_infecciones | 2.00 (1.00-2.00) | 2.00 (1.00-2.00) | 2.00 (1.00-2.00) | 1.00 (1.00-2.00) | |
| 1 Median (Q1-Q3) | |||||
| 2 NA | |||||
La asociación entre el tipo de lactancia (variable categórica) y el número de infecciones (variable cuantitativa discreta de conteo) se estudió con un modelo de regresión de Poisson.
Varianza del número de infecciones: 0.18
Media del número de infecciones: 0.07
Ratio varianza/media = 2.45
Posible sobredispersión
Se observó sobredispersión en la variable número de infecciones (varianza = 0.18, media = 0.07; ratio varianza/media = 2.45), lo que indica desviación del supuesto de equidispersión de la distribución de Poisson (la sobredispersión es una característica común en datos de conteo reales (Ref.). Por ello, se consideró como alternativa un modelo de regresión binomial negativa, más flexible ante la presencia de sobredispersión. (Ref.)
De forma complementaria y con carácter exploratorio, se utilizó el test no paramétrico de Kruskal–Wallis para comparar la distribución del número de infecciones entre los grupos de lactancia.
Para la construcción de modelos estadísticos se toma como referencia para la variable tipo_lactancia el nivel Artificial.
[1] "Materna" "Artificial" "Mixta"
Dispersión: 2.4
Debido a la sobredispersión detectada, la relación se mide con un modelo de binomial negativa (hemos confirmado la sobredispersión que preveíamos)
Call: glm.nb(formula = n_infecciones ~ tipo_lactancia, data = data,
init.theta = 0.03687146168, link = log)
Coefficients:
(Intercept) tipo_lactanciaArtificial tipo_lactanciaMixta
-2.7402 0.4889 0.0773
Degrees of Freedom: 40086 Total (i.e. Null); 40084 Residual
(8418 observations deleted due to missingness)
Null Deviance: 5078
Residual Deviance: 5039 AIC: 17400
Interpretación de los coeficientes en un modelo binomial negativo:
- Intercepto: es la tasa esperada de infecciones en el grupo de referencia de lactancia (lactancia materna).
- Resto de coeficientes: son los IRR comparados con el grupo de referencia.
IRR IC 2.5 IC 97.5 significativo
(Intercept) 0.065 0.060 0.070 1
tipo_lactanciaArtificial 1.631 1.393 1.912 1
tipo_lactanciaMixta 1.080 0.917 1.274 0
tipo_lactanciaArtificial
IRR: 1.631 (significativo)
IRR > 1 -> efecto nocivo o de riesgo (comparado con latancia materna )
1.393 - 1 = 0.393 ( 39.3 % más en el mejor caso)
1.912 - 1 = 0.912 ( 91.2 % más en el peor caso)
Aumento del 39 al 91 % en la tasa de infecciones.
tipo_lactanciaMixta
IRR: 1.08 (no significativo)
IRR > 1 -> efecto nocivo o de riesgo (comparado con latancia materna )
0.917 - 1 = -0.083 ( -8.3 % más en el mejor caso)
1.274 - 1 = 0.274 ( 27.4 % más en el peor caso)
Aumento del -8 al 27 % en la tasa de infecciones.
El intercepto del modelo representa la tasa esperada de infecciones en la categoría de referencia del tipo de lactancia. Dicha tasa es baja, entre 0.06 y 0.07 infecciones por unidad de exposición, asumiendo un tiempo/periodo de seguimiento homogéneo (estoy suponiendo que es un año).
De forma exploratoria, se usa el test no paramétrico de Kruskal–Wallis para comparar los grupos sin asumir normalidad.
Kruskal-Wallis rank sum test
data: n_infecciones by tipo_lactancia
Kruskal-Wallis chi-squared = 70.33, df = 2, p-value = 5.347e-16
Existen diferencias estadísticamente significativas en el número de infecciones entre los tipos de lactancia (p = 5.35e-16 ).
Al menos un grupo difiere del resto.
Tamaño de efecto (epsilon^2): 0.001 ( efecto trivial desde el punto de vista práctico)