Ayuda básica
En la planificación de un estudio para estimar diferencias entre las proporciones de las poblaciones a las que pertenecen dos grupos, tenemos que estimar el tamaño de muestra necesario en función de los valores de las proporciones de los grupos en estudio, el nivel de confianza y la potencia. Normalmente el valor utilizado para el nivel de confianza es 95%, mientras que generalmente se usan valores del 80% para la potencia.
El tamaño de muestra de cada grupo se puede calcular para pruebas estadísticas unilaterales (si interesa saber si la proporción de un grupo es, o bien superior, o bien inferior, a la del otro grupo) o bilaterales (si interesa saber si hay o no diferencia entre ambas proporciones en cualquiera de los dos sentidos).
Otra posibilidad que nos podemos encontrar es la necesidad de calcular si el valor de la proporción observada en un grupo difiere (cualquiera de los casos anteriormente descritos) del valor que se esperaría encontrar en una población determinada (valor observado frente a valor esperado).
Ayuda avanzada
1. Comparación de dos proporciones
Cuando queremos comparar las proporciones observadas en dos grupos, planteamos como hipótesis nula que no existe diferencia entre ambos valores
H0: P1=P2
Para poder calcular el tamaño de muestra que se debe seleccionar en cada grupo debemos tener en cuenta la hipótesis alternativa deseada, que dependerá del tipo de contraste estadístico a realizar:
H1: P1<P2, o P1>P2 (contraste unilateral)
$
n={\left(Z_\alpha\sqrt{2\overline{P}(1-\overline{P})}+Z_\beta\sqrt{P_1(1-P_1)+P_2(1-P_2)}\right)^2\over (P_1-P_2)^2}
$
$
\overline{P}=\dfrac{P_1+P_2}{2}
$
En los casos que los valores de las proporciones observadas sean menores de 0.05 (5%) se utilizará como fórmula alternativa:
$
n=\dfrac{(Z_\alpha+Z_\beta)^2}{ 2\left(arcsen\sqrt{P_2}-arcsen\sqrt{P_1}\right)^2}
$
donde:
Zα: valor de Z para un nivel de confianza NC=1-α (Z0,05=1,64)
Zβ: valor de Z para un nivel de potencia P=1-β (Z0,2=0,842)
P1: proporción esperada en el grupo 1
P2: proporción esperado en el grupo 2
H1: P1≠P2 (contraste bilateral)
$
n={\left(Z_{\alpha/2}\sqrt{2\overline{P}(1-\overline{P})}+Z_\beta\sqrt{P_1(1-P_1)+P_2(1-P_2)}\right)^2\over (P_1-P_2)^2}
$
$
\overline{P}=\dfrac{P_1+P_2}{2}
$
En los casos que los valores de las proporciones observadas sean menores de 0.05 (5%) se utilizará como fórmula alternativa:
$
n=\dfrac{(Z_{\alpha/2}+Z_\beta)^2}{ 2\left(arcsen\sqrt{P_2}-arcsen\sqrt{P_1}\right)^2}
$
donde:
Zα/2: valor de Z para un nivel de confianza NC=1-α (Z0,05/2=1,96)
Zβ: valor de Z para un nivel de potencia P=1-β (Z0,2=0,842)
P1: proporción esperado en el grupo 1
P2: proporción esperado en el grupo 2
2. Comparación de una proporción y la proporción esperada
Cuando queremos comparar la proporción observada en un grupo con una proporción esperada, planteamos como siguiente hipótesis nula
H0: P1=P0
Para poder calcular el tamaño de muestra que se debe seleccionar debemos tener en cuenta la hipótesis alternativa deseada, que dependerá del tipo de contraste estadístico a realizar:
H1: P1<P0, o P1>P0 (contraste unilateral)
$
n={\left[Z_\alpha\sqrt{P_0 (1-P_0)}+Z_\beta\sqrt{P_1(1-P_1)}\right]^2\over \left(P_0-P_1\right)^2}
$
donde:
Zα: valor de Z para un nivel de confianza NC=1-α (Z0,05=1,64)
Zβ: valor de Z para un nivel de potencia P=1-β (Z0,2=0,842)
P1: proporción observada (muestra)
P0: proporción esperada (población)
H1: P1≠P0 (contraste bilateral)
$
n={\left[Z_{\alpha/2}\sqrt{P_0 (1-P_0)}+Z_\beta\sqrt{P_1(1-P_1)}\right]^2\over \left(P_0-P_1\right)^2}
$
donde:
Zα/2: valor de Z para un nivel de confianza NC=1-α (Z0,05/2=1,96)
Zβ: valor de Z para un nivel de potencia P=1-β (Z0,2=0,842)
P1: proporción observada (muestra)
P0: proporción esperada (población)
Ejemplo
1. Comparación de dos proporciones
Vamos a realizar un estudio en el que queremos comprobar si la prevalencia frente a una determinada enfermedad es diferente en machos que en hembras. La hipótesis de trabajo es que en hembras es del 10% y en machos es del 20%, ¿Cuántos individuos de cada sexo debemos seleccionar para confirmar esta diferencia?
Los datos del problema son:
H0: hipótesis nula = (π1 = π2)
H1: hipótesis alternativa = (π1 ≠ π2)
NC: nivel de confianza deseado = 95%
P: potencia deseada = 80%
P1: porcentaje grupo 1 = 10%
P2: porcentaje grupo 2 = 20%
Necesitaremos tomar una muestra de al menos 200 individuos de cada grupo (200 machos y 200 hembras) para poder confirmar si existe diferencia entre las prevalencias.
2. Comparación de una proporción y la proporción esperada
Vamos a realizar un estudio en el que queremos comprobar si la prevalencia observada frente a una determinada enfermedad en una población es menor a la esperada. La hipótesis de trabajo es que hemos observado una prevalencia del 10% aunque lo esperado era una prevalencia del 20%. ¿Cuántos individuos debemos seleccionar para confirmar esta hipótesis?
Los datos del problema son:
H0: hipótesis nula = (π1 = π0)
H1: hipótesis alternativa = (π1 < π0)
NC: nivel de confianza deseado = 95%
P: potencia deseada = 80%
P1: porcentaje observado = 10%
P0: porcentaje esperado = 20%
Necesitaremos tomar una muestra de al menos 83 individuos para poder confirmar nuestra hipótesis.