Calculadora de la prueba de rangos con signo de Wilcoxon - Muestras pareadas
Compara dos muestras relacionadas o mediciones repetidas con la prueba no paramétrica de rangos con signo de Wilcoxon. Obtén la estadística W, el valor Z y el valor p sin asumir normalidad.
Introduce tus mediciones pareadas antes/después separadas por comas. Ambas muestras deben tener la misma cantidad de valores.
Calculadora de la prueba de rangos con signo de Wilcoxon - Muestras pareadas
Compara dos muestras relacionadas o mediciones repetidas con la prueba no paramétrica de rangos con signo de Wilcoxon. Obtén la estadística W, el valor Z y el valor p sin asumir normalidad.
Acerca de la prueba de rangos con signo de Wilcoxon
La prueba de rangos con signo de Wilcoxon es una prueba de hipótesis estadística no paramétrica que se usa para comparar dos muestras relacionadas o mediciones repetidas en un mismo grupo. Es la contraparte no paramétrica de la prueba t pareada y se aplica cuando no puede justificarse el supuesto de normalidad de las diferencias entre pares.
Introducida por Frank Wilcoxon en 1945, la prueba es especialmente valiosa en ensayos clínicos y ciencias del comportamiento, donde se mide a las mismas personas antes y después de una intervención. En lugar de usar los valores crudos, la prueba ordena las diferencias absolutas entre observaciones pareadas y suma por separado los rangos asociados con diferencias positivas y negativas.
El procedimiento funciona así: para cada par se calcula la diferencia d = (after − before). Los pares con diferencia cero se excluyen. Las diferencias absolutas se ordenan de menor a mayor y, si hay empates, reciben el promedio de los rangos. La suma de rangos para las diferencias positivas es W⁺ y la de las negativas es W⁻. La estadística W es la menor de W⁺ y W⁻.
Para muestras más grandes (normalmente n ≥ 10), la distribución de W se aproxima mediante una normal. La puntuación Z se calcula usando la media y la desviación estándar de W bajo la hipótesis nula. La media es n(n+1)/4 y la desviación estándar es √[n(n+1)(2n+1)/24], donde n es el número de diferencias no nulas.
La hipótesis nula establece que la diferencia mediana entre observaciones pareadas es cero: el tratamiento no tiene efecto. La hipótesis alternativa es que la diferencia mediana no es cero (bilateral), o que es positiva o negativa (unilateral). Esta calculadora informa el valor p bilateral, que es la opción más conservadora.
Un valor p por debajo de 0.05 suele interpretarse como evidencia de que las mediciones pareadas difieren de forma significativa. En un estudio de presión arterial, esto podría indicar que un medicamento redujo significativamente la presión sistólica. En un estudio de psicología, podría mostrar que un programa de terapia redujo significativamente las puntuaciones de ansiedad.
La prueba requiere que las observaciones estén pareadas: cada observación de la Muestra 1 debe corresponder a una observación específica de la Muestra 2 (la misma persona en otro momento, o sujetos emparejados). Los pares deben ser independientes entre sí y las diferencias deben provenir de una distribución simétrica, aunque no necesariamente normal.
En comparación con la prueba t pareada, la prueba de rangos con signo de Wilcoxon es más robusta frente a valores atípicos y distribuciones no normales, aunque algo menos potente cuando se cumple la normalidad. Es la opción recomendada para muestras pequeñas, resultados ordinales o cuando hay valores extremos en los datos.
Ejemplos prácticos
Usa estos ejemplos para ver cómo funciona la calculadora con distintos conjuntos de datos pareados.
| Entrada | Salida | Nota |
|---|---|---|
| Antes: 140,135,150,160,130,145,155,138,148,152 — Después: 132,130,142,151,125,137,145,130,140,148 | W=0, Z≈−2.80, p≈0.005 | Medicamento para la presión arterial: todas las diferencias son negativas, reducción significativa. |
| Antes: 8,7,6,9,8,7,8,9 — Después: 6,5,5,7,6,6,7,7 | W=0, Z≈−2.52, p≈0.012 | Puntuaciones de ansiedad tras la terapia: mejora significativa con α = 0.05. |
| Antes: 75,80,82,79,88,90,76,85,89,92,78,84 — Después: 80,85,85,83,90,94,81,88,92,95,81,89 | W=0, Z≈+3.06, p≈0.002 | Notas de estudiantes antes y después de un nuevo método de enseñanza: ganancia muy significativa. |
Cómo usar la calculadora
- Introduce las mediciones antes del tratamiento (o de referencia) en el campo de la Muestra 1, separadas por comas.
- Introduce las mediciones correspondientes después del tratamiento en el campo de la Muestra 2. Ambas muestras deben tener exactamente la misma cantidad de valores.
- Haz clic en Calcular para obtener las diferencias, ordenarlas y producir la estadística W, el valor Z y el valor p.
- Un valor p inferior a 0.05 (mostrado en rojo) indica una diferencia estadísticamente significativa entre las dos condiciones.
- Usa los botones de ejemplo para cargar rápidamente conjuntos de datos reales y verificar la calculadora con resultados conocidos.
Preguntas frecuentes
¿Cuál es la diferencia entre la prueba de Wilcoxon y la prueba t pareada?
Ambas pruebas comparan mediciones pareadas, pero la prueba t pareada asume que las diferencias se distribuyen normalmente. La prueba de rangos con signo de Wilcoxon no hace ese supuesto y por eso se prefiere para muestras pequeñas, datos ordinales o datos con valores atípicos importantes. Cuando se cumple la normalidad, la t tiene algo más de potencia.
¿Qué ocurre con los pares cuya diferencia es cero?
Los pares en los que los valores antes y después son idénticos (diferencia = 0) se excluyen del análisis. El tamaño muestral efectivo n usado para calcular la estadística y el valor p solo cuenta las diferencias no nulas. Este es el procedimiento estándar recomendado en la mayoría de los libros de estadística.
¿Cómo se manejan las diferencias empatadas?
Cuando varios pares producen la misma diferencia absoluta, esos valores reciben el promedio de los rangos que ocuparían. Por ejemplo, tres pares con |d| = 5 que compiten por los rangos 4, 5 y 6 reciben cada uno rango 5. Esta corrección por rangos medios preserva la validez de la aproximación Z.
¿Por qué esta calculadora solo reporta un valor p bilateral?
La prueba bilateral es la más conservadora y la opción predeterminada en la mayoría de los estudios exploratorios. Comprueba si la diferencia mediana es cero en cualquiera de las dos direcciones. Para hipótesis direccionales (por ejemplo, que el tratamiento siempre mejora los resultados), puedes dividir entre dos el valor p bilateral mostrado para obtener el valor p unilateral.
¿Qué tamaño de muestra se necesita para que la aproximación Z sea válida?
La aproximación normal para la estadística W suele ser fiable cuando n ≥ 10 (después de eliminar las diferencias cero). Para muestras más pequeñas, conviene consultar los valores críticos exactos de la tabla de Wilcoxon. Esta calculadora usa la aproximación normal, así que conviene ser prudente con n < 10.