Calculateur du test des rangs signés de Wilcoxon - Échantillons appariés

Comparez deux échantillons liés ou des mesures répétées avec le test non paramétrique des rangs signés de Wilcoxon. Obtenez la statistique W, le score Z et la valeur p sans supposer la normalité.

Saisissez vos mesures appariées avant/après séparées par des virgules. Les deux échantillons doivent contenir le même nombre de valeurs.

Calculateur du test des rangs signés de Wilcoxon - Échantillons appariés
Comparez deux échantillons liés ou des mesures répétées avec le test non paramétrique des rangs signés de Wilcoxon. Obtenez la statistique W, le score Z et la valeur p sans supposer la normalité.

À propos du test des rangs signés de Wilcoxon

Le test des rangs signés de Wilcoxon est un test d’hypothèse statistique non paramétrique utilisé pour comparer deux échantillons liés ou des mesures répétées sur un même groupe. C’est l’équivalent non paramétrique du test t apparié, employé lorsque l’hypothèse de normalité des différences entre paires ne peut pas être justifiée. Introduit par Frank Wilcoxon en 1945, ce test est particulièrement utile dans les essais cliniques et les sciences du comportement, où les mêmes personnes sont mesurées avant et après une intervention. Au lieu d’utiliser les valeurs brutes, le test classe les différences absolues entre observations appariées et additionne séparément les rangs associés aux différences positives et négatives. Le procédé fonctionne ainsi : pour chaque paire, on calcule la différence d = (after − before). Les paires dont la différence est nulle sont exclues. Les différences absolues sont classées de la plus petite à la plus grande, avec rang moyen en cas d’ex æquo. La somme des rangs des différences positives est W⁺, et celle des différences négatives est W⁻. La statistique W est la plus petite des deux. Pour les échantillons plus grands (généralement n ≥ 10), la distribution de W est approximée par une loi normale. Le score Z est calculé à l’aide de la moyenne et de l’écart-type de W sous l’hypothèse nulle. La moyenne vaut n(n+1)/4 et l’écart-type √[n(n+1)(2n+1)/24], où n est le nombre de différences non nulles. L’hypothèse nulle affirme que la différence médiane entre observations appariées est nulle — le traitement n’a aucun effet. L’hypothèse alternative est que la différence médiane n’est pas nulle (bilatéral), ou qu’elle est positive ou négative (unilatéral). Ce calculateur affiche la valeur p bilatérale, qui est le choix le plus conservateur. Une valeur p inférieure à 0.05 est généralement interprétée comme une preuve de différence significative entre les mesures appariées. Dans une étude sur la pression artérielle, cela peut indiquer qu’un médicament a abaissé significativement la pression systolique. Dans une étude en psychologie, cela peut montrer qu’un programme thérapeutique a réduit significativement les scores d’anxiété. Le test exige que les observations soient appariées : chaque observation de l’échantillon 1 doit correspondre à une observation précise de l’échantillon 2 (la même personne à un autre moment, ou des sujets appariés). Les paires doivent être indépendantes les unes des autres, et les différences doivent provenir d’une distribution symétrique, sans nécessairement être normale. Par rapport au test t apparié, le test des rangs signés de Wilcoxon est plus robuste aux valeurs aberrantes et aux distributions non normales, mais un peu moins puissant lorsque l’hypothèse de normalité est vérifiée. C’est le choix recommandé pour les petits échantillons, les résultats ordinaux ou lorsqu’il existe des valeurs extrêmes dans les données.

Exemples pratiques

Utilisez ces exemples pour voir comment le calculateur fonctionne avec différents jeux de données appariées.

EntréeSortieRemarque
Avant : 140,135,150,160,130,145,155,138,148,152 — Après : 132,130,142,151,125,137,145,130,140,148W=0, Z≈−2.80, p≈0.005Médicament contre l’hypertension — toutes les différences sont négatives, baisse significative.
Avant : 8,7,6,9,8,7,8,9 — Après : 6,5,5,7,6,6,7,7W=0, Z≈−2.52, p≈0.012Scores d’anxiété après thérapie — amélioration significative à α = 0.05.
Avant : 75,80,82,79,88,90,76,85,89,92,78,84 — Après : 80,85,85,83,90,94,81,88,92,95,81,89W=0, Z≈+3.06, p≈0.002Notes d’étudiants avant/après une nouvelle méthode d’enseignement — gain hautement significatif.

Comment utiliser le calculateur

  1. Saisissez les mesures avant traitement (ou de base) dans le champ de l’échantillon 1, séparées par des virgules.
  2. Saisissez les mesures correspondantes après traitement dans le champ de l’échantillon 2. Les deux échantillons doivent contenir exactement le même nombre de valeurs.
  3. Cliquez sur Calculer pour obtenir les différences, les classer, puis afficher la statistique W, le score Z et la valeur p.
  4. Une valeur p inférieure à 0.05 (affichée en rouge) indique une différence statistiquement significative entre les deux conditions.
  5. Utilisez les boutons d’exemple pour charger rapidement des jeux de données réels et vérifier le calculateur avec des résultats connus.

FAQ

Quelle est la différence entre le test de Wilcoxon et le test t apparié ?
Les deux tests comparent des mesures appariées, mais le test t apparié suppose que les différences sont normalement distribuées. Le test des rangs signés de Wilcoxon n’impose pas cette hypothèse et est donc préférable pour les petits échantillons, les données ordinales ou les données avec des valeurs aberrantes importantes. Lorsque la normalité est vérifiée, le test t a un peu plus de puissance.
Que devient une paire dont la différence est nulle ?
Les paires où les valeurs avant et après sont identiques (différence = 0) sont exclues de l’analyse. La taille effective n utilisée pour calculer la statistique et la valeur p ne compte que les différences non nulles. C’est la procédure standard recommandée dans la plupart des ouvrages de statistique.
Comment sont gérées les différences à ex æquo ?
Lorsque plusieurs paires produisent la même différence absolue, ces valeurs reçoivent la moyenne des rangs qu’elles occuperaient. Par exemple, trois paires avec |d| = 5 en concurrence pour les rangs 4, 5 et 6 reçoivent chacune le rang 5. Cette correction par rang moyen préserve la validité de l’approximation Z.
Pourquoi ce calculateur n’affiche-t-il qu’une valeur p bilatérale ?
Le test bilatéral est le plus conservateur et le choix par défaut dans la plupart des études exploratoires. Il teste si la différence médiane est nulle dans l’une ou l’autre direction. Pour des hypothèses directionnelles (par exemple, le traitement améliore toujours les résultats), vous pouvez diviser par deux la valeur p bilatérale affichée pour obtenir la valeur p unilatérale.
Quelle taille d’échantillon faut-il pour que l’approximation Z soit valable ?
L’approximation normale de la statistique W est généralement fiable lorsque n ≥ 10 (après suppression des différences nulles). Pour des échantillons plus petits, il faut consulter les valeurs critiques exactes du tableau de Wilcoxon. Ce calculateur utilise l’approximation normale, donc il faut rester prudent avec n < 10.