Calculateur de résidus - régression linéaire

Tests d'hypothèse et inférence statistique

Cet outil calcule les résidus d'un modèle de régression linéaire simple. Saisissez vos points de données X et Y pour trouver la droite de régression et analyser les erreurs de prédiction.

Calculateur de résidus - régression linéaire
Tests d'hypothèse et inférence statistique

À propos du calculateur de résidus

Un résidu est la différence entre une valeur observée et la valeur prédite par un modèle statistique. Dans le cadre de la régression linéaire simple, le résidu de l'observation i est défini par e_i = y_i − ŷ_i, où y_i est la valeur observée réelle et ŷ_i est la valeur prédite par la droite de régression des moindres carrés ŷ = b₀ + b₁x. La méthode des moindres carrés ordinaires (OLS) trouve la droite de régression qui minimise la somme des carrés des résidus (SSE = Σe_i²). Cet outil calcule la pente (b₁) et l'ordonnée à l'origine (b₀) à l'aide des formules standards : b₁ = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)² et b₀ = ȳ − b₁x̄. L'analyse des résidus est une étape fondamentale du diagnostic de régression. Après l'ajustement d'un modèle, il faut examiner les résidus pour vérifier les hypothèses clés : linéarité (les résidus ne doivent montrer aucun motif systématique lorsqu'on les trace en fonction de x), homoscédasticité (les résidus doivent avoir une variance à peu près constante), indépendance (les résidus ne doivent pas être autocorrélés) et normalité (les résidus doivent suivre approximativement une distribution normale). Un graphique des résidus — un nuage de points des résidus par rapport aux valeurs prédites ou à la variable indépendante — est l'outil de diagnostic principal. Des résidus répartis aléatoirement autour de zéro, sans motif, indiquent que le modèle linéaire est approprié. Des motifs systématiques comme une forme en U suggèrent une non-linéarité, les formes en entonnoir indiquent une hétéroscédasticité, et des regroupements peuvent révéler des observations influentes ou des valeurs aberrantes. Le coefficient de détermination R² mesure quelle part de la variance de y est expliquée par x. R² varie de 0 (le modèle n'explique aucune variance) à 1 (ajustement parfait). Il se calcule par 1 − SSE/SST, où SST = Σ(yᵢ − ȳ)². Ce calculateur est idéal pour les étudiants qui apprennent la régression, les analystes qui effectuent des contrôles rapides de qualité des données et les chercheurs qui valident l'ajustement du modèle avant de passer à des modélisations plus complexes. Les résultats incluent l'équation complète de régression, un tableau des résidus point par point, le SSE total et la valeur de R² pour une interprétation immédiate.

Exemples de calcul des résidus

Ces exemples montrent comment les résidus sont calculés à partir de paires de données X et Y.

Données X → YDroite de régression
X: 1,2,3,4,5 / Y: 2,4,5,4,5ŷ = 0.6x + 2.2R² = 0.60
X: 1,2,3,4 / Y: 2,4,6,8ŷ = 2x + 0R² = 1.00 (ajustement parfait)
X: 1,2,3,4,5 / Y: 5,3,4,2,1ŷ = -0.9x + 5.7R² = 0.81

Comment utiliser ce calculateur

  1. Saisissez les valeurs indépendantes (X) dans la première zone de texte, séparées par des virgules ou des espaces.
  2. Saisissez les valeurs observées correspondantes (Y) dans la deuxième zone de texte, dans le même ordre que X.
  3. Cliquez sur 'Calculer' pour ajuster la droite des moindres carrés et calculer tous les résidus.
  4. Consultez le tableau des résidus pour repérer les observations éloignées de la droite de régression.
  5. Examinez R² pour évaluer la qualité de l'ajustement du modèle linéaire à vos données.

Questions fréquentes

Que signifie un grand résidu ?
Un grand résidu indique que la valeur observée est éloignée de la prédiction du modèle de régression. De grands résidus peuvent signaler des valeurs aberrantes, des observations influentes ou le fait que le modèle linéaire n'est pas le meilleur ajustement pour vos données. Examinez ces points avant de tirer des conclusions.
Pourquoi les résidus somment-ils à zéro en régression OLS ?
Lorsque la régression OLS inclut un terme constant, les résidus somment toujours exactement à zéro. C'est une propriété mathématique de l'estimateur des moindres carrés : la droite de régression doit passer par le point (x̄, ȳ), ce qui fait s'annuler les écarts positifs et négatifs.
Quelle est la différence entre un résidu et une erreur ?
Une erreur est la différence inobservable entre une valeur observée et la vraie droite de régression de la population. Un résidu est la différence observable entre une valeur observée et la droite de régression estimée. En pratique, les résidus servent à estimer et analyser les erreurs.
Que m'indique R² au sujet des résidus ?
R² (coefficient de détermination) est la proportion de la variance totale de Y expliquée par le modèle de régression linéaire. Un R² élevé signifie que le modèle s'ajuste bien et que les résidus sont faibles par rapport à la variabilité totale de Y. Toutefois, un R² élevé ne garantit pas à lui seul que les hypothèses du modèle sont respectées.
Comment détecter l'hétéroscédasticité dans les résidus ?
Tracez les résidus en fonction des valeurs ajustées. Si la dispersion des résidus augmente ou diminue systématiquement avec les valeurs ajustées (forme d'entonnoir), une hétéroscédasticité est présente. Des tests formels comme Breusch-Pagan ou White peuvent le confirmer statistiquement.
Ce calculateur peut-il gérer une régression linéaire multiple ?
Non, ce calculateur ne gère que la régression linéaire simple avec une variable indépendante (X) et une variable dépendante (Y). Pour une régression multiple avec deux prédicteurs ou plus, utilisez un logiciel statistique comme R, Python (statsmodels), Excel ou SPSS.