Residuen-Rechner - lineare Regression

Hypothesentests und statistische Inferenz

Dieses Tool berechnet die Residuen eines einfachen linearen Regressionsmodells. Geben Sie Ihre X- und Y-Datenpunkte ein, um die Regressionsgerade zu finden und Vorhersagefehler zu analysieren.

Residuen-Rechner - lineare Regression
Hypothesentests und statistische Inferenz

Über den Residuen-Rechner

Ein Residuum ist die Differenz zwischen einem beobachteten Wert und dem von einem statistischen Modell vorhergesagten Wert. Im Kontext der einfachen linearen Regression ist das Residuum für Beobachtung i definiert als e_i = y_i − ŷ_i, wobei y_i der tatsächlich beobachtete Wert und ŷ_i der durch die kleinste-Quadrate-Regressionsgerade ŷ = b₀ + b₁x vorhergesagte Wert ist. Die Methode der kleinsten Quadrate (OLS) findet die Regressionsgerade, die die Summe der quadrierten Residuen minimiert (SSE = Σe_i²). Dieses Tool berechnet Steigung (b₁) und Achsenabschnitt (b₀) mit den Standardformeln: b₁ = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)² und b₀ = ȳ − b₁x̄. Die Residuenanalyse ist ein grundlegender Schritt der Regressionsdiagnostik. Nach der Anpassung eines Modells sollten Sie die Residuen prüfen, um zentrale Annahmen zu verifizieren: Linearität (Residuen sollten beim Plotten gegen x kein systematisches Muster zeigen), Homoskedastizität (Residuen sollten ungefähr konstante Varianz aufweisen), Unabhängigkeit (Residuen sollten nicht autokorreliert sein) und Normalität (Residuen sollten einer ungefähr normalen Verteilung folgen). Ein Residuenplot — ein Streudiagramm der Residuen gegen vorhergesagte Werte oder gegen die unabhängige Variable — ist das wichtigste Diagnosewerkzeug. Zufällig um Null verteilte Residuen ohne Muster deuten darauf hin, dass das lineare Modell geeignet ist. Systematische Muster wie eine U-Form weisen auf Nichtlinearität hin, Trichterformen auf Heteroskedastizität, und Cluster deuten auf einflussreiche Beobachtungen oder Ausreißer hin. Das Bestimmtheitsmaß R² misst, wie viel der Varianz in y durch x erklärt wird. R² reicht von 0 (das Modell erklärt keine Varianz) bis 1 (perfekte Anpassung). Es wird als 1 − SSE/SST berechnet, wobei SST = Σ(yᵢ − ȳ)² ist. Dieser Rechner ist ideal für Studierende, die Regression lernen, für Analysten mit schnellen Datenqualitätsprüfungen und für Forschende, die den Modellfit vor komplexeren Analysen validieren. Die Ergebnisse umfassen die vollständige Regressionsgleichung, eine punktweise Residuentabelle, die gesamte SSE und den R²-Wert zur sofortigen Interpretation.

Beispiele zur Residuenberechnung

Diese Beispiele zeigen, wie Residuen aus X- und Y-Datenpaaren berechnet werden.

X → Y-DatenRegressionsgerade
X: 1,2,3,4,5 / Y: 2,4,5,4,5ŷ = 0.6x + 2.2R² = 0.60
X: 1,2,3,4 / Y: 2,4,6,8ŷ = 2x + 0R² = 1.00 (perfekte Anpassung)
X: 1,2,3,4,5 / Y: 5,3,4,2,1ŷ = -0.9x + 5.7R² = 0.81

So verwenden Sie diesen Rechner

  1. Geben Sie die unabhängigen (X-)Werte im ersten Textfeld ein, getrennt durch Kommas oder Leerzeichen.
  2. Geben Sie die zugehörigen beobachteten (Y-)Werte im zweiten Textfeld in derselben Reihenfolge wie X ein.
  3. Klicken Sie auf 'Berechnen', um die kleinste-Quadrate-Regressionsgerade anzupassen und alle Residuen zu berechnen.
  4. Prüfen Sie die Residuentabelle, um Beobachtungen zu identifizieren, die weit von der Regressionsgerade entfernt sind.
  5. Bewerten Sie mit R², wie gut das lineare Modell zu Ihren Daten passt.

Häufig gestellte Fragen

Was bedeutet ein großes Residuum?
Ein großes Residuum bedeutet, dass der beobachtete Wert weit von der Vorhersage des Regressionsmodells entfernt ist. Große Residuen können auf Ausreißer, einflussreiche Beobachtungen oder darauf hinweisen, dass das lineare Modell nicht die beste Anpassung für Ihre Daten ist. Untersuchen Sie solche Punkte, bevor Sie Schlussfolgerungen ziehen.
Warum summieren sich Residuen in der OLS-Regression zu Null?
Wenn die OLS-Regression einen Achsenabschnitt enthält, summieren sich die Residuen immer exakt zu Null. Das ist eine mathematische Eigenschaft des Kleinste-Quadrate-Schätzers: Die Regressionsgerade muss durch den Punkt (x̄, ȳ) verlaufen, sodass sich positive und negative Abweichungen aufheben.
Was ist der Unterschied zwischen Residuum und Fehler?
Ein Fehler ist die unbeobachtbare Differenz zwischen einem beobachteten Wert und der wahren Regressionsgeraden der Population. Ein Residuum ist die beobachtbare Differenz zwischen einem beobachteten Wert und der geschätzten Regressionsgeraden. In der Praxis werden Residuen verwendet, um Fehler zu schätzen und zu analysieren.
Was sagt mir R² über die Residuen?
R² (Bestimmtheitsmaß) ist der Anteil der Gesamtvarianz in Y, der durch das lineare Regressionsmodell erklärt wird. Ein hohes R² bedeutet, dass das Modell gut passt und die Residuen im Verhältnis zur Gesamtvariabilität von Y klein sind. Ein hohes R² allein garantiert jedoch nicht, dass die Modellannahmen erfüllt sind.
Wie erkenne ich Heteroskedastizität in Residuen?
Stellen Sie die Residuen gegen die angepassten Werte dar. Wenn die Streuung der Residuen mit den angepassten Werten systematisch zu- oder abnimmt (Trichterform), liegt Heteroskedastizität vor. Formale Tests wie der Breusch-Pagan- oder White-Test können dies statistisch bestätigen.
Kann dieser Rechner multiple lineare Regression behandeln?
Nein, dieser Rechner verarbeitet nur einfache lineare Regression mit einer unabhängigen Variable (X) und einer abhängigen Variable (Y). Für multiple Regression mit zwei oder mehr Prädiktoren verwenden Sie Statistiksoftware wie R, Python (statsmodels), Excel oder SPSS.