Die Steigung der Regressionsgeraden und der Korrelationskoeffizient

Frau zeigt einer anderen Frau ein Diagramm

Emely/Getty Images





Viele Male in der Studie vonStatistikenEs ist wichtig, Verbindungen zwischen verschiedenen Themen herzustellen. Wir werden ein Beispiel dafür sehen, bei dem die Steigung der Regressionsgerade in direktem Zusammenhang mit steht Korrelationskoeffizient . Da es sich bei beiden Konzepten um gerade Linien handelt, ist es nur natürlich, die Frage zu stellen: „Wie sind die Korrelationskoeffizienten und kleinste quadratische Linie verbunden?'

Zunächst werden wir uns einige Hintergrundinformationen zu diesen beiden Themen ansehen.



Details zur Korrelation

Es ist wichtig, sich an die Details zu erinnern, die sich auf den Korrelationskoeffizienten beziehen, der mit bezeichnet ist r . Diese Statistik wird verwendet, wenn wir gepaart habengepaarte Daten, können wir nach Trends in der Gesamtverteilung der Daten suchen. Einige gepaarte Daten weisen ein lineares oder geradliniges Muster auf. Aber in der Praxis fallen die Daten nie genau entlang einer geraden Linie.

Mehrere Personen schauen sich das gleiche an Streudiagramm von gepaarten Daten würde sich nicht darüber einig sein, wie nahe es an der Darstellung eines linearen Gesamttrends liegt. Schließlich mögen unsere Kriterien dafür etwas subjektiv sein. Die Skala, die wir verwenden, könnte sich auch auf unsere Wahrnehmung der Daten auswirken. Aus diesen und weiteren Gründen brauchen wir eine Art objektives Maß, um zu sagen, wie nahe unsere gepaarten Daten an einer Linearität sind. Der Korrelationskoeffizient leistet dies für uns.



Ein paar grundlegende Fakten über r enthalten:

  • Der Wert von r Bereich zwischen jeder reellen Zahl von -1 bis 1.
  • Werte von r nahe 0 impliziert, dass es wenig bis gar keine lineare Beziehung zwischen den Daten gibt.
  • Werte von r nahe 1 bedeutet, dass es eine positive lineare Beziehung zwischen den Daten gibt. Dies bedeutet, dass als x erhöht das Y steigt auch.
  • Werte von r nahe -1 bedeutet, dass es eine negative lineare Beziehung zwischen den Daten gibt. Dies bedeutet, dass als x erhöht das Y sinkt.

Die Steigung der Linie der kleinsten Quadrate

Die letzten beiden Elemente in der obigen Liste weisen uns auf die Steigung der Linie der kleinsten Quadrate der besten Anpassung hin. Denken Sie daran, dass die Steigung einer Linie ein Maß dafür ist, um wie viele Einheiten sie für jede Einheit, die wir nach rechts verschieben, nach oben oder unten geht. Manchmal wird dies als der Anstieg der Linie geteilt durch den Lauf oder die Änderung in angegeben Y Werte dividiert durch die Änderung in x Werte.

Im Allgemeinen haben gerade Linien Steigungen, die positiv, negativ oder null sind. Wenn wir unsere Regressionslinien der kleinsten Quadrate untersuchen und die entsprechenden Werte von vergleichen würden r , würden wir feststellen, dass jedes Mal, wenn unsere Daten eine haben negativer Korrelationskoeffizient , ist die Steigung der Regressionsgerade negativ. Ebenso ist für jedes Mal, wenn wir einen positiven Korrelationskoeffizienten haben, die Steigung der Regressionslinie positiv.

Aus dieser Beobachtung sollte ersichtlich sein, dass definitiv ein Zusammenhang zwischen dem Vorzeichen des Korrelationskoeffizienten und der Steigung der Geraden der kleinsten Quadrate besteht. Warum das so ist, bleibt zu erklären.



Die Formel für die Steigung

Der Grund für die Verbindung zwischen dem Wert von r und die Steigung der Geraden der kleinsten Quadrate hat mit der Formel zu tun, die uns die Steigung dieser Geraden gibt. Für gekoppelte Daten ( x, y ) bezeichnen wir die Standardabweichung des x Daten durch sx und die Standardabweichung der Y Daten durch sY .

Die Formel für die Steigung a der Regressionsgerade ist:



  • a = r(sY/sx)

Die Berechnung einer Standardabweichung beinhaltet das Ziehen der positiven Quadratwurzel einer nichtnegativen Zahl. Folglich müssen beide Standardabweichungen in der Formel für die Steigung nichtnegativ sein. Wenn wir davon ausgehen, dass unsere Daten eine gewisse Variation aufweisen, können wir die Möglichkeit außer Acht lassen, dass eine dieser Standardabweichungen null ist. Daher ist das Vorzeichen des Korrelationskoeffizienten dasselbe wie das Vorzeichen der Steigung der Regressionslinie.