Wann ist die Standardabweichung gleich Null?
Maureen P. Sullivan / Getty Images
Das Stichprobenstandardabweichung ist eine deskriptive Statistik, die die Streuung eines quantitativen Datensatzes misst. Diese Zahl kann jede nicht negative reelle Zahl sein. Da Null nichts Negatives ist reelle Zahl , scheint es sinnvoll zu fragen: Wann wird die Standardabweichung der Stichprobe gleich Null sein? Dies tritt in dem sehr speziellen und höchst ungewöhnlichen Fall auf, wenn alle unsere Datenwerte genau gleich sind. Wir werden die Gründe dafür untersuchen.
Beschreibung der Standardabweichung
Zwei wichtige Fragen, die wir normalerweise zu einem Datensatz beantworten möchten, sind:
- Was ist das Zentrum des Datensatzes?
- Wie verteilt ist der Datensatz?
Es gibt verschiedene Messungen, sogenannte deskriptive Statistiken, die diese Fragen beantworten. Zum Beispiel das Zentrum der Daten, auch bekannt als das Durchschnitt , kann durch Mittelwert, Median oder Modus beschrieben werden. Andere weniger bekannte Statistiken können verwendet werden, z. B. die Verfolgungsjagd oder der Trimenon.
Für die Verbreitung unserer Daten könnten wir die Reichweite nutzen, die Interquartilbereich oder die Standardabweichung. Die Standardabweichung wird mit dem Mittelwert gepaart, um die Streuung unserer Daten zu quantifizieren. Wir können diese Nummer dann verwenden, um mehrere Datensätze zu vergleichen. Je größer unsere Standardabweichung ist, desto größer ist die Streuung.
Intuition
Betrachten wir also anhand dieser Beschreibung, was es bedeuten würde, eine Standardabweichung von Null zu haben. Dies würde darauf hindeuten, dass es in unserem Datensatz überhaupt keine Streuung gibt. Alle einzelnen Datenwerte würden zu einem einzigen Wert zusammengefasst. Da unsere Daten nur einen Wert haben könnten, würde dieser Wert den Mittelwert unserer Stichprobe darstellen.
In dieser Situation, wenn alle unsere Datenwerte gleich sind, gäbe es keinerlei Abweichung. Intuitiv ergibt es Sinn, dass die Standardabweichung eines solchen Datensatzes Null wäre.
Mathematischer Beweis
Die Probenstandardabweichung wird durch eine Formel definiert. Daher sollte jede Aussage wie die obige mit dieser Formel bewiesen werden. Wir beginnen mit einem Datensatz, der zur obigen Beschreibung passt: Alle Werte sind identisch, und das gibt es n Werte gleich x .
Wir berechnen den Mittelwert dieses Datensatzes und sehen, dass es so ist
x = ( x + x + . . . + x )/ n = nx / n = x .
Wenn wir nun die einzelnen Abweichungen vom Mittel berechnen, sehen wir, dass alle diese Abweichungen Null sind. Folglich sind sowohl die Varianz als auch die Standardabweichung beide gleich Null.
Notwendig und ausreichend
Wir sehen, dass, wenn der Datensatz keine Variation aufweist, seine Standardabweichung null ist. Wir können fragen, ob die unterhalten dieser Aussage stimmt auch. Um zu sehen, ob dies der Fall ist, verwenden wir erneut die Formel für die Standardabweichung. Diesmal setzen wir die Standardabweichung jedoch gleich Null. Wir werden keine Annahmen über unseren Datensatz treffen, sondern sehen, welche Einstellung s = 0 impliziert
Angenommen, die Standardabweichung eines Datensatzes ist gleich Null. Dies würde bedeuten, dass die Stichprobenvarianz s zweiebenfalls gleich Null ist. Das Ergebnis ist die Gleichung:
0 = (1/( n - 1)) ∑ ( x ich- x )zwei
Wir multiplizieren beide Seiten der Gleichung mit n - 1 und sehen, dass die Summe der quadrierten Abweichungen gleich Null ist. Da wir mit reellen Zahlen arbeiten, kann dies nur geschehen, wenn jede der quadrierten Abweichungen gleich Null ist. Das bedeutet für jeden ich , der Begriff ( x ich- x )zwei= 0.
Wir ziehen nun die Quadratwurzel aus obiger Gleichung und sehen, dass jede Abweichung vom Mittelwert gleich Null sein muss. Denn für alle ich ,
x ich- x = 0
Das bedeutet, dass jeder Datenwert gleich dem Mittelwert ist. Dieses Ergebnis zusammen mit dem obigen erlaubt es uns zu sagen, dass die Stichproben-Standardabweichung eines Datensatzes genau dann Null ist, wenn alle seine Werte identisch sind.