Was sind das erste und dritte Quartil?
Peopleimages / Getty Images
Das erste und dritte Quartil sind deskriptive Statistiken, bei denen es sich um Positionsmessungen in einem Datensatz handelt. Ähnlich wie der Median die Mitte eines Datensatzes bezeichnet, markiert das erste Quartil das Viertel oder den 25%-Punkt. Ungefähr 25 % der Datenwerte sind kleiner oder gleich dem ersten Quartil. Das dritte Quartil ist ähnlich, jedoch für die oberen 25 % der Datenwerte. Auf diese Ideen gehen wir im Folgenden näher ein.
Der Median
Es gibt mehrere Möglichkeiten, die zu messen Center eines Datensatzes. Mittelwert, Median, Modus und Mittelbereich haben alle ihre Vor- und Nachteile, wenn es darum geht, die Mitte der Daten auszudrücken. Von all diesen Möglichkeiten, den Durchschnitt zu finden, ist die Median ist am widerstandsfähigsten gegen Ausreißer. Es markiert die Mitte der Daten in dem Sinne, dass die Hälfte der Daten kleiner als der Median ist.
Das erste Quartil
Es gibt keinen Grund, dass wir damit aufhören müssen, nur die Mitte zu finden. Was wäre, wenn wir uns entscheiden würden, diesen Prozess fortzusetzen? Wir könnten den Median der unteren Hälfte unserer Daten berechnen. Die Hälfte von 50 % sind 25 %. Somit würde die Hälfte der Hälfte oder ein Viertel der Daten darunter liegen. Da es sich um ein Viertel des ursprünglichen Satzes handelt, wird dieser Median der unteren Hälfte der Daten als erstes Quartil bezeichnet und mit bezeichnet Q 1.
Das dritte Quartil
Es gibt keinen Grund, warum wir uns die untere Hälfte der Daten angesehen haben. Stattdessen hätten wir uns die obere Hälfte ansehen und die gleichen Schritte wie oben ausführen können. Der Median dieser Hälfte, den wir bezeichnen werden mit Q 3teilt den Datensatz auch in Viertel auf. Diese Zahl bezeichnet jedoch das obere Viertel der Daten. Somit liegen drei Viertel der Daten unter unserer Zahl Q 3. Aus diesem Grund rufen wir an Q 3das dritte Quartil.
Ein Beispiel
Um das alles zu verdeutlichen, schauen wir uns ein Beispiel an. Es kann hilfreich sein, zunächst zu überprüfen, wie der Median einiger Daten berechnet wird. Beginnen Sie mit folgendem Datensatz:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Das Set enthält insgesamt zwanzig Datenpunkte. Wir beginnen damit, den Median zu finden. Da es eine gerade Anzahl von Datenwerten gibt, ist der Median der Mittelwert aus dem zehnten und elften Wert. Mit anderen Worten, der Median ist:
(7 + 8)/2 = 7,5.
Betrachten Sie nun die untere Hälfte der Daten. Der Median dieser Hälfte liegt zwischen dem fünften und sechsten Wert von:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Somit wird das erste Quartil als gleich befunden Q 1= (4 + 6)/2 = 5
Um das dritte Quartil zu finden, sehen Sie sich die obere Hälfte des ursprünglichen Datensatzes an. Wir müssen den Median finden von:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Hier ist der Median (15 + 15)/2 = 15. Also das dritte Quartil Q 3= 15.
Interquartilbereich und Fünf-Zahlen-Zusammenfassung
Quartile helfen dabei, uns ein vollständigeres Bild unseres Datensatzes als Ganzes zu geben. Das erste und dritte Quartil geben uns Auskunft über die interne Struktur unserer Daten. Die mittlere Hälfte der Daten liegt zwischen dem ersten und dritten Quartil und ist um den Median zentriert. Die Differenz zwischen dem ersten und dritten Quartil, die sog Interquartilbereich , zeigt, wie die Daten um den Median angeordnet sind. Ein kleiner Interquartilbereich weist auf Daten hin, die um den Median verklumpt sind. Ein größerer Interquartilsabstand zeigt, dass die Daten weiter gestreut sind.
Ein detaillierteres Bild der Daten kann erhalten werden, wenn der höchste Wert, der als Maximalwert bezeichnet wird, und der niedrigste Wert, der als Minimalwert bezeichnet wird, bekannt ist. Das Minimum, das erste Quartil, der Median, das dritte Quartil und das Maximum sind eine Gruppe von fünf Werten, die als bezeichnet werden Zusammenfassung mit fünf Zahlen . Eine effektive Möglichkeit, diese fünf Zahlen anzuzeigen, heißt a Boxplot oder Box-Whisker-Diagramm .