arithmetisches Mittel, Median (Häufigkeitsverteilung)

Neue Frage »

bananaboat Auf diesen Beitrag antworten »
arithmetisches Mittel, Median (Häufigkeitsverteilung)
Zur Beschreibung von Häufigkeitsverteilung gibt es ja drei Kenngrößen: Modalwert, arithmetisches Mittel und Median/Zentralwert. Was der Modalwert ist, weiß ich, aber
ich habe Probleme mit der Berechnung und Bedeutung vom arithmetischen Mittel und Median. In unserem Buch stehen zum arithmetischen Mittel irgendwie 2 verschiedene Berechnungsformeln: und , wobei Hn die absolute, hn die relative Häufigkeit und n der Stichprobenumfang ist. 1. Weiß ich nicht, welche Formel ich benutzen soll, und 2. weiß ich nicht, was ich damit ausrechne? Die mittlere absolute bzw. relative Häufigkeit??

Was den Median angeht, ich dachte eigentlich, das wäre der Wert, der genau in der Mitte der nach Größe geordneten Datenreihe liegt, dh. bei ungerader Datenanzahl n ist der Median n/2 und bei gerader Datenanzahl n n+1/2. Nur was hat das mit der Häufigkeit zu tun?
Im Unterricht haben wir allerdings gesagt, den Median berechnet man, indem man bei ungerader Meßwertanzahl die Strichprobenanzahl (!) m durch 2 teilt bzw. bei gerader Meßwertanzahl dann m+1/2 rechnet und den Wert dann bei den kummulierten Häufigkeiten sucht, wobei der zugehörige x-Wert dann der Median ist.

Das ist alles sehr verwirrend, ich hoffe jemand kann mir helfen!
Vielen Dank!
Zellerli Auf diesen Beitrag antworten »

Also das arithmetische Mittel kann man als Erwartungswert interpretieren, wenn dir das hilft.

Beim Erwartungswert addiert man die Ausprägungen aller Ereignisse multipliziert mit ihrer Wahrscheinlichkeit.
Die Ausprägung sind hier deine (Mess-)Werte und die Wahrscheinlichkeit entspricht der relativen Häufigkeit (absolute Häufigkeit geteilt durch Anzahl aller Versuche). Also

Ich glaube, dass deine zweite Formel so nicht im Buch steht. Denn sie ist falsch.

Mit dem Erwartungswert kommt man auf:
Das ist der Zähler deiner zweiten Formel.

Die erste und die zweite Formel hängen zusammen:










Und jetzt zum Median.
Der Median ist derjenige Wert mit der Eigenschaft, dass gleich viele Messwerte darunter und darüber liegen.
Das heißt aber nicht, dass man einfach nur die Anzahl der Ausprägungen zählt, sondern die Anzahl der Werte.

Beispiel:
Die Körpergröße von zehn Menschen in cm:

156 156 167 167 182 183 185 187 194 199

Nach deiner bisherigen (falschen!) Interpretation müsste man jetzt sagen:
Es gibt acht Ausprägungen (auch wenn es zehn Messwerte sind).
Das ist eine gerade Anzahl. Der Mittelwert der beiden "innersten" Ausprägungen (183 und 185) ist 184 Also ist der Median 184.

Richtig ist aber, dass der Median 182,5 ist. Denn so liegen gleichviele Messwerte darüber und darunter.
Eben das zeichnet den Median ja aus, dass er sich nicht verschiebt, wenn einer der beiden Zwerge (156) noch mehr schrumpft. Die können sogar auf 1cm gehen und er bleibt bei 182,5.
Wenn nach deiner Theorie einer der beiden Zwerge schrumpft hat man plötzlich neun Ausprägungen und der (falsche) Median wandert nach unten auf die 183.

Bei einer ungeraden Anzahl von Messwerten ist der Median immer der Wert in der Mitte.


Allgemein ermittelt man den Median am besten, indem man sagt: Ich habe x Messwerte. Dann marschier ich mal los, bis ich die Hälfte davon hinter mir gelassen habe. Der Wert direkt nach dem Überschreiten der Hälfte ist der Median bei einer ungeraden Anzahl. Und bei einer geraden Anzahl ist es der Mittelwert des Wertes direkt vor der Hälfte und des Wertes direkt danach.
bananaboat Auf diesen Beitrag antworten »

Danke für deine Antwort! Also ich habe nochmal in mein Buch geguckt, du hast Recht ... bei der zweiten Gleichung nimmt man nur die Merkmalsausprägungen mit der zugehörigen relativen Häufigkeit mal, ohne diese dann noch durch die Stichprobenanzahl zu teilen ... wobei ich immer noch nicht weiß, was das über die Häufigkeitsverteilung aussagt ^^

Das mit dem Median ist mir jetzt auch klar, also in deinem Beispiel hast du doch für den Median den Mittelwert von 182 und 183 genommen, oder? Aber hier ist mir auch nicht klar, was ich damit über die Häufigkeitsverteilung sagen kann ...
Zellerli Auf diesen Beitrag antworten »

In meinem Beispiel war der Median der Mittelwert auf 182 und 183, genau.

Man kann immer extravagante Verteilungen konstruieren mit einem bestimmten Mittelwert (egal welche Art Mittelwert), daher kann man mit absoluter Sicherheit garnichts für die Häufigkeitsverteilung folgern.
Über die Häufigkeiten kann man jedoch etwas (wenn auch oft zu grobes) folgern:

Das ist ein Beispiel das ich immer gerne benutze bei unseren stationären Geschwindigkeitsmessgeräten:
Die Durchschnittsgeschwindigkeit (artihmetisches Mittel) in der 30er-Zone ist 36,2km/h (da sagen dann die Kollegen "Ist doch toll, nur 6,2km/h zu schnell!").
Der Median, den keiner versteht, ist 32,1km/h.

Am Durchschnitt kann man ablesen, dass der Verkehr im Mittel mit 36,2 fließt. Hier ist auch zu erwarten, dass um einen bestimmen Bereich um 36,2 die meisten Autos liegen, also Werte nahe bei 36,2 häufiger sind als entferntere.

Am Median kann man ablesen, dass jeder zweite Autofahrer über 32,1 fährt. Das bedeutet auch, dass Werte unter 30 seltener sind als Werte über 30 (weil ja die Hälfte schon über 32,1 liegt).

Wenn der Durchschnitt höher ist als der Median kann man zudem sagen, dass die Ausreißer nach oben intensiver sind als die nach unten (wir hatten auch einige mit 90 und mehr).
Denn ein Ausreißer zählt im Median nur "1", egal ob er bei 40km/h ist oder bei 90km/h. Wichtig für den Median ist, dass hier ein Wert vorliegt, der über dem Median liegt.
Beim Durchschnitt hingegen ist ein Wert von 80km/h doppelt so gewichtig wie einer von 40km/h.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »