Varianz: warum quadrieren?

Neue Frage »

PeLu Auf diesen Beitrag antworten »
Varianz: warum quadrieren?
Meine Frage:
Guten Abend,

im gestrigen Unterricht fanden wir keine schlüssige Antwort auf die Frage, warum denn bei der Berechnung der Varianz die Abweichung der einzelnen Werte vom Mittelwert quadriert werden müssen. Dadurch werden ja besonders hohe Abweichungen überwertet und Abweichungen kleiner 1 "entwertet".

Meine Ideen:
Vor Jahren hatte ich mal gelesen, dass die Berechnung der Varianz und die daraus berechnete Standardabweichung die Basis für die Interpretation geben (im Bereich von Mittelwert +/- 1 Standardabweichung befinden sich 68% aller Teilnehmer ...) Aber nicht mal die Suchmaschine meiner Wahl oder sogar Wikipedia konnten mir helfen. Hat dazu jemand eine Idee?

Vielen Dank im voraus

PeLu
Math1986 Auf diesen Beitrag antworten »
RE: Varianz: warum quadrieren?
Zitat:
Original von PeLu
Meine Frage:
im gestrigen Unterricht fanden wir keine schlüssige Antwort auf die Frage, warum denn bei der Berechnung der Varianz die Abweichung der einzelnen Werte vom Mittelwert quadriert werden müssen. Dadurch werden ja besonders hohe Abweichungen überwertet und Abweichungen kleiner 1 "entwertet".

Meine Ideen:
Vor Jahren hatte ich mal gelesen, dass die Berechnung der Varianz und die daraus berechnete Standardabweichung die Basis für die Interpretation geben (im Bereich von Mittelwert +/- 1 Standardabweichung befinden sich 68% aller Teilnehmer ...) Aber nicht mal die Suchmaschine meiner Wahl oder sogar Wikipedia konnten mir helfen. Hat dazu jemand eine Idee?
Deine Idden sind ja durchaus richtig,
Es ist ja durchaus gewollt, dass bei der Varianz die größeren Abweichungen "überproportional" stark gewertet werden.
Wenn man die Abweichungen nicht quadrieren würde dann müsste man die Beträge der Abweichungen betrachten, das wäre auich nicht wirklich einfacher zu berechnen als die Varianz.
frank09 Auf diesen Beitrag antworten »

Nun könnte man ja die Frage stellen, wenn man besonders große Abweichungen vom Mittelwert "bestrafen" will, warum muss man dann ausgerechnet "hoch 2" rechnen und nicht z.B "hoch 1,5" oder "hoch 3" (dann natürlich die Beträge)?
Eine Antwort darauf ist, dass das "Zentrum" einer Verteilung (i.d. Regel das arithmetische Mittel) auch das Zentrum des Streuungsmaßes (i.d. Regel Varianz/Standardabw.) sein sollte.

D.h. (nur) die Varianz einer Verteilung wird minimal , wenn ich sie auf das arithmetische Mittel beziehe. Kann man durch Ableiten leicht herausfinden. Andersrum ist es genau der MW, der die Varianz minimiert (und nicht etwa der Median o.ä.).

Nehme ich z.B. die einfachen,"linearen" (nicht quadrierten) Beträge der Abweichungen vom Mittelwert, könnte ich evtl. den Mittelwert abändern, ohne dass die Streuung sich ändert . Hätte ich z.B. die zwei Werte 1 und 3, damit den Mittelwert 2, dann wäre die durchschnittliche lineare Abweichung 1. Wenn ich jetzt den Mittelwert auf 2,5 abändere (quasi "fälsche") dann bliebe die lineare Abweichung trotzdem unverändert.
Die Varianz würde in jedem Fall auf den falschen MW reagieren und ansteigen.
Auch bei höheren Potenzen würde der MW nicht automatisch die Streuung minimieren.
PeLu Auf diesen Beitrag antworten »

Hallo frank09,
hallo Math1986,

erstmal Danke fürs mitdenken.
Allerdings helfen mir die Antworten nicht wirklich weiter:

@Math1986:
Zitat:
Es ist ja durchaus gewollt, dass bei der Varianz die größeren Abweichungen "überproportional" stark gewertet werden.

WARUM? Welche inhaltliche Begründung gibt es dafür?

@frank09
Das mit dem "fälschen" und "Auch bei höheren Potenzen würde der MW nicht automatisch die Streuung minimieren" habe ich nicht verstanden. Wäre es möglich, das ein wenig ausführlicher darzustellen? Ich habe es auch mal mit der Potenz 4 probiert, auch diese reagiert ja auf den falschen MW.

Danke vorab für weitere Hilfen

PeLu

Natürlich freue ich mich auch über weitere Mitdenker
Namensuchender Auf diesen Beitrag antworten »
RE: Varianz: warum quadrieren?
Zitat:
Original von PeLu
Meine Frage:
Guten Abend,

im gestrigen Unterricht fanden wir keine schlüssige Antwort auf die Frage, warum denn bei der Berechnung der Varianz die Abweichung der einzelnen Werte vom Mittelwert quadriert werden müssen. Dadurch werden ja besonders hohe Abweichungen überwertet und Abweichungen kleiner 1 "entwertet".

Meine Ideen:
Vor Jahren hatte ich mal gelesen, dass die Berechnung der Varianz und die daraus berechnete Standardabweichung die Basis für die Interpretation geben (im Bereich von Mittelwert +/- 1 Standardabweichung befinden sich 68% aller Teilnehmer ...) Aber nicht mal die Suchmaschine meiner Wahl oder sogar Wikipedia konnten mir helfen. Hat dazu jemand eine Idee?

Vielen Dank im voraus

PeLu

Sehr schön mitgedacht! Freude
Der einzige Grund, weshalb man die Werte quadriert bei der Berechnung der Varianz ist der, dass die Varianz halt so definiert ist. Es gibt andere Grössen, die man berechnen kann, z.B. den durchschnittlichen Abstand vom Erwartungswert (bzw. Mittelwert in einer Stichprobe). Bloss ist das dann eben nicht die Varianz. Die Frage, die sich im Anschluss stellt, ist die, weshalb man nun also so eine "idiotische" Varianz berechnen solle. Der Hauptgrund dafür ist der, dass man damit sehr gut weiterrechnen kann. Man muss nicht viel von der Materie verstehen, um mit der Varianz etwas anfangen zu können. Aber Du hast völlig recht damit, dass die Varianz sehr anfällig ist auf einzelne grosse Ausreisser. Das ist durchaus nicht schön und es gibt deshalb einiges an Forschung, um robustere Methoden zu entwickeln, die nicht so anfällig sind auf einzelne Ausreisser.

Das mit den 68% innerhalb einer Standardabweichung gilt übrigens nicht für alle Verteilung. Aber für die Gaussverteilung (irrefürenderweise auch als Normalverteilung bezeichnet) gilt das. Die Gaussverteilung wiederum hat eine sehr zentrale Bedeutung in der Stochastik. Der Grund für die Bedeutung der Gaussverteilung ist erneut hauptsächlich, dass man damit so wunderbar leicht rechnen kann. Netterweise sind andere Verteilungen dank des Zentralen Grenzwertsatzes oft recht ähnlich wie die Gaussverteilung, so dass man näherungsweise mit Gaussverteilung rechnen kann, ohne allzu grosse Fehler zu begehen.
Namensuchender Auf diesen Beitrag antworten »

Zitat:
Original von frank09
Nun könnte man ja die Frage stellen, wenn man besonders große Abweichungen vom Mittelwert "bestrafen" will, warum muss man dann ausgerechnet "hoch 2" rechnen und nicht z.B "hoch 1,5" oder "hoch 3" (dann natürlich die Beträge)?
Eine Antwort darauf ist, dass das "Zentrum" einer Verteilung (i.d. Regel das arithmetische Mittel) auch das Zentrum des Streuungsmaßes (i.d. Regel Varianz/Standardabw.) sein sollte.

D.h. (nur) die Varianz einer Verteilung wird minimal , wenn ich sie auf das arithmetische Mittel beziehe. Kann man durch Ableiten leicht herausfinden. Andersrum ist es genau der MW, der die Varianz minimiert (und nicht etwa der Median o.ä.).

Nehme ich z.B. die einfachen,"linearen" (nicht quadrierten) Beträge der Abweichungen vom Mittelwert, könnte ich evtl. den Mittelwert abändern, ohne dass die Streuung sich ändert . Hätte ich z.B. die zwei Werte 1 und 3, damit den Mittelwert 2, dann wäre die durchschnittliche lineare Abweichung 1. Wenn ich jetzt den Mittelwert auf 2,5 abändere (quasi "fälsche") dann bliebe die lineare Abweichung trotzdem unverändert.
Die Varianz würde in jedem Fall auf den falschen MW reagieren und ansteigen.
Auch bei höheren Potenzen würde der MW nicht automatisch die Streuung minimieren.

Man könnte dazu nun sagen, dass die (empirische) Varianz in der Tat zum Erwartungswert (Mittelwert) gehört wie die Fliege zur Scheisse. Augenzwinkern
 
 
frank09 Auf diesen Beitrag antworten »

Zitat:
Zitat:
Es ist ja durchaus gewollt, dass bei der Varianz die größeren Abweichungen "überproportional" stark gewertet werden.

WARUM? Welche inhaltliche Begründung gibt es dafür?

Wenn man starke Abweichungen(durch quadrieren) nicht übergewichten würde, hätte
man nur die durchschnittliche Abweichung vom Mittelwert, die zu wenig über Extremwerte aussagt.
-4,-4,-4,4,4,4 und -10,-1,-1,1,1,10 hätten so dieselbe Streuung (nämlich 4), obwohl in der zweiten Reihe die Extremwerte (-10 und 10) um mehr als das doppelte vom Mittelwert abweichen (gegenüber -4 und 4).

Zitat:
Das mit dem "fälschen" und "Auch bei höheren Potenzen würde der MW nicht automatisch die Streuung minimieren" habe ich nicht verstanden. Wäre es möglich, das ein wenig ausführlicher darzustellen? Ich habe es auch mal mit der Potenz 4 probiert, auch diese reagiert ja auf den falschen MW.


Oft ist es ja so, dass man bei einer Stichprobe (z.B 10 aus 100 Elementen) den wahren Mittelwert nicht kennt. Wenn man nun die Varianz schätzen will, greift man auf den Mittelwert der Stichprobe zurück. In diesem Fall ist der Durchschnitt aller Schätz-Varianzen von Stichproben immer kleiner als die tatsächliche Varianz.

Diese würde herauskommen, wenn man den tatsächlichen Mittelwert aller 100 Elemente kennen würde und den "richtigen" Mittelwert der 10 Elemente durch diesen (der nicht der MW der 10 Elemente wäre, also "gefälscht") in der Varianzformel ersetzen würde. Die Varianz würde dann ansteigen. Man kann mit einem Korrekturfaktor n/(n-1) >1 aus der kleineren Stichprobenvarianz die richtige Varianz schätzen. Bei einer Varianz "hoch 3" würde sie nicht automatisch steigen, wenn man den Mittelwert austauscht, deshalb (ohne Beweis) taugt sie auch nicht zum Schätzen.

Indirekt damit verbunden (auch ohne Beweis) ist die Tatsache, dass man nur mit der quadrierten Varianz vernünftig rechnen kann.
Wenn man zwei Verteilungen addiert (z.B. zweimal Würfeln und Augenzahlen addieren), dann ist deren Varianz die Summe aus den Varianzen für "einmal Würfeln"
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »