Statistik, Standardabweichung

Neue Frage »

sunshine270882 Auf diesen Beitrag antworten »
Statistik, Standardabweichung
Hallo!

Hab da mal ne Frage zu Statistik:
Wie lautet die korrekte Formel für die Standardabweichung?
Ich habe in meinen Notizen leider verschiedene Möglichkeiten aufgeschrieben und weiß jetzt nicht mehr, was davon richtig ist.
Mein Statistikbuch hat da leider nicht wirklich weiter geholfen, das war wohl reine Geldverschwendung...

*langsamnervöswerd* (die Klausur ist in ca 12 Stunden)

MfG, Sarah
epikur Auf diesen Beitrag antworten »

Die Standardabweichung einer Zufallsvariable X berechnet sich als sqrt(Var(X)), wobei Var(X) = E(X^2)-E(X)^2 und E(X) = int X dP. ( = int x*f(x) d(x=-oo..oo) falls X eine Dichte f besitzt.)

Sowas will/kann man in der Statistik aber nicht ausrechnen da man ja X nicht kennt. Vielmehr will man X bestimmen oder auch schätzen. Zum Beispiel: Seien X1...Xn Beobachtungen, dann ist das Stichprobenmittel erklärt durch X| = 1/n sum[k=1..n] Xk und die Stichprobenvarianz durch S^2 = 1/(n-1) sum[k=1..n] (X| -Xk)^2

Eine Stichprobenstandardabweichung wäre dann also sqrt(S^2). Wenn du nun davon ausgehst das deine X1...Xn unabhängig identisch N(my,sigma) Normalverteilt sind, so kannst du die Paramter der Verteilung mittels my := X| , sigma := S^2 schätzen. Es handelt sich dabei sogar um die beste Erwartungstreue Schätzung, auch wenn der Beweis dafür alles andere als trivial ist, obwohl diese Schätzung bis auf den Faktor 1/(n-1) offensichtlich erscheint.

EDIT: Nur um das nochmal explizit zu machen, je nach Verteilungsannahme an die X1...Xn kommen ganz andere "beste" Verfahren heraus um die Varianz zu schätzen. Die Stichprobenvarianz ist nicht immer geeignet, eigentlich nur im Normalverteilungsfall. Es ist also möglicherweise kein Versehen wenn du mehr als eine Formel in deinen Aufzeichnungen findes.
 
 
sunshine270882 Auf diesen Beitrag antworten »

Vielen Dank!
Ich denke, das hat meine Frage geklärt Big Laugh

LG, Sarah
Anirahtak Auf diesen Beitrag antworten »

Hallo!

Die Formel, die die verwendet hast ist fast richtig.
Sie heißt:


Und für die Standardabweichung s ergibt sich dann:


@epikur: du hast die Vorzeichen bei der Varianz vertauscht, was recht ungünstig ist, wenn man dann die Wurzel zieht...

Die Variante, die Standardabweichung zu berechnen heißt Verschiebungssatz.

Es gibt so weit ich weiß folgende "Arten" der Standardabweichung:

- die Standardabweichung in der deskriptiven Statistik als Maßzahl für die Streuung in in Stichproben; hier gibt es die empirische Standartabweichung und die Stichprobenvarianz

- die Standardabweichung von Zufallsvariablen, mit unterschiedlicher Berechnung bei stetigen und diskreten Zufallsvariablen

Wenn du noch genauer wissen willst, dann frag ruhig :-)

Anirahtak
epikur Auf diesen Beitrag antworten »

Zitat:
Original von Anirahtak
@epikur: du hast die Vorzeichen bei der Varianz vertauscht, was recht ungünstig ist, wenn man dann die Wurzel zieht...


Ich sollte doch immer mal nachschlagen und nicht so wild aus dem Kopf zitieren ;). Vor allem wenn ich mich schon länger net mehr mit dem Kram beschäftigt habe.

Zitat:

- die Standardabweichung von Zufallsvariablen, mit unterschiedlicher Berechnung bei stetigen und diskreten Zufallsvariablen


Das ist Quatsch. Meine obige Definition gilt für _alle_ Zufallsvariablen. Die Integrale sehen nur anderst aus.
Anirahtak Auf diesen Beitrag antworten »

Klar, der Verschiebungssatz, den du benutzt, funktioniert immer.
Was ich meinte ist, dass der Erwartungswert bzw. und Varianz mit der anderen Formel verschieden berechnet werden.

Deine Variante mit dem Intergral von x*f(x) über ganz IR funktioniert nur bei stetigen Zufallsgrößen.
Bei diskreten bildet man die Summe über x_i*f(x_i).

Die Idee, die dahinter steht ist natürlich die gleiche, aber bei den diskreten kann man nicht mit Integralen rechnen.

:-) Anirahtak
epikur Auf diesen Beitrag antworten »

Nocheinmal. E(X) := int X dP gilt _immer_, denn so ist der Erwartungswert nun einmal definiert. Desweiteren gilt im Falle der Existenz einer Dichte auch immer E(X) = int x*f(x) dx, wobei natürlich bezügliche des richtigen Maßes integriert werden muss. Im Falle diskreter Zufallsvariablen ist die Masse des Maßes nun einmal auf die diskreten Punkte verteilt weshalb sich das auch als sum[x aus X(Omega)]( x*f(x) ) schreiben lässt.

EDIT: lol .. X( ist aber ein nettes smiley
Anirahtak Auf diesen Beitrag antworten »

Ok, ok ich glaube dir :-)

Was mich irritiert ist, dass ich gelernt hab, und es in allen Skripten die ich im Internet finden konnte auch so steht, dass der Erwartungswert für diskrete und stetige Zufallsgrößen verschieden definiert sind.

Was ich nicht versteht ist, wie man das Integral von Funktionen berechnet, die nur an endlich vielen Punkten einen Wert annehmen.

Ich dachte, das Integral von zum Bsp. f(x)=1 für x=1 und f(x)=0 sonst wäre 0 (zumindest ist das mein Verständnis von der Definition des Integrals...)

Vielleicht kannst du mir das ja am Beispiel vom einfachen Würfeln erklären.

Danke :-)

Anirahtak
epikur Auf diesen Beitrag antworten »

Zitat:
Original von Anirahtak
Was mich irritiert ist, dass ich gelernt hab, und es in allen Skripten die ich im Internet finden konnte auch so steht, dass der Erwartungswert für diskrete und stetige Zufallsgrößen verschieden definiert sind.


In der Tat gibt es aber Zufallsvariablen die weder absolut stetig noch diskret sind. Man kann den Erwartungswert aber nur allgemeiner definieren wenn man sich in der Maßtheorie und und mit allgemeinem Maßintegralen auskennt. Die dir bekannten Definitionen ergeben sich dann als Sätze aus der allgemeineren Definition.

Zitat:

Was ich nicht versteht ist, wie man das Integral von Funktionen berechnet, die nur an endlich vielen Punkten einen Wert annehmen.


Dies hängt eben von zugrunde liegendem Maß und dem davon abhängigen Integral ab. Ein Maß ist eine Funktion die ein Volumen misst, zB misst das Lebesgue-Maß l in R Volumina derart, das l([a,b]) = b-a, also der Länge des Intervalls entspricht. Dies kann man dann für (leider nicht alle) Teilmengen des R erweitern, so das gewisse Konsitenzbedingungen erfüllt sind. (zb muss l(A) + l(B) = l(A u B) gelten wenn A n B = leer) Integrale definiert man dann in mehreren Schritten, ich will nur mal den ersten widergeben. Sei A Teilmenge von R, dann ist 1_A(x) := 1 falls x in A , 0 sonst. 1_A(x) heisst Indikatorfunktion oder auch charakteristische Funktion von A. int 1_A(x) dl(x) ist dann erklärt mittels int 1_A(x) dl(x) := l(A). Darauf aufbauend kann man Integrale für Funktionen der Form int sum[k=1..n] a_k * 1_A_k(x) dl(x) := sum[k=1..n](a_k*l(A_k)) erklären (wenn die A_k disjunkt sind) und wiederum darauf Integrale für beliebige Funktionen.

Der Trick an der ganzen Sache ist nun das jedes Wahrscheinlichkeitsmaß eben ein Maß mit einer zusätzlichen Normierungseigenschaft ist, und sich diese ganze Theorie darauf anwenden lässt. Wenn es die Maßtheorie nicht gäbe müsste man sie für die W-Theorie erfinden. Die Analysis benutzt sowieso fast nur das Lebesgue Maß und Integral. Man kann das Lebesgue Integral als Verallgemeinerung des Riemannintegrals (das man in der Schule kennenlernt) betrachten, denn wenn f L-intbar ist, so ist es auch R-intbar, und die Menge der L-intbaren Funktionen ist wesentlich grösser als die der R-intbaren und wenn beide Integrale existieren stimmen sie überein.

Ein diskretes Maß das seine Werte auf N konzentriert wäre zB das Zählmaß, das zählt wieviele Punkte in einer Menge natürlich sind. m(A) := | A n N |. Natürlich gilt hier m(R) = oo. Ein diskretes W-maß wäre zB P(A) := sum[n aus A n N](1/2^n), denn es gilt P(R) = 1

Ich empfehle Bauer: Maß und Integrationstheorie, deGruyter.

Zitat:

Vielleicht kannst du mir das ja am Beispiel vom einfachen Würfeln erklären.


Ok. Als erstes modellieren wir das Experiment Würfeln einmal. Die Menge unserer Grundereignisse ist G = {1,2,3,4,5,6}, Sei A Teilmenge von G, dann definieren wir unser Wahrscheinlichkeitsmaß als P(A) := |A|/|G|. Die Wahrscheinlichkeit eine 1 oder 2 zu Würfeln ist also P({1,2}) = |{1,2}|/|G| = 2/6. Sei X:G->R die Identität, also X(w) = w. Dann können wir X darstellen als X(w) = sum[k=1..6](k*1_{k}(w)). Es ergibt sich nach obiger Integrationsformel E(X) = int X(w) dP(w) = int sum[k=1..6](k*1_{k}(w)) dP(w) = sum[k=1..6](k*P({k})) = sum[k=1..6](k*1/6) = (1+2+3+4+5+6)/6 = 3.5 Im Mittel würfelt man also eine 3.5

EDIT: schon wieder das X( smiley.
Anirahtak Auf diesen Beitrag antworten »

Hallo!!!

Erst mal sorry, dass ich deine Aussage angezweifelt habe... (aber du verstehst vielleicht, dass es einfach nicht mit meinem Integralbegriff konsistent war...) :-)

Und zweitens vielen, vielen Dank für die lange Erklärung!!!!!!!!
Werds mir das morgen mal genauer zu gemüte führen...

Gute Nacht
:-) Anirahtak
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »