Varianz einer Zufallsvariable oder eines Stichprobenergebnisses

Neue Frage »

fenderbender Auf diesen Beitrag antworten »
Varianz einer Zufallsvariable oder eines Stichprobenergebnisses
Hi Leute,

ich habe ein kleines Verständnisproblem:

1)
Ich habe folgende Herleitung (im Übrigen selber hergeleitet, also keine Garantie auf 100% Richtigkeit Augenzwinkern )


Und am Ende steht dann Var[X], also die Varition einer Zufallsvariablen. In der Klammer stehen noch die Summen von Var[x_i], was doch eigentlich die Variationen eines beobachtungsergebnisses sind.

Kann mir einer erklären, warum ich im Ergebnis dann plötzlich den Index weglassen darf?

2)
Ausgang dieser Herleitung ist die Anwendung des Gesetzes für große Zahlen auf einen Schätzer



An dieser Stelle hätte ich nur die Frage, warum man hier die Abweichung von T/2 und dem Erwartungswert nimmt, und nicht die Abweichung vom Schätzer T zum geschätzten Wert \theta.
Ist das immer so bei der Tshebysheff-Ungleichung? Oder hat das einen anderen Grund?


Danke
Grüße
F.
dinzeoo Auf diesen Beitrag antworten »

hi...
also einfach irgendwelche "herleitungen" reinzuschreiben macht wenig sinn. was ist denn dein bzw. welche infos besitzt du über das ganze modell???

Zitat:
Kann mir einer erklären, warum ich im Ergebnis dann plötzlich den Index weglassen darf?


du hast das doch selbst hergeleitet, warum du also den index wegelassen hast solltest du am besten wissen.
ohne die oben genannten angaben kann man hier nur raten.
dinzeooo Auf diesen Beitrag antworten »

da ich gerade langeweile hab, rate ich mal:

1) sind zufallsvariablen die identisch + unabhängig verteilt sind.

2) statt variation meinst du varianz

ab jetzt schreib ich für die zufallsvariablen grossbuchstaben, ist so üblich.

dann gilt:



dann folgt daraus + der unabhänigkeit + rechenregel für die varianz:

fenderbender Auf diesen Beitrag antworten »

Zitat:
Original von dinzeooo
da ich gerade langeweile hab, rate ich mal:

1) sind zufallsvariablen die identisch + unabhängig verteilt sind.

2) statt variation meinst du varianz

ab jetzt schreib ich für die zufallsvariablen grossbuchstaben, ist so üblich.

dann gilt:



dann folgt daraus + der unabhänigkeit + rechenregel für die varianz:



Genau, und jetz brauch ich nur noch den Grund für den Schritt

Zündholz Auf diesen Beitrag antworten »

Hallo,
Was heißt denn das zwei Zufallsvariablen identisch verteilt sind bzw. was für Konsequenzen ergeben sich daraus.
Also z.B. X ist normalverteilt zum Mittelwert m und Varianz s. Was hat denn Y, wenn Y identisch verteilt ist wie X, für eine Varianz?

Schöne Grüße
dinzeoo Auf diesen Beitrag antworten »

hab da die vergessen sehe ich gerade, schätze mal das es klar war aber ohne fehler nochmal:



grund dafür wurde schon genannt, stichwort identisch verteilt, dann gilt:

Zitat:
Original von dinzeooo





klar jetzt?
 
 
fenderbender Auf diesen Beitrag antworten »

Ok super!

Danke für die Hilfe, das bringt mich ein ganzes Stück weiter!

Dann kann ich sagen, wenn ich den Schätzer



anschaue, habe ich Stichproben, wo jedes die Ergebnisse enthält.
Also würfel ich z.B. 10 mal und erhalte , das in meinem abgelegt wird. Dann würfle ich noch 99 mal und ich habe dann insgesamt 100 verschiedene mit jeweils 10 .
Kann ich das so sagen?

Danke
dinzeoo Auf diesen Beitrag antworten »

Zitat:
Original von fenderbender
Dann kann ich sagen, wenn ich den Schätzer



anschaue, habe ich Stichproben, wo jedes die Ergebnisse enthält.
Also würfel ich z.B. 10 mal und erhalte , das in meinem abgelegt wird. Dann würfle ich noch 99 mal und ich habe dann insgesamt 100 verschiedene mit jeweils 10 .
Kann ich das so sagen?


nein, das hört sich alles ziemlich falsch an. die klein x_i stehen in der regel für die realisationen von gross X_i. d.h.:



X_i ist eine zufallsvariable, also eine funktion. du verwendest auch immer X ohne index, ohne genaue definition davon macht dies auch wieder wenig sinn. es könnte sein, das ihr es als zufallsvektor definiert habt, also:

(keine unübliche vorgehensweise übrigens)

dann könnte man schon eher sagen, dass X die werte "enthält", wobei das auch schon wackelig formuliert ist.

so wie es ausssieht geht es ja um statistik bzw. schätztheorie, deshalb am besten mal ein bsp.
situation:
durchschnittkörpergrösse bei männern soll geschätzt werden
dazu werden zufallsvariablen identisch und unabhängig auf einem wahrscheinlichkeitsraum definiert.
was der exakte w'raum ist spielt in der statistik meistens keine rolle bzw. ist nicht von interesse. (wie wäre er denn bei deinem würfelbsp?)
was aber von interesse ist, ist die verteilung der (also von interesse ist nicht P sondern ). nehmen wir mal an sie sind normalverteilt mit unbekannten erwartungswert (den wollen wir ja gerade schätzen) und unbekannter varianz

jetzt gehst du durch die stadt und fragst N männer nach deren körpergrösse, sprich du hast jetzt N daten/realisationen, d.h. du hast



oder genauer:



da wir ja wissen, dass die X_i normalverteilt sind ist ein sinnvoller schätzer für den mittelwert das arithmetische mittel, (warum sinnvoll wird vermutlich in deinem skript stehen), also:



jetzt setzt du die N realisationen ein und hast einen schätzer für .
in deiner vorlesung wird es aber vermutlich nie um das einsetzen am ende gehen sondern vielmehr um einen sinnvollen schätzer bzw. um die fragestellung was überhaupt ein sinnvoller schätzer ist (z.b. begriffe die kommen könnten sind erwartungstreue, suffiziente, vollständige usw.)

einen schätzer für den mittelwert zu finden ist natürlich leicht und auch intuitiv direkt lösbar gewesen. aber oft interessieren auch andere grössen, wie hier z.b. einen schätzer für die varianz . oder wenn die X_i eine andere verteilung besitzen benötigt man auch andere schätzer für deren parameter usw...

hoffe es hat dir die sache etwas klarer gemacht, aber ich glaub du solltest dir mal die grundlagen in deinem skript etwas genauer anschaun.
fenderbender Auf diesen Beitrag antworten »

Oh man, ich glaub ich bin schon blöd-studiert....


also nochmal:

ist eine Zufallsvariable, also eine Funktion;
Diese Funktion beschreibt wie ich der Messung einen Wert zuweise, richtig?

Also in deinem Beispiel ist der Strich auf dem Maßband, das ich zum Messen verwende und mein sagt jetz, dass mein z.B. den Wert (cm) bekommt. Die nächset Person ist dann z.B. 177cm, dann ist das usw.

Oder im diskreten Fall mit dem Würfel, würfle ich die Seite mit den drei Augen und mein sagt, dass ich bei die 3 eintragen darf.

Bin ich bisher noch richtig?

Wenn ja, stellt sich die Frage, was ist dann ? Die selbe Untersuchung an einem anderen Tag?

Danke
Dinzeoo Auf diesen Beitrag antworten »

Zitat:
Original von fenderbender
Oh man, ich glaub ich bin schon blöd-studiert....


also nochmal:

ist eine Zufallsvariable, also eine Funktion;
Diese Funktion beschreibt wie ich der Messung einen Wert zuweise, richtig?

Also in deinem Beispiel ist der Strich auf dem Maßband, das ich zum Messen verwende und mein sagt jetz, dass mein z.B. den Wert (cm) bekommt. Die nächset Person ist dann z.B. 177cm, dann ist das usw.


schau dir mal w ww. matheboard.de/thread.php?threadid=447403&hilight=dinzeoo
an.

Zitat:

Wenn ja, stellt sich die Frage, was ist dann ? Die selbe Untersuchung an einem anderen Tag?


ist einfach die zweite messung. man stellt sich ja die stichprobe als eine art zufallsexperiment vor. also jede messung ist durch ein zufall entstanden und wir mittels einer zufallsvariable beschrieben.
die erste messung wird also durch die zufallsvariabel X_1 dargestellt, zweite messung durch X_2 usw.
deshalb ist es auch sinnvoll die zufallsvariablen als unabhängig und identisch verteilt anzunehmen. was unser zufall hier ist bzw. was ist wird im link erklärt.
fenderbender Auf diesen Beitrag antworten »

Zitat:
Original von Dinzeoo

ist einfach die zweite messung. man stellt sich ja die stichprobe als eine art zufallsexperiment vor. also jede messung ist durch ein zufall entstanden und wir mittels einer zufallsvariable beschrieben.
die erste messung wird also durch die zufallsvariabel X_1 dargestellt, zweite messung durch X_2 usw.
deshalb ist es auch sinnvoll die zufallsvariablen als unabhängig und identisch verteilt anzunehmen. was unser zufall hier ist bzw. was ist wird im link erklärt.


Sodala, verstehe ich das dann so richtig:

Würfelexperiment:
1) z.B. 10 Würfel -> gleichzeitig werfen -> X_1 besteht dann aus x_1...x_10
-> nochmal werfen: X_2 besteht wieder aus x_1 ... x_10
2) z.B 1 Würfel: X_1 = x_1, nächster Wurf: X_2=x_1

(Das hab ich übrigens schon im 2. Beitrag so gemeint mit "enthält". Entweder ich hab mich blöd ausgedrückt oder ich bin schon wieder falsch Augenzwinkern )
dinzeoo Auf diesen Beitrag antworten »

Zitat:
Original von fenderbender
Würfelexperiment:
1) z.B. 10 Würfel -> gleichzeitig werfen -> X_1 besteht dann aus x_1...x_10
-> nochmal werfen: X_2 besteht wieder aus x_1 ... x_10
2) z.B 1 Würfel: X_1 = x_1, nächster Wurf: X_2=x_1


ok, jetzt versteh ich es. falsch ist es mehr oder weniger nicht, aber so schreibt man es normalerweise nicht an.

wenn wir die situation 1) haben, dann sagt man, das x_1 einfach dimension 10 hat. also z.b. also x_1 ist dann ein vektor ist. klein x_1 wurde ja gerade als variable so bezeichnet das es zu gross X_1 gehört. in deinem bsp bekommt X_1 x1,...,x_10 und X_2 bekommt die gleichen nochmal, so eine notation wäre schon recht verwirrend und wird in eurem skript auch sicherlich nicht verwendet, deshalb wirkte es für mich auch falsch.

zu 2) passt und ist auch meistens so gemeint.
fenderbender Auf diesen Beitrag antworten »

Zitat:
Original von dinzeoo
Zitat:
Original von fenderbender
Würfelexperiment:
1) z.B. 10 Würfel -> gleichzeitig werfen -> X_1 besteht dann aus x_1...x_10
-> nochmal werfen: X_2 besteht wieder aus x_1 ... x_10
2) z.B 1 Würfel: X_1 = x_1, nächster Wurf: X_2=x_1


ok, jetzt versteh ich es. falsch ist es mehr oder weniger nicht, aber so schreibt man es normalerweise nicht an.

wenn wir die situation 1) haben, dann sagt man, das x_1 einfach dimension 10 hat. also z.b. also x_1 ist dann ein vektor ist. klein x_1 wurde ja gerade als variable so bezeichnet das es zu gross X_1 gehört. in deinem bsp bekommt X_1 x1,...,x_10 und X_2 bekommt die gleichen nochmal, so eine notation wäre schon recht verwirrend und wird in eurem skript auch sicherlich nicht verwendet, deshalb wirkte es für mich auch falsch.

zu 2) passt und ist auch meistens so gemeint.


Danke nochmal,

mein Problem ist, dass ich fast ohne Statistikkenntnisse eine Statistikvorlesung besuche, in der sowas als bekannt vorausgesetzt wird (wobei ich gemerkt hab, dass es 90% der Kommilitonen so geht wie mir Augenzwinkern ).
D.h. "so in meinem Skript" steht es nicht Augenzwinkern

Magst du mir nochmal für 1) und 2) eine mathematisch richtige Notation schreiben und eine umgangssprachliche Formulierung, damit auch ich es verstehe?
Das wäre super!


Und: Stimmen folgende Aussagen?:

Der Schätzer kann dann so beschrieben werden:
a) Ich schmeiße z.B. 10 Würfel und bekomme eine Zufallsvariable X mit einer bestimmten Verteilung (im Fall des Würfels vermutlich gleichverteilung)
b) Ich wiederhole a) dann N mal und bekomme im Mittel immer auf das gleiche X mit gleicher Verteilung, so dass (wenn i.i.d)

Es gibt aber auch die Notation . Das wäre dann der Fall, wenn ich N würfel hab, die ich nur einmal gleichzeitig werfe.

Danke
dinzeo Auf diesen Beitrag antworten »

Zitat:
Original von fenderbender
Magst du mir nochmal für 1) und 2) eine mathematisch richtige Notation schreiben und eine umgangssprachliche Formulierung, damit auch ich es verstehe?


vergiss am besten den fall nr.1. und alles mit gleichzeitig werfen. betrachte jede messung,wurf, usw. einzelnd bzw. hintereinander.
fall nr.2 und

Zitat:

Und: Stimmen folgende Aussagen?:

Der Schätzer kann dann so beschrieben werden:
a) Ich schmeiße z.B. 10 Würfel und bekomme eine Zufallsvariable X mit einer bestimmten Verteilung (im Fall des Würfels vermutlich gleichverteilung)
b) Ich wiederhole a) dann N mal und bekomme im Mittel immer auf das gleiche X mit gleicher Verteilung, so dass (wenn i.i.d)

Es gibt aber auch die Notation . Das wäre dann der Fall, wenn ich N würfel hab, die ich nur einmal gleichzeitig werfe.


versuch ich mal in einem zu beantworten. bei deinem a) und b) gehst du viel zu kompliziert an die sache ran und richtig verstanden hab ich es auch nicht was du meinst, deswegen nochmal ein beispiel. ein würfel ist im allgmeinen für die statistik eher schlecht, das eignet sich für die wahrscheinlichkeitstheorie. aber von mir aus bleiben wir mal beim würfel bzw. um es etwas leichter zu machen bei einer münze.
ich versuch es jetzt mal nicht so mathematisch exakt zu formulieren, damit du erstmal verstehst was überhaupt das ganze soll.

zu erst muss dir also klar sein was überhaupt geprüft werden soll. da könnte es mehrere fragestellungen geben, z.b. ist die münze wirklich gleichverteilt? (könnte ja gezinkt sein) sobald ich wüsste das es gleichverteilt ist, bräuchte ich statistisch überhaupt nix mehr überprüfen, da ja dann alles klar ist. z.b. bei körpergrössen könnte man erstmal überprüfen ob die normalverteilt sind aber dieses thema behandelt ihr momentan garnicht oder vll auch nie.
in dem bereich in dem du dich gerade aufhälst (schätztheorie) geht es darum einen parameter zu schätzen(im bsp münze ist es ansich das gleiche wie zu überprüfen ob es gleichverteilt ist). das heisst wir starten quasi an einem ganz anderen punkt.

gegeben sind nämlich 100 münzwurfe. fragestellung in der schätztheorie ist dann, mit welcher wahrscheinlichkeit kommt z.b. kopf. was ich aus der wahrscheinlichkeitstheorie weiss, ist das ein münzwurf bernoulli verteilt ist mit parameter p. (parameter p=wahrscheinlichkeit für kopf, daraus folgt 1-p = wkeit für zahl).
für körpergrösse würde man z.b. annehmen sie sind normalverteilt(also es wird eine annahme getroffen). das passiert in der statistik sehr oft, über gewisse experimente, wie z.b. messung von körpergrösse, oder warteschlangen an der kasse usw. hat man schon eine verteilungsannahme). als mediziner kann es natürlich sein, das man seine daten erstmal auf irgend eine verteilung überprüfen muss, in den fällen kann man nämlich nicht einfach sagen die daten sind normalverteilt aber egal... sobald man eine verteilung hat gehts los mit der schätztheorie(in eurem fall zumindestens) wir wissen ein münzwurf ist bernoulli verteilt und haben wie gesagt die stichprobe mit 100 daten. hier starten wir also!
jetzt kommen die zufallsvariablen ins spiel, man nimmt nämlich an, das der münzwurf durch zufall enstanden ist(beim münzwurf natürlich klar, bei körpergrössen vll nicht so klar)

d.h. unsere 100 daten sind folgendermaßen entstanden:

wir haben
0 steht hier für zahl, 1 steht für kopf.
diese zufallsvariablen sind identisch und unabhängig bernoulli verteilt mit parameter p (das ist die annahme die wir vorher getroffen haben). diese beiden annahmen, unabhängig und identisch verteilt sind intuitiv auch logisch. wir gehen nämlich davon aus, das der erste wurf nicht den zweiten oder 100sten wurf beeinflusst und identisch verteilt weil wir mal davon ausgehen es wurde immer die selbe münze geworfen. diese annahme nimmt man eigentlich so gut wie immer und sind meistens auch klar. kannst dir ja mal überlegen ob es bei körpergrössen auch sinnvoll ist die annahme so zu treffen. weiter im bsp:
unsere 100 münzwürfe sind also durch die zufallsvariablen X_1 bis X_100 entstanden. ziel ist es, wie oben auch schon beschrieben, den parameter p zu schätzen. ein "sinnvoller" schätzer ist z.b. der schätzer den du genannt hast, nämlich



die schwierigkeit und eventuell ein haupthema bei euch, ist es einen sinnvollen schätzer zu finden und dazu muss das wort sinnvoll erstmal definiert werden. kommen wir wieder zurück zur aufgabe:
sagen wir mal unsere stichprobe sieht so aus: 50 mal kam kopf(also 1) und 50 mal kam zahl (also 0). damit ist x_1,..x_100 = (0,...,0,1,...,1) reihenfolge mal unbeachtet.

jetzt setz ich es in den schätzer ein:

T(0,...,0,1,...1)=1/100*50=1/2

unser schätzer für p ist also 1/2. daraus könnte man dann folgern die münze ist wohl nicht gezinkt bzw. fair.

in der schätztheorie geht es also um die schätzung eines parameters einer verteilung.

klein x_i sind übrigens immer die wirklichen daten. wenn man etwas wie erwartungswert oder varianz ausrechnen will, nimmt man die gross X_i.
E(x_i) macht nämlich keinen sinn, da der erwartungswert ein integral ist, und ein integral will man über einer funktion haben, also über gross X_i. (grob formuliertAugenzwinkern )
genauso macht

keinen sinn.

was studierst du genau, mal so am rande?
fenderbender Auf diesen Beitrag antworten »

Ich habe mich zwar für den Elektrotechnik-Master immatrikuliert, aber vermutlich doch den Mathe-Mater erwischt Augenzwinkern
Nein, Probleme gibts gottseidank nur damit...

Also ich glaub allmählich es macht für die Berechnungen und Überlegungen gar keinen Unterschied ob das X nun groß oder klein ist Augenzwinkern Im Skript ist es scheinbar auch willkürlich, denn
findet man öfter und genau daher kommt meine Verwirrung...

Aber nochmal ohne Resignation:

Du schreibst: "diese zufallsvariablen sind identisch und unabhängig bernoulli verteilt mit parameter p ". Sagen wir mal es ist Gaußverteilt (da gibts mehr Möglichkeiten als 1 und 0 und ich kanns mir besser vorstellen.
Außerdem heißt es, eine Zufallsvariable ist eine Funktion.

Wie hängt jetzt meine Zufallsvariable X mit der Gauß-Verteilung (oder Bernoulli oder sonst was) zusammen. Ich trau mich jetzt nich zu sagen, dass X gleich der Dichteverteilung ist. (Hätte vermutlich ähnliche Auswirkungen wie zu behaupten, dass Pi=3,0 ist).
Ich tu mich schwer einzusehen, dass X eine Funktion ist, wenn ich nicht schreiben darf.

Und mir fällt gerad noch was ein. Wenn gilt:
, warum ist der Erwartungswert von T

(mir ist klar, dass keinen Sinn macht)
dinzeoo Auf diesen Beitrag antworten »

Zitat:
Original von fenderbender
Also ich glaub allmählich es macht für die Berechnungen und Überlegungen gar keinen Unterschied ob das X nun groß oder klein ist Augenzwinkern Im Skript ist es scheinbar auch willkürlich, denn
findet man öfter und genau daher kommt meine Verwirrung...

ok, dafür kannst du sogesehen nix, aber es ist trotzdem falsch. die grossbuchstaben stehen für die zufallsvariable, die kleinbuchstaben für deren realisationen. je nach studiengang wird man damit probleme kriegen. in bwl-studium würde es zum beispiel keinen jucken... aber ohne diese trennung wird es ab einen punkt mathematisch nicht mehr weitergehen. wenn du glück hast kommt ihr nicht soweit und du kannst auf klein gross verzichten..


Zitat:

Du schreibst: "diese zufallsvariablen sind identisch und unabhängig bernoulli verteilt mit parameter p ". Sagen wir mal es ist Gaußverteilt (da gibts mehr Möglichkeiten als 1 und 0 und ich kanns mir besser vorstellen.
Außerdem heißt es, eine Zufallsvariable ist eine Funktion.

Wie hängt jetzt meine Zufallsvariable X mit der Gauß-Verteilung (oder Bernoulli oder sonst was) zusammen. Ich trau mich jetzt nich zu sagen, dass X gleich der Dichteverteilung ist. (Hätte vermutlich ähnliche Auswirkungen wie zu behaupten, dass Pi=3,0 ist).
Ich tu mich schwer einzusehen, dass X eine Funktion ist, wenn ich nicht schreiben darf.


hier kommt die wahrscheinlichkeitstheorie ins spiel, wo du definitiv paar lücken hast. man sagt z.b. X ist normalverteilt/gaußverteilt wenn für das bild maß P^X gilt



schau dir mal unter wikipedia den begriff zufallsvariable an und zusätzlich auch paar beispiele von einer münze, würfel usw. dann bekommst bisschen mehr ein gefühl für eine zufallsvariable.


Zitat:

Und mir fällt gerad noch was ein. Wenn gilt:
, warum ist der Erwartungswert von T

(mir ist klar, dass keinen Sinn macht)


wenn es so in eurem skript steht ist es tatsächlich schwer durch zu blicken. der schätzer T(x1,...,xN) passt so wie er definiert ist.
will man aber den erwartungswert bestimmen, betrachtet man den schätzer bzgl. der zufallsvariablen X_1 bis X_N. T ist dann nämlich selber eine zufallsvariable, mathematisch ganz exakt könnte man es so formulieren:




X_1, ... , X_N sind ja identisch und unabhängig, d.h.





im vorletzen gleichheitszeichen habe ich die eigenschaften des erwartungswert ausgenutzt(die regel gilt immer auch wenn keine unabhängigkeit gegeben ist, bei der varianz gilt sie nur wenn unabhängigkeit gegeben ist) und das letzte gleichheitszeichen weil die X_i identisch verteilt sind.
fenderbender Auf diesen Beitrag antworten »

Oh DANKE!!

Du bist ein guter Geburtenhelfer Augenzwinkern

Jetzt wirds wirklich klarer... Noch ein bisschen Gefühl und Erfahrung, dann krieg ich das hin denk ich Augenzwinkern

Ist die Verteilung von X umgangssprachlich gesprochen, die Dichteverteilung nur in einem anderen Raum? (Messraum, Maßraum, ... oder wie das heißt)

Die Regeln von E, Var, ... hab ich mir schon stundenlang eingetrichtert (und anschaulich verstanden) Augenzwinkern Und auch das Bsp in Wikipedia kann ich fast schon auswändig...
Für heut is erstmal genug mit Statistik.

ich danke dir sehr herzlich für deine unermüdliche Unterstützung!
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »