Kovarianz von zwei Mittelwerten

07.02.2008, 10:54

Mathematica

Auf diesen Beitrag antworten »

Kovarianz von zwei Mittelwerten

Hallo zusammen!

Ich bin auf der Suche nach einer Formel für die Kovarianz von zwei Mittelwerten, bei gegebener Kovarianz der Beobachtungswerte - in Anlehnung an die Formel für die Varianz des Mittelwertes.

Varianz des Mittelwertes
$\begin{eqnarray*} var\left(\frac{1}{n}\sum_{i=1}^nx_i\right)=\frac{1}{n^2}var\left(\sum_{i=1}^nx_i\right)=\frac{1}{n^2}\sum_{i=1}^nvar\left(x_i\right)=\frac{1}{n^2}n\sigma_x^2=\frac{\sigma_x^2}{n} \end{eqnarray*}$

Kovarianz zweier Mittelwerte
$\begin{eqnarray*} cov\left(\frac{1}{n}\sum_{i=1}^nx_i,\frac{1}{n}\sum_{i=1}^ny_i\right)=\frac{1}{n^2}cov\left(\sum_{i=1}^nx_i,\sum_{i=1}^ny_i\right)=\frac{1}{n^2}\sum_{i=1}^n\sum_{j=1}^ncov\left(x_i,y_i\right)=\frac{1}{n^2}n^2\sigma_{x,y}=\sigma_{x,y} \end{eqnarray*}$

Stimmt das? Habe ich mir aus Wikipedia zusammengebastelt und bin mir deswegen nicht absolut sicher. Vor allem, weil der Stichprobenumfang keine Rolle zu spielen scheint. Vielen Dank für Eure Ideen im Voraus!

07.02.2008, 11:22

Dual Space

Auf diesen Beitrag antworten »

RE: Kovarianz von zwei Mittelwerten
Bezeichnen wir mal die Mittelwerte mit $\begin{eqnarray*} E(X) \end{eqnarray*}$ bzw. $\begin{eqnarray*} E(Y) \end{eqnarray*}$ . Erstmal sollte man sich klar machen, dass der Erwartungswertoperator die Stochastik killt, dass also $\begin{eqnarray*} E(X) \end{eqnarray*}$ und $\begin{eqnarray*} E(Y) \end{eqnarray*}$ deterministisch sind.

Gut, dann gilt also

$\begin{eqnarray*} Cov(E(X),E(Y))&=&E[(E(X)-E(E(X)))(E(Y)-E(E(Y)))]\\&=&E[(E(X)-E(X))(E(Y)-E(Y))]\\&=&E[0]=0. \end{eqnarray*}$

07.02.2008, 11:34

Mathematica

Auf diesen Beitrag antworten »

RE: Kovarianz von zwei Mittelwerten
Ok, das ist eindrucksvoll... Aber was ist dann der Fehler an meiner Herleitung? Gilt also im Speziellen für die Zufallsvariablen 'zwei Mittelwerte' immer Cov=0, obwohl die Beobachtungen eine von null verschiedene Kovarianz aufweisen?

07.02.2008, 11:35

Dual Space

Auf diesen Beitrag antworten »

RE: Kovarianz von zwei Mittelwerten
Erklär doch am besten mal, wie du eine Kovarianz "beobachten" willst.

Im Übrigen gilt auch $\begin{eqnarray*} Var[E(X)]=E[(E(X)-E(E(X)))^2]=E[0]=0. \end{eqnarray*}$

07.02.2008, 14:05

Mathematica

Auf diesen Beitrag antworten »

RE: Kovarianz von zwei Mittelwerten
Ich habe zwei Reihen (Querschnittsdaten), wobei jedem x ein y zugeordnet ist (oder umgekehrt, ist völlig egal). Wenn nun z. B. hohe Werte bei x mit einem hohen Wert beim y zusammenfallen, habe ich eine positive Kovarianz zwischen den Beobachtungswerten. Meine Frage ist, was folgt daraus für die Mittelwerte. Demnach müsste ja auch ein hoher Mittelwert bei x einen hohen Mittelwert bei y bedingen (im Sinne von "damit einhergehen") und somit die Kovarianz größer als null sein.

07.02.2008, 16:34

AD

Auf diesen Beitrag antworten »

@Dual Space

Moment - da scheint mir bei dir ein Missverständnis vorzuliegen: Erwartungswert $\begin{eqnarray*} E(X) \end{eqnarray*}$ einer Zufallsgröße $\begin{eqnarray*} X \end{eqnarray*}$ einerseits, und Mittelwert $\begin{eqnarray*} \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i \end{eqnarray*}$ einer Folge unabhängig identisch (wie X) verteilter Zufallsgrößen $\begin{eqnarray*} X_1,\ldots,X_n \end{eqnarray*}$ andererseits sind zwei völlig verschiedene Dinge. Das erste ist eine deterministische Zufallsgröße - auch einfach "Zahl" genannt Augenzwinkern

Augenzwinkern

- während das zweite eine echt zufällige Größe ist.

Anzeige

07.02.2008, 17:54

Dual Space

Auf diesen Beitrag antworten »

Ich hatte die $\begin{eqnarray*} x_i \end{eqnarray*}$ für Messwerte und bin dementsprechend vom (empirischen) Mittelwert ausgegangen. Sollen $\begin{eqnarray*} x_i \end{eqnarray*}$ hier tatsächlich Zufallsvariablen sein? Nee, oder?

08.02.2008, 10:18

Mathematica

Auf diesen Beitrag antworten »

Sie die Beobachtungswerte oder Messwerte als Stichprobe nicht so oder so Zufallsvariablen? Auf jeden Fall ist der Mittelwert, wie Arthur dargestellt hat eine Zufallsvariable. Womit sich wieder die Frage aufdrängt, wie kriege ich die Kovarianz zwischen zwei Mittelwerten heraus. Oder ist meine Herleitung schon richtig gewesen? Wie schon gesagt, der fehlende Stichprobenumfang macht mich stutzig. Dann müsste ja bei wachsenden n die Korrelation irgendwann auch betragsmäßig größer als eins werden können?!?

08.02.2008, 10:22

Dual Space

Auf diesen Beitrag antworten »

Zitat:

Original von Mathematica
Sie die Beobachtungswerte oder Messwerte als Stichprobe nicht so oder so Zufallsvariablen?

Das verstehe ich nun wiederum nicht. Normalerweise beobachtet man mit der Stichprobe Realisierungen einer Zufallsvariable.

08.02.2008, 11:58

Mathematica

Auf diesen Beitrag antworten »

Ja, mein Fehler. Du hast völlig Recht, sorry! X und Y sind die Zufallsvariablen mit Realisierungen x_i bzw. y_i. Irgendwie kann meine Lösung aber nicht richtig sein (sind die Rechenregeln denn korrekt), da wie gesagt die Korrelation betreagsmäßig per definitionem nicht größer als eins werden kann. Nichtsdestotrotz ist m. E. die Kovarianz aber auch nicht zwangsläufig gleich null.

08.02.2008, 12:31

Dual Space

Auf diesen Beitrag antworten »

Wenn $\begin{eqnarray*} x_i \end{eqnarray*}$ Realisierungen der Zufallsvariable $\begin{eqnarray*} X \end{eqnarray*}$ sind, dann ist $\begin{eqnarray*} \frac{1}{n}\sum_{i=1}^n x_i \end{eqnarray*}$ der empirische Mittelwert und meine Rechnungen von oben gelten.

08.02.2008, 13:21

Mathematica

Auf diesen Beitrag antworten »

Aber wie Arthur schon dargestellt hat, ist doch $\begin{eqnarray*} E(X) \neq \bar X \end{eqnarray*}$ , alleine schon deswegen weil das eine deterministisch ist und das andere stochastisch. Und was ist mit meiner intuitiven Interpretation? Wenn die Kovarianz zwischen den Beobachtungen positiv ist, hohe oder niedrige x- und y-Werte fallen zusammen, dann ist auch der Mittelwert von X und Y hoch bzw. niedrig und damit sollte auch dessen Kovarianz größer null sein?!

08.02.2008, 13:35

Dual Space

Auf diesen Beitrag antworten »

Also ich steig nicht mehr durch. Antworte doch mal klipp und klar, ob $\begin{eqnarray*} x_i \end{eqnarray*}$ Messwerte (also deterministisch) sind, oder Zufallsvariablen bezeichnen.

08.02.2008, 15:50

Mathematica

Auf diesen Beitrag antworten »

Also vielleicht das Grundproblem komplett. Ich habe $\begin{eqnarray*} n \end{eqnarray*}$ Beobachtungen (in diesem Sinne "deterministische Messwerte") von zwei ökonomischen Variablen $\begin{eqnarray*} X \end{eqnarray*}$ und $\begin{eqnarray*} Y \end{eqnarray*}$ , wobei $\begin{eqnarray*} x_i \end{eqnarray*}$ und $\begin{eqnarray*} y_i \end{eqnarray*}$ für das gleiche $\begin{eqnarray*} i \end{eqnarray*}$ zusammenhängen. Ich kann die Kovarianz zwischen $\begin{eqnarray*} X \end{eqnarray*}$ und $\begin{eqnarray*} Y \end{eqnarray*}$ berechnen und die Mittelwerte $\begin{eqnarray*} \bar X \end{eqnarray*}$ und $\begin{eqnarray*} \bar Y \end{eqnarray*}$ . Jetzt stellt sich für mich die Frage nach der Kovarianz der empirischen Mittelwerte, die wiederum selbst Zufallsvariablen sind und nicht deterministische Größen.

In deiner Darstellung würde die Rechnung wie folgt aussehen (es geht um $\begin{eqnarray*} \bar X, \bar Y \end{eqnarray*}$ und nicht $\begin{eqnarray*} E(\bar X), E(\bar Y) \end{eqnarray*}$ ): $\begin{eqnarray*} Cov(\bar X, \bar Y)=E[(\bar X-E(\bar X))(\bar Y-E(\bar Y))] \end{eqnarray*}$ . Ich kann doch nicht einfach $\begin{eqnarray*} \bar X \end{eqnarray*}$ durch $\begin{eqnarray*} E(X) \end{eqnarray*}$ ersetzen - unabhängig davon, ob die Ursprungswerte stochastisch oder deterministisch sind?

Wenn ich einem Riesengedankenfehler aufsitze, bitte klär mich auf, aber für mich macht es nur so Sinn. Dass die Kovarianz zwischen zwei deterministischen Größen gleich null ist logisch (das gleiche gilt folglich ja auch für deren Varianz). Nur sind die empirischen Mittelwerte keine deterministischen Größen, sondern Zufallsvariablen - Determiniertheit der Ursprungswerte hin oder her, es handelt sich um Stichprobengrößen.

08.02.2008, 17:16

Mathematica

Auf diesen Beitrag antworten »

Mir dämmert gerade etwas, was dein Verständnisproblem mit meinem Problem sein könnte. (Vielleicht auch nicht...) Die Beobachtungen erfassen nicht eine Grundgesamtheit oder Ähnliches, sondern sind zum Beispiel als finite Zeitreihe eines zugrundliegenden infiniten datenerzeugenden Prozesses zu sehen. Somit als wenn man eine Stichprobe von Personen befragen würde etc.

08.02.2008, 19:24

Dual Space

Auf diesen Beitrag antworten »

Zitat:

Original von Mathematica
Ich kann die Kovarianz zwischen $\begin{eqnarray*} X \end{eqnarray*}$ und $\begin{eqnarray*} Y \end{eqnarray*}$ berechnen und die Mittelwerte $\begin{eqnarray*} \bar X \end{eqnarray*}$ und $\begin{eqnarray*} \bar Y \end{eqnarray*}$ .

Prima. Danke dafür, Arthur.

Das was du jetzt mit $\begin{eqnarray*} \bar X \end{eqnarray*}$ bezeichnet hat nichts mit dem zu tun, was Arthur Dent gepostet hat. Nach wie vor sind die Summen die du betrachtest deterministisch. Das ist auch nicht verwunderlich, da eine Summe deterministischer Werte nicht plötzlich stochastisch wird.

Finde dich damit ab, dass in deinem Modell die Varianz und die Covarianz Null ist, oder lass dir was neues einfallen.

@Arthur: Kannst du nicht auch noch ein paar Worte verlieren? Mir wird hier nicht sehr viel Glaubwürdigkeit geschenkt.

08.02.2008, 20:31

Mathematica

Auf diesen Beitrag antworten »

Versteh das bitte nicht als persönlichen Angriff, nur kann ich deiner Argumentation nicht folgen. Was mit Sicherheit daran liegen könnte, dass ich kein Mathematiker bin. Nochmal deine Frage zur Determiniertheit. Wenn die Beobachtungen Stichprobenwerte sind, sind diese dann deterministisch?

Und eine Sache ist mir mit Sicherheit klar, die Varianz des Mittelwertes kann nicht gleich null sein. Weil das bedeuten würde, dass wenn ich aus der Grundgesamtheit beliebige Stichproben ziehen würde ich immer denselben Mittelwert erhalte und das ist "unwahrscheinlich".

Vielleicht ist mein Fehler auch so trivial, dass mir nicht klar ist, dass meine Beobachtungen in Wahrheit stochastisch sind? Ich will mit Sicherheit nicht an deiner Kompetenz zweifeln, versteh mich bitte nicht falsch, aber ich komme einfach nicht mit.

08.02.2008, 21:53

Mathematica

Auf diesen Beitrag antworten »

Ich glaube, ich habe es selber gefunden. Aufgrund eines klitzekleinen Fehlers in der Notation bin ich diesem Irrtum aufgesessen. Ich habe postuliert, dass $\begin{eqnarray*} cov\left(\frac{1}{n}\sum_{i=1}^nx_i,\frac{1}{n}\sum_{i=1}^ny_i\right)=\frac{1}{n^2}cov\left(\sum_{i=1}^nx_i,\sum_{i=1}^ny_i\right)=\frac{1}{n^2}\sum_{i=1}^n\sum_{j=1}^ncov\left(x_i,y_i\right)=\frac{1}{n^2}n^2\sigma_{x,y}=\sigma_{x,y} \end{eqnarray*}$ . Der Fehler ist, dass im mittleren Ausdruck $\begin{eqnarray*} cov(x_i,y_j) \end{eqnarray*}$ - also der Index $\begin{eqnarray*} j \end{eqnarray*}$ beim $\begin{eqnarray*} y \end{eqnarray*}$ an Stelle von $\begin{eqnarray*} i \end{eqnarray*}$ - stehen muss. Damit sind nur die $\begin{eqnarray*} n \end{eqnarray*}$ Kovarianzen für $\begin{eqnarray*} i=j \end{eqnarray*}$ ungleich null (und identisch), womit die obige Formel sich verändert auf $\begin{eqnarray*} \dots=\frac{1}{n^2}n\sigma_{x,y}=\frac{1}{n}\sigma_{x,y} \end{eqnarray*}$ . Damit kann die Korrelation auch nicht mehr betragsmäig größer als eins werden, da nun die Kovarianz genauso schnell konvergiert wie die Varianzen.

Vielen Dank für deine Beiträge, sonst wäre ich nicht drauf gekommen.

08.02.2008, 22:28

Dual Space

Auf diesen Beitrag antworten »

Naja dann mach was du willst.

Eine Frage noch: Du bist ein WiWi, oder?

09.02.2008, 21:47

Mathematica

Auf diesen Beitrag antworten »

Ja, ich arbeite mit echten Problemen und echten Zahlen...

15.03.2009, 21:54

emptybrain

Auf diesen Beitrag antworten »

Ich fürchte, hier hat der WiWi recht :-)).

In der Notation sollte man allerdings besser große Xi und Yi verwenden, dann ist klar, dass sich alles auf Zufallsvariablen bezieht.
Und es muss einem klar sein, dass nur X1 mit Y1, x2 mit Y2 usw. korreliert sein können, nicht X1 mit Y2 o.ä.

1

Verwandte Themen

Die Beliebtesten »

Die Größten »

Die Neuesten »