Arithmetisches Mittel 2 Variablen 0/1 + bedingtes arithmetisches Mittel

Neue Frage »

ManUFan45 Auf diesen Beitrag antworten »
Arithmetisches Mittel 2 Variablen 0/1 + bedingtes arithmetisches Mittel
Meine Frage:
Hallo ich habe eine Frage zu meiner Übungsaufgabe
Aufgabe:

Tabelle 1 beschreibt einen Datensatz, der die Eigenschaften von 500 Mitarbeitern eines Unternehmens hinsichtlich zweier statistischer Variablen X und Y erfasst. Beide Variablen sind
diskret und binär, d.h. sie können nur die Werte 0 oder 1 annehmen. X bezeichnet die Variable
?Hochschulabschluss? (X = 0: kein Hochschulabschluss, X = 1: Hochschulabschluss). Die statistische Variable Y sagt aus, ob die betreffende Person Personalverantwortung im Unternehmen
hat (Y = 0: keine Personalverantwortung, Y = 1: Personalverantwortung).
Tabelle 1: Relative Häufigkeiten
h(xi, yj ) yj = 0| yj = 1| Summe
xi = 0 | 0,46 | 0,18 | 0,64
xi = 1 |0,16 | 0,20 | 0,36
Summe | 0,62 |0,38 | 1

[B2] Berechnen Sie die arithmetischen Mittel beider Variablen.
[B3] Berechnen Sie die bedingten arithmetischen Mittel von Y . Interpretieren Sie.
[B4] Berechnen Sie die Kovarianz von X und Y und interpretieren Sie das Ergebnis. Was wäre
ein alternatives Maß, das Ihnen Auskunft über die Stärke des Zusammenhangs zwischen X und Y geben kann?
[B5] Sind die statistischen Variablen X und Y statistisch unabhängig? Warum (nicht)?

Meine Ideen:
Zu B2 ich würde das arithmetische mittel für y mit 0 mal 0,62 + 1 mal 0,32 rechnen und da kommt dann Ymittelwert = 0,32 raus aber das fühlt sich für mich irgendwie falsch an. Bei X wäre es dann 0,36...
bei B3 dachte ich daran das ich Y yj|x=0 = 0 mal 0,46: 0,64 + 1 mal 0,18 :0,64 = 0,28125
und für Y yj| X=1 = 0 mal 0,16:0,36 + 1x 0,2 :0,36 machen muss = 0,55....56
Stimmt das weil das fühlt sich sehr komisch dan dies so zu machen...
Bei interpretieren sie das ergebnis habe ich keine ahnung wie man das interpretieren könnte.

bei B5 wäre evtl eine antwort hilfreich und wieso und bei der B4 wüsste ich kein alternatives Maß.
HAL 9000 Auf diesen Beitrag antworten »

Zitat:
Original von ManUFan45
Zu B2 ich würde das arithmetische mittel für y mit 0 mal 0,62 + 1 mal 0,32 rechnen und da kommt dann Ymittelwert = 0,32 raus aber das fühlt sich für mich irgendwie falsch an. Bei X wäre es dann 0,36...

Ist korrekt. Generell gilt für solche 0-1-Zufallsgrößen die einfache Formel , übrigens sogar für alle (ist für die Varianz von Interesse).

Zitat:
Original von ManUFan45
bei B3 dachte ich daran das ich Y yj|x=0 = 0 mal 0,46: 0,64 + 1 mal 0,18 :0,64 = 0,28125

Grauenhaft lesbar, aber vom Ergebnis her richtig.



Zitat:
Original von ManUFan45
und für Y yj| X=1 = 0 mal 0,16:0,36 + 1x 0,2 :0,36 machen muss = 0,55....56

Dito.



B5 kann sofort beantwortet werden anhand des Ergebnisses von B4: Hast du die Kovarianz dort ausgerechnet?
 
 
ManUFan45 Auf diesen Beitrag antworten »

Ich weiß leider nicht wie du das so schön hin bekommst aber ich dachte:
Ich würde sagen die Cov berechne ich so: 1: 2-1 (1:n-1) ((0.46+0,18-0,36)x(0,62-0,38) + 80,36-0,36)x(0, 38-0,38) = 0,0672 aber ich denke das ist falsch
ok nein ich habe keine ahnung wie ich die cov hier raus berechne...
Bei B4 teil 2 alternatives maß weiß ich leider auch nicht
und B5 falls das richtig sein sollte habe ich leider auch keine ahnung ob sie jetzt abhängig oder nicht sind da ich sehe das der 2te teil ja (falls es richtig ist) einfach weg fällt!?
LG
ManUFan45 Auf diesen Beitrag antworten »

Zitat:
Original von ManUFan45
Ich weiß leider nicht wie du das so schön hin bekommst aber ich dachte:
Ich würde sagen die Cov berechne ich so: 1: 2-1 (1:n-1) ((0.46+0,18-0,36)x(0,62-0,38) + 80,36-0,36)x(0, 38-0,38) = 0,0672 aber ich denke das ist falsch
ok nein ich habe keine ahnung wie ich die cov hier raus berechne...
Bei B4 teil 2 alternatives maß weiß ich leider auch nicht
und B5 falls das richtig sein sollte habe ich leider auch keine ahnung ob sie jetzt abhängig oder nicht sind da ich sehe das der 2te teil ja (falls es richtig ist) einfach weg fällt!?
LG


da sollte natürlich : 1: 2-1 (1:n-1) ((0.46+0,18-0,36)x(0,62-0,38) + (0,36-0,36)x(0, 38-0,38) = 0,0672
das hier stehen
HAL 9000 Auf diesen Beitrag antworten »

Ich kann nicht entschlüsseln, welche Rechenweise du da anwendest: Leider rückst du ja sofort mit Zahlen an ohne vorher (mit Symbolen) zu erklären, was du da gerade tust. unglücklich


Der einfachste Weg, die Kovarianz hier auszurechnen ist .

Mit sowie den oben schon berechneten und ergibt das .

Damit sind nicht unkorreliert, und damit können sie auch nicht unabhängig sein, merke:

"unabhängig unkorreliert" bzw. invertiert "nicht unkorreliert nicht unabhängig" .
ManUFan45 Auf diesen Beitrag antworten »

Ich habe diese funktion genommen nur habe ich im internet gesehen das man bei n unten im bruchstrich nochmal -1 machen muss keine ahnung wieso.
Wieso habe ich denn ein ganz anderes ergebnis wenn ich es nach der formel auf dem bild machen würde so wie wir es gelernt haben?
Wende ich etwa die falsche formel an?
i.gyazo. com/d8490b550f7bab7db69c6a8ccecb5d62.png
HAL 9000 Auf diesen Beitrag antworten »

Zitat:
Original von ManUFan45
Ich habe diese funktion genommen nur habe ich im internet gesehen das man bei n unten im bruchstrich nochmal -1 machen muss keine ahnung wieso.

Wir sind hier bei der Kovarianzberechnung eines Zufallsvektors statt bei der Berechnung der empirischen Kovarianz einer zweidimensionalen Stichprobe - nicht verwechseln!!!
ManUFan45 Auf diesen Beitrag antworten »

und woran erkenne ich den unterschied welche ich nehmen muss? wie sieht denn das andere aus? Ich dachte immer es gibt hier nur eine allgemeine formel ...
HAL 9000 Auf diesen Beitrag antworten »

Zitat:
Original von ManUFan45
und woran erkenne ich den unterschied welche ich nehmen muss?

Aus dem Kontext. Und weiter werde ich das hier auch nicht ausbreiten - ich halte hier keine Vorlesung.

-------------------------

Ok, doch ein paar Worte zu dieser Grundsatzproblematik:

1) Oben im Eröffnungbeitrag ist die GENAUE Verteilung der beiden Merkmale für die 500 Mitarbeiter des Unternehmens angegeben, ermittelt durch eine Vollbefragung. Die relativen Häufigkeiten entsprechen damit genau den Wahrscheinlichkeiten für die genannten Zufallsgrößen . Die Kovarianz, von der die Rede ist, ist also die Kovarianz der beiden Zufallsgrößen.


2) Eine andere Situation läge vor, wenn diese Daten in einem Großunternehmen (mit sagen wir 100000 Beschäftigten) erhoben worden wären, und die n=500 also nur die Stichprobengröße wäre. In dem Fall hätten wir dann 500 Wertepaare mit als Stichprobe, mit

500*0,46 = 230mal (0,0)
500*0,18 = 90mal (0,1)
500*0,16 = 80mal (1,0)
500*0,20 = 100mal (1,1)

In dem Fall wäre das mit dem berechtigt, denn wir kennen dann die tatsächliche Verteilung von im gesamten Großunternehmen nicht, sondern versuchen sie durch unsere Stichprobenwerte zu schätzen! Es ist dann also auch nicht , sondern ist nur eine Schätzung von . Das ist eine im Grundsatz andere Situation als 1).
ManUFan45 Auf diesen Beitrag antworten »

Tut mir leid danke für die schnell antwort.
Dann habe ich es jetzt ein bisschen besser verstanden also nehme ich dann einfach den (1,1) wert und ziehe von dem dann die Mittelwerte ab. Ich nehme einfach mal an das es keine 3 werte innen gibt sonder nur 2 werte falls es überhaupt dran kommt dann wüsste ich wie es zu tun ist.
Aber wieso wird wie du beschrieben hast 1:N-1 genommen aber bei meine bild wird ja nur 1:n genommen. wann weiß ich also das ich 1:n-1 nehme und wann nehme ich 1:n?
HAL 9000 Auf diesen Beitrag antworten »

Die (N-1)-Variante liefert einen erwartungstreuen Schätzer (was das ist, das schlage bitte selber nach, falls es dich interessiert) für die zugehörige Kovarianz der Zufallsgrößen, das ist meist eine wünschenswerte Eigenschaft. Aber wie gesagt, dass betrifft 2) - wir sind hier in Szenario 1).
ManUFan45 Auf diesen Beitrag antworten »

[B3] Berechnen Sie die bedingten arithmetischen Mittel von Y . Interpretieren Sie.
ist das nicht falsch von mir ausgerechnet? muss ich es nicht anders herum machen?
Also: 0*0,46+1*0,16/0,62 = 0,2580
Da es ja das bedingte arithmetische mittel von y ist? hier jetzt für y=0?
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »