Trainingsdaten im maschinellen Lernen als Zufallsvariablen

Neue Frage »

HabNochKeinen Auf diesen Beitrag antworten »
Trainingsdaten im maschinellen Lernen als Zufallsvariablen
Meine Frage:
Ich lese mich gerade etwas in das Thema Maschinelles Lernen (und damit einhergehend notgedrungen in die Stochastik) ein und würde gerne grundlegend verstehen, wie man Zufallsvariablen richtig verwendet.

Ich nehme mal folgende Beispiele (wobei 1 bis 5 jeweils als getrennt voneinander zu betrachten sind):
1a) Ich werfe eine Münze einmal
2a) Ich würfle einmal
3a) Ich messe irgendwo im Haus die Temperatur einmal
4a) Ich nehme aus der Produktion von Rohren ein Rohr raus und messe dessen Durchmesser
5a) Auf einem Bildschirm wird aus einer Menge von Wörtern zufällig eines angezeigt (wobei jedem Wort eine eindeutige Zahl zugeordnet ist)


1b) Ich werfe 1 Münze n mal oder n Münzen gleichzeitig
2b) Ich würfle n mal oder mit n Würfeln gleichzeitig
3b) Ich messe an n Stellen im Haus oder n-mal an derselben Stelle (mit kurzer Pause dazwischen)
4b) Ich nehme n Rohre raus und messe deren Durchmesser
5b) Es werden n Wörter gleichzeitig angezeigt (auch eines mehrfach) oder n mal hintereinander irgendein Wort

6) Und jetzt in Bezug aufs maschinelle Lernen: Ich messe von 150 Iris-Blumen jeweils Breite und die Länge des Kelchblatts sowie des Kronblatts. Daraus ergibt sich ein Datensatz von 150 Elementen.




Meine Ideen:
bei 1 bis 5 a) liegt jeweils ein einstufiges Zufallsexperiment vor. Jedes dieser Experimente kann ich über eine Zufallsvariable modellieren (die kann ich X oder Y oder sonstwie nennen).

Bei 1 bis 5 b) habe ich jeweils n Zufallsexperimente, die ich jeweils mit einer eigenen Zufallsvariable modelliere. Am häufigsten sehe ich da die Notation , also auf 1 b) bezogen wäre Ausgang des ersten Wurfs, Ausgang des 2. Wurfs bzw. das, was die erste bzw. zweite Münze zeigt.

Wenn man bei den jeweiligen Versuchen davon ausgeht, dass Unabhängigkeit vorliegt und sich die Verteilungen nie ändern, dann liegen bei 1 bis 5 b) i.i.d. Zufallsvariablen vor.

Stimmt das so?

Zumindest sieht das bei den Beispielen in Wikipedia so für mich aus: https://de.wikipedia.org/wiki/Zufallsvariable#Beispiel:_Zweimaliger_Würfelwurf bzw. https://de.wikipedia.org/wiki/Zufallsvariable#Motivation_des_formalen_Begriffs

Z. B. zu 1 b) Wenn ich die Münze 3 mal werfe oder 3 Münzen 1 mal, dann kann da ja z. B. (Kopf, Kopf, Zahl) liegen. Ist das jetzt die Realisierung einer Zufallsvariablen X oder jeweils eine Realisierung von 3 Zufallsvariablen (oder ich könnte sie auch X,Y,Z nennen)?

zu 6)
Nach meinem Verständnis ist das Messen der Kelchblatt-Länge von 150 Blumen vom Modell her dasselbe wie 150mal eine Münze werfen. Laut Wikipedia hätte ich dann 150 Zufallsvariablen mit jeweils 2 möglichen Realisationen bzw. bei den Blumen eben die entsprechenden Werte.

Oder sind die 4 Spalten jeweils eine Zufallsvariable und die Werte die Realisationen? Dann müsste doch aber auch 20maliges Werfen einer Münze nur EINE Zufallsvariable sein und nicht 20 .i.i.d-Zufallsvariablen.
Dopap Auf diesen Beitrag antworten »

Du kannst eine Zufallsgröße auch in Worten definieren.

Sei die Summe von n Würfen einer fairen 0/1 Münze.

Der Weg über :

Sei die jeweiligen Zufallsgrößen für den n-ten Versuch mit

muss nicht unbedingt sein.

Oft wird ein Spielwürfel gewürfelt und dabei wird den oben liegendem Symbolen die Anzahl der Punkte zugeordnet, also von einem ersten Ereignismenge auf die einfachere Ergebnismenge stillschweigend übergegangen.

1b) Müssen musst du gar nichts. Du kannst eine oder mehrere Zufallsgrößen so definieren wie es für den momentanen Gebrauch am besten geeignet ist.
Unterscheiden sollte man aber schon ob die Reihenfolge von Belang ist.
z.B.
ist die Summe der "Köpfe" von Interesse, dann geht gleichzeitiges Werfen.
ist das Ereignis < die mittlere Münzseite hat links und rechts eine anderen Münzseite als Nahbarn>
dann geht nur 3 maliges Werfen.
Ulrich Ruhnau Auf diesen Beitrag antworten »

Wenn man noch nie etwas über Wahrscheinlichkeitsrechnung gehört hat, dann sollte man sich mit den folgenden Begriffen vertraut machen: Wahrscheinlichkeit, Häufigkeit, Verteilungsfunktion, Zufallsgröße, Erwartungswert, Gleichverteilung, Gaußverteilung, Poissonverteilung.

Fangen wir mit der Wahrscheilichkeit an, mit der ein Ereignis eintritt: Formelzeichen oder : es gilt immer .
Die Wahrscheinlichkeit mit einem Würfel eine 1 zu würfeln ist .

Sei P(A) die Wahrscheinlichkeit mit der das Ereignis A eintritt.
Sei P(B) die Wahrscheinlichkeit mit der das Ereignis B eintritt.
Wenn beide Ereignisse unabhängig voneinander sind, dann ist die Wahrscheinlichkeit für das gleichzeitige Eintreten beider Ereignisse
Und dann ist die Wahrscheinlichkeit für das Eintreten von mindestens einem Ereigniss . Andernfalls treten A und B nicht unabhängig voneinander ein.

Wenn es Ereignisse gibt, die sich gegenseitig ausschließen, dann kann man deren Wahrscheinlichkeiten direkt addieren zu einer Gesamtwahrscheinlichkeit, mit der eines dieser Ereignisse eintritt. Z.B. die Wahrscheinlichkeit, mit einem Würfel mit nur einem Wurf eine Eins oder eine Zwei zu würfeln, beträgt so
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »