Zusammensetzen zweier Verteilungsfunktionen

Neue Frage »

Mullistannen Auf diesen Beitrag antworten »
Zusammensetzen zweier Verteilungsfunktionen
Hallo,

ich habe folgendes Problem: eine Maschine wird zu einem Zeitpunkt te ein- und zu einem Zeitpunkt ta ausgeschalten. Die Zeitpunkte sind dabei zufällig mit den Verteilungen

Fe(t) = P(t <= te)

und

Fa(t) = P(t <= ta).

Wie ist nun die Wahrscheinlichkeit dafür, dass sich die Maschine zu einem Zeitpunkt ti in eingeschaltenem Zustand befindet?


Mein Ansatz: die Maschine ist eingeschalten, wenn sie vor ti eingeschalten worden ist, Wahrscheinlichkeit dafür

P_schonein = Fe(ti),

und gleichzeitig vor ti nicht ausgeschaltet wurde, Wahrscheinlichkeit dafür

P_nichtaus = 1-Fa(ti).

Sind beide Verteilungen strikt voneinander getrennt, so dass sich Einschalt- und Ausschaltzeitpunkte nirgends überdecken können, ist die gesuchte Wahrscheinlichekeit offenbar

P_läuft = Fe(ti) - Fa(ti).

Wie lässt sich dies mathematisch korrekt hinschreiben (falls es korrekt ist Augenzwinkern )? Und was geschieht wenn sich die Verteilungen überdecken?

Vielen Dank für Hilfe,
Mulli
Mullistannen Auf diesen Beitrag antworten »
Korrektur
OK Korrektur offenbar gilt nicht

P_läuft(ti) = Fe(ti) - Fa(ti)

sondern

P_läuft(ti) = P_schonein(ti) * P_nichtaus(ti) = Fe(ti) * (1 - Fa(ti)).

Gilt dies aber nun allgemein?
HAL 9000 Auf diesen Beitrag antworten »

Einige Korrekturen: Wenn dein Einschaltzeitpunkt sowie dein Ausschaltzeitpunkt sind, dann ist die Verteilungsfunktion von nicht , sondern umgekehrt

, analog ,

ich verwende hier mal bewusst die Konvention "Zufallsgrößen Großbuchstaben": Die ist kein Dogma, erleichtert aber oft mit einem Blick die Situation zu erfassen.



ist richtig, wenn Ein- und Ausschaltzeitpunkt unabhängig voneinander sind. Das scheint mir eine sehr starke Einschränkung zu sein und überhaupt nur dann sinnvoll, wenn die Verteilungsbereiche von und strikt getrennt sind, d.h. es existiert ein Zeitpunkt , bis zu dem die Maschine garantiert an- aber auch garantiert noch nicht ausgeschalten wurde, d.h. und . Ansonsten kann es bei dieser Unabhängigkeitssituation nämlich zu der aus praktischer Sicht absurden Situation kommen, dass mit positiver Wahrscheinlichkeit die Maschine ausgeschaltet wird bevor (!) sie eingeschaltet wird. Big Laugh

Ohne Unabhängigkeitsforderung kann bzw. muss man das ganze mit der gemeinsamen Verteilung von modellieren, die dann eben u.a. die Eigenschaft aufweisen muss, um diese genannte Absurdität zu vermeiden. Bei einem solchen allgemeineren Ansatz gibt es nicht mehr zwingend ein solches , d.h. eine Überdeckung der Bereiche ist hier durchaus möglich.


Mit der gemeinsamen Verteilungsfunktion des Zufallsvektors ist dann



mit der Randverteilungsfunktion .
Mullistannen Auf diesen Beitrag antworten »

Danke für die Korrekturen!

Was t' bedeutet ist mir nicht ganz klar.

Die Zeile

P_läuft(ti) = P(Te <= ti, Ta > ti) = P(Te <= ti) - P(Te <= ti, Ta <= ti) = Fe(ti) - Fe,a(ti,ti)

bedeutet wohl,

die Wahrscheinlichkeit, dass die Maschine bei ti gerade läuft ist gleich der Wahrsch. dass der Einschaltzeitpunkt früher oder gleich war und der Ausschaltzeitpunkt später ist,

und das ist gleich

der Wahrscheinlichkeit, dass der Einschaltzeitpunkt früher war weniger der Wahrsch. dass Ein- und Ausschaltzeitpunkt früher waren, oder?

Und wie komme ich auf diese Verteilung Fe,a ?
HAL 9000 Auf diesen Beitrag antworten »

Zitat:
Original von Mullistannen
Und wie komme ich auf diese Verteilung Fe,a ?

Das ist dein Problem, d.h., es hängt von der Modellierung deines Prozesses ab. Da gibt es keine theoretischen Vorgaben.
Mullistannen Auf diesen Beitrag antworten »

Ich meine wie komme ich auf Fe,a bei gegebenen Fe, Fa?
 
 
HAL 9000 Auf diesen Beitrag antworten »

Nochmal mit anderen Worten: Die gemeinsame Verteilungsfunktion ist ohne Unabhängigkeitsannahme für NICHT allein durch ihre Randverteilungsfunktionen bestimmt.

Das ist im Analogiesinne so, als wenn du von einem kompliziert geformten Körper nur zwei Schattenrisse aus unterschiedlichen Richtungen kennst - aus denen kannst du auch nicht im entferntesten den gesamten Körper rekonstruieren.
Mullistannen Auf diesen Beitrag antworten »

OK. Was ist dann das beste, was man aus einem Datensatz, der aus einer Vielzahl der Zeitpunkte te und dazugehöriges ta besteht, bezüglich der Wahrscheinlichkeiten ohne Modellierung von Verteilungsfunktionen aussagen kann? Nur Prozentzahlen durch Abzählen des Ereignisses "lief zu bestimmten Zeit t"? (Also z.B. von 100x lief die Maschine um 1 Uhr 10x, um 2 Uhr 20x, usw.)
HAL 9000 Auf diesen Beitrag antworten »

Wenn du so diese Daten vorliegen hast, kannst du doch daraus die empirische zweidimensionale Verteilungsfunktion schätzen! Bzw., wenn es dir nur um geht, das direkt aus den Daten schätzen:

Anzahl Datensätze, die das erfüllt / Anzahl aller Datensätze

Eine "bessere" Schätzung ist ohne tiefgreifende Modellierung nicht möglich.



Nun, ich kenne die konkreten Daten nicht. Vielleicht ist ja das Modell passend, dass zwar nicht und , wohl aber Einschaltzeitpunkt und Betriebsdauer (also ) unabhängig sind? Wäre zu testen.
Mullistannen Auf diesen Beitrag antworten »

Der Datensatz ist nicht umfangreich genug, um Verteilungsfunktionen sinnvoll schätzen zu können. Mir ging es hier mehr ums Verständnis, bzw. dauert es noch eine Weile dann ist er vielleicht groß genug.

Vielen Dank jedenfalls für deine Antworten! Freude
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »