Aus Wahrscheinlichkeitsdichtefunktion PDF die Häufigkeit des Auftretens eines Ereignisses berechnen

Neue Frage »

TobiAsche Auf diesen Beitrag antworten »
Aus Wahrscheinlichkeitsdichtefunktion PDF die Häufigkeit des Auftretens eines Ereignisses berechnen
Meine Frage:
Es ist ein Graph von einer normalverteilten Gaußfunktion gegeben (mu=0, sigma=1), halblogarithmisch aufgetragen. Die Gausfunktion soll als Messwerte angenommen werden, die aus der Messung von Ereignissen erstellt wurde. Nun soll an zwei Punkten die Häufigkeit des Auftretens in einem Zeitintervall berechnet werden. Also quasi aus der Wahrscheinlichkeitsdichte von 10^-10 soll sowas wie X Mal pro Tag herauskommen.

Hier die Grafik:
[attach]44295[/attach]

Um noch die Praktische Situation genauer zu erklären: Es wurden etwa 1 Millionen sehr verrauschte Messdaten aufgenommen. Bei diesen wurde eine Inkrementstatistik mit Tau=2s erstellt, sprich es wurde an jedem Wert 2 Sekunden später geschaut, wie hoch der Wert dann ist, und die Differenz gebildet. Das ganze wurde als Histogramm dargestellt, normiert auf die Standardabweichung aller Inkremente (=sigma). Wenn man das plottet, sieht es aus wie eine gaußsche Normalverteilung. Ich hoffe man versteht was gemacht wurde.

Meine Ideen:
Mein Problem ist, dass ich ja eigentlich ein Intervall nehmen müsste, denn die Fläche gibt ja die Wahrscheinlichkeit an. Denn wenn ich einen einzelnen Wert ohne Breite in x-Richtung nehme, ist die Fläche Null. Und damit tritt das ganze nie auf. Und dann hänge ich fest, und weiß nicht weiter. Eine Idee war noch auf die absoluten Counts zurückzurechnen. Aber das half nicht wirklich weiter.
Huggy Auf diesen Beitrag antworten »
RE: Aus Wahrscheinlichkeitsdichtefunktion (PDF) die Häufigkeit des Auftretens eines Ereignisses bere
Für die Wahrscheinlichkeit, dass ein Inkrement in einem bestimmten Intervall liegt, brauchst du tatsächlich die Fläche unter der Dichtekurve in diesem Intervall, also das Integral der Dichtefuntion über dieses Intervall. Das Integral von bis der Dichtefunktion der Normalverteilung heißt Verteilungsfunktion der Normalverteilung. Es ist in vielen Rechnern implementiert, oft mit dem Vorsatz CDF (Cumulative Density Distribution). Für die Standardnormalverteilung gibt es auch Tabellen.
TobiAsche Auf diesen Beitrag antworten »
RE: Aus Wahrscheinlichkeitsdichtefunktion (PDF) die Häufigkeit des Auftretens eines Ereignisses bere
Danke für die Antwort! Hm, dann lag ich wohl nicht so ganz falsch.
Also müsste ich wohl Bins festlegen, wenn ich eine Wahrscheinlichkeit möchte. Das ist dann ja aber irgendwie willkürlich...

In der Vorlesung wurde als Beispiel geschrieben:
Prob(x_Tau > 6 sigma) = 10^-10 => 1/100 years
Prob(x_Tau > 6 sigma) = 10^-4 => 1/hour

allerdings auf einer anderen Folie:
Prob(x_Tau > 6 sigma) = 10^-10 => 1/3000 years
Prob(x_Tau > 6 sigma) = 10^-4 => 1/day

Ah, jetzt merk ich erst, dass da ja ein größer als 6 sigma steht. Also geht es um die Wahrscheinlichkeit, dass es außerhalb liegt. Dann muss ich nochmal überlegen, vor allem warum die Ergebnisse sich widersprechen.
Huggy Auf diesen Beitrag antworten »
RE: Aus Wahrscheinlichkeitsdichtefunktion (PDF) die Häufigkeit des Auftretens eines Ereignisses bere
Das ist sehr undurchsichtig aufgeschrieben und mir daher nicht ganz verständlich.

Die Wahrscheinlichkeit, dass ein Ereignis in dem Bereich größer auftriit, ist . Wenn in einem Zeitraum Ereignisse gemessen werden, sind in in diesem Zeitraum Ereignisse größer zu erwarten. Daraus kann man errechnen, in welchem Zeitraum im Mittel einmal ein soches Ereignis größer zu erwarten ist.
HAL 9000 Auf diesen Beitrag antworten »

Für positive gilt übrigens folgende Einschachtelung der Standardnormalverteilungsfunktion , die insbesondere für große außerhalb des tabellierten Bereichs von Interesse sein kann:



Z.B. falls gerade kein CAS zur Hand ist oder irgendwelche Grenzbetrachtungen durchzuführen sind. Augenzwinkern

Für ergibt das .
TobiAsche Auf diesen Beitrag antworten »
RE: Aus Wahrscheinlichkeitsdichtefunktion (PDF) die Häufigkeit des Auftretens eines Ereignisses bere
Hi,

also es wurde auf ein verrauschtes Signal eine sogenannte Inkrement Statistik angewendet. Hier ein Bild zur Erklärung:
[attach]44297[/attach]

In der Vorlesung kam dieser Plot:
[attach]44298[/attach]

Und es wurde folgendes angegeben:
Prob(x_Tau > 6 sigma) = 10^-10 => 1/3000 years
Prob(x_Tau > 6 sigma) = 10^-4 => 1/day

Auf einer anderen Folie, aus einer späteren Vorlesung, mit dem gleichen Plot steht aber:
Prob(x_Tau > 6 sigma) = 10^-10 => 1/100 years
Prob(x_Tau > 6 sigma) = 10^-4 => 1/hour

1. Welche Lösung ist richtig?
2. Wie kommt man überhaupt auf die Lösung?


Irgendwie müssen die Tau = 4s mit einberechnet werden, denn sonst bekommt man ja keine Zeiteinheit mit rein...

Hoffentlich ist das Problem jetzt verständlicher.
 
 
HAL 9000 Auf diesen Beitrag antworten »

Die geplotteten Daten (blaue Punkte in deinem Plot) unterliegen ganz offensichtlich nicht einer Normalverteilung, sondern wie es viel eher aussieht einer Laplace-Verteilung (auch zweiseitige Exponentialverteilung genannt). verwirrt

Und für derartige Zufallsgrößen gilt dann in der Tat .

D.h., du solltest mal ordentlich auseinanderklamüsern, was hier was ist. Da ist es z.B. wenig hilfreich, wenn du beides (Normalverteilung und Laplaceverteilung) mit dem selben Symbol belegst. unglücklich
TobiAsche Auf diesen Beitrag antworten »

Wir sollen die Verteilung die durch die Messwerte herauskommt mit einer Normalverteilung vergleichen. Der rote Plot ist die Normalverteilung, der blaue die Messwerte. Es handelt sich um eine Vorlesungsfolie.
Es soll im Prinzip bestimmt werden, wie hoch der Fehler ist, wenn man die Messdaten mit ner Normalverteilung vergleicht.

Im Prinzip sollte der exakte Hintergrund ja egal sein. Es geht darum, aus einem PDF-Plot die Auftrittshäufigkeit zu berechnen.
HAL 9000 Auf diesen Beitrag antworten »

Ich fasse mal zusammen, was ich durch Aufsammeln deiner diversen gestreuten Informationen vermute:

Aus deinen empirischen Daten bestimmst du eine Schätzung für Standardabweichung deiner Zufallsgröße "Inkrementwert" (für deren Erwartungswert nimmst du an).

Jetzt interessierst du dich dafür, wie oft das vergleichsweise seltene Ereignis "" auftaucht. Gemäß Wahrscheinlichkeit ist das bei Messungen durchschnittlich einmal der Fall. Da deine Messungen den Zeitabstand haben, entspricht dies dem Zeitraum .


Wie groß ist nun die Wahrscheinlichkeit im Nenner?

a) Modellannahme Normalverteilung: Siehe obige Rechnung von Huggy bzw. Abschätzung von mir, da ist .

b) Modellannahme Laplaceverteilung: Auch siehe oben .

Deine empirischen Daten sprechen ziemlich klar und deutlich eher für b). Aber man muss sich auch gar nicht auf parametrische Modelle verlassen, sondern kann die auch nonparametrisch aus der Stichprobe schätzen, sofern diese riesig genug ist:

c) Nonparametrische Schätzung , dabei ist die gesamte Stichprobengröße und die Anzahl der Stichprobenwerte mit . Aus dem Dichteplot allein lassen sich und aber nicht wirklich ablesen - ich gehe aber davon aus, dass dir noch die Originalstichprobe zur Verfügung steht.


P.S.: Die unterschiedlichen Zeitangaben nach dem => hier

Zitat:
Original von TobiAsche
In der Vorlesung wurde als Beispiel geschrieben:
Prob(x_Tau > 6 sigma) = 10^-10 => 1/100 years
Prob(x_Tau > 6 sigma) = 10^-4 => 1/hour

allerdings auf einer anderen Folie:
Prob(x_Tau > 6 sigma) = 10^-10 => 1/3000 years
Prob(x_Tau > 6 sigma) = 10^-4 => 1/day

können an sich nur an verschiedenen Messzeitpunktabständen liegen, s.o.
TobiAsche Auf diesen Beitrag antworten »

Vielen Dank für die ausführliche Antwort.
Also in den Vorlesungsfolien wurde explizit Tau=4s gefordert. Und es wurden aber zwei verschiedene Ergebnisse angegeben. Die Anzahl Stichproben sind aber nicht angegeben worden. Eine der beiden Angaben aus der Vorlesung muss falsch sein. Ich wollte erstmal herausfinden welche.

Meine Rechnung wäre nun folgende, ist hierbei die Zeit die verstreichen muss, damit das Ereignis einmal eintrifft:



bzw.



Damit wären beide nicht so wirklich richtig. Gerundet hätte ich jetzt 1/1000 Jahre, und 1/2 Tage gesagt. Oder habe ich mich verrechnet?


Noch so eine Idee:
Muss ich mein Ergebnis noch mit 2 multiplizieren, da ich ja einen positiven und einen negativen Ast habe, oder ist das quatsch? Dann käme immerhin der 1/Tag hin... Und im Prinzip auch die 1/3000 Jahre, wenn man hart aufrundet.
HAL 9000 Auf diesen Beitrag antworten »

Zitat:
Original von TobiAsche
Muss ich mein Ergebnis noch mit 2 multiplizieren, da ich ja einen positiven und einen negativen Ast habe, oder ist das quatsch?

In dem Fall ginge es dann nicht um , sondern um - deine Entscheidung.

Zu der restlichen Raterei nach dem richtigen oder wie oder was kann ich nichts mehr beitragen, vielleicht hast du ja auch nur falsch abgeschrieben. Allerdings wiederhole ich nochmal (diesmal zum letzten Mal), dass die Wahrscheinlichkeit bei der Normalverteilung etwa statt ist.
TobiAsche Auf diesen Beitrag antworten »

Okay, vielen vielen Dank! Na mit dem Faktor 2 passt es dann ja ungefähr.

Ich habe nichts falsch abgeschrieben, da es hochgeladene PowerPoint-Folien sind. Und da hatten die genommen, auch wenn das eher falsch ist. Das hatte ich auch schon festgestellt. Is halt ein schusseliger Professor... Ich möchte ja dessen Annahmen verifizieren, und bei käme ja was viel zu kleines heraus... Naja.

Vielen Dank für die Hilfe, ich denke dass so abgeschätzt wurde, und dass die Angaben aus der einen Folie einfach falsch sind.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »