Suche diskrete Verteilung

Neue Frage »

Mazze Auf diesen Beitrag antworten »
Suche diskrete Verteilung
Hallo alle miteinander,

ich suche eine diskrete Wahrscheinlichkeitsverteilung die folgendes leistet:

Ich habe eine Menge von Daten zu jedem Monat im Jahr (für knapp 50 Jahre). Einige Monatswerte treten gehäuft auf über die Jahre. Die sollen eine höhere Wahrscheinlichkeit haben als jene die weniger oft auftreten. Wichtig ist aber das man auch Werten die garnicht auftreten eine wahrscheinlichkeit zuweist. Nehmen wir an wir beobachten im Monat t über die 50 Jahre Werte, definiere



dabei wird Epsilon so gewählt das es äquidistante Werte liefert und jedes trifft. Nun hätte ich gerne eine sinnvolle Verteilung auf M wobei die typischen Werte (nahe am Mittelwert) eine höhere Wahrscheinlichkeit bekommen sollen als diejenigen die weniger (bis garnicht) auftreten. Eine einfache Gewichtung Häufigkeit/Gesammtanzahl funktioniert genau wegen den nicht aufgetretenen Werten nicht.

Eine erste Idee war eine Normalverteilung anzunehmen und Varianz und Erwartungswert aus den Daten zu schätzen. Danach hätte ich eine andere diskretisierung vorgenommen, nämlich





( die Daten sind so das sie sich um den Mittelwert häufen und immer weniger auftreten sofern sie weit weg sind)

Ich brauch das, da ich einen diskreten (!) Markovprozess habe und die Übergangswahrscheinlichkeiten von zu 1 Summieren müssen. Daher wäre entweder eine diskrete Verteilung sinnvoll oder eben die Intervaleinteilung.

vielleicht hat ja jemand eine Idee
viele grüße
AD Auf diesen Beitrag antworten »

Ich hab mir das jetzt zwei-, dreimal durchgelesen: Jedesmal, wenn ich denke "aha, das meint er", wird es im nächsten Satz durch neue Aspekte umgeworfen... Vielleicht erklärst du mal etwas deutlicher den Inhalt deiner Symbole , und worauf du diese diskrete Verteilung suchst.
Mazze Auf diesen Beitrag antworten »

(werte des Zeitpunkts t (z.Bsp Monat))

Sind die Werte die über die 50 Jahre beobachtet wurden (und nach größe geordnet wurden). n ist abhängig davon wieviel verschiedene Werte es gab. ist eine diskrete Zufallsvariable zum Zeitpunkt t die Werte in



(epsilon wie oben )

annimmt. Es gibt also t ZV'en (die vorerst unabhängig angenommen werden). Zu jedem Zeitpunkt t liegen mir die Daten vor. Nun suche ich eine Verteilung für die , mit den oben genannte vorgaben.
(d.h nahe am Mittelwert ist die Wahrscheinlichkeit größer als weiter Weg)

edit:

Meine Idee mit der Normalverteilung hat übrigens nichts mit M zu tun, allerdings war das auch nur eine Notlösung da ich eigentlich an den genauen Werten interessiert bin.

edit2:

Noch eine Bemerkung zu den hinzugefügt
AD Auf diesen Beitrag antworten »

Ok, du suchst also zu vorhandenem Zahlenmaterial ein möglichst passendes parametrisches Modell und erwartest Vorschläge von uns, die wir die Daten überhaupt nicht kennen? Als einzige Information "in der Mitte größere Wkt als weiter weg"? Das verlangt Hellseherei, deswegen mache ich auch keine konkreten Vorschläge.
Mazze Auf diesen Beitrag antworten »

Ich dachte dafür gäbe es eventuel etwas standardisiertes (also eine oft benutzte Verteilung). Die Daten varieren jeweils vom Ort und können gänzlich verschieden sein. Im Zweifelsfall kann man ja eine Normalverteilung annehmen und EW und VAR schätzen aber die Normalverteilung ist für kontinuierliche ZV (daher die Idee der Intervaleinteilung oben).

Es handelt sich um durchflussmengen (cf/s) von Flüssen die (vorerst) nur von der Jahreszeit abhängig betrachtet werden (daher die Monate). Das ganze wird benutzt um die Wasserverwendung von Stauseen zu optimieren. Die Frage ist wann man wieviel Wasser zur Stromerzeugung verwendet. Man würde erwarten das die Durchflussmengen kontinuierlich sind aber in diesem Fall brauche ich sie diskret, d.h ich Unterteile sie in diskrete Teilmengen. Und diesen weisst man nun eine Wahrscheinlichkeit zu. Dazu kommen natürlich Mengen die nicht aufgetreten sind, und die habe ich äquidistant zwischen dem minimal gemessenen Fluss und dem maximal gemessenen Fluss gesetzt. Diesen müssen natürlich auch wahrscheinlichkeiten zugeordnet werden. In diesen Einheiten (umgerechnet auf Volumen) habe ich dann auch den Wasserspeicher des KW aufgeteilt (das brauche ich halt wegen dem diskreten und endlichen Zustandsraum).

Mal als Beispiel:

Gemessen 68, 67, 62,63,64 cf/s, 44,45,43 cf/s 12,11 cf/s der Mittelwert wäre 43.1. Aufgeteilt würde das ganze in die Menge

{11,12,,...,68}

Als ich das so gerade aufschrieb frage ich mich ob die Forderung, nahe am Mittelwert die "hohen" Wahrscheinlichkeiten zu setzen sinnvoll ist? Es wäre wohl besser an den "Häufungspunkten" die wahrscheinlichkeiten zu erhöhen. Das kann man wohl nur an den Daten entscheiden.

Es ist natürlich klar das die durchfluss Mengen nicht nur abhängig vom Zeitpunkt sind sondern auch von den vorhergehenden Mengen, dies wird aber vorerst nicht berücksichtigt.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »