Verteilung bestimmen

Neue Frage »

mickey Auf diesen Beitrag antworten »
Verteilung bestimmen
Hi Leute,

ich habe folgende Frage:

Ich habe eine sehr große Menge an Daten mit Werten und ich will ermitteln, wie die Werte verteilt sind.
Wie würdet ihr dabei vorgehen?
gibt es dafür einen bestimmten Algorithmus oder so??

was mir für die Verteilungen zur Verfügung steht:

Verteilungsfunktion
Dichtefunktion
Funktion um gleichverteilte Zufallszahlen zu transformieren (damit sie einer gewünschten verteilungen genügen)
Erwartungswert, Varianz, max. min, mittelwert
Schätzung der Parameter für die verschiedenen Verteilungen

mein Anstaz wäre jetzt:

1. Maximum, Minimum und Mittelwert berechnen
2. Mit den berechneten Werten und ihrer Lage können bereits einige Verteilungen ausgeschlossen werden
3. Mögliche weitere Ausschlussfaktoren:
1. Symmetrie
2. Negative Werte
3. Schiefe
4. Parameter für die jeweiligen Verteilungen, die noch in Frage kommen, schätzen
5. Verteilung wählen, welche die geringsten und wenigsten Abweichungen aufzeigt
6. Zufallszahlen genrieren und so transformieren, dass sie der ausgewählten Verteilung entsprechen
7. Ermittelte Verteilungen mit Q-Q Plot und P-P Plot prüfen


glaubt ihr das geht so??
ich finde da fehlt irgendiwe noch was...
würde mich echt über eure Meinungen freuen

vielen Dank und lg
mickey
mickey Auf diesen Beitrag antworten »
RE: Verteilung bestimmen
Hallo nochmal smile


ich habe bereits meinen Ansatz auf eigene Faust nochmal überarbeitet...
wäre wirklich nett, wenn hier jemand ne meinung dazu hat oder einen fertigen Algorithmus kennt...

hier erstmal mein überarbeiteter Algorithmus:

1. Schiefe überprüfen [(rechtsschief, linksschief, bei Symmetrie v(x) = 0]
a. Für spätere Fälle bei denen negative Werte möglich sind, auf negative Werte
prüfen
2. EM-Algorithmus (Expectation-Maximization-Algorithmus)
3. Diejenige aus den verbleibenden Verteilungen wählen, welche die geringsten und
wenigsten Abweichungen aufweist
4. Ermittelte Verteilungen mit Q-Q Plot und P-P Plot prüfen (der gegebenen
Verteilung gegenüberstellen)

wie gesagt jegliches feedback hilft mir weiter

Vielen Dank und lg
mickey
mickey Auf diesen Beitrag antworten »
RE: Verteilung bestimmen
scheint wohl nicht all zu leicht zu sein... naja, sonst wäre ich wohl schon selber drauf gekommen Augenzwinkern

gibt es denn überhaupt nen algorithmus mit dem ich genau bestimmen kann, welche verteilung vorliegt??

crystal ball kann das ja, also muss es doch irgendjemand so nen algorithmus kennen...


falls nicht genau klar ist, was ich da für nen algorithmud suche... dann bitte bescheid geben smile


lg mickey Tanzen
AD Auf diesen Beitrag antworten »

Zitat:
Original von mickey
gibt es denn überhaupt nen algorithmus mit dem ich genau bestimmen kann, welche verteilung vorliegt??

Angesichts der durchaus wohldurchdachten Überlegungen in deinen vorherigen Beiträgen erstaunt mich die Naivität dieser Frage:

Eine genaue Bestimmung der zugrunde liegenden Verteilung nur aus einer Stichprobe heraus ist natürlich unmöglich - das ist doch immer so in der Statistik. "Nichtparametrisch" ist die beste Verteilungsschätzung die empirische Verteilungsfunktion an sich, und "parametrisch" hast du ja die Vorgehensweisen selbst aufgelistet, hauptsächlich hier:

Zitat:
Original von mickey
4. Parameter für die jeweiligen Verteilungen, die noch in Frage kommen, schätzen
5. Verteilung wählen, welche die geringsten und wenigsten Abweichungen aufzeigt

Die Frage nach der genauen Verteilung wirkt also auf mich wie die Suche nach dem Stein der Weisen, nach der Weltformel o.ä. Augenzwinkern
mickey Auf diesen Beitrag antworten »

ok da hast du natürlich recht Freude . also anders formuliert:

wie ich mitlerweile recherchiert habe, ermittelt crystal ball gar nicht automatisiert verteilungen, sondern lässt dies den nutzer manuel selber machen (bzw. lässt den nutzer auswählen, welche verteilung wohl am sinnvollsten zu wählen ist...naja wie auch immer). Lehrer

es scheint also keinen algorithmus, methode oder verfahren zu geben mit dem man eine verteilung SCHÄTZEN kann -also die anzahl möglicher verteilungen so reduzieren kann, dass (sagen wir mal...) 3-5 verteilungen übrig bleiben, die in frage kommen (von 45 verteilungen, mit denen man beispielsweise in excel verteilte zufallszahlen generieren kann). traurig

meine idee wäre halt immernoch mit gezielten abfragen möglichst viele verteilungen auszuschließen, so dass ich eine relativ geringe anzahl erhalte. für die übrigen verteilungen die parameter schätze und die verteilungen mit plots und chi-quadrat-test überprüfe... verwirrt

bin ich damit eher aufen guten oder schlechten weg?? Hammer

einziges wirkliches ausschlusskriterium ist bisher "schiefe" unglücklich

lg mickey
mickey Auf diesen Beitrag antworten »

na gut, habe es geschafft Verteilungen so zu klassifizieren, dass maximal drei mögliche verteilungen übrig bleiben... Freude

ich habe "nur noch" eine klasse, in der noch zu viele verteilungen stehen:
kontinuierliche rechtsschiefe verteilungen böse

ich habe für die verteilungen die parameter geschätzt und jewelis schiefe und E(x) verglichen, aber ich erhalte leider keine aussagekräftigen ergebnisse verwirrt

was kennt ihr denn noch für kriterien mit denen ich diese klasse von verteilungen unterscheiden könnte??

vielen dank
lg mickey
 
 
AD Auf diesen Beitrag antworten »

Die Klasse der "kontinuierlichen rechtsschiefen verteilungen" ist ebenso wie die Klasse aller Verteilungen nichtparametrisch, d.h., sie lässt sich nicht vollständig durch endlich viele reelle Parameter beschreiben. Eine Eingrenzung auf eine oder mehrere parametrische Klassen wäre also wünschenswert, wenn ich mir deine bisherigen Ansätze so anschaue.
mickey Auf diesen Beitrag antworten »

hhmm... also ich versuche jetzt grade durch gezielte abfragen jeweils eine verteilung auszuschließen... z. B. min(xi) < 1 => keine paretoverteilung...

naja, leider fehlen noch einige... also falls jemand ein bestimmtes kriterium kennt, dem eine spezielle rechtsschiefe kontinuierliche verteilung unbedingt genügen muss... sofort her damit Wink

Tanzen mickey
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »