Verteilung bestimmen |
31.07.2008, 14:23 | mickey | Auf diesen Beitrag antworten » | ||||
Verteilung bestimmen ich habe folgende Frage: Ich habe eine sehr große Menge an Daten mit Werten und ich will ermitteln, wie die Werte verteilt sind. Wie würdet ihr dabei vorgehen? gibt es dafür einen bestimmten Algorithmus oder so?? was mir für die Verteilungen zur Verfügung steht: Verteilungsfunktion Dichtefunktion Funktion um gleichverteilte Zufallszahlen zu transformieren (damit sie einer gewünschten verteilungen genügen) Erwartungswert, Varianz, max. min, mittelwert Schätzung der Parameter für die verschiedenen Verteilungen mein Anstaz wäre jetzt: 1. Maximum, Minimum und Mittelwert berechnen 2. Mit den berechneten Werten und ihrer Lage können bereits einige Verteilungen ausgeschlossen werden 3. Mögliche weitere Ausschlussfaktoren: 1. Symmetrie 2. Negative Werte 3. Schiefe 4. Parameter für die jeweiligen Verteilungen, die noch in Frage kommen, schätzen 5. Verteilung wählen, welche die geringsten und wenigsten Abweichungen aufzeigt 6. Zufallszahlen genrieren und so transformieren, dass sie der ausgewählten Verteilung entsprechen 7. Ermittelte Verteilungen mit Q-Q Plot und P-P Plot prüfen glaubt ihr das geht so?? ich finde da fehlt irgendiwe noch was... würde mich echt über eure Meinungen freuen vielen Dank und lg mickey |
||||||
08.08.2008, 14:19 | mickey | Auf diesen Beitrag antworten » | ||||
RE: Verteilung bestimmen Hallo nochmal ich habe bereits meinen Ansatz auf eigene Faust nochmal überarbeitet... wäre wirklich nett, wenn hier jemand ne meinung dazu hat oder einen fertigen Algorithmus kennt... hier erstmal mein überarbeiteter Algorithmus: 1. Schiefe überprüfen [(rechtsschief, linksschief, bei Symmetrie v(x) = 0] a. Für spätere Fälle bei denen negative Werte möglich sind, auf negative Werte prüfen 2. EM-Algorithmus (Expectation-Maximization-Algorithmus) 3. Diejenige aus den verbleibenden Verteilungen wählen, welche die geringsten und wenigsten Abweichungen aufweist 4. Ermittelte Verteilungen mit Q-Q Plot und P-P Plot prüfen (der gegebenen Verteilung gegenüberstellen) wie gesagt jegliches feedback hilft mir weiter Vielen Dank und lg mickey |
||||||
19.08.2008, 10:09 | mickey | Auf diesen Beitrag antworten » | ||||
RE: Verteilung bestimmen scheint wohl nicht all zu leicht zu sein... naja, sonst wäre ich wohl schon selber drauf gekommen gibt es denn überhaupt nen algorithmus mit dem ich genau bestimmen kann, welche verteilung vorliegt?? crystal ball kann das ja, also muss es doch irgendjemand so nen algorithmus kennen... falls nicht genau klar ist, was ich da für nen algorithmud suche... dann bitte bescheid geben lg mickey |
||||||
19.08.2008, 12:47 | AD | Auf diesen Beitrag antworten » | ||||
Angesichts der durchaus wohldurchdachten Überlegungen in deinen vorherigen Beiträgen erstaunt mich die Naivität dieser Frage: Eine genaue Bestimmung der zugrunde liegenden Verteilung nur aus einer Stichprobe heraus ist natürlich unmöglich - das ist doch immer so in der Statistik. "Nichtparametrisch" ist die beste Verteilungsschätzung die empirische Verteilungsfunktion an sich, und "parametrisch" hast du ja die Vorgehensweisen selbst aufgelistet, hauptsächlich hier:
Die Frage nach der genauen Verteilung wirkt also auf mich wie die Suche nach dem Stein der Weisen, nach der Weltformel o.ä. |
||||||
19.08.2008, 13:19 | mickey | Auf diesen Beitrag antworten » | ||||
ok da hast du natürlich recht . also anders formuliert: wie ich mitlerweile recherchiert habe, ermittelt crystal ball gar nicht automatisiert verteilungen, sondern lässt dies den nutzer manuel selber machen (bzw. lässt den nutzer auswählen, welche verteilung wohl am sinnvollsten zu wählen ist...naja wie auch immer). es scheint also keinen algorithmus, methode oder verfahren zu geben mit dem man eine verteilung SCHÄTZEN kann -also die anzahl möglicher verteilungen so reduzieren kann, dass (sagen wir mal...) 3-5 verteilungen übrig bleiben, die in frage kommen (von 45 verteilungen, mit denen man beispielsweise in excel verteilte zufallszahlen generieren kann). meine idee wäre halt immernoch mit gezielten abfragen möglichst viele verteilungen auszuschließen, so dass ich eine relativ geringe anzahl erhalte. für die übrigen verteilungen die parameter schätze und die verteilungen mit plots und chi-quadrat-test überprüfe... bin ich damit eher aufen guten oder schlechten weg?? einziges wirkliches ausschlusskriterium ist bisher "schiefe" lg mickey |
||||||
21.08.2008, 16:03 | mickey | Auf diesen Beitrag antworten » | ||||
na gut, habe es geschafft Verteilungen so zu klassifizieren, dass maximal drei mögliche verteilungen übrig bleiben... ich habe "nur noch" eine klasse, in der noch zu viele verteilungen stehen: kontinuierliche rechtsschiefe verteilungen ich habe für die verteilungen die parameter geschätzt und jewelis schiefe und E(x) verglichen, aber ich erhalte leider keine aussagekräftigen ergebnisse was kennt ihr denn noch für kriterien mit denen ich diese klasse von verteilungen unterscheiden könnte?? vielen dank lg mickey |
||||||
Anzeige | ||||||
|
||||||
21.08.2008, 16:35 | AD | Auf diesen Beitrag antworten » | ||||
Die Klasse der "kontinuierlichen rechtsschiefen verteilungen" ist ebenso wie die Klasse aller Verteilungen nichtparametrisch, d.h., sie lässt sich nicht vollständig durch endlich viele reelle Parameter beschreiben. Eine Eingrenzung auf eine oder mehrere parametrische Klassen wäre also wünschenswert, wenn ich mir deine bisherigen Ansätze so anschaue. |
||||||
21.08.2008, 16:41 | mickey | Auf diesen Beitrag antworten » | ||||
hhmm... also ich versuche jetzt grade durch gezielte abfragen jeweils eine verteilung auszuschließen... z. B. min(xi) < 1 => keine paretoverteilung... naja, leider fehlen noch einige... also falls jemand ein bestimmtes kriterium kennt, dem eine spezielle rechtsschiefe kontinuierliche verteilung unbedingt genügen muss... sofort her damit mickey |
|
Verwandte Themen
Die Beliebtesten » |
|
Die Größten » |
|
Die Neuesten » |
|