Diskretisieren einer Zufallsvariablen |
24.10.2006, 13:40 | Yoda | Auf diesen Beitrag antworten » | ||
Diskretisieren einer Zufallsvariablen In der Literatur findet man zu Diskretisierungsmethoden wenig. Daher meine Bitte, mir die Diskretisierung einer Zufallsvariablen zu erläutern. Meine Problematik besteht aus einer stetigen Zufallsvariablen X, die auf der reellen Achse Zahlen (Daten) verteilt. Letztenendes möchte ich deren Verteilung bestimmen. Ich hoffe, ich gehe richtig in der Annahme, dass bei Schätzungen von Verteilungen die Wahrscheinlichkeitsdichte nur gemittelt über endliche Intervalle der Zufallsvariablen geschätzt werden können. Somit hat man die Notwendigkeit der Diskretisierung. Reicht es nun bzgl. des Diskretisierens der Zufallsvariablen ihren Wertebereich in n-Teile zu gliedern? D.h. in n gleich große Intervalle, so dass die diskrete Zufallsvariable ist, die mit Wahrscheinlichkeit den Wert annimmt. Ist die Diskretisierung damit abgeschlossen? Oder muß man sich zu jeder Diskretisierung auch Gedanken über ihre Konvergenz der Unterteilung machen (also über Verfeinerungen usw.) ? Gruß und danke im voraus, Yoda P.S: Tut mir leid, ich komme mit dem Formeleditor nicht klar. PPS kurellajunior: geformelt |
||||
24.10.2006, 17:07 | AD | Auf diesen Beitrag antworten » | ||
RE: Diskretisieren einer Zufallsvariablen
Reicht wofür - das ist die Frage. Jede Schätzung der Verteilung kann natürlich nur so gut sein, wie die Feinheit (oder eben Grobheit) der Intervallunterteilung angelegt ist. D.h., zwei stetige Zufallsgrößen , deren Verteilung zwar verschieden ist, für die aber für alle Intervalle einer gewählten Intervalleinteilung gilt, wird man durch diese Intervalleinteilung niemals unterscheiden können. Aus statistischer Sicht sollte die Intervalleinteilung nicht so sehr in Intervalle gleicher Länge münden, als vielmehr in Intervalle (möglichst) gleicher Wahrscheinlichkeit! Also bei Intervallen diese möglichst so einteilen, dass für gilt. Aus Genauigkeitsgründen der zu bestimmenden Verteilung sollte man die Intervallzahl also möglichst hoch wählen. Andererseits macht das wenig Sinn, wenn man nur wenige Daten zur Verfügung hat, und dann etwa viele Klassen "leer" bleiben. Aus diesen beiden sich gegensätzlich verhaltenden Erwägungen liegt eine vernünftige Intervallanzahl (z.B. für Chi-Quadrat-Anpassungstest) irgendwo in der Größenordnung , wobei die Stichprobenanzahl ist. |
||||
24.10.2006, 23:58 | Marvin42 | Auf diesen Beitrag antworten » | ||
die Abb. einer ZV ist doch also dann doch eher den Definitionsbereich einteilen als den Wertebereich. Ich schreib schon wieder Blödsinn. einfach ignorieren. |
|