Normalverteiltes Histogramm erstellen wenn Sigma und Mittelwert bekannt

Neue Frage »

Chris_Ratlos Auf diesen Beitrag antworten »
Normalverteiltes Histogramm erstellen wenn Sigma und Mittelwert bekannt
Meine Frage:
Von einer Normalverteilung ist mir die Standardabweichung Sigma sowie der Mittelwert bekannt.

Nun möchte ich ein Histogramm approximieren, welches mir den selben Mittelwert sowie Standardabweichung Sigma ausgibt. Das Histogramm soll 10 Balken besitzen.

Meine Ideen:
Mein erster Gedanke war es, die Fläche unter der Normalverteilungsfunktion in zehn Bereiche einzuteilen. Z.B. von 0 bis 10%,10 bis 20% ...90 bis 100%. Darauf folgend wollte ich mit Hilfe der Normalverteilungsfunktion mit Sigma und Mittelwert die Wahrscheinlichkeit unter der Kurve in den jeweiligen Bereichen berechnen und die erhaltenen Prozentzahlen als Verteilungsschlüssel nutzen.

Die Fläche unter der Verteilung und somit das Integral der Funktion von 0 bis 1 ergibt die Gesamtsumme meine Werte, richtig?

Das Ganze noch mal Zusammengefasst:
1. Verteilung bestimmen mit jeweiligen Sigma und Mittelwert
2. Bereiche Festlegen
3. Theoretische Gesamtsumme ermitteln durch bestimmtes Integral?
4. Prozent der gesetzten Bereiche berechnen (Funktionswert x2-x1)
5. Absoluten Wert für den gesetzten Bereich festlegen durch Bereichsprozent*Gesamtsumme.

Es hängt jedoch an der Ermittlung der Prozente pro gewählten Bereich.
Ich hab einen Denkfehler und komme nicht drauf was ich falsch mache. Hmm, ggf ist meine Annahme des Mittelwerts auch falsch und klappt nur bei Gleichverteilung?

Kann mir jemand einen Tipp geben?
Kasen75 Auf diesen Beitrag antworten »

Hallo,

die jeweiligen z-Werte der Standardnormalverteilung sind:

10%-ige-Quantile

10 ****** -1,2815515655
20 ****** -0,8416212336
30****** -0,5244005127
40 ****** -0,2533471031
50 ****** 0
60 ****** 0,2533471031
70 ****** 0,5244005127
80 ****** 0,8416212336
90 ****** 1,2815515655

Die transformierte Variable ist dann .

Um nun die x-Werte für z.B. den Bereich 30%-40% zu berechnen, würde ich wie folgt vorgehen.





Diese Gleichungen müssen dann jeweils gelöst werden.
Zwischen und liegen dann die 10% der x-werte, die größer sind als die kleinsten 30% der x-Werte und kleiner sind als größten 60% der x-Werte.

Grüße.
 
 
Chris_Ratlos Auf diesen Beitrag antworten »

Vielen Dank Kasen, das Hilft mir weiter!

Wenn ich die mit und sowie deinen Quantils-Daten berechnet habe, dann erhalte ich folgende Werte:











Das heißt doch jetzt, dass 10% der Werte zwischen und x<1.186, x=1.186 bis x<2.083 weitere 10% ....und 10% x>6.414 bis der Werte liegen.

Ich hatte gedacht, dass ich nun für die gefundenen x-Werte in den jeweiligen Bereich einfach das arithmetische Mittel [zB. für Quantil 20%-30%-> (2.730-2.083)/2 ] bilden und als meine Balkenhöhe im Histogramm annehmen kann. Der Mittelwert (=3.8) würde ja auch stimmen, nur tut es die Standardabweichung nicht. Dies hängt auch stark damit zusammen, dass ich die Grenzbereiche zu ja nicht an x-Werten festmachen kann. D.h. für mich nun, dass ich die Grenzbereiche irgendwie anders Berücksichtigen muss.
Wenn ich nun die 10% Quantile nochmals verkleinere, z.B. in 0.1% und führe die z-Transformation erneut durch, dann die x-Mittelwerte zwischen 0.1% und 9.9%, 10% und 19.9% etc. bilde und dann den Mittelwert aus den 10 gebildeten Mittelwerten bilde, so erhalte ich und womit ich schon relativ nah an meinen gesuchten Werten bin.

Wie kann ich denn die Grenzbereiche vernünftig approximieren, damit ich auf mein und komme?
Chris_Ratlos Auf diesen Beitrag antworten »

Edit: Würde mir der Schwerpunkt der Teilflächen weiter helfen? Ich fände es eigentlich sinnig hiermit zu arbeiten:
Chris_Ratlos Auf diesen Beitrag antworten »

ok, habs ausprobiert und es hilft mir weiter. Problem ist nun jedoch, dass das Ergebnis dann zwar eine gute Approximation für meinen Standardabweichung und Erwartungs- bzw. Mittelwert ist, jedoch nicht mehr Normalverteilt :/

Wie kann ich die Werte denn Normalverteilt generieren?

Sorry für die ständigen Folgeposts, ich leg gleich einen account an, dann kann ich editieren.
Kasen75 Auf diesen Beitrag antworten »

Deine erste Idee find ich gut. Ich denke hier kannst du nur approximieren. Je kleiner du die Unterteilung der Intervalle machst, umso näher wirst du dich der Standardabweichung in den Teilintervallen näher.
Wobei ich sagen würde, dass die Summe der Varianzen der Intervalle nicht die Gesamtvarianz ergeben sollten.

Die Gesamtvarianz setzt sich ja zusammen aus der Varianz innerhalb der Intervalle und der Varianz zwischen den Intervallen.



Wobei ich mich gerade frage, woher du den Mittelwert des 10%-Quantils hast. ist ja nur die obere Grenze.

Als Ausweg könnt man hier z.B. eine Binomialverteilung verwenden, die fast die gleiche Verteilung aufweist.


Bei deiner zweiten Idee fehlt mir irgendwie der Zugang.
Chris_Ratlos Auf diesen Beitrag antworten »

Hi Kasen,

danke nochmals. Ich habe die Ext. und Interne Varianz berechnet und daraus die interne und externe SD (falls es die überhaupt gibt). Wenn ich die Varianz bzw. SD ohne Gruppierung berechne ergibt sich ein Unterschied von ca. 1.6% zu der SD mit Gruppierung. D.h. die SD ohne Gruppierung ist größer und die interne SD beträgt 1.6% der SD ohne Gruppierung.

Um den Mittelwert der gesetzten Quantile zu ermitteln habe ich die Formel angeführt. Damit kann ich berechnen, wo genau die x-Schwerpunktskoordinate einer Fläche und somit der Mittelwert eines Quantils liegt.
Als Integrationsgrenzen kann man dann ja einfach die berechneten Grenzwerte der Quantile nehmen. f(x) ist die Dichtefunktion der Normalverteilung.
Mit Excel lässt sich leider nur sehr blöd integrieren, daher bleibe ich bei n=10000 bzw p=1/10000 von 0.01 bis 99.99% und jede meiner Gruppierungen basiert auf ca. 833 Einzelwerten (habe die Gruppen auf n=12 erhöht). Dei Abweichung zum integrativen Ergebnis ist gering.

Ich habe mich gestern auch vertan. Meine berechneten x-Werte (mit und ohne Gruppierung) sind sehr wohl normalverteilt. Somit kann ich diese verwenden mit der Einschräkung, dass die SD 1.6% vom eigentlichen SD abweicht. Ich denke aber diese Toleranz ist ok.

Vielen Dank für deine Hilfe!=)
Chris
Chris_Ratlos Auf diesen Beitrag antworten »

Hi, noch eine kurze Frage:

Mir kam der Gedanke, ob es irgendwie möglich ist diese 1.6% Abweichung durch die interne SD zu kompensieren?
Der Wert 1.6% schein konstant zu sein da er mit verschiedenen Mittelwerten und Ausgangsstandardabweichungen auftritt und somit vermutlich nur von der Anzahl der Gruppen abhängig ist.
Gibt es einen Weg meine 12 generierten Werte so zu adjustieren, damit die 1.6% bereits in meiner externen SD beinhaltet sind ohne das sich der Mittelwert ändert?

Der Ansatz müsste ja mit sein..

oder muss ich da mit einer DGL arbeiten?

Ist nur so ein Gedanke der mir gerade kam. Ich habe diesen auch noch nicht in tiefe durchdacht. Falls da jemand von euch ein Geistesblitz zu hat oder eine solche Anpassung bereits selbst durchgeführt würde ich mich über eine Idee freuen!=)
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »