Vereilungskurve zeichnen / Gaußverteilung

Neue Frage »

chris85 Auf diesen Beitrag antworten »
Vereilungskurve zeichnen / Gaußverteilung
Hi, ich hab da ein Problem beim zeichnen einer Verteilungskurve. Und zwar habe ich ein Histogramm auf dem Häufigkeit/Anzahl der Ereignisse abgebildet ist.Dazu dann noch die Standardabweichung,Mittelwert,Varianz,Anzahl der Messungen und Gesamtzahl der Ereignisse.

Wie kann man dann damit die Verteilungskurve,also Gaußkurve in das Histogramm einzeichnen?

Kann man vllt mit einer Formel einzelnen Punkte berechnen und dann dadurch eine Kurve zeichnen?
Oder wie macht man das?

LG Chris
Divergenz Auf diesen Beitrag antworten »
RE: Vereilungskurve zeichnen / Gaußverteilung
Hallo,

du weißt doch sicher, wie die Verteilungsfunktion einer Normalverteilung im allgemeinen aussieht?! Da kommen nur die Parameter (Mittelwert) und (Standardabweichung) drinnen vor. Also setz einfach deine Werte ein und fertig!
chris85 Auf diesen Beitrag antworten »

Ne ich glaube die kenne ich nicht. Kannst du diese mir schnell zeigen?
Wäre super.

LG Chris
chris85 Auf diesen Beitrag antworten »

Ich habe gerade die Formel gefunden. Meinst du diese vllt?

Falls ja was ist in dieser Formel x ? ist der Mittelwert oder?

LG Chris
Divergenz Auf diesen Beitrag antworten »

Sorry, hat ein Weilchen bei gedauert.
Sieht ein wenig komisch aus bei dir. Schau mal hier auf dem Link:
http://de.wikipedia.org/wiki/Normalverteilung

Hier findest du die Dichtefunktion (welche man explizit angeben kann). Die Verteilungsfunktion ist dann das Integral darüber, wie es auch da steht. Allerdings kann man dieses i.a. nicht auflösen, gib dir dazu also keine Mühe!
Und richtig, ist der Erwartungs- oder Mittelwert. ist einfach die Stelle, schließlich handelt es sich hierbei um Funktionen!
chris85 Auf diesen Beitrag antworten »

Ist es diese Formel hier?



Ich hab das jetzt mal getestet.

mein Mittelwert
meine Standardabweichung
und für x = 15 (Im Diagramm ist auf der x-Achse die Anzahl der Pulse aufgetragen und auf der y-Achse die Häufigkeit. 26 Pulse gibt es also 15 mal.)

So sieht es dann aus:



Das ist doch aber ein viel zu kleiner Wert.Da muss irgendwas falsch sein!
Was hab ich da falsch gemacht?

LG Chris
 
 
Divergenz Auf diesen Beitrag antworten »

Die Funktion, die du genommen hast, ist die Dichtefunktion. Um jetzt Wahscheinlichkeiten zu berechnen, müsstest du die Verteilungsfunktion nehmen. Es gilt:

Die Wahrscheinlichkeit an einer bestimten Stelle ist aber bei so einer stetigen Verteilung immer gleich 0. Interessant sind hier eher Intervalle! In deiner Stichprobe, wurden für sicher auch Ergenisse gewertet, die etwas kleiner oder größer waren. Wenn du also die Wkt. für das entsprechende Intervall bestimmen würdest, dann könnte sich vielleicht der Wert mit der relativen Häufigkeit aus der Stichprobe vergleichen lassen.
chris85 Auf diesen Beitrag antworten »

Also ich habe ein Histogramm mit Anzahl der Pulse auf der x-Achse und Häufigkeit auf der y-Achse. Dann habe ich die Daten noch zusätzlich in einer Tabelle. Ich soll jetzt praktisch in das Histogramm die zugehörige Kurve hineinmalen.
Wie kann ich das machen?
Ich weiß jetzt gar nicht mehr mit welcher Formel und wie das geht.
Könntest du mir das genau erklären? Ich im Moment auf der Stelle und komme einfach nicht weiter.

LG Chris
Divergenz Auf diesen Beitrag antworten »

Okay, ein Histogramm stellt die Wahrscheinlichkeiten einer diskreten Verteilung dar. Wenn du da eine Funktion drüberlegen sollst, sollst du also mit einer stetigen Zufallsgröße vergleichen, indem Fall also mit der Gaußverteilung. Falls deine Vergleichszufallsgröße auch diskret sein darf, ist hier vielleicht besser eine Binomialverteilung anzusetzen, dann besteht der Graph aber nur aus einzelnen Punkten, die man auch mittels Balken (wie im Histogramm) darstellen kann.

Bleiben wir aber bei der Gaußverteilung. Dann ist, was du suchst die Dichtefunktion, die die typische Glockenkurve ergibt. Damit nun deine Funktionswerte nicht soviel kleiner sind als deine Häufigkeiten, solltest du entweder im Histogramm relative Häufigkeiten verwenden, oder die Dichtefunktion mit der Anzahl aller Versuche (Summe aller abs. Häufigkeiten) multiplizieren. Denn das Integral über die Dichte ist immer auf 1 normiert! Wenn du außerdem die Balken in deinem Histogramm mit der Breite 1 zeichnest, dann sollten die Flächen des Histogramms etwa die Fläche unter der Glockenkurve darstellen (vorausgesetzt die Daten sind hinreichend gut, d. h. viele!).
chris85 Auf diesen Beitrag antworten »

Also das heißt dass das Ergebnis das ich in der Rechnung oben bekommen (0,003752) habe nicht falsch ist, sondern dass ich es noch mit der Summe aller abs. Häufigkeiten multiplizieren muss.
Was ist die Summe aller absoluten Häufigkeiten? Ist das die Anzahl aller aufgetretenen Ereignissen? Ich habe z.B. 400 Messungen und dabei 13625 Pulse gemessen.
Muss ich dann die beiden Werte multiplizieren?
Ich habe das jetzt einfach mal gemacht und bekomme für 0,003752*13625 = 51,121 heraus. Das erscheint mir allerdings viel zu groß, das würde auch nicht ins Histogramm passen.
Was ist denn dann die Summe aller absoluten Häufigkeiten?
AD Auf diesen Beitrag antworten »

Zitat:
Original von chris85
Ich habe z.B. 400 Messungen und dabei 13625 Pulse gemessen.
Muss ich dann die beiden Werte multiplizieren?

Vielleicht erklärst du mal, welcher Art deine Daten sind. Ich kann mir aus den Bruchstücken nur folgendes zusammenreimen:

Du hast 400 Messungen gemacht, bei jeder Messung ergibt sich irgendeine Pulszahl. Und aus diesen 400 Werte wurde ein Histogramm gebildet, mit irgendeiner Klasseneinteilung bzgl. der Pulszahlen. Ist das soweit erstmal korrekt?
chris85 Auf diesen Beitrag antworten »

Ich schreib jetzt einfach mal das Ergebnis der statistischen Auswertung hin:

Anzahl der Messungen: 400
Mittelwert: 34,062500
Varianz: 35,128594
Standardabweichung: 5,926938
Standardabweichung des Mittelwerts: 0,296347
Gesamtzahl der Ereignisse: 13625
Messzeitintervall: 2,00 s
Mittlere Zählrate: 17,031250 s
Standardabweichung der Zählrate: 2,963469 s

Das sind Werte aus einem Versuch zu radioaktiven Zerfall.
Dazu hab ich ein Histogramm bei dem die Anzahl der Pulse auf der x-Achse aufgetragen sind und auf der y-Achse, die Häufigkeit.
Und jetzt soll ich die Kurve dazu in das Histogramm eintragen.

Ich weiß allerdings nicht richtig wie man sowas macht.

LG Chris
AD Auf diesen Beitrag antworten »

Die Tatsache

400 * 34.0625 = 13625

legt nahe, dass meine Interpretation richtig war, schön (du hast mir ja leider nicht direkt geantwortet).


Was sollst du nun eigentlich noch einzeichnen: Die empirische Verteilungsfunktion - oder die Verteilungsfunktion einer Normalverteilung, die auf den geschätzten Parametern deiner Stichprobe beruhen?

Das sind zwei grundverschiedene Dinge, bei ersterem wäre eigentlich die Kenntnis der gesamten Stichprobe vonnöten, nicht nur die von dir angegebenen Charakteristiken sowie Histogramm, das reicht nicht.
chris85 Auf diesen Beitrag antworten »

Ich soll die Verteilungsfunktion der Gauß- bzw. Poissonverteilung einzeichnen.
Kannst du mir zeigen wie ich das machen muss?
Divergenz Auf diesen Beitrag antworten »

Hallo nochmal,

wie schon gesagt, wenn du eine vergleichbare die Verteilung charakterisierende Kurve in das Histaogramm zeichnen willst, dann solltest du die Dichtefunktion nehmen. Diese ist in deinem Fall mit den 400 Messwerten zu multiplizieren (400=Gesamtzahl aller Messungen, nicht aller Pulse).
Dass nun für dein Bsp. x=15 ein so kleiner Wert dabei herauskommt, ist ganz natürlich, denn bei der Normalverteilung liegt fast die ganze Masse im Intervall . x=15 liegt bei dir außerhalb dieses Intervalls, wahrscheinlich ist es dein erster Wert in Histogramm. Interessanter ist der Vergleich "im Zentrum der Verteilung" also nahe des Mittelwertes. Dort erzielst du bestimmt eine höhere Übereinstimmung.
Probier es einfach mal! Zeichne dein Histogramm und in dasselbe Koordinatensystem die Dichtfunktion, die du oben schon aufgeschrieben hast, multipliziert mit 400.
Es muss ja auch nicht sein, dass es eine gute Übereinstimmung gibt, vielleicht ist die Gaußverteilung hier ungeeignet! Vielleicht ist die Poissonverteilung besser, es wird ja einen Sinn haben, dass ihr mit beiden Verteilungen vergleichen sollt!
chris85 Auf diesen Beitrag antworten »

Also berechnet hab ich das also richtig dass ich für x die Häufigkeit (y-Achse) der Pulse genommen habe und nicht die Anzahl der Pulse(x-Achse)?
Das mein x für die Anzahl der Pulse: 26 und die Häufgikeit dieser Pulse: 15 liegt eigentlich schon in diesem mittleren Bereich drin, deswegen hat mich das jetzt verwundert dass das so klein ist.
Dieser kleine Wert den ich oben erhalten habe muss ich nun also mit 400 (Anzahl der Messungen) multipliezieren? oder wie muss ich das jetzt verstehen?
Ich will ja praktisch diese Kurve in das schon bestehende Histogramm einzeichnen, und da muss ich mich ja irgendwie schon an den Maßstab annähern oder?

Lg Chris
AD Auf diesen Beitrag antworten »

Du kannst nicht Histogrammkurve und Verteilungsfunktion im selben Maßstab zeichen - das ist so, als wolltest du in eine Geschwindigkeits-Zeit-Diagramm (x-Achse: Zeit, y-Achse: Geschwindigkeit) auch noch den Weg in das Diagramm eintragen - was wegen der unterschiedlichen physikalischen Einheiten für Weg und Geschwindigkeit nur so klappt, dass du für die Weg-Zeit-Kurve die y-Achse anders interpretierst, mit neuer Einheit und i.a. auch neuer Werte-Skale.

Hier verhält es sich völlig analog: Die Histogrammwerte sind absolute Pulszahlen, während die Verteilungsfunktionswerte ja relative Anteilswerte der Stichprobe angeben, also nur Werte zwischen 0 und 1.

Es gibt keine Vorschriften für die Skalenwahl zueinander, außer "optische" Gründe.
Divergenz Auf diesen Beitrag antworten »

Wenn ich das richtig verstanden habe, ist deine Zufallsgröße die Anzahl der Pulse innerhalb einer festen Zeitspanne und wird auf der x-Achse abgetragen. Diese Werte solltest du auch als x-Variable in der Funktion verwenden. Die Häufigkeit, wie oft x Pulse gemessen werden, hängt doch dann(nach dem Gesetz der großen Zahlen) bei hinreichend vielen Messungen (hoffentlich sind 400 genug) stark mit der zugehörigen Wahrscheinlichkeit zusammen. Das ist dann das, was bei dir scheinbar auf der y-Achse abgetragen ist (und das ist auch gut so).
Demnach, so habe ich das jedenfalls verstanden, sind x=15 Pulse bei dir y=26 mal gemessen wurden, und die 15 liegt nicht in dem Intervall um den Mittelwert, wo man vielleicht eine gute Annäherung erwarten könnte. Las dich außerdem nicht täuschen, schließlich vergleichst du mit einer stetigen Verteilung, die also auch Bereiche berücksichtigt, die in deiner diskreten Messung gar nicht auftauchen können und auch physikalisch keinen Sinn ergeben würden. Deshalb liegt die Kurve der Normalverteilung sicher überall etwas unter deinen Messungen!
In deiner Rechnung für x=15 ist dein Ergebnis übrigens um eine Kommastelle verschoben. Wenn ich richtig gerechnet habe ist f(15)~0,00038.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »