Summe zweier Normalverteilugnen

Neue Frage »

Dweezil Auf diesen Beitrag antworten »
Summe zweier Normalverteilugnen
Meine Frage:
Hallo,

ich habe eine Frage zu Verteilungsfunktionen. Ich habe dazu schon einige postings in den Weiten des nets gefunden, manche beantworten sogar genau das was ich fragte aber leider für mich als Nichtmathematiker nicht nachvollziehbar genug.

Also um es einfach zu halten ein praktisches Beispiel:

Ich messe eine Größe sehr oft, und komme darauf dass diese Normalverteilt um einen Mittelwert m mit St.abw. s ist, sagen wir m=100 und s=5 (nennen wir die Zufallsvar. X1). Dann messe ich die selbe Größe nocheinmal mit einem anderen Verfahren (ob das jetzt real sinvoll ist oder nicht ist egal, es geht mir nur um die Mathematik), und hier ergibt sich m=110 und s=10 (X2).

Wie lauten jetzt der tatsächliche Mittewert m und St.abw. s dieser Größe, wenn ich die Informationen BEIDER Messungen verwende? Lässt sich auch eine Formel für die neue Verteilung angeben? Einfach X1+X2 geht ja wohl nicht, da dann die Summenfunktion ja gegen 2 gehen würde.

Lässt sich für beliebige Verteilungen (z.B. Gleichverteilung 1-5 + Gleichverteilung 100-110) eine Verteilungsfunktion angeben?

Vielen Dank für etwaige Hilfe, und sorry wenn diese Frage schon mal gestellt worden ist!

Martin

Meine Ideen:
Ansätze Summe X1 und X2 siehe Fragestellung oben.
HAL 9000 Auf diesen Beitrag antworten »

Zitat:
Original von Dweezil
Lässt sich für beliebige Verteilungen (z.B. Gleichverteilung 1-5 + Gleichverteilung 100-110) eine Verteilungsfunktion angeben?

Wenn die beiden Ausgangsgrößen unabhängig sind: Ja, aber es kann je nach Ausgangsverteilungen ganz schön kompliziert werden, evtl. mit nicht geschlossen darstellbaren Integralen. Die Verteilungsfunktion der Summe ergibt sich nämlich als Faltung der beiden Verteilungsfunktionen der Summanden.

Bei der Summe zweier unabhängiger Normalverteilungen ist die Sache aber einfach: Für und ist einfach . Aber Achtung, beliebter Anfängerfehler: Es werden die Varianzen addiert, nicht die Standardabweichungen, d.h. es ist für die Summe .
Dweezil Auf diesen Beitrag antworten »

Danke für die schnelle Antwort! Wenn ich also wie in meinem Beispiel die erste Nomalverteilung mit m1=100, s1=5 mit der zweiten mit m2=110 und s2=10 kombiniere, sollte für die neue Verteilung ein m=105 und s=11.18 herauskommen.

Um das zu überprüfen habe ich mit Maple 2 Samples (je 1000 Werte) mit den beschriebenen Normalverteilungen erstellt, diese dann kombiniert (also wie das z.B. bei einer Messung wie im ursprünglichen Post beschrieben praktisch stattfinden würde), und für das neue Set von jetzt insgesamt 2000 Werten St.abw. und MW berechnet. MW wie erwartet: sehr nahe 105. Aber die Standardabw. stimmt nicht überein, insbesondere wenn man andere (stärker differierende) Werte wählt. Was habe ich da falsch vestanden?

Nochmals zusammenfassend:

Sample 1:
1000 Werte normalverteilt
Mittelwert m1=100
St.abw. s1=5

Sample 2:
1000 Werte normalverteilt
Mittelwert m2=110
St.abw. s2=10

Vereinigung Sample 1 und 2:
2000 Werte
m=105.02
s=9.299


P.S. Sorry wenn ich da etwas primitive Fragen stelle und die dann mit einfachen Samples nachzurechnen versuche. Aber auf dem Gebiet der Stochastik kenne ich mich nicht wirklich aus, und da dies auch recht anspruchsvoll ist ist es nicht so einfach sich da auf die Schnelle einzuarbeiten! Augenzwinkern
Dweezil Auf diesen Beitrag antworten »

OK hab mir deine Antwort nochmals genauer durchgelesen; natürlich hab ichs beim ersten mal falsch Verstanden und gleich eine Antwort gepostet, sorry!

Also wie schon geschrieben gehts mir nicht um die Summe zweier Zufallsvariablen. Um ehrlich zu sein kann ich gar nicht genau sagen welche Operation da jetzt auf die Zufallsvariable angewendet wird. Für das arithmetische Mittel (1/n)*Summe(X_n) habe ich Beziehungen gefunden, die jedoch nur unter der Vorraussetzung gleicher Normalverteilungen der einzelnen Zufallsvariablen gültig sind.
HAL 9000 Auf diesen Beitrag antworten »

Na ein dazu kommender Faktor, bzw. eine allgemeine lineare Transformation ist doch keine Hürde:

Sind reelle Zahlen mit , so folgt aus unmittelbar , sowas sollte eigentlich alles im Rahmen der Behandlung der Normalverteilung durchgesprochen werden, von wegen "Standardisierung" u.ä.

Für dein Beispiel und bedeutet dies zunächst sowie dann für mit schließlich , d.h. normalverteilt mit Mittelwert und Standardabweichung .


Mit den beiden Regeln (Summe sowie lineare Transformation) lässt sich für jede Linearkombination plus evtl. Verschiebung



mit unabhängigen normalverteilten Komponenten , die nicht notwendig dieselben Normalverteilungsparameter haben, wiederum feststellen, dass auch normalverteilt ist, und es lassen sich auch die Parameter dieser Normalverteilung bestimmen.
Namensuchender Auf diesen Beitrag antworten »
RE: Summe zweier Normalverteilugnen
Zitat:
Original von Dweezil
Meine Frage:
Hallo,

ich habe eine Frage zu Verteilungsfunktionen. Ich habe dazu schon einige postings in den Weiten des nets gefunden, manche beantworten sogar genau das was ich fragte aber leider für mich als Nichtmathematiker nicht nachvollziehbar genug.

Also um es einfach zu halten ein praktisches Beispiel:

Ich messe eine Größe sehr oft, und komme darauf dass diese Normalverteilt um einen Mittelwert m mit St.abw. s ist, sagen wir m=100 und s=5 (nennen wir die Zufallsvar. X1). Dann messe ich die selbe Größe nocheinmal mit einem anderen Verfahren (ob das jetzt real sinvoll ist oder nicht ist egal, es geht mir nur um die Mathematik), und hier ergibt sich m=110 und s=10 (X2).

Wie lauten jetzt der tatsächliche Mittewert m und St.abw. s dieser Größe, wenn ich die Informationen BEIDER Messungen verwende? Lässt sich auch eine Formel für die neue Verteilung angeben? Einfach X1+X2 geht ja wohl nicht, da dann die Summenfunktion ja gegen 2 gehen würde.

Lässt sich für beliebige Verteilungen (z.B. Gleichverteilung 1-5 + Gleichverteilung 100-110) eine Verteilungsfunktion angeben?

Ich vermute, dass Dich als Nicht-Mathematiker weniger die Summe der beiden Zufallsvariablen interessiert, als vielmehr der gewichtete Mittelwert der Resultate der beiden Messmethoden? Sprich: Du willst vermutlich wissen, was Du nun als Mittelwert Deiner kombinierten Messung annehmen sollst und wie stark der Mittelewert streut.
Als Einstieg dazu taugt Wiki: http://de.wikipedia.org/wiki/Arithmetisc...etisches_Mittel
 
 
Dweezil Auf diesen Beitrag antworten »
RE: Summe zweier Normalverteilugnen
Hallo, danke für die Anwort. Ja du hast recht es geht mir nicht um eine Summe von Zufallsvariablen, sondern um die Aussagen die man treffen kann wenn man beide (oder mehrere) Zufallsvariablen bezüglich einer Größe gleichzeitig berücksichtigt.

Dazu habe ich auch schon folgendes, auch auf wikipedia, gefunden: das was ich behandeln möchte ist offenbar eine Mischverteilung: http://de.wikipedia.org/wiki/Mischverteilung, im speziellen eine Kombination aus 2 Normalverteilungen: http://de.wikipedia.org/wiki/Kontaminierte_Normalverteilung.

Die Verteilung des Beispiels das ich vorhin gepostet habe lässt sich also offenbar als kontaminierte Normalverteilung beschreiben.

Auf der anderen Seite gibt es jetzt aber auch die Methode der gewichteten arithmetischen Mittel, in welchem eine Gewichtung nach 1/s^2 vorgenommen wird.

Wenn ich jetzt bezüglich einer Größe 2 verschiedene Verteilungen habe, ist mir noch nicht klar wann ich eine Mischverteilung annehmen soll und wann ich aus den 2 (in meinem Bsp. Normal-) Verteilungen durch Gewichtung eine einzige neue Normalverteilung berechnen kann.
Namensuchender Auf diesen Beitrag antworten »
RE: Summe zweier Normalverteilugnen
Zitat:
Original von Dweezil
es geht mir nicht um eine Summe von Zufallsvariablen, sondern um die Aussagen die man treffen kann

Für den Fall brauchst Du ein statistisches Modell, für das es...
Zitat:

Dazu habe ich auch schon folgendes, auch auf wikipedia, gefunden: das was ich behandeln möchte ist offenbar eine Mischverteilung: http://de.wikipedia.org/wiki/Mischverteilung, im speziellen eine Kombination aus 2 Normalverteilungen: http://de.wikipedia.org/wiki/Kontaminierte_Normalverteilung.

in diesen Links mögliche wahrscheinlichkeitstheoretische Fundamente gibt. Der Ansatz mit der kontaminierten Normalverteilung geht davon aus, dass ein Teil der Messresultate grob falsch sein kann, beispielsweise, weil ein Gerät falsch eingestellt war oder der Telefonist statt eine 1000 eine 10000 hingeschrieben hat. Ein bisschen Robustheit gegen solche Fehler ist zwar generell ganz nett, aber im vorliegenden Fall hast Du, Deiner Beschreibung nach zumindest, zwei grundsätzlich gut gemachte Messreihen von einer Grösse, die sauber getrennt sind.

Zitat:
Auf der anderen Seite gibt es jetzt aber auch die Methode der gewichteten arithmetischen Mittel, in welchem eine Gewichtung nach 1/s^2 vorgenommen wird.

Das ist in meinen Augen ein passender Ansatz hier.

Zitat:
Wenn ich jetzt bezüglich einer Größe 2 verschiedene Verteilungen habe, ist mir noch nicht klar wann ich eine Mischverteilung annehmen soll und wann ich aus den 2 (in meinem Bsp. Normal-) Verteilungen durch Gewichtung eine einzige neue Normalverteilung berechnen kann.

Mischverteilungen können wahrscheinlichkeitstheoretische Basis für eine statistische Modellannahme sein, um dann darauf statistische Methodik anzuwenden. Mischverteilungsbasierte Modelle braucht man, um entweder verschiedene Grössen in einer einzigen Verteilung zu erkennen, oder eben um einen Teil der Messergebnisse als "schlecht" zu identifizieren, um sie dann auszusondieren.
Mit den Daten wirst Du also nie eine Mischverteilung "machen". Du wirst höchstens als Modell (mehr oder weniger willkürlicherweise bzw. wohlbegründet) postulieren, dass die Daten einer solchen Mischverteilung entspringen. Das wäre beispielsweise dann ein sinnvoller Ansatz, wenn jemand käme und die Daten der zwei Datensätze vermischt, so dass man nicht mehr wüsste, welches Ergebis von der einen Messreihe und welches von der anderen Messreihe stammt. In Deinem Fall gibt es aber glücklicherweise zwei völlig verschiedene Datensätze. Man will die nicht so vermengen, dass man nachher wieder herausfinden muss, welche Daten nun wohl von der einen Messung kommen und welche von der anderen. Oder kurz zusammengefasst: Wenn Du schon getrennte Daten hast, brauchst Du keine Mischverteilung.
HAL 9000 Auf diesen Beitrag antworten »
RE: Summe zweier Normalverteilugnen
@Namenssuchender

Ich hoffe, du weißt auch genau, was du tust, wenn du Dweezil hier von der Summenverteilung zur Mischverteilung (ab)lenkst: Wenn man mehrere Messungen derselben Größe macht - wie im Eröffnungsbeitrag beschrieben - dann tut man dies gewöhnlich, um die Zielgröße möglichst genau zu bestimmen, d.h. mit möglichst kleiner Varianz. Und da ist doch der (gewichtete Mittelwert) die passende Größe, statt einen der beteiligten Messwerte auszuwürfeln. Augenzwinkern
Dweezil Auf diesen Beitrag antworten »
RE: Summe zweier Normalverteilugnen
Danke für die ausführliche Antwort! Was du schreibst ist gut nachvollziehbar, passt auch gut zu dem Bsp. mit der Fischpopulation auf wikipedia. Also da war ich auf dem falschen Weg mit der Mischverteilunng.

@ HAL 9000: keine Sorge, hab nicht vor irgendwelche Konzepte blind anzuwenden. Aber ich finde es wichtig zumindest ansatzweise zu verstehen was bei der einen und was bei der anderen Methode passiert. Auf die Mischverteilung bin ich gekommen, weil ich die 2 Samples (welche im übrigen nur Spielerei sind und keinen realen Hintergrund haben) vermengt habe. Der andere Weg, aus je einem Wertepaar den Mittelwert zu bilden, war für mich nicht so unmittelbar erkennbar.
Namensuchender Auf diesen Beitrag antworten »
RE: Summe zweier Normalverteilugnen
Zitat:
Original von HAL 9000
Ich hoffe, du weißt auch genau, was du tust, wenn du Dweezil hier von der Summenverteilung zur Mischverteilung (ab)lenkst:

Tu ich doch gar nicht? Ich schreibe doch explizit hin, dass hier ein gewichtetes Mittel das ist, was Dweezil mutmasslich interessiert.

Zitat:
Wenn man mehrere Messungen derselben Größe macht - wie im Eröffnungsbeitrag beschrieben - dann tut man dies gewöhnlich, um die Zielgröße möglichst genau zu bestimmen, d.h. mit möglichst kleiner Varianz. Und da ist doch der (gewichtete Mittelwert) die passende Größe, statt einen der beteiligten Messwerte auszuwürfeln. Augenzwinkern

Ich sage irgendwie nichts anderes?
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »