normalisieren gemäß Standardnormalverteilung

Neue Frage »

Sinusoidal Auf diesen Beitrag antworten »
normalisieren gemäß Standardnormalverteilung
Hallo zusammen,

Hintergrund:
Verschiedene Merkmale liegen in unterschiedlichen Wertebereichen vor. Um zu verhindern, dass eine Ausprägung aufgrund großer nomineller Werte das Ergebnis zu stark beeinflusst, sollen die Merkmalsausprägungen normalisiert werden.
Dies geschieht durch Skalierung der Wertebereiche gemäß der Standardnormalverteilung. Demnach entspricht das arithmetische Mittel eines Merkmals nach Normalisierung dem Wert 0 und weist eine einheitliche Varianz vom Wert 1 auf.

Dafür werden die Daten zunächst zentriert indem die arithmetischen Mittelwerte aller Merkmale entfernt werden. Daraufhin werden die Daten durch eine Division mit der empirischen Standardabweichung aller Merkmale skaliert.



Frage1: Die Zentrierung ist mir klar. Aber weshalb weisen alle Merkmale eine einheitliche Varianz von 1 auf, nach der Division durch die empirische Standardabweichung aller Merkmale?

Grundsätzliche Frage: Wie geht es überhaupt unterschiedlich verteilte Merkmale alle in die Form der Standardnormalverteilung zu transferieren? Dann hab ich doch gar keine Information mehr darüber, wie stark die Daten ursprünglich gestreut haben, oder? Wo ist mein Denkfehler? Ich glaube, ich habe den Begriff normalisieren bisher nie wirklich verstanden...


Danke für jede Hilfe verbunden mit der Hoffnung, dass die Frage noch zur Schulmathematik gehört und richtig platziert ist smile
Dopap Auf diesen Beitrag antworten »

wie mache ich aus einer Parabel mit Minimum auf der X-Achse eine Standardparabel:



ersetze [Verschiebung in x-Richtung ]

Stauche oder dehne die Parabel bis es passt.

Multipliziere [Stauchung/Dehnung in y-Richtung ]

--------------------------------------

deine ursprünglichen Daten sollten schon begründbar normalverteilt sein.

Die ursprüngliche Streuung

wurde ja vorher berechnet.
Sinusoidal Auf diesen Beitrag antworten »

Hallo Dopap,

die Normalisierung der Parabel macht Sinn, danke!
Ich überlege grade, ob das für jedes Merkmal eine eigene Normalisierung bedeutet, also für jedes Merkmal den eigenen Mittelwert entfernen und durch die eigene empirische Streuung dividieren?

Oder ob die Streuung über alle Merkmale berechnet wird und dadurch dividiert wird?

In dem Parabelbeispiel: Die Information über die ursprüngliche Verschiebung und die Streckung/Stauchung der Parabel, liegt doch in dem x+b und dem 1/a. Nach der Normalisierung sind diese Informationen "verloren"?

Wie würde sich der Unterschied zweier Parabeln:



und



denn nach der Normalisierung ausdrücken?
Sinn der Normalisierung kann doch nicht sein, exakt gleiche Parabeln (Normalverteilungskurven) zu erhalten?
Ich glaube ich denke immer noch falsch und wäre für einen weiteren Tip sehr dankbar!
Dopap Auf diesen Beitrag antworten »

Zitat:
Original von Sinusoidal
In dem Parabelbeispiel: Die Information über die ursprüngliche Verschiebung und die Streckung/Stauchung der Parabel, liegt doch in dem x+b und dem 1/a. Nach der Normalisierung sind diese Informationen "verloren"?


nicht unbedingt . wegen bleibt die ursprüngliche Information erhalten.

Zitat:

Wie würde sich der Unterschied zweier Parabeln: und
denn nach der Normalisierung ausdrücken?
Sinn der Normalisierung kann doch nicht sein, exakt gleiche Parabeln (Normalverteilungskurven) zu erhalten?


doch, das ist so!

Die Berechnung von Wkt's mit der Normalverteilung geht nicht elementar, da folgendes gilt:



deshalb liegt die Standardnormalverteilung in Tabellen vor und erhält den Namen
Sinusoidal Auf diesen Beitrag antworten »

Vielen Dank für die weitere Antwort!
Da ich immer noch nicht komplett im Bilde bin, vielleicht mal ganz konkret an einem Beispiel:

Ich habe zwei Klassen C1 (Schrauben) und C2 (Muttern). Zudem ist ein Objekt O1 mit seinem Merkmalsvektor
, bestehend aus zwei normalverteilten Merkmalen (Kreisförmigkeit und Lage des Schwerpunktes), gegeben.

(keine realen Werte):

Wertebereich Kreisförmigkeit: [0;2]
Wertebereich Lage des Schwerpunktes: [0;1]

Arithmetisches Mittel Kreisförmigkeit C1: 0,2
Standardabweichung Kreisförmigkeit C1: 0,1

Arithemtisches Mittel Lage des Schwerpunktes C1: 1,5
Standardabweichung Lage des Schwerpunktes C1: 0,1



Arithmetisches Mittel Kreisförmigkeit C2: 0,5
Standardabweichung Kreisförmigkeit C2: 0,2

Arithemtisches Mittel Lage des Schwerpunktes C1: 1
Standardabweichung Lage des Schwerpunktes C1: 0,2



Um die Entscheidung, ob das Objekt zur Klasse C1 oder C2 gehört, von beiden Merkmalen gleichermaßen abhängig zu machen, sollen die Merkmalsausprägungen normalisiert werden.

In der Literatur, die ich dazu benutze steht, dass dafür eine Funktion benutzt wird, die folgerndermaßen vorgeht:

" Dabei zentriert diese Funktion die Daten zuerst, indem sie den arithmetischen Mittelwert aller
Merkmale aller Klassen entfernt. Anschließend werden die Daten durch Division mit der empirischen
Standardabweichung aller Merkmale aller Klassen skaliert. Dadurch ergibt sich ein normalisierter
Merkmalsvektor einer Klasse wie folgt:

"

Meine Frage: Was bedeutet "den arithmetischen Mittelwert aller Merkmale aller Klassen" entfernen bzw. "durch Division mit der empirischen Standardabweichung aller Merkmale aller Klassen"...skalieren?
Könnten Sie mir ganz konkret an diesem Beispiel zeigen, wie diese Normalisierung nun stattfinden würde?
Vielen Dank nochmal!
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »