Filtern einer Variable, die keine Aussagekraft hat

Neue Frage »

Elkese Auf diesen Beitrag antworten »
Filtern einer Variable, die keine Aussagekraft hat
Hallo,
ich habe folgendes Problem:
mir liegt ein Datensatz aus 16 unabhängigen Variablen vor (alle ordinalskaliert) und einer abhängigen ordinalskalierten Variablen. Nun möchte ich prüfen ob eine Variable einer anderen so stark ähnelt, dass ich sie herauslassen kann. ich habe bereits einen Korrelationstest gemacht und Variable a und c korrelaieren nach kendall und spearman stark (ca.. 0,85). Alle weiteren haben eine schwächere Korrelation. Ich denke, dass die Korrelation nicht ausreicht, um eine Variable zu entfernen. Wie könnte ich noch vorgehen?
Ich dachte bereits daran anhand einer multinomialen regression mit dem Likelihood Test zu prüfen....bin mir nur leider nicht so sicher.
Habt ihr eine Idee?
Elkese
Venus² Auf diesen Beitrag antworten »

Mit Hilfe der Hauptkomponentenanalyse kann man die Dimension eines Datensatzes reduzieren.

Man sucht zunächst die Hauptrichtung, entlang der die Varianz des Datensatzes (Projektion der Datenpunkte auf diese Richtung) maximal ist. Danach sucht man die Hauptrichtung, die senkrecht auf der ersten Hauptrichtung steht und entlang der die Varianz des Datensatzes maximal ist. Dann ist die Hauptrichtung zu bestimmen, die senkrecht auf der ersten und zweiten Hauptrichtung steht und entlang der wieder die Varianz des Datensatzes maximal ist usw. Bei 16 Variabeln sind das dann 16 Hauptrichtungen. Entlang der letzten Hauptrichtungen weist der Datensatz im günstigen Fall keine hohe Varianz mehr auf, sodass diese Komponenten dann weggelassen werden können, weil er durch die ersten Hauptrichtungen hinreichend gut beschrieben wird.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »