passende Verteilung für Statistikprojekt

Neue Frage »

ermeglio Auf diesen Beitrag antworten »
passende Verteilung für Statistikprojekt
Meine Frage:
Hallo zusammen,
habe folgende Ausgangslage, ich muss eine Statistik Projektarbeit abgeben. Ich bin nun gerade daran, leider komme ich aber nicht weiter und zwar versuche ich vergebens eine passende Verteilung zu finden.

in meiner Statistik wurden ca. 80 Leuten befragt auf die zwei fragen
1) wie alt bist du
2) welches Alter würdest du am liebsten jetzt gerade haben

Nun habe ich also ca. 80 Datensätze mit je aktuelles Alter und aktuelles "Wunschalter"

Verlangt wird nun dass man eine passende Verteilung findet. Und hier ist mein Problem. Denn meine Daten sind sehr "wirr" verteilt (siehe Graph) und sämtliche Verteilungen scheinen nicht zu passen.


Oder liege ich da falsch?
könnten ev. einer der folgenden Verteilungen "passen"?

Binomial Verteilung
Hyper geometrische Verteilung
Poisson Verteilung
Geometrische Verteilung





Meine Ideen:
ich dachte die Geometrische Verteilung könnte passen, da viele unterschiedliche Einzel Werte vorhnden sind und daher jeweils relativ kleine P(x)
Jonas Weckschmied Auf diesen Beitrag antworten »

Nun, gerne werden allen möglichen Datensätzen ja Normalverteilungen unterstellt, das könnte hier auch klappen.
Du kannst ja verschiedene Tests anwenden, um auf (Normal)verteilung zu testen, z.b. kolmogorov-smirnov test.
Aber du willst ja sicherlich auch einen Zusammenhang zwischen den zwei Variablen finden, oder? Vllt. Mal die Korrelation ausrechnen usw...
ermeglio Auf diesen Beitrag antworten »

Hallo Jonas,

danke für die Infos. Leider hatten wir kolmogorov-smirnov test noch nicht...

eigentlich ging es mir primär um das aktuelle Wunschalter, nicht unbedingt um die Korrelation mit dem Alter, ist aber sicherlich ein guter Punkt.

Mir ist etwas eingefallen in Bezug auf die Verteilung:

was wenn ich statt dass effektive Wunschalter als x Wert, Klassen definiere, z.Bsp. in Schritt von 5, also Wunschalter klassifiziere, so z.Bsp:

"0-4, 5-9,10-14,15-19,..., 70-74,75-79,80-mehr"

vielleicht könnte ich ja dann die Normalverteilung anwenden ... aber...

ist das erlaubt oder ist gilt dies bereits als "Beschiss" bzw. als eine Verfälschung der Statistik?

vielen Dank für eine Rückmeldung!

Gruss
Jonas Weckschmied Auf diesen Beitrag antworten »

Das ist kein Beschiss, sonern das wird bei Histogrammen häufig so gemacht ( gruppieren ), ob das was ändert ist fagoich.
Am Besten wäre es, wenn du noch mehr Leute befragst, wenn das möglich ist, und dabei nicht vergessen, dass die Befragten immer zufällig ausgewählt werden müssen ( simple random sample )
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »