Normalverteilung Zahlen generieren

Neue Frage »

Gizzi Auf diesen Beitrag antworten »
Normalverteilung Zahlen generieren
Hallo,
für meine Statistikstudienarbeit bräuchte ich eine "normalverteilte" Zahlenreihe.
Ich habe 100 befragte Personen, die alle eine Zahl zwischen 0 und 4 angeben können. Diese Zahlen müssten jetzt aber "normalverteilt" werden.
Leider bekomm ich das nicht hin, denn egal wie ich die Zahlen verteile zeigt mit OpenStat immer an: "Strong evidence against normality".
Hat irgendjemand eine Idee? Bin schon völlig am verzweifeln!

Danke!
wisili Auf diesen Beitrag antworten »
RE: Normalverteilung Zahlen generieren
Eine Zufallsvariable kann nur normalverteilt sein, wenn sie stetig ist.
Deine ist diskret (5-wertig).
Gizzi Auf diesen Beitrag antworten »
...
Ok, das hat mir mein schlauer Statistikdozent komischerweise nicht gesagt...
ok...dann nehm ich halt die Zahlen 0-5 (dann sind es 6), geht es dann?
AD Auf diesen Beitrag antworten »
Re: ...
Eine diskrete Verteilung auf 0-5 ist genauso wenig eine stetige Verteilung, wie es die diskrete Verteilung auf 0-4 ist - hast du denn über Wisilis Anmerkung überhaupt nicht nachgedacht? unglücklich

Dieser grundsätzliche Unterschied zwischen diskreten und stetigen Verteilungen sollte dir schon bewusst sein, wenn du eine Studienarbeit schreibst.
Gizzi Auf diesen Beitrag antworten »
stetig + diskret
Hallo,
mir ist der Unterschied leider nicht bekannt. Was muss ich denn machen, dass ich eine stetige Verteilung bekomme?
wisili Auf diesen Beitrag antworten »
RE: Normalverteilung Zahlen generieren
Zitat:
Original von Gizzi
... eine Zahl zwischen 0 und 4 angeben ...


Das suggeriert die ganzen Zahlen 0, 1, 2, 3, 4 oder nur 1, 2, 3? Sicher ist man nicht;
sind vielleicht sogar reelle Zahlen gemeint? Auch dann wäre die Aufgabe keineswegs klar.
 
 
Gizzi Auf diesen Beitrag antworten »
genau
Also, ich habe einen Fragebogen, den 100 Personen (fiktiv) beantworten.
Eine Frage ist: "Wie of sind sie im letzten Kalenderjahr 2009 privat verreist?"
Ich habe also den Fragebogen 100x fiktiv ausgefüllt und habe nun für diese Frage folgende Antwortmöglichkeiten:
0
1
2
3
4

D.h. Die Person ist entweder kein mal verreist, oder einmal, zweimal usw.

Da diese Merkmalsausprägungen ein Verhältnisskalenniveau zeugen soll ich nun einen Einstichproben T-Test machen...
Die Vorraussetzung für so einen Test ist jedoch, dass die Daten "normalverteilt" sind.
Meine Frage also: Wie kann ich die oben genannten Zahlen/Ziffern bei 100 Personen normalverteilen?
wisili Auf diesen Beitrag antworten »
RE: genau
Ein EINstichproben T-Test setzt eine bekannte Grundgesamtheit voraus.
Gizzi Auf diesen Beitrag antworten »
kann nicht sein
hmmm...die habe ich aber nicht...
wie verteile ich also meine zahlen???

Ich schicke mal den Mailverkehr mit einem Dozenten dazu (die untereste mail ist die älteste):



Hallo,
um eine Normalverteilung zu erzeugen, müssen sie sich „ihre“ Variable normal verteilt vor Augen führen.

Vereinfacht ausgedrückt haben sie bei einer Normalverteilung sehr viele Ausprägungen im mittleren Wertebereich, also in ihrem Falle viele Werte um 2 (2,1,3) und wenige Extremwerte (0,4). Wenn sie ihre Daten so verändern, müsste eine normal verteilte Variable resultieren.

Ich hoffe damit ihnen geholfen zu haben.
Viele Grüße
Prof. Dr. Steinhausen

-----------------------------------------------------------------
Vielen Dank für die schnelle Antwort. Leider ist mir nicht ganz klar, was Sie unter Zufallszahlenvariable meinen und wie ich dieses generieren soll.

Momentan habe ich bei meinen Merkmalen nur die Häufigkeit innerhalb der 100 befragten Personen verändert, jedoch scheint es mir so, dass ich mit den Zahlen 0 bis 4 und bei N=100 keine Normalverteilung einstellen lässt.

Ich habe schon mehrmals meinen Datensatz "behandelt", aber Openstat zeigt mir einfach immer an, dass es nicht normalverteilt sein kann.


Vielen Dank für Ihre Hilfe.
----------------------------------------------

..probieren Sie es einfach mal, indem Sie ihre Daten in Excel „behandeln“ und die besagte Variable als Zufallszahlenvariable generieren. Das klappt dann auch nicht immer gleich und sie müssen die Daten in der Excel öfter „aktualisieren“ und immer wieder in Openstat importieren, ist aber immer noch weniger „mühsam“ als per Hand.

Übrigens so simpel ist diese Voraussetzung nun auch wieder nicht.
Ich hoffe, es hilft.
------------------------------------------------------------
Guten Abend,

wahrscheinlich wundern Sie sich gleich über meine Frage, aber ich scheitere leider gerade wohl an der simpelsten Vorraussetzung für die statitischen Tests der Studienarbeit.

Und zwar schaffe ich es einfach nicht meine Daten "normal zu verteilen". Konkret möchte ich eine Normalverteilung bei 100 Personen für die Werte 0 bis 4 herbeibringen, um dann später auch den T-Test durchführen zu können. Egal wie lang ich rumprobiert habe, mir zeigt OpenStat immer wieder an: "Strong evidence against normality".

Haben Sie da vielleicht einen Trick, wie man solche Daten schnell und einfach normalverteilt?

Bin für jede Hilfe dankbar!
Viele Grüße
wisili Auf diesen Beitrag antworten »
RE: kann nicht sein
Jetzt hat man den Eindruck, du solltest eine 100-elementige Stichprobe mit Zahlen 0, 1, 2, 3, 4 basteln,
sodass sie von einer gewissen Software «Openstat» mit unbekannten Testverfahren als kompatibel mit einer Normalverteilung (ohne bekanntes mü und sigma) qualifiziert wird.

Da man Binomialverteilungen mehr oder weniger gut durch Normalverteilungen annähern kann, könntest du es ja mal so versuchen: p=0.5, n=4, also 6 mal «0», 25 mal «1», 38 mal «2», 25 mal «3», 6 mal «4».
(mü =2, sigma = 1).
Gizzi Auf diesen Beitrag antworten »
:(
Leider hier auch "strong evidence against normality"

was mach ich jetzt?
wisili Auf diesen Beitrag antworten »
Re: :(
Überlegen, was wohl die Software macht.
Gizzi Auf diesen Beitrag antworten »

was meinst du jetzt damit?

wie kann ich denn endlich rausfinden, wie oft ich die "0", die "1", die "2", die "3" und die "4" brauche, damit es bei 100 stück normalverteilt ist?
AD Auf diesen Beitrag antworten »

@Gizzi

Ich hab ein paar grundsätzliche Bauchschmerzen mit deinem Anliegen:

Du hast einen Datensatz mit 100 Werten im Bereich 0 bis 4. Ok, das ist die Ausgangslage.

Was soll das jetzt aber bedeuten, dass du diese Daten "normalverteilen" willst? Die Daten sind, wie sie in der Stichprobe erhoben werden - willst du sie etwa fälschen, nur damit du irgendein Verfahren auf sie anwenden kannst??? unglücklich

Oder hast du gar keine echten Daten, und willst sie stattdessen simulieren (wie es auch wisili vermutet)? Aus welchen Gründen aber Umfrageergebnisse, wie diese hier, nun aber unbedingt normalverteilt sein müssen, entzieht sich völlig meiner Logik. Dass das auf Mittelwerte solcher Umfrageergebnisse zutrifft, Ok, ergibt sich aus dem zentralen Grenzwertsatz - aber wieso auch auf Einzelumfrageergebnisse? Nehmen wir mal z.B. die individuellen IMDb-Filmbewertungen zum gestern in frischer Restauration uraufgeführten Film "Metropolis (1927):

http://www.imdb.com/title/tt0017136/ratings

Das ist alles anderen als eine unimodale, näherungsweise normalverteilte Stichprobe. Beim Blockbuster der diesjährigen Saison sieht es übrigens nicht viel anders aus

http://www.imdb.com/title/tt0499549/ratings

Eine Umfrage unter Fußballfans nach der Beliebtheit des FC Bayern München (mit Werten 0..4) wird vermutlich auch keine auch nur einigermaßen normalverteilte Stichprobe ergeben. Augenzwinkern
Gizzi Auf diesen Beitrag antworten »
hallo
nein, ich will nichts fälschen, sondern ich habe keine "echten" daten.
Unsere Aufgabe ist es eine studienarbeit zu schreiben, in der wir verschiedene statistische Test durchführen können.
Dafür sollen wir als erstes einen fiktiven Fragebogen erstellen und dann dazu eine Datendatei, wobei die Gesamtmenge größer ist als 60...ich habe also 100 gewählt.

Damit ich aber den T-Test rechnen kann gilt aus Vorraussetzung, dass meine Datenzahlen zu der einen Frage eben "normalverteilt" sind...

Somit manipuliere ich zwar schon, aber es sind ja keine echten daten.
Und es kommt einzig und allein darauf an, die statistischen Tests rechnen zu können.
wisili Auf diesen Beitrag antworten »

Arthur Dent hat natürlich Recht mit den grundsätzlichen Überlegungen zum Einsatz von Statistik.
Den einzigen «Lichtblick» zur Ehrenrettung der Aufgabe sehe ich so: Dein Lehrer will dich zwingen bedenkenlos angewendete Software zu hinterfragen, herauszubekommen, welchen «Evidenztest» sie durchrechnet. Wenn du das verstehst, kannst du sie wohl leicht mit dem nötigen Futter überlisten. Das ist für die Anwendung zwar nutzlos, hat aber trotzdem enormen Lernwert.
Gizzi Auf diesen Beitrag antworten »

Nein, der Dozent will einfach nur, dass wir diese Test stupide rechnen.
Aber wenn ich schon an der Vorraussetzung für einen solchen Test scheitere, dann wird das wohl nichts.

Deswegen wäre mir wesentlich mehr geholfen, wenn ihr mir konkrete Beispiele für die Verteilung der Zahlen 0,1,2,3,4 geben würdet...so wie vorher wisili.

Danke! smile
Gizzi Auf diesen Beitrag antworten »
keine tiefe
wisst ihr, ich will hier keine diskussion vom zaun brechen, was eigentlich geht und was nicht, ob daten manipuliert sind oder nicht..

ich will einfach nur diese eine vorrausstetzung (normalverteilung) erfüllen, damit ich endlich weiterrechnen kann!

Danke für eure Hilfe!
AD Auf diesen Beitrag antworten »

Na dann weiterhin viel Spaß beim Simulieren von normalverteilten diskreten Zufallsgrößen. Finger1

Wascht mich, aber macht mich nicht nass - tolle Haltung.
Gizzi Auf diesen Beitrag antworten »

das sollte keine kritik sein,
nur dass es mir garnicht darum geht um den sinn- oder unsinn dieser aufgabe zu diskutieren.
AD Auf diesen Beitrag antworten »

Zitat:
Original von Gizzi
nur dass es mir garnicht darum geht um den sinn- oder unsinn dieser aufgabe zu diskutieren.

Das muss aber leider sein, da die Forderung "diskret + normalverteilt" blanker Unsinn ist, dieser Widerspruch ist schlicht nicht lösbar und damit dein Anliegen nicht erfüllbar.

Selbst die von Wisili andeutungsweise vorgeschlagene Verwendung der Approximation greift hier sehr schlecht. Selbst die Abiturienten lernen heutzutage, dass diese Approximation allenfalls für brauchbar ist. In deinem Fall ist diese Forderung nicht im entferntesten erfüllt, da gilt sogar für alle die Abschätzung .
Gizzi Auf diesen Beitrag antworten »

meine forderung ist doch nur normalverteilt.

Wieso sind denn meine Zahlen auch noch diskret...?? Weil es ganze zahlen sind?
AD Auf diesen Beitrag antworten »

Zitat:
Original von Gizzi
meine forderung ist doch nur normalverteilt.

Oben stand noch was von 0..4, von denen wir angenommen haben, dass es nur die ganzen Zahlen 0,1,2,3,4 sind. Na klar ist das diskret, was denn sonst?

Die Unterhaltung mit dir verläuft so schlecht, weil du erschreckende Lücken in den Grundlagen aufweist. Leider sehe ich bisher auch wenig Bereitschaft bei dir, diese zu schließen - hoffentlich belehrst du mich eines besseren.
Gizzi Auf diesen Beitrag antworten »

nein, so große lücken habe ich nicht, aber ich verstehe nicht, wieso du sagst, dass diskret+normalverteilt nicht funktioniert.
habe da ein gegenbeispiel und sonst hätte mir das ja auch der dozent gesagt! Augenzwinkern

Es muss also irgendwie gehen!
AD Auf diesen Beitrag antworten »

Zitat:
Original von Arthur Dent
hoffentlich belehrst du mich eines besseren.

Die Hoffnung ist schon gestorben, denn dein maßlos selbstzufriedenes "habe keine so großen Lücken" spricht Bände mangelnder Selbsterkenntnis.

Zitat:
Original von Gizzi
habe da ein gegenbeispiel

Na dann mal raus mit der Sprache.

Ansonst übergebe ich (mich) jetzt vollständig an wisili, mag der sich mit dir rumärgern - wenn er denn will.
wisili Auf diesen Beitrag antworten »

Nein, ich auch nicht, der vielzitierte Dozent soll es richten.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »