Normalverteilung Zahlen generieren |
13.02.2010, 11:39 | Gizzi | Auf diesen Beitrag antworten » | ||||
Normalverteilung Zahlen generieren für meine Statistikstudienarbeit bräuchte ich eine "normalverteilte" Zahlenreihe. Ich habe 100 befragte Personen, die alle eine Zahl zwischen 0 und 4 angeben können. Diese Zahlen müssten jetzt aber "normalverteilt" werden. Leider bekomm ich das nicht hin, denn egal wie ich die Zahlen verteile zeigt mit OpenStat immer an: "Strong evidence against normality". Hat irgendjemand eine Idee? Bin schon völlig am verzweifeln! Danke! |
||||||
13.02.2010, 12:11 | wisili | Auf diesen Beitrag antworten » | ||||
RE: Normalverteilung Zahlen generieren Eine Zufallsvariable kann nur normalverteilt sein, wenn sie stetig ist. Deine ist diskret (5-wertig). |
||||||
13.02.2010, 12:14 | Gizzi | Auf diesen Beitrag antworten » | ||||
... Ok, das hat mir mein schlauer Statistikdozent komischerweise nicht gesagt... ok...dann nehm ich halt die Zahlen 0-5 (dann sind es 6), geht es dann? |
||||||
13.02.2010, 12:30 | AD | Auf diesen Beitrag antworten » | ||||
Re: ... Eine diskrete Verteilung auf 0-5 ist genauso wenig eine stetige Verteilung, wie es die diskrete Verteilung auf 0-4 ist - hast du denn über Wisilis Anmerkung überhaupt nicht nachgedacht? ![]() Dieser grundsätzliche Unterschied zwischen diskreten und stetigen Verteilungen sollte dir schon bewusst sein, wenn du eine Studienarbeit schreibst. |
||||||
13.02.2010, 13:50 | Gizzi | Auf diesen Beitrag antworten » | ||||
stetig + diskret Hallo, mir ist der Unterschied leider nicht bekannt. Was muss ich denn machen, dass ich eine stetige Verteilung bekomme? |
||||||
13.02.2010, 14:05 | wisili | Auf diesen Beitrag antworten » | ||||
RE: Normalverteilung Zahlen generieren
Das suggeriert die ganzen Zahlen 0, 1, 2, 3, 4 oder nur 1, 2, 3? Sicher ist man nicht; sind vielleicht sogar reelle Zahlen gemeint? Auch dann wäre die Aufgabe keineswegs klar. |
||||||
Anzeige | ||||||
|
||||||
13.02.2010, 14:10 | Gizzi | Auf diesen Beitrag antworten » | ||||
genau Also, ich habe einen Fragebogen, den 100 Personen (fiktiv) beantworten. Eine Frage ist: "Wie of sind sie im letzten Kalenderjahr 2009 privat verreist?" Ich habe also den Fragebogen 100x fiktiv ausgefüllt und habe nun für diese Frage folgende Antwortmöglichkeiten: 0 1 2 3 4 D.h. Die Person ist entweder kein mal verreist, oder einmal, zweimal usw. Da diese Merkmalsausprägungen ein Verhältnisskalenniveau zeugen soll ich nun einen Einstichproben T-Test machen... Die Vorraussetzung für so einen Test ist jedoch, dass die Daten "normalverteilt" sind. Meine Frage also: Wie kann ich die oben genannten Zahlen/Ziffern bei 100 Personen normalverteilen? |
||||||
13.02.2010, 14:38 | wisili | Auf diesen Beitrag antworten » | ||||
RE: genau Ein EINstichproben T-Test setzt eine bekannte Grundgesamtheit voraus. |
||||||
13.02.2010, 14:43 | Gizzi | Auf diesen Beitrag antworten » | ||||
kann nicht sein hmmm...die habe ich aber nicht... wie verteile ich also meine zahlen??? Ich schicke mal den Mailverkehr mit einem Dozenten dazu (die untereste mail ist die älteste): Hallo, um eine Normalverteilung zu erzeugen, müssen sie sich „ihre“ Variable normal verteilt vor Augen führen. Vereinfacht ausgedrückt haben sie bei einer Normalverteilung sehr viele Ausprägungen im mittleren Wertebereich, also in ihrem Falle viele Werte um 2 (2,1,3) und wenige Extremwerte (0,4). Wenn sie ihre Daten so verändern, müsste eine normal verteilte Variable resultieren. Ich hoffe damit ihnen geholfen zu haben. Viele Grüße Prof. Dr. Steinhausen ----------------------------------------------------------------- Vielen Dank für die schnelle Antwort. Leider ist mir nicht ganz klar, was Sie unter Zufallszahlenvariable meinen und wie ich dieses generieren soll. Momentan habe ich bei meinen Merkmalen nur die Häufigkeit innerhalb der 100 befragten Personen verändert, jedoch scheint es mir so, dass ich mit den Zahlen 0 bis 4 und bei N=100 keine Normalverteilung einstellen lässt. Ich habe schon mehrmals meinen Datensatz "behandelt", aber Openstat zeigt mir einfach immer an, dass es nicht normalverteilt sein kann. Vielen Dank für Ihre Hilfe. ---------------------------------------------- ..probieren Sie es einfach mal, indem Sie ihre Daten in Excel „behandeln“ und die besagte Variable als Zufallszahlenvariable generieren. Das klappt dann auch nicht immer gleich und sie müssen die Daten in der Excel öfter „aktualisieren“ und immer wieder in Openstat importieren, ist aber immer noch weniger „mühsam“ als per Hand. Übrigens so simpel ist diese Voraussetzung nun auch wieder nicht. Ich hoffe, es hilft. ------------------------------------------------------------ Guten Abend, wahrscheinlich wundern Sie sich gleich über meine Frage, aber ich scheitere leider gerade wohl an der simpelsten Vorraussetzung für die statitischen Tests der Studienarbeit. Und zwar schaffe ich es einfach nicht meine Daten "normal zu verteilen". Konkret möchte ich eine Normalverteilung bei 100 Personen für die Werte 0 bis 4 herbeibringen, um dann später auch den T-Test durchführen zu können. Egal wie lang ich rumprobiert habe, mir zeigt OpenStat immer wieder an: "Strong evidence against normality". Haben Sie da vielleicht einen Trick, wie man solche Daten schnell und einfach normalverteilt? Bin für jede Hilfe dankbar! Viele Grüße |
||||||
13.02.2010, 15:27 | wisili | Auf diesen Beitrag antworten » | ||||
RE: kann nicht sein Jetzt hat man den Eindruck, du solltest eine 100-elementige Stichprobe mit Zahlen 0, 1, 2, 3, 4 basteln, sodass sie von einer gewissen Software «Openstat» mit unbekannten Testverfahren als kompatibel mit einer Normalverteilung (ohne bekanntes mü und sigma) qualifiziert wird. Da man Binomialverteilungen mehr oder weniger gut durch Normalverteilungen annähern kann, könntest du es ja mal so versuchen: p=0.5, n=4, also 6 mal «0», 25 mal «1», 38 mal «2», 25 mal «3», 6 mal «4». (mü =2, sigma = 1). |
||||||
13.02.2010, 15:42 | Gizzi | Auf diesen Beitrag antworten » | ||||
:( Leider hier auch "strong evidence against normality" was mach ich jetzt? |
||||||
13.02.2010, 15:44 | wisili | Auf diesen Beitrag antworten » | ||||
Re: :( Überlegen, was wohl die Software macht. |
||||||
13.02.2010, 15:48 | Gizzi | Auf diesen Beitrag antworten » | ||||
was meinst du jetzt damit? wie kann ich denn endlich rausfinden, wie oft ich die "0", die "1", die "2", die "3" und die "4" brauche, damit es bei 100 stück normalverteilt ist? |
||||||
13.02.2010, 15:50 | AD | Auf diesen Beitrag antworten » | ||||
@Gizzi Ich hab ein paar grundsätzliche Bauchschmerzen mit deinem Anliegen: Du hast einen Datensatz mit 100 Werten im Bereich 0 bis 4. Ok, das ist die Ausgangslage. Was soll das jetzt aber bedeuten, dass du diese Daten "normalverteilen" willst? Die Daten sind, wie sie in der Stichprobe erhoben werden - willst du sie etwa fälschen, nur damit du irgendein Verfahren auf sie anwenden kannst??? ![]() Oder hast du gar keine echten Daten, und willst sie stattdessen simulieren (wie es auch wisili vermutet)? Aus welchen Gründen aber Umfrageergebnisse, wie diese hier, nun aber unbedingt normalverteilt sein müssen, entzieht sich völlig meiner Logik. Dass das auf Mittelwerte solcher Umfrageergebnisse zutrifft, Ok, ergibt sich aus dem zentralen Grenzwertsatz - aber wieso auch auf Einzelumfrageergebnisse? Nehmen wir mal z.B. die individuellen IMDb-Filmbewertungen zum gestern in frischer Restauration uraufgeführten Film "Metropolis (1927): http://www.imdb.com/title/tt0017136/ratings Das ist alles anderen als eine unimodale, näherungsweise normalverteilte Stichprobe. Beim Blockbuster der diesjährigen Saison sieht es übrigens nicht viel anders aus http://www.imdb.com/title/tt0499549/ratings Eine Umfrage unter Fußballfans nach der Beliebtheit des FC Bayern München (mit Werten 0..4) wird vermutlich auch keine auch nur einigermaßen normalverteilte Stichprobe ergeben. ![]() |
||||||
13.02.2010, 15:57 | Gizzi | Auf diesen Beitrag antworten » | ||||
hallo nein, ich will nichts fälschen, sondern ich habe keine "echten" daten. Unsere Aufgabe ist es eine studienarbeit zu schreiben, in der wir verschiedene statistische Test durchführen können. Dafür sollen wir als erstes einen fiktiven Fragebogen erstellen und dann dazu eine Datendatei, wobei die Gesamtmenge größer ist als 60...ich habe also 100 gewählt. Damit ich aber den T-Test rechnen kann gilt aus Vorraussetzung, dass meine Datenzahlen zu der einen Frage eben "normalverteilt" sind... Somit manipuliere ich zwar schon, aber es sind ja keine echten daten. Und es kommt einzig und allein darauf an, die statistischen Tests rechnen zu können. |
||||||
13.02.2010, 16:03 | wisili | Auf diesen Beitrag antworten » | ||||
Arthur Dent hat natürlich Recht mit den grundsätzlichen Überlegungen zum Einsatz von Statistik. Den einzigen «Lichtblick» zur Ehrenrettung der Aufgabe sehe ich so: Dein Lehrer will dich zwingen bedenkenlos angewendete Software zu hinterfragen, herauszubekommen, welchen «Evidenztest» sie durchrechnet. Wenn du das verstehst, kannst du sie wohl leicht mit dem nötigen Futter überlisten. Das ist für die Anwendung zwar nutzlos, hat aber trotzdem enormen Lernwert. |
||||||
13.02.2010, 16:13 | Gizzi | Auf diesen Beitrag antworten » | ||||
Nein, der Dozent will einfach nur, dass wir diese Test stupide rechnen. Aber wenn ich schon an der Vorraussetzung für einen solchen Test scheitere, dann wird das wohl nichts. Deswegen wäre mir wesentlich mehr geholfen, wenn ihr mir konkrete Beispiele für die Verteilung der Zahlen 0,1,2,3,4 geben würdet...so wie vorher wisili. Danke! ![]() |
||||||
13.02.2010, 16:14 | Gizzi | Auf diesen Beitrag antworten » | ||||
keine tiefe wisst ihr, ich will hier keine diskussion vom zaun brechen, was eigentlich geht und was nicht, ob daten manipuliert sind oder nicht.. ich will einfach nur diese eine vorrausstetzung (normalverteilung) erfüllen, damit ich endlich weiterrechnen kann! Danke für eure Hilfe! |
||||||
13.02.2010, 16:21 | AD | Auf diesen Beitrag antworten » | ||||
Na dann weiterhin viel Spaß beim Simulieren von normalverteilten diskreten Zufallsgrößen. ![]() Wascht mich, aber macht mich nicht nass - tolle Haltung. |
||||||
13.02.2010, 16:27 | Gizzi | Auf diesen Beitrag antworten » | ||||
das sollte keine kritik sein, nur dass es mir garnicht darum geht um den sinn- oder unsinn dieser aufgabe zu diskutieren. |
||||||
13.02.2010, 16:48 | AD | Auf diesen Beitrag antworten » | ||||
Das muss aber leider sein, da die Forderung "diskret + normalverteilt" blanker Unsinn ist, dieser Widerspruch ist schlicht nicht lösbar und damit dein Anliegen nicht erfüllbar. Selbst die von Wisili andeutungsweise vorgeschlagene Verwendung der Approximation greift hier sehr schlecht. Selbst die Abiturienten lernen heutzutage, dass diese Approximation allenfalls für brauchbar ist. In deinem Fall ist diese Forderung nicht im entferntesten erfüllt, da gilt sogar für alle die Abschätzung . |
||||||
13.02.2010, 16:58 | Gizzi | Auf diesen Beitrag antworten » | ||||
meine forderung ist doch nur normalverteilt. Wieso sind denn meine Zahlen auch noch diskret...?? Weil es ganze zahlen sind? |
||||||
13.02.2010, 17:04 | AD | Auf diesen Beitrag antworten » | ||||
Oben stand noch was von 0..4, von denen wir angenommen haben, dass es nur die ganzen Zahlen 0,1,2,3,4 sind. Na klar ist das diskret, was denn sonst? Die Unterhaltung mit dir verläuft so schlecht, weil du erschreckende Lücken in den Grundlagen aufweist. Leider sehe ich bisher auch wenig Bereitschaft bei dir, diese zu schließen - hoffentlich belehrst du mich eines besseren. |
||||||
13.02.2010, 17:09 | Gizzi | Auf diesen Beitrag antworten » | ||||
nein, so große lücken habe ich nicht, aber ich verstehe nicht, wieso du sagst, dass diskret+normalverteilt nicht funktioniert. habe da ein gegenbeispiel und sonst hätte mir das ja auch der dozent gesagt! ![]() Es muss also irgendwie gehen! |
||||||
13.02.2010, 17:20 | AD | Auf diesen Beitrag antworten » | ||||
Die Hoffnung ist schon gestorben, denn dein maßlos selbstzufriedenes "habe keine so großen Lücken" spricht Bände mangelnder Selbsterkenntnis.
Na dann mal raus mit der Sprache. Ansonst übergebe ich (mich) jetzt vollständig an wisili, mag der sich mit dir rumärgern - wenn er denn will. |
||||||
13.02.2010, 18:21 | wisili | Auf diesen Beitrag antworten » | ||||
Nein, ich auch nicht, der vielzitierte Dozent soll es richten. |
|