Fiktiver Datensatz - nichtlineare Regression

Neue Frage »

UniProblem1234 Auf diesen Beitrag antworten »
Fiktiver Datensatz - nichtlineare Regression
Meine Frage:
Hallo zusammen,

im Rahmen einer universitären Aufgabenstellung haben wir einen fiktiven Datensatz mit 60 Fällen gegeben. Aufgabe ist es, eine Regressionsanalyse durchzuführen und für zwei vorgegebene Werte von x y zu schätzen.

Durch Überprüfung des Scatterplots konnte herausgefunden werden, dass die Daten nicht linear sind. Das R^2 für eine kubische Funktion hingegen war sehr hoch (siehe Scatterplot). Somit haben wir eine Regression als Kurvenanpassung (kubisch) durchgeführt und eine Regressionsgerade erhalten, mit der die beiden Werte auch geschätzt werden konnte.

Durch Überlegung ist uns jedoch aufgefallen, dass es sich neben einer kubischen Funktion auch um eine periodische Funktion wie eine Sinusfunktion handeln könnte. Per Hand haben wir die Parameter a,b,c,d der Sinusfunktion grob schätzen können.

Jedoch stehen wir vor dem Problem, wie man die Parameter genauer bestimmen bzw. eine Sinus-Regression durchführen kann? Wie lässt es sich mit Sicherheit herausfinden, ob es sich nun um eine kubische Funktion handelt, die gegen plus/minus unendlich strebt oder um eine periodische Funktion? Leider kommen wir alleine nicht weiter.

Vielen Dank für eure Hilfe!!

Meine Ideen:
Ursprungsidee: Es handelt sich um eine kubische Funktion.
Neuer Ansatz: Möglicherweise wäre eine periodische Funktion jedoch angebrachter für den Datensatz als die Regression über eine kubische Funktion. Dabei kommen wir jedoch nicht weiter.
UniProblem1234 Auf diesen Beitrag antworten »
RE: Fiktiver Datensatz - nichtlineare Regression
Nachtrag: Wir arbeiten mit SPSS.
mYthos Auf diesen Beitrag antworten »

.. und ich mit Excel oder Geogebra (!) [CurveExpert kann auch helfen)
-----------
Auf Grund der ersten Sicht auf den Plot erscheinen beide Funktionstypen gleich geeignet.
Man kann daher für beide einmal die Regression durchführen (Methode der kleinsten Summe der Differenzenquadrate) und dann nachsehen, welches Bestimmtheitsmaß (KORREL) günstiger ist.

Mit welchen (allgemeinen) Funktionsgleichungen hast du dies schon getestet?
Kannst du den Datensatz zur näheren Untersuchung mal anhängen ..

mY+
UniProblem1234 Auf diesen Beitrag antworten »

Hallo mYthos,

Danke für deine Antwort. Bisher haben wir eine Kubischeregression durchgeführt und auch ein akzeptables r^2 herausbekommen. Gerne würden wir jedoch, wie gesagt, auch noch die Sinus-Variante testen. Hier kommen wir nur leider nicht weiter da wir nicht herausgefunden haben, wie man das über SPSS lösen könnte. Kennst du eine (einfache) Variante mit Excel?

Händisch haben wir eine ungefähre Sinusfunktion aufgestellt, die wie folgt aussieht: f(x) = 60,6345 * sin (0,01689 *(x-178)) + 67,0739


Anbei findest du den Datensatz.
mYthos Auf diesen Beitrag antworten »

Mit der Datei kann ich nichts anfangen, wie gesagt nicht mit SPSS.
Es genügt einfach eine x-y - Liste der 50 - 60 Zahlenpaare, die hier zu sehen sind (abh/unabh. Variable) bzw. ein exportiertes Excel-Sheet.

mY+
UniProblem1234 Auf diesen Beitrag antworten »

Entschuldige, hatte ich ganz vergessen... Hier eine Excel.
 
 
mYthos Auf diesen Beitrag antworten »

Ich hab's gerade online konvertieren lassen .. (hattest du etwas angehängt?)

mY+
UniProblem1234 Auf diesen Beitrag antworten »

und jetzt auch wirklich mit Anhang.
mYthos Auf diesen Beitrag antworten »

So, jetzt habe ich beide Sheets. Wobei das online konvertierte besser ist, denn in deiner Liste sind die abh. Werte nicht als Zahlen formatiert, das macht aber nichts.

Ich werde mich dann damit beschäftigen. Soviel mal schon, die kubische Regressfunktion hat R² = 0,97, das ist gar nicht so schlecht.

Bis später!

mY+
mYthos Auf diesen Beitrag antworten »

Nun ist die Regression auch mit einer Sinusfunktion durchgeführt worden.
Der Ansatz ist eine parallelverschobene allgemeine Sinusfunktion mit variabler Amplitude, Frequenz (Periodenlänge) und Phasenverschiebung.
Somit lautet sie allgemein.



Damit in Excel das Verfahren mittels des Solvers funktioniert, müssen die Parameter zuerst geschätzt werden, besonders die Frequenz (Variable b ist ca. ), andernfalls konvergiert das Verfahren zu falschen Werten.
Amplitude und Nullpunktsverschiebung sind dagegen leichter einzugrenzen.

Damit resultiert die optimale Funktion als

mit BSTM (Bestimmtheitsmaß) = 0,9818

[attach]47077[/attach]

Zum Vergleich: Die kubische Funktion lautet mit BSTM

Die Sinusfunktion ist etwas besser!

Das XLS ist im ZIP-Archiv.
Have Phun!

[attach]47080[/attach]

mY+
UniProblem1234 Auf diesen Beitrag antworten »

Hallo mYthos!

vielen lieben Dank für deine Mühe!!

Das heißt du hast zuerst deine Werte geschätzt - bis hierhin verstehen wir alles.

Danach bist du durch die Anwendung des Verfahrens des Solvers in Excel auf die optimalen Werte / die optimale Funktion gekommen, die dann die Summe der Diff^2 minimiert?
Kannst du uns kurz erläutern, wie man dabei vorgehen muss? Dieser Prozess ist uns nicht ganz klar.

Liebe Grüße!
Steffen Bühler Auf diesen Beitrag antworten »

Da UniProblem1234 auch nach einem Fourieransatz gefragt hatte, hier meine Anmerkungen dazu: Sinusregression oder andere nichtlineare Regression aus Datensatz im SPSS

Viele Grüße
Steffen
mYthos Auf diesen Beitrag antworten »

@Uniproblem1234
Wie die Regression in Excel allgemein bewerkstelligt werden kann, habe ich kürzlich in einem anderen Thread

https://www.matheboard.de/thread.php?pos...573#post2129573

beschrieben, welcher ohnehin ohne Echo geblieben ist.

Nun wirst du dies vielleicht an Hand des hier mitgelieferten Excel-Sheets nachvollziehen können, dort enthalten ist übrigens auch die kubische Regression.
Den Koeffizient des kubischen Gliedes darf man keinesfalls auf 0,00003 runden, sondern muss 0,0000254 belassen.

Eine Hürde stellt lediglich die Einstellung der Anfangswerte der Iteration dar.
Falls diese Werte zu weit von den erwarteten abweichen, konvergiert die Iteration nicht oder endet auch bei völlig anderen, nicht zutreffenden Parametern.
Daher habe ich daneben die Schätzwerte (Anfangsparameter der Iteration) eingetragen.
Diese kann man alleine dem Graphen des gegebenen Datensatzes entnehmen, wenn man weiss, wie diese in die Kurvenform und die Lage der Sinusfunktion eingehen.

Der Solver wird über das Menu "Extras" (Excel 2003) bzw. "Daten"-"Solver" (Excel 2010) aufgerufen.
Die Zielzelle ist die Summe der quadratischen Abweichungen (im Solver Minimum einstellen), die veränderbaren Zellen sind jene, in denen die Parameterwerte a, b, c d stehen.

Mehr ist es nicht.
Die Iteration wird durch Klicken auf den "Lösen"-Button gestartet.

Bei Unklarheiten bitte weiter fragen.

mY+
UniProblem1234 Auf diesen Beitrag antworten »

Danke für die ausführliche Erklärung!
Jetzt konnten wir alles nachvollziehen und haben das ganze auch selbst hinbekommen - super!

Schönen Abend noch und nochmals lieben Dank...
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »