Bestimmheitsmaß durch den Nullpunkt gezwungen Regression

Neue Frage »

Chris McRaven Auf diesen Beitrag antworten »
Bestimmheitsmaß durch den Nullpunkt gezwungen Regression
Meine Frage:
Hallo an Euch alle,

ich habe eine Frage zum Bestimmtheitsmaß und hoffe Ihr könnt mir da weiter helfen. Ich muss eine lineare Regression durchführen, die durch den Nullpunkt gezwungen wird und dafür soll auch das Bestimmtheitsmaß berechnet werden. Leider habe ich keine Ahnung wie ich das ausrechne. Ich finde auch nicht wirklich eine Formel dazu. Zum Bestimmtheitsmaß gibt es natürlich viel zu finden aber wie berechne ich das wenn meine Regressionsgerade durch den Nullpunkt gezwungen wird?

Meine Ideen:
Zur Info: Ich berechne die Regression in Excel und da es bei Excel Probleme gibt was genau diese forcierte Regression betrifft wollte ich das mal händisch nachrechnen um zu gucken was Excel da so macht.

Ich würde mich sehr freuen und wäre dankbar wenn mir hier weitergeholfen werden kann mit einer Formel und evtl ein paar Erläuterungen dazu (bin echt kein Statistiker :P )
mYthos Auf diesen Beitrag antworten »

Da Excel die Trendanalyse mit der Methode der kleinsten Summe der Differenzenquadrate berechnet, kann dies im Allgemeinen für jeden beliebigen Funktionstyp manuell durchgeführt werden.
Die Koeffizienten der Regressfunktion werden dabei mittels des SOLVERS ermittelt.
Daher muss man nicht auf die Trendfunktion für die wenigen auswählbaren Typen zurückgreifen.
Für den Korrelationskoeffizient gibt es die Excel-Funktion KORREL (das BSTMaß ist abhängig davon)

Jedenfalls ist dies hier eine interessante Frage, die man sich genauer ansehen müsste.
Zunächst ein schon älterer Link

--> http://www.herber.de/forum/archiv/780to7...Regression.html

Dort wird die RGP-Funktion verwendet. Die Erklärung zur RGP-Funktion:

--> https://support.office.com/de-de/article...7a-fa7abf772b6d

Schaue zunächst, ob du damit etwas machen kannst.
Gut wäre es, du hättest eine Reihe von Messwerten, an Hand derer man das Ganze einmal durchspielen kann.

mY+
Huggy Auf diesen Beitrag antworten »

Wenn man "Trendlinie einfügen" benutzt, gibt es die Option "Schnittpunkt". Damit kann man den Schnittpunkt der Trendlinie mit der y-Achse definieren. Das Bestimmtheitsmaß, sofern ausgewählt, bezieht sich dann auf diese spezielle Trendlinie.
Chris McRaven Auf diesen Beitrag antworten »

Zitat:
Original von Huggy
Wenn man "Trendlinie einfügen" benutzt, gibt es die Option "Schnittpunkt". Damit kann man den Schnittpunkt der Trendlinie mit der y-Achse definieren. Das Bestimmtheitsmaß, sofern ausgewählt, bezieht sich dann auf diese spezielle Trendlinie.


Leider stimmt in diesem Fall das Bestimmtheitsmaß nicht unglücklich

Hier sind ein paar Beispiel Werte:
x | y
1 | 10
2 | 9
3 | 7
4 | 3
5 | 1

Benutzt man die graphische Analyse so erhält man ein Bestimmtheitsmaß von -1,68 was ja theoretisch nicht möglich ist.

Die RGP Funktion ist die, welche ich gerne auf Richtigkeit des Ergebnisses überprüfen würde smile


Ich habe dazu diesen Artikel gefunden:
http://www.excel4managers.de/index.php?p...nkt-xy-diagramm

leider kann ich daraus nicht herauslesen, ob es in der Excel Version 2010 noch unstimmigkeiten in der RGP Funktion gibt oder nicht unglücklich
HAL 9000 Auf diesen Beitrag antworten »

Zitat:
Original von Chris McRaven
Hier sind ein paar Beispiel Werte:
x | y
1 | 10
2 | 9
3 | 7
4 | 3
5 | 1

Bei diesen speziellen Daten eine durch den Ursprung gezwungene Regressionsgerade zu betrachten hat schon was exotisches. Big Laugh
Huggy Auf diesen Beitrag antworten »

Zitat:
Original von Chris McRaven
Leider stimmt in diesem Fall das Bestimmtheitsmaß nicht unglücklich

Das ist interessant. Diesen Bug kannte von Excel kannte ich nicht. Ich habe Excel 2007 und da ist er noch vorhanden, wie ich bei Benutzung deines Beispiels sehe.

Die Funktion RGP liefert bei Vorgabe eines Durchgangs durch den Nullpunkt ein anderes Ergebnis für das Bestimmtheitsmaß als die Option Trendlinie einfügen. Mir ist aber nicht klar, wie RGP den Wert berechnet. Die übliche Berechnung des Bestimmtheitsmaßes ist offenbar sinnlos, wenn man den y-Achsenabschnitt vorgibt.

Edit: Habe herausgefunden, wie RGP bei dieser Nebenbedingung rechnet. Das stimmt mit einer Definition des Bestimmtsheitsmaßes unter einer solchen Nebenbedingung überein, die ich in einem alten Buch gefunden habe.
 
 
Leopold Auf diesen Beitrag antworten »

Zitat:
Original von Huggy
Zitat:
Original von Chris McRaven
Leider stimmt in diesem Fall das Bestimmtheitsmaß nicht unglücklich

Das ist interessant. Diesen Bug kannte von Excel kannte ich nicht.


Jetzt hoffen wir nur, daß die NASA, die NSA, die Hersteller oder Betreiber von Atombombern, Flugzeugen, Kraftwerken, Chemieanlagen, Beförderungssystemen und so weiter für ihre Berechnungen nicht auf EXCEL zurückgreifen. Wir hoffen es. Befürchten tue ich etwas anderes.
mYthos Auf diesen Beitrag antworten »

Ob das ein Bug ist, mag dahingestellt bleiben. Ein negatives Bestimmtheitsmaß könnte ein korrigiertes Bestimmtheitsmaß darstellen, welches mit einem "Strafterm" belegt ist.
In besondern Fällen können somit auch negative Werte entstehen.
Näheres über dieses komplexe Sachgebiet ist der Literatur zu entnehmen.

Jedenfalls könnte es anzeigen, dass die Daten nicht nur unkorreliert sind (r²=0), sondern in einem völlig irrationalen (imaginären) Missverhältnis zueinander stehen.

Mit der von Chris angegebenen Messreihe einen Nulldurchgang erzwingen zu wollen, dürfte - wie auch schon von Hal angedeutet - unsinnig sein.

Wenn man die Reihe der Messwerte "umdreht", kann eher eine Korrelation hergestellt werden.
Bei der Erstellung der Trendlinie in Excel kann nicht nur y = 0 gesetzt, sondern auch die Linie vorwärts oder rückwärts fortgesetzt werden.
Wir erhalten dann (auch unter Einbeziehung der neuen Punkte) eine "vernünftige" Trendfunktion.

[attach]41237[/attach]

mY+
Chris McRaven Auf diesen Beitrag antworten »

Durch solche Daten würde ich das im Prinzip auch nicht machen smile

Hab das Beispiel aus dem Artikel, für den ich den link in meinem vorrigen Beitrag gepostet habe, um zu verdeutlichen, dass für die RGP Funktion und für die Trendlinie unterschiedliche Ergebnisse erzeugt werden. Es kommt mir ja nicht darauf an ob R² negativ ist sondern eher darauf, dass die Werte unterschiedlich sind und ich mich frage, ob ich der RGP Funktion für meine Datenanalyse (für meine Bachelorarbeit) trauen kann smile
Huggy Auf diesen Beitrag antworten »

Wie ich schon sagte, liefert die RGP-Funktion bei diesem Beispiel ein Ergebnis für das Bestimmtsheitsmaß, nämlich 0.33, welches mit einer Formel aus einem Buch für das Bestimmtheitsmaß bei Regression unter einer solchen Nebenbedingung übereinstimmt. Das spricht dafür, dass RGP im Unterschied zu der Option bei Trendlinie einfügen ein korrektes Ergebnis liefert.
Chris McRaven Auf diesen Beitrag antworten »

Ja vielen Dank Freude

Kannst Du die Formel hier posten? Mich würde interessieren wie die dann aussieht bzw. wie die sich zusammensetzt. Ich hab nämlich leider keine Formel für diesen Fall gefunden.

Mir hilft selber rechnen immer dabei das nachvollziehen zu können.
Huggy Auf diesen Beitrag antworten »

Zitat:
Original von Chris McRaven
Mir hilft selber rechnen immer dabei das nachvollziehen zu können.

Das ist eine sehr vernünftige Einstellung!

Mir erscheint es wichtig, zu verstehen, dass und weshalb die übliche Definition des Bestimmtheitsmaßes für die lineare Regression ohne Nebenbedingung nicht einfach auf die lineare Regression mit vorgegebenem y-Achsenabschnitt übertragen werden kann. Ohne Nebenbedingung wird das Bestimmtheitsmaß üblicherweise auf eine Aufspaltung der Streuung der gegebenen y-Werte um ihren Mittelwert in eine Streuung der gegebenen y-Werte um die Regressionsgerade (die nicht durch die Regression erklärte Streuung) und eine Streuung der mit der Regressionsgeraden berechneten y-Werte um den Mittelwert (die durch die Regressionsgerade erklärte Streuung) zurückgefiührt.



Mit dieser Aufspaltung wird das Bestimmtheitsmaß definiert als der relative Anteil der erklärten Streuung an der Gesamtstreuung.



Bei der einfachen linearen Regressions (nur eine unabhängige Variable) ist diese Definition äquivalent zu einer Definition als Quadrat des Korrelationskoeffizienten.

Schaut man sich (1) an, ist gar nicht offensichtlich, weshalb diese Gleichung gilt. Tatsächlich gilt diese Gleichung auch nicht für eine beliebige Regressionsfunktion. Sie gilt nur, wenn die Regressionsgerade ohne Nebenbedingung mit der Methode der kleinsten Quadrate bestimmt wird. Wird bei der Regression der y-Achsenabschnitt vorgegeben, gilt diese Gleichung nicht mehr. Man kann dann auch das Bestimmtheitsmaß nicht mit ihrer Hilfe definieren.


Das Bestimmtheitsmaß bei linearer Regression mit vorgebenem y-Achsenabbschnitt wird anscheinend nur selten behandelt. Ich habe nur eine Quelle dazu gefunden. Dort wird ausgeführt, dass in diesem Fall Gleichung (1) wieder gilt, wenn man in ihr durch ersetzt. Nach dieser Modifikation wird dann das Bestimmtsmaß wieder über (2) definiert. Die Excel-Funktion RGP folgt anscheinend dieser Definition. Dabei gestattet RGP nicht die freie Wahl von sondern lässt nur zu.
Chris McRaven Auf diesen Beitrag antworten »

Entschuldigung für die späte Reaktion aber vielen Dank für die ausführliche Antwort Freude

Allerdings habe ich noch einige Fragen dazu:

- Wenn ich das richtig verstanden habe sagt Formel 1 aus, dass die Gesamtstreuung = nicht erklärte Streuung + erklärte Streuung ist. Soweit so gut. Formel 2 sagt aus, so wie ich das verstanden habe, dass r² = erklärte Streuung / Gesamtstreuung ist warum ist der Zähler dann nicht gleich dem Term nach dem Pluszeichen in Formel 1?

- Wenn man in Formel eins durch (also in meinem Fall 0) tauschen muss, gilt das dann auch so einfach für Formel 2? Oder muss man da noch mehr umstellen?

- kannst du die Quelle nennen? das ganze ist für meine Bachelor Arbeit und evtl nutze ich die Formel dann auch. Es wäre dann gut wenn ich einen Anhaltspunkt hätte in welchen Buch man das nachschlagen kann (vllt steht das ja zufällig auch in der Bibliothek) smile
Huggy Auf diesen Beitrag antworten »

Zitat:
Original von Chris McRaven
warum ist der Zähler dann nicht gleich dem Term nach dem Pluszeichen in Formel 1?

Ist er doch!

Zitat:
- Wenn man in Formel eins durch (also in meinem Fall 0) tauschen muss, gilt das dann auch so einfach für Formel 2?

Ja.

Zitat:
- kannst du die Quelle nennen? das ganze ist für meine Bachelor Arbeit und evtl nutze ich die Formel dann auch. Es wäre dann gut wenn ich einen Anhaltspunkt hätte in welchen Buch man das nachschlagen kann (vllt steht das ja zufällig auch in der Bibliothek) smile

Ich habe das hier gefunden:

Kurt Stange
Angewandte Statistik
Band 2
Seite 154 ff.

Das Buch ist aus dem Jahr 1971. In Bibliotheken sollte es auftreibbar sein.
Chris McRaven Auf diesen Beitrag antworten »

Zitat:
Original von Huggy
Zitat:
Original von Chris McRaven
warum ist der Zähler dann nicht gleich dem Term nach dem Pluszeichen in Formel 1?

Ist er doch!


Ok ich war vom i im Index des Mittelwertes abgelenkt das sollte da wahrscheinlich nicht hin (Mittelwert mit durchlaufender Nummer wäre in diesem Fall ja auch merkwürdig).


Ich denke jetzt hab ichs. Zumindest bekomme ich für einige Testzahlen für die RGP Funktion in Excel das gleiche raus wie mit der Formel (unter Verwendung der Steigung, welche von der RGP Funktion geliefert wird).


Ich danke Euch (insbesondere Huggy) für eure Mühen!
Huggy Auf diesen Beitrag antworten »

Zitat:
Original von Chris McRaven
Ok ich war vom i im Index des Mittelwertes abgelenkt das sollte da wahrscheinlich nicht hin (Mittelwert mit durchlaufender Nummer wäre in diesem Fall ja auch merkwürdig).

Ach ja, da hatte sich ein Dreckfuhler eingeschlichen. Werde ihn korrigieren.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »