Regressionsanalyse mit Excel

Neue Frage »

Freshi Auf diesen Beitrag antworten »
Regressionsanalyse mit Excel
Edit (mY+): Hilfeschreie - vor allem in der Überschrift - sehen wir gar nicht gerne. Diese werden gestrichen! Bitte in Hinkunft davon abzusehen.

Hallo zusammen!

Vorweg: Ich bin ne ziemliche Null in Mathe, sowie in der Arbeit mit Excel.
Hoffentlich könnt ihr mir trotzdem helfen.

Ich habe folgendes Problem:
Für meine medizinische Dissertation möchte ich eine Regressionsanalyse und Korrelationsanalyse mit Excell durchführen.
Mit der Korrelation hatte ich keine Probleme, bei der Regression mangelt es mir an der Interpretation der Ergebnisse.
Ich untersuche bei einer genetischen Erkrankung den Zusammenhang der Ausprägung eines Symptoms mit der Ausprägung von anderen.

In meinem Excel Sheet gibt es für jeden Patienten eine Zeile mit verschieden Spalten für die Zahlenwerte der unabhängigen bzw. abhängigen Variablen.
Ich starte also mit der ersten Regressionsanalyse zu einer abhängigen Variablen mit 11 Patienten:

Werte:

unabhängige Variable: 0,39 ; 0,45 ; 0,47 ; 0,53 ; 0,53 ; 0,3 ; 0,43 ; 0,89 ; 0,6 ; 0,6 ; 0,38

abhängige Variable: 3,1 ; 2,4 ; 2,8 ; 2,8 ; 3,0 ; 3,0 ; 3,5 ; 2,8 ; 2,6 ; 2,7 ; 1,9

Ich gebe in den Y-Eingabebereich die Zellen für die abh. Variable ein und in den X-Bereich die Zellen für die unabh. Variable.
Das Konfidenzniveau setze ich auf 95%.

Nun mein Problem: Ich verstehe die Auswertung nicht!

Ich erhalte 2 Zeilen: In der einen steht Schnittpunkt in der andern X Variable 1
Für Schnittpunkt erhalte ich: t-Statistik: 6,15 und P-Wert: 0,00016
Für XVariable1: t-Statistik -0,077 und P-Wert: 0,9396

Kann mir jmd erklären was diese Werte genau bedeuten? Habe ich nun etwas signifikantes herausgefunden, oder nicht?
Dankbar wäre ich auch, wenn mit jmd. dieses komplette Auswertungsblatt erklären könnte (Was Bedeutet "Freiheitsgerade", "Bestimmtheitsmaß"?)

Vielen Dank für eure Hilfe!
mYthos Auf diesen Beitrag antworten »

Aus deiner Messreihe werde ich nicht schlau. Denn die Messwerte sind ziemlich ungewöhnlich, so kann niemals eine Funktion zustande kommen. Du hast zu zwei gleichen x-Werten verschiedene y-Werte, und das gleich zwei Mal. Sortiert ist das Ganze auch nicht, aber das ist noch das Wenigste. Auch ein Trend kann nicht erkannt werden.

Oder soll vielleicht eine rein statistische Auswertung gemacht werden, keine Regressionsanalyse? Darauf deutet das Konfidenzintervall (Niveau) hin. Korrelation ist wiederum ein Merkmal für die Übereinstimmung zweier Funktionsreihen bei der Regression. Allerdings wüsste ich nicht, wohin deine Reihe sonst "regressiert" werden sollte.

Vielleicht kann mal ein Stochastik-Spezialist darüber schauen ...

mY+
Freshi Auf diesen Beitrag antworten »

Das ich für zwei x-Werte (Symptom A) unterschiedliche y-Werte habe (Symptom b) ist ja nachvollziehbar!?

Eine statistische Auswertung soll tatsächlich gemacht werden.
Aber ich dachte die Regression sei teil davon.

Ich fühl mich grad echt überfordert unglücklich
mYthos Auf diesen Beitrag antworten »

Zitat:
Original von Freshi
Das ich für zwei x-Werte (Symptom A) unterschiedliche y-Werte habe (Symptom b) ist ja nachvollziehbar!
...

Für mich nicht, wenn es sich um x/y - Punkte einer zusammenhängenden Messreihe handelt. Vorstellbar sind zwei unterschiedliche, voneinander unabhängige Reihen von Messergebnissen. Diese hier wären aber hier hinsichtlich eines direkten Vergleiches sehr verschieden.

Aber wie gesagt, ich muss da ohnehin abgeben.

mY+
Zellerli Auf diesen Beitrag antworten »

edit: Ich versuche dann mal zu übernehmen Augenzwinkern

Habe sowas mit Excel noch nicht gemacht. Ich lege dir Origin ans Herz.
Außerdem solltest du dir unbedingt noch etwas Wissen aneignen zur Fehlerrechnung und Statistik. Immerhin handelt es sich um eine Dissertation!

Mal ein paar Anmerkungen:

Die Wertepaare, die du doppelt gemessen hast musst du mitteln. Dabei sinkt natürlich der Fehler, bzw. das Gewicht des Messwertes steigt (welchen Fehler haben deine Daten?).

Der p-Wert ist die Wahrscheinlichkeit dass unter Voraussetzung einer gewissen Verteilung (in der Medizin meist eine Gleichverteilung, aber ich kenne deine Versuchsanordnung nicht), ein Ergebnis wie du es vorliegen hast, auftritt.
Das heißt, wenn der p-Wert 94% beträgt (wie es wohl bei dir der Fall ist), bedeutet das, dass mit einer Wahrscheinlichkeit von 94% dein Messergebnis oder ein extremeres Auftritt.
Bei einem Niveau von 5% (also 95% "Sicherheit" schlampig formuliert), wie du es voraussetzt, muss dein Text einen p-Wert von weniger als 5% liefern.
In sofern hast du nicht die Nullhypothese (also die Gleichverteilung oder je nachdem was du vorausgesetzt hast) verworfen.

Die t-Statistik ist wohl der t-Wert deiner Messreihe.
Es wird dabei eine Student-t-Verteilung vorausgesetzt und nachher ausgespuckt, was der t-Wert beim Hypothesentest ist.
Die Freiheitsgrade sind grundsätzlich erstmal , wobei die Anzahl deiner Messwerte angibt. Für jeden Parameter der t-Verteilung, den du aus den Messwerten entnimmst, sinken die Freiheitsgrad um 1.

Das Bestimmtheitsmaß (ich nenne es mal ) hängt mit dem Korrelationskoeffizienten zusammen. Soweit mir bekannt gilt bei der Regression mit nur einer freien Variablen .

Alles mal googlen und nochmal gründlich nachlesen.

Du solltest die Regression angesichts so weniger Werte ruhig "per Hand" durchführen. Es ist wirklich kein schweres Thema, nur wenn du mit den komplizierten Begriffen beginnst (also das Pferd von hinten aufzäumst), wird es unnötig schwer.

Dazu empfehle ich immer wieder die Fehlerrechungsvorlesung meines ehemaligen Professors Ossau, die gut gegliedert, nicht unnötig ausschweifend und verständlich auch anhand von Beispielen die wichtigen Themen erklärt.
Für dich sind dabei relevant: Regression, Korrelation, Signifikanztest, t-Verteilung, Konfidenzintervalle
tigerbine Auf diesen Beitrag antworten »

Ich möchte, da es sich um eine Dissertation handelt, auch noch auf den ink in diesem Post verweisen. Eine genaue Untersuchung deines Problems geht schnell über das hinaus, was man in einem Board leisten kann.
 
 
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »