An Messdaten angepasste Funktion + Konfidenzintervall?

Neue Frage »

kitterich Auf diesen Beitrag antworten »
An Messdaten angepasste Funktion + Konfidenzintervall?
Hallo liebe Mitglieder,

zur Zeit stecke ich in meiner Bachelorarbeit (Maschinenbauer) und komme an einer Stelle nicht so recht weiter.
Zunächst einmal einen kurzen Überblick, worum es geht:

Ausgewertet wurden Wirkungsgraddifferenzen einer Dampfturbine (Quasi die prozentuale Abnahme des Wirkungsgrades über die Zeit). Die Datenmenge ist mit über 250.000 Daten recht groß geraten. An diese Daten soll eine Funktion angepasst werden, mit der eben jener Wirkungsgradabfall dargestellt werden kann.

Zur Vorgehensweise:
Das Programm, mit welchem die Anpassung geschehen soll, packt leider nicht mehr als ~1500 Daten.Zur Schmälerung der Daten habe ich deshalb zunächst einmal die ursprünglichen Daten in "Klassen" unterteilt - heißt nichts anderes als eine Einteilung in Zeitintervalle. Innerhalb dieser Klassen wurde der Mittelwert und die Standardabweichung gebildet. Ferner wurde jede Klasse auf Normalverteilung untersucht (Kommt ohne Ausnahme hin). Die gebildeten Mittelwerte sind meine Datenpunkte, an die die Funktion angepasst werden soll

Dann kommt das Fitting: Als Ausgangsfunktion dient mir die Funktion f(t):

f(t)= a(1) * (1- exp( a(2) * x)

a(1) und a(2) sind die Koeffizienten, die durch das Programm angepasst werden.
Die ausgegebene Funktion liegt natürlich über- und unterhalb 50% aller Punkte (roundabout).
Nun kommt des Pudels Kern:
Ich möchte für DIESE FUNKTION ein Konfidenzintervall (95%) angeben, um sagen zu können, dass sich die Messwerte mit einer 95%-igen Wahrscheinlichkeit innerhalb dieser Funktion (bzw. unterhalb des Funktionsasts) befinden.

Was ich bisher gemacht habe:
Ich habe die Standardabweichungen zusammengefasst (=
1.Summe der Standardabweichunge zum Quadrat (Varianz)
2. geteilt durch Anzahl n der Messdaten
und
3.anschließend Wurzel gezogen um wieder auf Standardabweichung zu kommen). Somit erhalte ich für alle Messreihen genau eine Standardabweichung. Diese habe ich mit 1,96 multipliziert (95%-Konfidenzintervall, da großes n) und anschließend auf die Mittelwerte aufaddiert und das Fitting einfach erneut durchgeführt. Meine Idee war, dass dadurch die Funktion eine Art "Konfidenzband" annehmen würde. Ich denke aber nicht dass man das so einfach machen kann, oder?

Hat jemand eine fixe Idee, wie ich mit diesem Problem umgehen kann?
Wie gesagt, es soll darum gehen, eine angepasste Funktion mit einem Konfidenzband (95%) zu "beaufschlagen".

Für Hilfe wäre ich wirklich dankbar.

PS: Ich hoffe die Problematik war halbwegs verständlich

LG Stefanus
HAL 9000 Auf diesen Beitrag antworten »
RE: An Messdaten angepasste Funktion + Konfidenzintervall?
Zitat:
Original von kitterich
Ich habe die Standardabweichungen zusammengefasst (=
1.Summe der Standardabweichunge zum Quadrat (Varianz)
2. geteilt durch Anzahl n der Messdaten
und
3.anschließend Wurzel gezogen um wieder auf Standardabweichung zu kommen). Somit erhalte ich für alle Messreihen genau eine Standardabweichung. Diese habe ich mit 1,96 multipliziert (95%-Konfidenzintervall, da großes n) und anschließend auf die Mittelwerte aufaddiert und das Fitting einfach erneut durchgeführt. Meine Idee war, dass dadurch die Funktion eine Art "Konfidenzband" annehmen würde. Ich denke aber nicht dass man das so einfach machen kann, oder?

1.Es steht und fällt damit, ob dein Modell wirklich auch zu den Daten passt:

Das bedeutet u.a., dass die Residuen (=Differenz zwischen gemessenen und gemäß berechneten Werten) tatsächlich näherungsweise normalverteilt sind (was man testen kann, etwa mit Kolmogorov-Smirnov).


2.Du könntest natürlich auch schlicht die 250000 Residuen ordnen und die empirischen 2.5%- sowie 97.5%-Quantile als Bandbegrenzung nehmen, dann bist du nicht auf normalverteilte Residuen angewiesen, hast aber den Sortieraufwand - sollte aber mit heutiger Computer-Leistung auch bei 250000 Werten kein Problem sein. Augenzwinkern
kitterich Auf diesen Beitrag antworten »
RE: An Messdaten angepasste Funktion + Konfidenzintervall?
Also:
Ich habe die angepasste Funktion f(x) genommen und die Differenz zu den Messdaten erstellt. Die erhaltenen Ergebnisse habe ich via Minitab auf Normalverteilung untersucht (insgesamt drei Testvarianten, unter anderem nach Kolmogorov). Es stellt sich heraus, dass die Residuen NICHT normalverteilt sind (wie zu erwarten war, da die Funktion vorgegeben).
Heißt das, dass ich nicht mit der Standardrechnung rechnen darf um mein Konfidenzintervall zu bestimmen?

Wie war das mit dem manuellen Setzen der Quantile gemeint?
Messdaten der Größe nach ordnen, Median bilden und dann die Grenzen bestimmen habe ich verstanden. Aber wie drücke ich das als Konfidenzband für die Funktion aus?

Für Hilfe wäre ich sehr dankbar!
HAL 9000 Auf diesen Beitrag antworten »

Zitat:
Original von kitterich
Messdaten der Größe nach ordnen, Median bilden und dann die Grenzen bestimmen habe ich verstanden.

Wieso Median? Nein, wie ich bereits geschrieben hatte: Als untere Grenze das 2.5%-Quantil und als obere Grenze das 97.5%-Quantil der Residuen. Das ist dann nicht notwendig symmetrisch nach oben/unten, aber es definiert ein passendes Band um deine Anpassungsfunktion.

http://de.wikipedia.org/wiki/Empirisches...ischer_Quantile
kitterich Auf diesen Beitrag antworten »

Wenn ich die Quantile bestimme, dann erhalte ich doch einen Wert, der mir sagt, dass 95% aller Daten darunter liegen oder? Wie kann ich das denn mit meiner Funktion verknüpfen?
Das ganze soll so aussehen wie in dem Bild im Anhang.
Wie wurden denn die Linien ober- und unterhalb der Regressionskurve erstellt und wie kommt man an die Konfidenzbänder, die das ganze einhüllen?

Das Netz hilft mir bei meinem Problem leider nicht wirklich weiter...
HAL 9000 Auf diesen Beitrag antworten »

Ich sag jetzt zum dritten und allerletzten Mal, wie ich es meine:

Nicht die Quantile der Daten betrachten, sondern die Quantile der Residuen

.

Das sind dann z.B. das 2.5%-Quantil und das 97.5%-Quantil , dann hast du doch in dem Band die gewünschten 95% der Werte!!!


Ich sag ja gar nicht, dass das der Weisheit letzter Schluss ist, aber zumindest zu diesem Weg sollte doch nun endlich mal klar sein, wie es gemeint ist.
 
 
kitterich Auf diesen Beitrag antworten »

Ich habe dich da schon verstanden und auch der Rechenweg ist mir einleuchtend!
Das Problem an der Sache ist doch folgendes:

Wenn ich anhand der Residuen die Quantile bilde, dann erhalte ich ja für die untere und obere Quartilsgrenze einen konkreten Wert, richtig?

Wenn ich dann hergehe und sage:





addiere ich auf die Funktion doch immer den gleichen Wert, nämlich bzw. . Das Bild oben im Anhang (letzter Beitrag) vermittelt mir aber, dass in diesem Fall nicht nur EIN Wert aufaddiert wurde, da ja der Abstand zwischen der eigentlichen Funktion und der Grenze des Konfidenzbands variiert (Sprich das Band ist an einigen Stellen schmaler und an manchen weiter).
Das ist es, was ich nicht nachvollziehen kann.
HAL 9000 Auf diesen Beitrag antworten »

Das wusste ich ja nicht, dass du genau dieses Verhalten nachbilden willst - ich war davon ausgegangen, dass du nur ein mögliches und passendes Band haben willst. Wenn du eine andere Bandbreite dynamisch angepasst an haben willst, dann musst du das bei der Residuenstatistik eben einfließen lassen:

Wenn diese Breite z.B. proportional zu sein soll, dann betrachtest du eben die Quantile von statt (wie oben von mir beschrieben) direkt von . Selbstverständlich kannst du auf diese Weise auch andere Dynamikprofile abhängig von bzw. auf diese Weise einsetzen.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »