Signifikante Veränderung eines Kurvenverlaufs erkennen

Neue Frage »

stangmat Auf diesen Beitrag antworten »
Signifikante Veränderung eines Kurvenverlaufs erkennen
Hallo!
Ich bin auf dem Gebiet der Statistik und Mathematik ein absoluter Laie, stehe nun aber vor einem statistischen Problem bei dem ich hoffe hier unter Experten Hilfe zu finden.
gemittelt
Das Grundproblem ist folgendes:
Ich habe eine Kurve die einen Signalverlauf über die Zeit darstellt x(t). Also z.B. eine Kurve über 10 Sekunden bei der zu jedem Messzeitpunkt (z.B. 10 x pro Sekunde) ein Amplitudenwert gemessen wurde. Nun bin ich auf der Suche nach einer Methode, um eine Aussage liefern zu können, ob sich das Signal/die Kurve zu einem ganz bestimmten Messzeitpunkt SIGNIFIKANT von einem "Referenzintervall" unterscheidet. Beispielsweise sollte eine Aussage getroffen werden können, ob sich der Messwert zum Zeitpunkt t=5.1 (ein Amplitudenwert) signifikant vom Signal zwischen Sekunde 3 und 4 (10 Amplitudenwerte) unterscheidet.

Wichtig dabei ist dabei eventuell auch folgende Information: die Kurve ist eine Mittelung aus mehreren Einzelkurven. Es gibt also für jeden Messzeitpunkt tatsächlich mehr als einen Amplitudenwert, diese werden dann aber zu einer einzigen Kurve gemittelt.

Was mir bisher eingefallen ist, wäre die Messwerte des Referenzintervalls (z.B. 10 Werte zwischen Sekunde 3 und 4) als Zeitreihe zu nehmen und den einzelnen Wert zum Zeitpunkt 5.1 in die Zeitreihe mit aufzunehmen und damit einen Test auf Ausreißer (z.B. Grubbs Test for Outliers) zu rechnen. Wenn der Wert als Ausreißer erkannt wird, so ist er signifikant vom Referenzintervall abweichend, ansonsten nicht.
Ich denke aber dass ich mit meinem Wissen hier nicht viel weiter komme. Ich hoffe sehr dass jemand mein Problem durchschaut hat und mir helfen kann.
beste Grüße,
Matthias
stangmat Auf diesen Beitrag antworten »

Hallo nochmal,

ich versuche das Problem noch mal etwas anders und verständlicher zu beschreiben, ein anderes Zahlenbeispiel dazu anzugeben und ein paar zusätzliche Ergänzungen zu beschreiben:

Ich habe 20 ähnliche Kurven die jeweils einen Signalverlauf über die Zeit darstellen x1(t), x2(t), ... , x20(t). Jede dieser Kurven ist exakt 100 Sekunden lang und enthält pro Sekunde einen Messwert/Amplitudenwert.
Diese 20 Kurven werden nun zu einer einzigen Kurve gemittelt (also sozusagen für jeden Messzeitpunkt t die Mittelung der 20 Messwerte) und ich erhalte somit eine mittlere Kurve x(t).

Nun bin ich auf der Suche nach einer statistischen Auswertemöglichkeit, die mir folgende Aussage ermöglicht: Ist der Messwert der Kurve x(t) zu einem bestimmten Zeitpunkt (z.B. zu Sekunde 70) signifikant abweichend (höher oder geringer) von den Messwerten eines bestimmten Referenzintervalls (z.B. Sekunde 30-40)?
Also anders formuliert: Unterscheidet sich der Messwert zum Zeitpunkt t = 70 signifikant von den Messwerten zwischen t = 30 bis t = 40? Ist das Signal also signifikant angestiegen oder abgefallen?

Was mir bisher eingefallen ist, wäre die Messwerte des Referenzintervalls (z.B. 10 Werte zwischen Sekunde 30 und 40) als Zeitreihe zu nehmen und den einzelnen Wert zum Zeitpunkt 70 in die Zeitreihe mit aufzunehmen und damit einen Test auf Ausreißer (z.B. Grubbs Test for Outliers) zu rechnen. Wenn der Wert zu t = 70 als Ausreißer erkannt wird, so ist er signifikant vom Referenzintervall abweichend, ansonsten nicht.

Noch einer meiner Gedanken zu dem Thema: Falls es ein Problem ist, dass der Messwert zum Zeitpunkt t = 70 ja nur EINEN Messwert darstellt, könnte man vielleicht die Tatsache irgendwie nutzen, dass dieser eine Messwert ja aus 20 Werte gemittelt wurde...?


Sollte es tatsächlich keine geeignete Möglichkeit geben, einen einzelnen Amplitudenwert auf "Unterschiedlichkeit" zu einem Referenzintervall zu untersuchen, so wäre für mich auch ein anderer Ansatz denkbar: Unterscheidet sich das Signal zwischen ZWEI Intervallen signifikant? Also z.B.: Unterscheiden sich die Messwerte zwischen den Zeitpunkten t=30 und t=40 von den Messwerten zu den Zeitpunkten t=65 und t=75. Wäre dieser Ansatz besser bzw. wäre das eine Möglichkeit das Problem zu lösen? Ideal wäre allerdings die erste (obere) Fragestellung (1 Wert verglichen zu Intervall).

beste Grüße,
Matthias
JPL Auf diesen Beitrag antworten »

HI stangmat,

ein Test x(t) ist sig. verschieden von einem Referenzintervall R=[x(m)-x(n)] (t>n>m) kannst du folgendermassen machen:

Für jeden Punkt x(y) in R hast du 20 Werte, also kannst du für die gemittelte Kurve in R ein Konfidenzband zum gewüsnchten Niveau (z.B. 95%) angeben und dieses fortschreiben. Liegt x(t) nicht drin, liegt dieser im Mittel höher/niegdriger als der erwartete Wert. (prognoseintervall: http://web.neuestatistik.de/inhalte_web/...comp_37413.html)

wenn du einfach nur wissen willst, ob der Wert an x(t) größer/kleiner als der Mittelwert von R ist, kannst du einfach alle Werte von R mit allen Werten von x(t) vergleichen.

Grüße,
JPL
stangmat Auf diesen Beitrag antworten »

Hi JPL,
erstmal vielen Dank für die Antwort und den tollen Tip - das mit dem Konfidenzintervall ist - finde ich - ein sehr guter Lösungansatz! Eines ist mir in deiner Erkärung aber etwas unklar: du hast geschrieben "ein Konfidenzband zum gewüsnchten Niveau (z.B. 95%) angeben und dieses fortschreiben"; was meinst du mit "fortschreiben"?

Inzwischen hab ich mir noch einen weiteren Lösungsansatz überlegt, falls du/jemand hierzu Einwände/Anregungen/Anmerkungen hat würd ich mich darüber freuen:
Ich würde einen 2sample-ttest rechnen. Und zwar besteht ja die Kurve x(t) aus 20 Einzelkurven. Ich mittle für jede der Einzelkurven die Amplitude im Referenzintervall (das heißt ich bekomme für das Referenzintervall 20 "gemittelte" Amplitudenwerte) und der Messwert zum zeitpunkt t=70 setzt sich ebenfalls aus 20 Amplitudenwerten zusammen. Ich rechne also einen ttest der 20 Werte des Referenzintervalls VS. der 20 Werte zum Zeitpunkt t=70.

Würde etwas dagegensprechen?

beste Grüße, Matthias
JPL Auf diesen Beitrag antworten »

Hi stangmat,

mit fortschreiben meinte ich, dass man das Konfidenzband für den gewünschten Bereich ermittelt und zum vergleich verwendet. Das ist eine Art fortschreibung/Prognose, weil das Konfi ja nur aus den Punkten von R ermittelt wird. Deswegen st es wichtig, ein Prognoseintervall zu berechnen.
Dein 2. ansatz ist dasselbe, was ich auch als 2. meinte. Es hat eine andere Fragestellung zu beantworten, nämlich einen Unterschied der Werte an sich und nicht (wie beim anderen Ansatz), ob die gemessenen Werte einer weiterentwicklung gemäß der Werte aus R entsprechen.
Wenn z.B. zwischen R und x(t) ein großer abstand ist, die Werte sich aber linear weiterentwickeln, kann man durchaus einen sig. unterscheid haben, aber im Grunde entsprechen die werte bei x(t) nur der erwartung, die man aus R ableiten würde. Du verlierst mit dem 2. ansatz also die Info der entwicklung, bzw. des zeitlichen Abstandes.
Es ist also - wie immer - eine Frage desse, was du wissen willst.
Viele Grüße,
JPL
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »