Berechnung der Übereinstimmung zweier Kurven

11.03.2019, 12:04

Laale

Auf diesen Beitrag antworten »

Berechnung der Übereinstimmung zweier Kurven

Hallo,

ich habe mich schon ein wenig eingelesen, aber noch nichts gefunden, was mein "Problem" löst.

Ich befasse mich zur Zeit damit, zwei Kurven zu vergleichen.
Kurve A ist die Referenzkurve, Kurve B meine ermittelte Kurve. Die Kurven verlaufen jeweils linear, haben aber verschiedene Steigungen. Die Werte sind metrisch.

Habe schon daran gedacht, dass euklidische Distanzmaß zu berechnen.
Mein Wunsch wäre es aber, eine Verschiebung oder Ähnlichkeit in Prozent oder zwischen 0 und 1 anzugeben.

Wahrscheinlich müsste ich dazu die Werte der Kurven mit dem jeweiligen Maximalwert der Kurven normieren?

Ein weiterer Wunsch wäre, die Richtung der Verschiebung anzugeben, also ob die Kurven nach rechts auf der x-Achse (schlechter als Referenz) oder nach links(besser als Referenz) verschoben ist. Dann sind aber vermutlich Werte zwischen -1 und 1 sinnvoll. Problem ist, dass die euklid. Distanz positve Werte aufweist aufgrund der Quadrierung.

Der weitere Wunsch ist zweitrangig und erstmal nicht wichtig. Der Fokus liegt darauf, einen Wert in Prozent (oder zwischen 0 und 1) anzugeben.

Habt ihr Ideen oder Anregungen (für einen meiner Wünsche)?

Vielen Dank

Laale smile

smile

Zwei Beiträge zusammengefasst, damit es nicht so aussieht, als ob schon jemand anntwortet. Steffen

11.03.2019, 12:31

mYthos

Auf diesen Beitrag antworten »

Wenn die Gleichungen bzw. Wertepaare beider Kurven (intervallskaliert) vorliegen, dann kann deren Korrelationskoeffizient (Bestimmtheitsmaß) ermittelt werden.
Die Referenzkurve ist ja gegeben, wie ist die zweite Kurve ermittelt worden?
Mittels Technologieeinsatz sollte die Untersuchung keine größere Probleme bereiten.

mY+

11.03.2019, 12:32

Elvis

Auf diesen Beitrag antworten »

Lineare Kurven sind Geraden, ein Maß für die Distanz könnte der Winkel sein.

11.03.2019, 12:34

Laale

Auf diesen Beitrag antworten »

Vielen Dank für die Antworten.

Was ich noch sagen sollte: Die Kurven sind nicht durchgehend linear. Die Kurve kann in zwei Bereiche aufgeteilt werden, die jeweils linear verlaufen. Sprich: Linearer Verlauf mit Steigung m1 bis zu einem gewissen Punkt, danach wieder ein linearer Verlauf, jedoch mit Steigung m2.

11.03.2019, 12:55

mYthos

Auf diesen Beitrag antworten »

Umso eher wäre eine Regressionsanalyse anzudenken.
Die damit erhaltene Gleichung kann dann leichter mit der gegebenen verglichen werden.
Wie weit dann die Kurven ineinander transferiert werden können, zeigen dann eventuell deren Graphen.

Als CAS kommen (erfolgreich) GeoGebra oder Excel in Betracht.

mY+

11.03.2019, 15:08

Laale

Auf diesen Beitrag antworten »

Zitat:

Original von mYthos
Umso eher wäre eine Regressionsanalyse anzudenken.

Danke für die Idee, aber geht es nicht einfacher?
Du meinst, dass ich sowas mache wie:
Funktion A und B laufen zwischen x1 und x5 linear, und dann nochmal von x5 bis x10. Sodass ich jeweils zwei Geradengleichungen für jede Funktion habe, richtig?
Bsp: Referenzkurve A
von x1 bis x5: y_A1 = m_A1*x+b_A1
von x5 bis x10: y_A2 = m_A2*x+b_A2

Ergebniskurve B
von x1 bis x5: y_B1 = m_B1*x+b_B1
von x5 bis x10: y_B2 = m_B2*x+b_B2

und dann?

--------
Ich habe bei beiden Funktionen die gleichen x-Werte, aber unterschiedliche y-Werte.
Hätte daran gedacht, einfach die Differenzen zu berechnen, Stichwort euklid. Distanz.

Problem ist halt, dass ich Werte erhalte, die nicht zwischen 0 und 1 liegen.

Wie normiere ich am besten?

Aus der Wertemenge von Funktion A den Maximalwert suchen und alle Werte aus A dadurch teilen?
Das gleiche auch für die Wertemenege für Funktion B und dann die Werte von B durch max(B) teilen?

So langsam bin ich durcheinander.

Anzeige

11.03.2019, 15:30

Laale

Auf diesen Beitrag antworten »

Habe nun, wie oben schon mal von euch angerissen, die Pearson-Korrelation berechnet. Klappt an sich gut. Nachteil ist, dass ich eben nicht sagen kann, dass sich die Werte um x% voneinander unterscheiden. Klar kann gesagt werden, dass die Werte mit r=0,87 korreliert sind, aber darunter kann sich ein "Laie" nichts vorstellen.

11.03.2019, 21:23

Laale

Auf diesen Beitrag antworten »

Ich habe 10 feste x-Werte und dem entsprechend für die Referenzkurve und die gemessene Kurve jeweils 10 y-Werte.
Die y-Werte sind zum Teil negativ.

Ich habe nun folgendes berechnet:

1) normierter euklid. Distanz (da bin ich bzgl. der Normierung noch unsicher)
Habe dazu für jede Kurve (y-y_min)/(y_max-y_min) genommen.
3) Pearson Korrelation

Überzeugt bin ich noch nicht.

12.03.2019, 10:14

Elvis

Auf diesen Beitrag antworten »

Wenn du deine Daten zur Verfügung stellst, kann man vielleicht etwas dazu sagen. Eine allgemeine Regel aufstellen, wie mit unbekannten Daten umzugehen ist, überfordert mich und vielleicht auch andere Helfer.

12.03.2019, 12:20

willyengland

Auf diesen Beitrag antworten »

Die Werte bereitzustellen ist eine gute Idee.

Außerdem musst du dir bei einer Angabe in Prozent überlegen, was 0% bedeuten soll und was 100% bedeuten soll.
0% dürfte klar sein: Werte liegen genau auf Referenzkurve

Aber 100%? Was sind 100% Abweichung von der Referenzkurve?

12.03.2019, 12:49

Laale

Auf diesen Beitrag antworten »

Hier ein paar beispielhafte Daten, welche das Problem verdeutlichen sollen.

x = [ 1 2 3 4 5 6 7 8 9 10];
y_ref = [ 6.42 4.52 2.62 0.72 -0.03 -0.78 -1.53 -2.28 -3.03 -3.78]
y_measurement = [-3.23 -6.91 -10.59 -14.27 -15.67 -17.07 -18.47 -19.87 -21.27 -22.67]

Ab einem x-Wert von 4 ändert sich die Steigung jeweils (4 bleibt fest als Punkt der Steigungsänderung).

Vielleicht hilft das weiter. Ich bin euch auf jeden Fall nun schon sehr dankbar! Freude

Freude

Und stimmt- was heißt 100% Abweichung? Grundsätzlich geht es mir darum, einen Wert zu finden, welcher den Unterschied (bzw. die Verschiebung) deutlich macht. Die euklidische Distanz ist mir nicht anschaulich genug.

12.03.2019, 13:30

willyengland

Auf diesen Beitrag antworten »

Hmm ...
ich denke, mit einem Prozentwert wirst du da nichts werden.
Selbst wenn du dir das irgendwie zurecht biegst, ist das geradezu Irreführung.

Eine Gerade setzt sich nun mal aus zwei Werten zusammen: Steigung und Achsenabschnitt.
Und du hast in jeder Kurve sogar zwei Geraden, also insgesamt 4 Werte.
Daraus kannst du keinen einzelnen Prozentwert machen.
Kann man schon, irgendwie, aber er sagt nichts sinnvolles aus.

12.03.2019, 13:35

Laale

Auf diesen Beitrag antworten »

Danke, Willy! Wahrscheinlich hast du Recht.

Das Angenehme ist, dass ich das hier aus reinem Interesse mache, da ich letztens in einem Aufsatz von Distanzmaßen und Ähnlichkeitsmaßen gelesen habe. Daher sind die Frage und die Kurven hier auch eher hypothetisch. Mit Sicherheit gibt es solche Fälle auch in der "Realität", bin diesen jedoch bisher nicht begegnet.

Von mir aus können wir das Thema erstmal beenden.

Schöne Grüße

Laale

12.03.2019, 19:27

mYthos

Auf diesen Beitrag antworten »

Vielleicht noch nicht beenden ...
Es liegt nahe, beim Vergleich der Werte - der Messkurve mit jenen der Referenzkurve - auf die Referenzkurve Bezug zu nehmen.
Das bedeutet, man belegt die Referenz mit 1 (oder 100%) und berechnet die Messwerte bzw. deren Änderung relativ (!) zur Referenz, nicht umsonst heisst die Tabelle, mit welcher man vergleicht, Referenztabelle.

Daher sind 0% für die Referenz kontraproduktiv, allenfalls wären es 100%.

[attach]49009[/attach]

Im ersten Diagramm sind die beiden Punktgraphen, so wie sie gegeben sind, eingezeichnet.
Sieht man sich die beiden Graphen an, so ist sofort eine bemerkenswerte Übereinstimmung festzustellen.
Der Korrelationskoeffizient bzw. das Bestimmtheitsmaß der beiden Reihen ist nahezu 1; das kann schon mal ein Hinweis auf eine enge Verwandtschaft der beiden Reihen sein.
Zu sehen ist auch, dass beide Graphen abschnittsweise linear verlaufen.

Nun kann man diese noch auf andere Weise untersuchen.
Die Messkurve wird in den Punkt x = 4 verschoben, sodass die Differenzwerte besser zu vergleichen sind. Im Punkt x = 4 ist die Distanz Null;
die relative Änderung (gelbe Linie, 5-fach überhöht) ist das Verhältnis des Abstandes der Messwerte zur Distanz (Offset = -14,99) zu (verglichen mit) der Distanz der Referenzwerte.
Allgemein tendiert diese relative Änderung - ausser bei 2 Punkten in der Umgebung von 4 - zu einem konstanten Wert (ca. 0.52).

Berechnet man letztendlich die Standardabweichung bei beiden Reihen, so ist auch dort das Verhältnis der beiden Werte etwa 0,52.

Das tendenzielle Verhalten bei beiden Reihen ist also weitgehend ähnlich.

mY+

12.03.2019, 19:55

Laale

Auf diesen Beitrag antworten »

Zitat:

Original von mYthos
Im ersten Diagramm sind die beiden Punktgraphen, so wie sie gegeben sind, eingezeichnet.
Sieht man sich die beiden Graphen an, so ist sofort eine bemerkenswerte Übereinstimmung festzustellen.
Der Korrelationskoeffizient bzw. das Bestimmtheitsmaß der beiden Reihen ist nahezu 1; das kann schon mal ein Hinweis auf eine enge Verwandtschaft der beiden Reihen sein.
Zu sehen ist auch, dass beide Graphen abschnittsweise linear verlaufen.

Das verstehe ich und es ist nachvollziehbar.

Zitat:

Original von mYthos
Nun kann man diese noch auf andere Weise untersuchen.
Die Messkurve wird in den Punkt x = 4 verschoben, sodass die Differenzwerte besser zu vergleichen sind. Im Punkt x = 4 ist die Distanz Null;
die relative Änderung (gelbe Linie, 5-fach überhöht) ist das Verhältnis des Abstandes der Messwerte zur Distanz (Offset = -14,99) zu (verglichen mit) der Distanz der Referenzwerte.
Allgemein tendiert diese relative Änderung - ausser bei 2 Punkten in der Umgebung von 4 - zu einem konstanten Wert (ca. 0.52).

Berechnet man letztendlich die Standardabweichung bei beiden Reihen, so ist auch dort das Verhältnis der beiden Werte etwa 0,52.

Das tendenzielle Verhalten bei beiden Reihen ist also weitgehend ähnlich.

mY+

Hier bin ich raus. Du verschiebst die Kurven um 14.99, da die Differenz der Kurven bei x=4 14.99 beträgt? Ich begreife den Satz nämlich nicht, was du wie ins Verhältnis setzt.

Und 0.52 = STD(Ref)/STD(Meas)?

Auf jeden Fall vielen Dank für die Mühe! smile

smile

12.03.2019, 21:07

mYthos

Auf diesen Beitrag antworten »

Die Kurve wurde in den Punkt x = 4 verschoben, um die Tendenzen - optisch - besser vergleichen zu könnnen.
Das muss natürlich nicht sein, man kann die Änderungsraten auch getrennt betrachten.
Wie hier, also einfach mit den jeweiligen Differenzenquotienten, siehe unterhalb der StdDev-Berechnung:

[attach]49010[/attach]

Die Änderungsraten beider Kurven sind konstant und verhalten sich wie etwa 0.52 : 1.
Nicht mehr und nicht weniger kann - zusätzlich zur Linearität - noch festgehalten werden.
Signifikant ist auch der qualitativ gute Korrelationskoeffizient von nahezu 1.

Was du mit dieser Information - und ob du damit etwas - anfangen kannst, kann ich jetzt nicht sagen.
__________

Ja, die beiden StdDev wurden ins Verhältnis gesetzt.
Wobei die StdDev von einer Stichprobe berechnet wurde (/(n-1)) (das ist aber hinsichtlich des Vergleiches egal).

mY+

12.03.2019, 21:13

Laale

Auf diesen Beitrag antworten »

Lieben Dank!

Was ich damit anfangen kann, weiß ich noch nicht so recht. Aber vom Prinzip hast du ja nur die Steigungen ins Verhältnis gesetzt.
Sind auf jeden Fall gute Sachen dabei. Mal schauen, was ich damit noch so anstelle Big Laugh

Big Laugh

12.03.2019, 21:18

mYthos

Auf diesen Beitrag antworten »

Ja, dieses Ding ist irgendwie interessant.
Mit dem ürsprünglichen Vorschlag: 0% = Punkt auf der Referenzkurve ist übrigens kein vernünftiger Vergleich möglich.

mY+

02.04.2020, 20:59

stuAlex

Auf diesen Beitrag antworten »

Ich möchte mich hier mal einklinken Wink

Wink

und hab da gleich mal eine Frage zur Regressionsanalyse. Was ich gesehen habe, war, dass eine Gerade durch eine Punktwolke gelegt und ein Koeffizient berechnet wird, der aussagt, wie abhängig die beiden Variablen ("x" und "y") voneinander sind. Wie kann man die zum Vergleich zweier Kurven heranziehen? verwirrt

verwirrt

Habt ihr Literatur mit Beispielen?

04.04.2020, 23:07

mYthos

Auf diesen Beitrag antworten »

Man kann zwei Funktionen ebenso vergleichen, indem man von den beiden Reihen der jeweiligen Funktionswerte den Korrelationskoeffizienten bzw. dessen Quadrat, das Bestimmtheitsmaß berechnet.
Werte in der Nähe von 1 bezeichnen einen relevanten Zusammenhang.
Dabei muss es aber nicht sein, dass sich die beiden Funktionen in ihren Graphen annähern, sondern nur im Funktionstyp bzw. in deren Verhalten (z.B. zwei lineare Funktionen).

Eine echte Annäherung liefert die Regression, sie kann dann durchgeführt werden, wenn die Funktionsgleichungen bzw. Funktionstypen bekannt sind. Mit Hilfe der Regression können dann die Parameter entsprechend eingegrenzt werden.

mY+

1

Verwandte Themen

Die Beliebtesten »

Die Größten »

Die Neuesten »