Prognoseintervall und Konfidenzintervall

Neue Frage »

Todi1234 Auf diesen Beitrag antworten »
Prognoseintervall und Konfidenzintervall
Meine Frage:


https://www.lineare-regression.de/prognoseintervall.html

Ich verstehe den Unterschied noch nicht so richtig, glaube ich. Kann mir das einer nocheinmal anders erklären?

Über eine hilfreiche Antwort würde ich mich sehr freuensmile


Meine Ideen:
So wie ich das beim Prognoseintervall verstanden habe, gebe ich eine Toleranz vor nach oben und unten (z.B Gewicht 80-120g). Ich berechne meine lineare Funktion oder quadratische Funktion.... aus meinem Datensatz und von da aus müssen dann 95% aller Einzelwerte in dem Bereich liegen ?

Und das Konfidenzintervall beschäftigt sich mit dem Mittelwert?Man errechnet wieder seine Funktion und bildet bei gleichen X werten den Mittelwert der Daten z.B (Werte 120 80 y Achse MW 100) und (5 und 5 x Achse)? . Und die müssen dann zu 95% im Niveau enthalten sein?

Was hat es mit der Unsicherheit der Punkte zu tun und der tatsächlichen Position auf sich (unterer Teil auf der Seite siehe Link)?

Ich hoffe es ist einigermaßen verständlich.

Über eine hilfreiche Antwort würde ich mich sehr freuensmile
Huggy Auf diesen Beitrag antworten »
RE: Prognoseintervall und Konfidenzintervall
Um deine Fragen zu beanworten, hole ich etwas weiter aus. Dabei füge ich an einigen Stellen in Klammern die Bedeutung der Größen für deinen Link hinzu. Der Mathematik der linearen Regression liegt folgende Modellvorstellung zugrunde:

Man hat eine Zufallsgröße (Das Gewicht einer Person). hängt von einer anderen Größe (Die Größe der Person) ab. Man nimmt an, dass für jeden Wert von normalverteilt ist mit den Parametern und bzw. .



ist der Erwartungswert der Normalverteilung. Dieser wird unglücklicherweise oft auch als der Mittelwert oder als der wahre Mittelwert (in deinem Link) bezeichnet, obwohl eine Verteilung keinen Mittelwert besitzt. Stichproben aus einer Verteilung besitzen einen Mittelwert. ist die Standardabweichung der Normalverteilung und ihre Varianz. Man nimmt ferner an, dass unabhängig von ist, also für jeden Wert von denselben Wert hat. Und man nimmt an an, dass linear von abhängt.



Wenn man nun eine Stichprobe von hat hat und daraus eine Regressionsgerade berechnet



dann ist für jedes ein Punktschätzer für .

Zitat:
Original von Todi1234
So wie ich das beim Prognoseintervall verstanden habe, gebe ich eine Toleranz vor nach oben und unten (z.B Gewicht 80-120g).

Nein! Du gibst ein Vertrauenslevel vor (in deinem Link z.B. 95 %): Aus den Stichprobenwerten kann man dann zu dem gewählten Vertrauenslevel das Prognoseintervall als Funktion von berechnen (die roten Kurven). Beachte, dass die roten Kurven keine Geraden sind. Sie krümmen sich nach außen hin leicht von der Regressionsgeraden weg. Wenn man nun weitere Stichprobenwerte für erhebt , so wird jeder dieser weiteren Werte mit einer Wahrscheinlichkeit gleich dem gewählten Vertrauenslevel innerhalb des Prognoseintervalls, also zwischen den beiden roten Kurven liegen.

Zitat:
Ich berechne meine lineare Funktion oder quadratische Funktion.... aus meinem Datensatz und von da aus müssen dann 95% aller Einzelwerte in dem Bereich liegen ?

Wenn du mit von da aus weitere Stichprobenwerte meinst und mit 95 % aller Einzelwerte eine Wahrscheinlichkeit meinst, dann ja.

Zitat:
Und das Konfidenzintervall beschäftigt sich mit dem Mittelwert?Man errechnet wieder seine Funktion und bildet bei gleichen X werten den Mittelwert der Daten z.B (Werte 120 80 y Achse MW 100) und (5 und 5 x Achse)? . Und die müssen dann zu 95% im Niveau enthalten sein?

Das Konfidenzintervall beschäftig sich mit dem unbekannten Wert von als Funktion von . Es wird mit einer ähnlichen Formel wie der für das Prognoseintervall aus einem gewählten Vertrauenslevel und den Stichprobenwerten berechnet (Die Grenzkurven des grauen Bereichs).

Wenn man eine gegeben Stichprobe betrachtet, dann wird das unbekannte



innerhalb des Konfidenzintervalls dieser gegebenen Stichprobe liegen oder auch nicht. Dafür kann man keine Wahrscheinlichkeit angeben. Es ist ja beides fest. ist fest, aber unbekannt. Und für eine gegeben Stichprobe ist auch das Konfidenzintervall fest. Wenn man aber wiederholt Stichproben nimmt und für jede Stichprobe das Konfidenzintervall bestimmt, dann erhält man eine Reihe von Konfidenzintervallen (grauen Bereichen) und das gewählte Vertrauenslevel gibt an, mit welcher Wahrscheinlichkeit jedes dieser Konfidenzintervalle das unbekannte enthält.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »