Allgemein Stochastik

Neue Frage »

Pretender2k Auf diesen Beitrag antworten »
Allgemein Stochastik
hier steht in kuerze etwas smile
Pretender2k Auf diesen Beitrag antworten »

Hallo zusammen,

ich zerbreche mir gerade ueber folgendes Problem den Kopf. Ich habe eine sehr grosse Kiste mit Aepfeln. Ich habe hierbei angenommen, dass das Volumen der Aepfel normalverteilt ist. Zu erst habe ich daher die Varianz und den Mittelwert ermittelt. Somit habe ich (Mittelwert des Volumens der Aepfel) und ( Std. des Volumens der Aepfel) erhalten.

Ich habe nun eine Messeinrichtung die mir das Volumen einer unbekannten Anzahl an Aepfeln liefert. Diese Messung ist Fehlerbehaftet. Ich nehme den Fehler hierbei ebenfalls als Normalverteilt an. Daher ergibt sich ein Messwert mit der Std. Abweichung

Ich moechte nun allgemein die Anzahl der Aepfel berechnen. Wuerde ich die Statistik beiseite lassen, wuerde ich also einfach das gemessene Volumen durch die Anzahl der Aepfel teilen und haette mein Ergebnis. Wie mach ich das jetzt aber statistisch richtig?
Huggy Auf diesen Beitrag antworten »

Deine Beschreibung ist etwas unscharf. Ich interpretiere sie so:

Du hast den Mittelwert und die Standardabweichung des Volumens eines einzelnen Apfels. Du hast einen Messwert V für das Gesamtvolumen einer größeren Anzahl Äpfel. Du kennst die Standardabweichung des Messverfahrens.



gerundet zur nächsten ganzen Zahl betrachtest du als Schätzwert für die Zahl der Äpfel. Jetzt möchtest du irgendwie die Qualität dieses Schätzwertes statistisch angeben.

Ist das soweit richtig?

Falls ja, gib ein Konfidenzintervall für an.
Pretender2k Auf diesen Beitrag antworten »

Zitat:
Original von Huggy
Deine Beschreibung ist etwas unscharf. Ich interpretiere sie so:

Du hast den Mittelwert und die Standardabweichung des Volumens eines einzelnen Apfels. Du hast einen Messwert V für das Gesamtvolumen einer größeren Anzahl Äpfel. Du kennst die Standardabweichung des Messverfahrens.
Genau!

Meine Frage ist eigentlich jetzt, wie schatze ich die Anzahl der Aepfel optimal?
Huggy Auf diesen Beitrag antworten »

Deine Frage irritiert mich. Wenn du eine Punktschätzung willst, dann ist diese



Wenn du eine Bereichsschätzung willst, gib für ein Konfidenzintervall mit einem dir genehmen Konfidenzniveau an. Wo hakt es denn konkret?
Pretender2k Auf diesen Beitrag antworten »

Wenn ich weiss, das in einer Kiste 10 Aepfel liegen dann wuerde ich das Volumen folgendermassen abschaetzen (Wenn ich und von einem Apfel kenne:



Die Unsicherheit dieser Schaetzung wuerde ich folgendermassen berechnen:



Gehe ich jetzt davon aus, das ich nicht das Volumen der 10 Aepfel berechnen will, sonderen dieses von einem Sensor ermittelt wurde muss ich ja jetzt irgendwie in die andere Richtung.

Das Problem ist hierbei aber dann, dass die Varianz fuer 10 Aepfel nicht die Gleiche ist wie fuer 9 Aepfel.

Wuerde ich also wissen, das fuer einen Apfel gilt: mit und mir mein Sensor 94VE angibt, muss ich ja jetzt richtig ermitteln ob es 9 oder 10 Aepfel sind. Wuerde ich 94/10 rechnen und dann Runden ergaebe das dann 9 Aepfel. Was ist aber mit den zuvor angesprochenen unterschiedlichen Varianzen fuer 9 und fuer 10 Aepfel?

Ich hab mir dann gedacht ich habe eine Gaussverteilung fuer 9 Aepfel mit einer Varianz und eine Gaussverteilung fuer 10 Aepfel mit einer Varianz . Ich hab dann, mit Hilfe der Minimierung der Falschalarmrate, einen Schwellwert berechnet. Dieser liegt dann aber nicht direkt in der Mitte!!! Ueber dem Schwellwert sind es 10 Aepfel daraunter 9 Aepfel.

Dazu kommt aber, dass der Sensor ja auch nicht genau arbeitet? hab das bisher garnicht betrachtet...

Vielleicht mach ich auch nur schwachsinn smile und alles was ich gemacht hab war fuer den Muelleimersmile also immer her mit dem Feedback :P

P.S.: Was hat es genau mit dem Konfidenzintervall auf sich?
EDIT: Ja ich weiss das Sigma die std und nicht varianz ist.. habs beim schreiben verplant...
 
 
Huggy Auf diesen Beitrag antworten »

Richtig ist schon mal, das gemessene Gesamtvolumen V ist bei festem n eine Zufallsgröße, die normalverteilt ist mit Mittelwert und Standardabweichung . Und da du n nicht kennst, kennst du diese Standardabweichung nicht. Für die Schätzung von n spielt das aber keine Rolle. Die Normalverteilung ist symmetrisch. Das beste, was du machen kannst, ist anzunehmen, dass das tatsächliche Gesamtvolumen dem gemessenen Volumen entspricht.

Mit einem Konfidenzintervall gibst du nicht einfach eine Zahl als Schätzwert an, sondern ein Intervall, in dem n mit einer gewissen Wahrscheinlichkeit liegt. Statt zu sagen, der Schätzwert ist 10, würde man z. B. sagen, mit 95 % Wahrscheinlichkeit liegt n im Intervall [9, 12].

Wenn dir Konfidenzintervalle bisher nicht vertraut sind, hat es wenig Zweck zu diskutieren, wie man es für dein Problem berechnen würde. Auch möchte ich darauf hinweisen, dass das Wort Wahrscheinlichkeit in Verbindung mit Konfidenzintervallen mit Vorsicht zu gebrauchen ist.
Pretender2k Auf diesen Beitrag antworten »

Zitat:
Original von Huggy
Richtig ist schon mal, das gemessene Gesamtvolumen V ist bei festem n eine Zufallsgröße, die normalverteilt ist mit Mittelwert und Standardabweichung


Fuer was steht das ? Kenn das mit der Fehlerfortpflanzung nur ohne dem zusatz....

Meine idee war: Zunaechst schaetzt man ein primaeres n in dem ich rechne. Diese Schaetzung ist jetzt nicht perfekt. Bekomme ich aber einen wert zwischen 7 und 8 heraus betrachte ich nun das ganze so, als ob ich mich zwischen den Werten 7 und 8 entscheiden muss. Ich berechne mir dann die Varianzen fuer 7 und 8 Aepfel. Wenn ich nun beide Gausskurven beschreiben kann, minimiere ich die Falschalarmrate und bekomme einen Schwellwert heraus. Den kann ich dann dazu benutzen um mich zwischen 7 oder 8 aepfeln zu entscheiden. Die Sache mit dem Konfidenzintervallen waere auch moeglich. Koennte ich doch z.B. den 1-3 Sigma Bereich der Gausskurven benutzen.

Ist das jetzt bloedsinn, was ich mir da gedacht habe? Augenzwinkern

Im Anhang ist mal nen Bildchen wie ich mir das so mit den Gausskurven vorstelle.
Huggy Auf diesen Beitrag antworten »

Zitat:
Original von Pretender2k
Fuer was steht das ?

sollte die Standardabweichung des Messverfahrens sein. Siehe meine erste Antwort.

Zitat:
Meine idee war: Zunaechst schaetzt man ein primaeres n in dem ich rechne. Diese Schaetzung ist jetzt nicht perfekt. Bekomme ich aber einen wert zwischen 7 und 8 heraus betrachte ich nun das ganze so, als ob ich mich zwischen den Werten 7 und 8 entscheiden muss. Ich berechne mir dann die Varianzen fuer 7 und 8 Aepfel. Wenn ich nun beide Gausskurven beschreiben kann, minimiere ich die Falschalarmrate und bekomme einen Schwellwert heraus.

Ich glaube zu verstehen, was dir vorschwebt. Das ist eine ganz interessante Idee. Machen wir mal ein Zahlenbeispiel. Sei und . lassen wir mal außer Acht. Bei 9 Äpfeln hat das das Gesamtvolumen V eine Standardabweichung und bei 10 Äpfeln hat man .

Was ist, wenn man misst? Bei 10 Äpfeln kommt man wegen der größeren Standardabweichung etwas eher dahin als bei 9 Äpfeln. Bei 9 Äpfeln hat man eine Wahrscheinlichkeit von 0,66 %, ein V im Bereich [94,9/95,1] zu messen. Bei 10 Äpfeln beträgt diese Wahrscheinlichkeit 0,72 %. Sollte man daher die Grenze, ab der man sich für 10 Äpfel entscheidet, nicht von 95 auf 94,9 oder 94,8 oder so etwas heruntersetzen?

Ist es das, was du dir vorstellst?


Ist das ein theoretisches Problem oder stammt es aus der Praxis.
Pretender2k Auf diesen Beitrag antworten »

Danke fuer die Infos. Ist exakt das was ich mir vorstelle. Handelt sich hierbei um ein rein theoretisches Experiment (das aber eventuell Anwendung in der Praxis finden soll).
Huggy Auf diesen Beitrag antworten »

So könnte man tatsächlich eine Verbesserung erreichen. Allerdings taucht da ein Problem auf. Die Wahrscheinlichkeiten, die ich für den Grenzbereich beispielhaft nannte, waren bedingte Wahrscheinlichkeiten. Für eine sinnvolle Korrektur braucht man jedoch die tatsächlichen Wahrscheinlichkeiten, d. h. man braucht noch die Wahrscheinlichkeiten für das Eintreten der jeweiligen Bedingung.

Wenn man viele Apfelchargen misst, und etwa die Hälfte besteht aus 9 bzw. 10 Äpfeln, kann man eine Korrektur aufgrund obiger Zahlen vornehmen und erhält eine Verbesserung der Trefferrate. Würde jedoch ca. 80 % der Chargen aus 9 Äpfeln bestehen und nur ca. 20 % aus 10 Äpfeln, wäre obige Korrektur kontraproduktiv. Dann würden die Chargen im Grenzbereich des Volumens überwiegend aus 9 Äpfel bestehen. Dann wäre eine Korrektur in die umgekehrte Richtung sinnvoll.

Falls man vorab weiß, in welchem Verhältnis die Apfelzahlen auftreten werden, kann man unter Berücksichtigung dieses Verhältnis und der Standardabweichung als Funktion der Apfelzahl eine optimale Korrektur bestimmen. Falls man das nicht weiß, kann die Korrektur nützen aber auch schaden. Wenn man die Daten speichert, könnte man eventuell die Korrektur im nachhinein vornehmen.
Pretender2k Auf diesen Beitrag antworten »

Diese Wahrscheinlichkeiten habe ich bereits beruecksichtigt. Nimmt man an, dass beide Wahrscheinlichkeiten (Auftreten von 9 Aepfeln und 10 Aepfeln) gleich hoch sind, kuerzen sich diese bei der Berechnung des Schwellwerts raus.

Ich werd mal bei gelegenheit posten wie dann meine gesamte Berechnung aussschaut und auch dann ne allgemeine Formel dazu aufschreiben.
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »