Bayes-Statistik Notation

Neue Frage »

haro21 Auf diesen Beitrag antworten »
Bayes-Statistik Notation
Hallo alle zusammen, ich verstehe die Bayessche Notation nicht so ganz. Beispiel:

ist ein unbekannter Parameter und wird als eine Zufallsgröße modelliert (ungewohnt für mich, da normalerweise für Zufallsgrößen Großbuchstaben verwendet werden). Man schreibt für die Dichtefunktion von :

,

was ist hier nun was? Normalerweise kenne ich die Schreibweise einer Dichtefunktion so:

, X bezeichnet die Zufallsvariable und x den Wert dieser Zufallsvariable.

Dann wird für die bedingte Verteilung folgendes geschrieben

,

wobei X eine Matrix ist mit den beobachteten Daten und y ist ein Vektor auch mit beobachteten Daten.

Das bedeutet X und y sind keine Zufallsvariablen, sind das dann Stichproben? Oder wie soll ich das Interpretieren?


? ist die Dichte der Verteilung w gegeben X,y?

Quelle: http://www.gaussianprocess.org/gpml/chapters/RW2.pdf
HAL 9000 Auf diesen Beitrag antworten »
RE: Bayes-Statistik Notation
Ja, der Mensch ist faul, und wählt verkürzte Bezeichnungen, wenn sowieso "klar" ist was gemeint ist.

Das Problem ist, dass für jemanden, der in die Materie einsteigt, das eben alles andere als klar ist. Da hat man mühsam gelernt, dass ordentliche Bezeichnungen und Konventionen (Großbuchstaben für Zufallsgrößen, Kleinbuchstaben für reelle Werte) die Sachverhalte klarer machen, und dann wird alles über den Haufen geworfen - da kann man schon verunsichert sein.


Zum Thema:

Tatsächlich würde man mit einer "ordentlichen" Terminologie den unbekannten Parameter als Zufallsgröße ansehen, dessen Verteilungsfunktion ist , welche im Fall eines stetig verteilten dann auch durch die Dichte beschrieben werden. Nun, hier ist dann einfach .

Im vorliegenden Fall wird nun ein lineares Modell mit normalverteilten Fehler betrachtet.

Dafür kann man eine bedingte Verteilungsfunktion und zugehörige Dichte betrachten. Die Bayesianer schreiben auch hier kurz , obwohl dieses eine völlig andere (!) Funktion ist als die beim obigen . Und um die Krone aufzusetzen, die im weiteren Verlauf dann ebenfalls auftauchende a-posteriori-Dichte meint in Wahrheit die Dichte zur Verteilungsfunktion . D.h., dreimal Symbol , aber in unterschiedlicher Bedeutung. Bei dieser Symbolik ist es also essentiell, aus den Argumentnamen zu schließen, welches der drei also gerade da gemeint ist - widerspricht tatsächlich der sonst üblichen Philosophie zur Verwendung von Funktionssymbolen, ist hier aber eben der Schreibfaulheit geschuldet.

Zu beachten ist noch: Obwohl Großbuchstabe gewählt wurde, ist damit hier keine Zufallsgröße gemeint, sondern ein reeller Vektor, die zugehörige Zufallsgröße habe ich jetzt hier zur Unterscheidung mit (Fettdruck) gekennzeichnet - hoffe, das kann man beim Lesen unterscheiden.


Ich hoffe, ich habe etwas mehr Klarheit in die Symbolik der Bayesianer gebracht - wenn nicht, dann entschuldige ich mich schon mal prophylaktisch für die jetzt womöglich noch größere Verwirrung. smile
haro21 Auf diesen Beitrag antworten »
RE: Bayes-Statistik Notation
Hallo Hal und danke für die Antwort.

Die Antwort hat mir schon geholfen, allerdings frage ich mich, weshalb die drei unterschiedliche Bedeutungen haben.

Ich habe jetzt die ganze Zeit gedacht, dass man mit dem Buchstaben die Dichtefunktion einer Zufallsvariablen bezeichnet.

- ist die Dichtefunktion von der Zufallsvariable

- ist die Dichtefunktion von der bedingten Zufallsvariable

- p(w | X, y) ist die Dichtefunktion von der bedingten Zufallsvariable

Ich sehe noch nicht ganz, wie sich diese 3 unterscheiden. Könntest du mir dabei helfen, dass zu verstehen?



Du schreibst, dass ein reeller Vektor ist, ist das wirklich immer so? In der Quelle, welche ich im ersten Beitrag verlinkt habe, ist eine Matrix. Man nennt die Matrix auch Designmatrix oder auch Datenmatrix.
Bsp: Angenommen man hat zwei Beobachtungen in jeweils zwei Experimente, sagen wir im ersten Expeirment und im zweiten , dann ist die DesignMatrix

bzw. wenn man bei noch eine Konstante berücksichtigen will, dann

.

Die Frage ist, wie kann nun eine Zufallsgröße eine Matrix als Realisierung haben? verwirrt
HAL 9000 Auf diesen Beitrag antworten »
RE: Bayes-Statistik Notation
Zitat:
Original von haro21
Du schreibst, dass ein reeller Vektor ist, ist das wirklich immer so? In der Quelle, welche ich im ersten Beitrag verlinkt habe, ist eine Matrix.

Im Modell ist ein Zufallsvektor, und entsprechend ein reeller Vektor, eine Realisierung von .

Wovon du redest ist, wenn eine ganze Stichprobe von solchen Vektoren (d.h. dann mehrere Realisierungen) zu einer Matrix zusammengefasst werden - das ist inhaltlich was ANDERES. Wenn man das auch wieder nur als bezeichnet, ist das eine weitere Symbolkonflikt-Baustelle. unglücklich
haro21 Auf diesen Beitrag antworten »
RE: Bayes-Statistik Notation
Ah okay, jetzt hat es klick gemacht. Das sind so viele Buchstaben, dass mir die Buchstaben ausgehen. Big Laugh

Kurze Frage noch zu einer Notation:

Man schreibt

, wobei

eine Realisierung vom Zufallsvektor
ist, und eine Realisierung vom Zufallsvektor ist. Man schreibt auch kurz .

So meine Frage ist nun:

Du hast statt die Zufallsgrößen hingeschrieben, also

? Darf man das einfach so machen und meint man dann auch das selbe? Oder darf man eine der beiden Notationen nicht verwenden? verwirrt
HAL 9000 Auf diesen Beitrag antworten »

Wenn du genau hinschaust, habe ich nicht oder geschrieben, nur du. Die mit Indizes, die ich oben genutzt habe, waren nur Dichtebezeichnungen, was ganz anderes.
 
 
haro21 Auf diesen Beitrag antworten »

Es geht mir um das lineare Modell. Du schreibst


, und sind Zufallsgrößen, aber in der Literatur wird meistens


geschrieben und wird als eine Zufallsvariable modelliert, y ist der beobachtete Zielwert und x sind die beobachteten Input Werte. ist wie bei dir norrmalverteilt. Steht zumindest hier http://www.gaussianprocess.org/gpml/chapters/RW2.pdf , was ist hier nun richtig?

Ist das beides dasselbe? Diese komische Notation von den Bayesianer verwirrt mich extrem.
haro21 Auf diesen Beitrag antworten »

Könntest du bitte nur kurz antworten? Lasse dich dann auch in Ruhe versprochen. Hilfe
HAL 9000 Auf diesen Beitrag antworten »

Meine Ansicht habe ich oben dargelegt. Ich behaupte nicht, im Besitz der absoluten Wahrheit über Symbolverwendungen zu sein, deswegen lasse ich mich nicht in deinen Strudel des immer weiter ins Klein-Klein driftenden Nachfragen ein:

Ich les doch jetzt nicht dein pdf durch, um für jede Formel zu ergründen, ob das dort ein fester Vektor ist, ein zufälliger Vektor, oder aber eben Reealisierung eines Zufallsvektors . Das musst du selbst aus dem Kontext rausfinden - die Formel allein gibt das nicht her.
haro21 Auf diesen Beitrag antworten »

Das kann ich natürlich verstehen. Ich danke dir für deine Beiträge, die haben mir geholfen. Freude

Hast du vllt. ein Tipp für mich, wie ich bei einer Ausarbeitung präzise bleibe, was den mathematischen Teil angeht? verwirrt
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »