Stationarität eines diskreten stochastischen Prozesses

Neue Frage »

skydiver Auf diesen Beitrag antworten »
Stationarität eines diskreten stochastischen Prozesses
Hi,

ich habe ein kleines Verständnisproblem mit der Definition von schwacher Stationarität bezogen auf eine diskrete Zeitreihe.

Ich betrachte einen diskreten stochastischen Prozess , wobei definitionsgemäß endlich ist.
Sagen wir dieser Prozess erzeugt die Zeitreihe {1,2,3,4}. Damit ist . Nach Wikipedia gleicht
ein stochastischer Prozess einer Zeitreihe. Damit habe ich also den Prozess definiert.

In der Wikipedia findet sich nun die folgende Definition von schwacher Stationarität:
  1. ist konstant



Mit dieser Definition habe ich Verständnisschwierigkeiten. Der Erwartungswert E(x_t) ist doch gerade x_t, da ich nur über einen Wert in der Stichprobe verfüge? In meiner obigen Zeitreihe hätte ich also vier Erwartungswerte: 1,2,3 und 4. Da sie nicht gleich sind, ist der Prozess schonmal nicht stationär. Das kann eigentlich nicht sein. Also ist mir momentan unklar, wie ich den ersten Punkt in der Definition für einen diskreten Prozess verstehen soll. Meint man vielleicht den Erwartungswert der gesamten Zeitreihe? Das würde für mich wieder keinen Sinn machen, denn dann hätte ich nur einen Wert der natürlich immer konstant wäre. Damit wäre die Forderung in der Definition auch unsinnig.

Es wäre für mich sinnig, wenn man Intervalle dieser Zeitreihe betrachtet, z.B. (1,2) und (3,4). Dann kann ich für jedes Wertepaar einen Mittelwert und eine Varianz ausrechnen. Ich habe ja nun mehrere Werte zur Verfügung. Dies lese ich aber so nicht aus der Definition heraus.
Mir ist daher etwas unklar, wie ich diese Definition verstehen muss.. Kann mir jemand vielleicht einen Denkanstoß geben?

Des Weiteren frage ich mich, welche Aussage man über die Varianz in einem schwach Stationären Prozess aufgrund des zweiten Punktes in der Definition machen kann. Impliziert die Eigenschaft, dass die Kovarianz nur vom Abstand zweier 'Werte' (X_t) abhängig ist, dass die Varianz recht konstant bleibt?!
AD Auf diesen Beitrag antworten »

Zitat:
Original von skydiver
Mit dieser Definition habe ich Verständnisschwierigkeiten. Der Erwartungswert E(x_t) ist doch gerade x_t, da ich nur über einen Wert in der Stichprobe verfüge?

Es sieht so aus, als hast du das Wesen eines stochastischen Prozesses, oder überhaupt einer Zufallsgröße überhaupt nicht verstanden: Der stochastische Prozess in seiner Gesamtheit ist doch was anderes als deine nur eine konkret vorliegende Trajektorie , d.h., du kennst die Prozesswerte nur für eine Zufallsausprägung . Aussagen zur Stationarität anhand einer einzigen Trajektorie sind allenfalls unter zusätzlichen Voraussetzungen über sowas wie den Ergodensatz möglich, dazu braucht es aber dann ein paar mehr Werte als deine vier, um statistisch zuverlässige Aussagen treffen zu können...
skydiver Auf diesen Beitrag antworten »

Naja, ich habe mich ja im ursprünglichen Posting konkret auf diskrete Zeitreihen bezogen, die man auf Stationarität untersuchen möchte. Man kennt in diesem Fall eben nur eine Ausprägung, der erzeugende Prozeß dahinter ist ja oftmals nicht bekannt. Es ist auch nicht weltfremd diese Zeitreihen auf Stationarität prüfen zu wollen. Auch hierfür gibt es Tests (beispielsweise die nichtparametrischen, die keinerlei Annahmen über die zugrundeliegende Verteilung annehmen).
Aus der Zeitreihenanalyse ist mir die Definition von Stationarität nur im obigen Sinne bekannt. Mir wird nicht so ganz klar, wie ich diese Definition auf eine solche diskrete Zeitreihe anwenden kann. Mein gedanklicher Versuch scheitert wie gesagt bereits beim Erwartungswert. Es klappt nur, wenn man die Zeitreihe in äquidistante Intervalle unterteilt, so wie dies auch in den Tests gemacht wird. Aber das kann ich aus dieser Definition nicht direkt herauslesen.

Das {1,2,3,4} als Beispiel zur reinen Veranschaulichung dient und kein reales Gebilde ist, über das man statistische Aussagen machen möchte, sollte ja ziemlich klar sein...
AD Auf diesen Beitrag antworten »

Zitat:
Original von skydiver
Es ist auch nicht weltfremd diese Zeitreihen auf Stationarität prüfen zu wollen. Auch hierfür gibt es Tests (beispielsweise die nichtparametrischen, die keinerlei Annahmen über die zugrundeliegende Verteilung annehmen).

Tatsächlich ist es nicht weltfremd, deswegen ja meine Erwähnung des Ergodensatzes. Es anhand von nur vier Werten prüfen zu wollen, würde ich dann allerdings doch als weltfremd bezeichnen - egal welche Annahmen zum Prozess man sonst noch zur Verfügung hat.


Und auch wenn du nur eine Realisierung zur Verfügung hast, kannst du doch nicht sowas

Zitat:
Original von skydiver
Der Erwartungswert E(x_t) ist doch gerade x_t, da ich nur über einen Wert in der Stichprobe verfüge?

schlussfolgern! Sagen wir, du hast nur die eine Realisierung der Zufallsgröße zur Verfügung, dann ist es ganz natürlich, dass du den Erwartungswert durch dem Wert schätzt. Das bedeutet aber noch lange nicht, dass der Erwartungswert gleich dem Wert ist. Vielleicht hast du dich da ja nur unglücklich ausgedrückt.
_skydiver Auf diesen Beitrag antworten »

Zitat:
Original von Arthur Dent
Es anhand von nur vier Werten prüfen zu wollen, würde ich dann allerdings doch als weltfremd bezeichnen - egal welche Annahmen zum Prozess man sonst noch zur Verfügung hat.


Klar, aber das war ja wie gesagt nie Gegenstand der Diskussion.

Zitat:
Original von Arthur Dent
Sagen wir, du hast nur die eine Realisierung der Zufallsgröße zur Verfügung, dann ist es ganz natürlich, dass du den Erwartungswert durch dem Wert schätzt. Das bedeutet aber noch lange nicht, dass der Erwartungswert gleich dem Wert ist. Vielleicht hast du dich da ja nur unglücklich ausgedrückt.


Ja, diese Formulierung ist in der Tat mächtig in die Hose gegangen. Eigentlich wollte ich damit sagen, dass dieser eine Wert ja die einzige Schätzung darstellt, über die ich verfüge. Wie ich daraus nun Aussagen über die Stationarität machen soll, ist mir unklar. Natürlich gibt es diese Tests. Die Funktionsweise des Tests nützt mir hier aber nichts. Die Tests gehen ja von der Annahme aus, dass wenn die erzeugte Zeitserie stationär ist, der Prozess auch stationär sein wird. Da das Zeigen von Stationarität nicht so direkt straigt-forward ist, gibt es dann verschiedene Verfahren. Ist alles klar.

Ich möchte mit der Definition nicht zeigen, dass etwas stationär ist oder eben nicht. Dafür gibt es die Tests. Ich möchte vielmehr die Grundlage verstehen, wie man mit dieser Definition überhaupt Aussagen über Stationarität machen kann, wenn nur eine Ausprägung zur Verfügung steht. Vielleicht ist das auch garnicht möglich und man muss sich anderen Grundlagen bedienen, die ich wohlmöglich nicht kenne. Wenn man sich etwas in Arbeiten zur Zeitserienanalyse umsieht wird Stationarität häufig über den stationären stochastischen Prozess aufgezogen und dann kommen irgendwann die Tests. Bisher bin ich noch nicht tief genug in der Materie um den Rückschluss ziehen zu können. Die Argumentation: wir definieren einen stochastischen Prozess der diesen Eigenschaften gehorcht und der dann eine Ausprägung erzeugt, die uns vorliegt, ist klar. Kann man aber anhand dieser Definition (wie gesagt es geht nicht um das Anwenden von Tests, die Verwende ich wenn ich auf Stationarität prüfe, es geht nur um das Verständnis) Aussagen über die Stationarität einer Zeitserie machen?
skydiver Auf diesen Beitrag antworten »

Ich kann das, was vielleicht etwas versteckt in den ganzen Postings enthalten war, nochmal etwas deutlicher formulieren. Ich habe eine Beobachtung O = {x_t}, t=1,2,... gemacht, wobei die Beobachtung lange genug war, um Aussagen erlauben zu können, also |O| >> 4 *g*. Es liegt nur diese eine Beobachtung O vor. Den Erwartungswert kann ich also immer nur anhand eines einzigen Datenwertes schätzen, was nicht genügt um die erste Bedingung, ein konstanter erster Moment, prüfen zu können. Ich denke daher Aussagen über Stationarität dieser diskreten Zeitreihe O sind nur möglich, wenn man diese Serie in k Teilreihen zerlegt. Dann nehme ich einfach an, dass jede Teilreihe eine (unabhängige) Ausprägung des darunterliegenden stochastischen Prozesses darstellt. Damit liegen nun für jedes t mehrere Werte vor, die ich als Schätzung für den Erwartungswert nehmen kann. Da ich nun mehrere Ausprägungen des Prozesses vorliegen habe, kann ich Aussagen gemäß der Definition machen, auch wenn diese natürlich nur mit einer gewissen Wahrscheinlichkeit zutreffen, also eben geschätzt sind.

Ergodizität unterstelle ich einfach mal (tatsächlich sollte das für viele Zeitreihen, die aus physikalischen Prozessen entstammen auch zutreffen).

Nehme ich wieder das obige Beispiel, so könnte man die Zeitreihe {1,2,3,4} in 2 (=> {1,2} und {3,4}) oder 4 Teilreihe zerlegen und die als einzelne Ausprägungen betrachten [1]. Diese Teilserien kann ich dann u.a. zur Schätzung des Erwartungswertes nehmen. Durch das Zerlegen in Teilreihen sollte ich auch mitbekommen, ob irgendwelche Perioden in der Zeitreihe enthalten sind, die zur nicht Stationarität führen würden.

Ich würde mir das jetzt so vorstellen (mit E(x_i) bezeichne ich die Schätzung für den tatsächlichen Erwartungswert, der mir ja unbekannt bleiben wird):
{1, 2, 3, 4} => E(x_1) = 1
{1,2} ^ {3,4} => E(x_1) = 4/2 ^ E(x_2) = 6/2
{1}, {2}, {3}, {4} => E(x_1) = (1+2+3+4)/4 = 10/4 (x_2 habe ich jetzt nicht mehr vorliegen..Meine Zeitreihe ist zu kurz)
=> Erwartungswerte nicht konstant => bereits Bedingung 1 der Def. verletzt => Zeitreihe ist nicht stationär (bitte, bevor jemand diese Schlussfolgerung zerschießt [1] betrachten, es geht nur um das Prinzip)

Wie schon im ursprünglichen Posting beschrieben ist dies der einzige Weg, wie ich mir dies vorstellen kann. Ich bin mir aber nicht sicher. Vielleicht mache ich auch einen Denkfehler dabei. Bin mir nicht sicher, ob ich diesen Sachverhalt vollständig verstanden habe... Vielleicht ist meine Vorstellung des Prüfens von Bedingung 1 der Def. (siehe obiges Beispiel) schon falsch.

[1] Disclaimer: Damit es nicht jemand in den falschen Hals bekommt: dieses Beispiel dient nur der Veranschaulichung und ist somit rein hypothetisch. Ich will davon garnichts ableiten, sondern nur verdeutlichen was ich meine. Man kann sich auch gerne eine Zeitreihe mit 10^8 Werten vorstellen, ich denke aber es man kann es auch genauso gut an 4 Werten erklären... ;-) Ich würde auch nicht mit der Definition auf Stationarität testen, dafür gibt es wie gesagt Tests. Es geht mir rein um das möglichst vollständige Verständnis des Stationaritäts-Begriffs.
 
 
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »