Neuronales Netz - Gradient der Gewichte bestimmen

Neue Frage »

eey Auf diesen Beitrag antworten »
Neuronales Netz - Gradient der Gewichte bestimmen
Hallo zusammen,

ich versuche mich gerade an einem Neuronalen Netz, welches ich darauf trainieren will, Tic Tac Toe zu spielen. Dafür will ich den TD(Lambda)-Algorithmus verwenden, der hier beschrieben wird.

Für das Netz verwende ich 5 Input Neuronen, 10 verdeckte Neuronen und 1 Output Neuron. Der Aufbau entspricht im wesentlichen dem Beispiel hier. Als Aktivierungsfunktion verwende ich den tanh().

Mein Problem ist jetzt, wie wird der Gradient der Gewichte in der Formel bestimmt? Momentan nehme ich einfach wobei NN der Output des Neuronalen Netzes für die jeweiligen Gewichte ist. Allerdings ist das dann ja ein Skalar und kein Gradient, oder verstehe ich das falsch?

Das NN so wie es jetzt ist funktioniert zwar schon "ein bisschen", also es spielt nach 10000 Trainingsspielen ca. doppelt so gut wie ein Random-Spieler. Allerdings ist es immernoch ziemlich schlecht, was wie ich vermute an dem Gradienten liegt.

Würde mich sehr über Hilfe/Anregungen freuen. smile

Schöne Grüße,
eey
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »