i

Umgang mit Chancen und Risiken

Unser Drachenspiel ist sehr einfach. Was es für den Spieler besonders einfach macht, ist die Tatsache, dass in einer bestimmten Situation eine bestimmte Aktion immer die gleiche Belohnung mit sich bringt und zur gleichen Folgesituation führt. Eine Aktion ist hier also gut oder schlecht, aber es gibt keine Aktionen, die in irgendeiner Weise mit Chancen oder Risiken behaftet sind. So ist es zum Beispiel überhaupt keine gute Idee, den Drachen ohne jede Waffe anzugreifen. Und zwar nie! Dagegen ist es eine gute Idee, ein Buch zu nehmen und dem Drachen vorzulesen: und zwar immer.

Das muss aber nicht so sein. Es könnte ja bei einem veränderten Spiel so sein, dass in 98 Prozent aller Fälle der Drache durch einen tollkühnen Angriff ohne Waffe so verblüfft ist, dass er vor Schreck die Zahlenkombination verrät und davonläuft. Der Spieler hätte den Schatz gewonnen und sich die Kosten für das Buch gespart, insgesamt also mehr Punkte gewonnen. In den übrigen 2 Prozent jedoch würde es ausgehen wie bisher: Nämlich fatal. Die Belohnung ist in diesen 2 Prozent der Fälle mies und der Folgezustand noch mieser, weil er jede weitere Aktion unmöglich macht.

Die Frage ist: Wie soll ein Lernverfahren mit solchen Zufälligkeiten (bzw. Chancen und Risiken) im Spielszenario umgehen.

Suche

v
5.1.3.5.5
dev.inf-schule.de/ki/menueansicht/maschinelles_lernen_mit_python/verstaerkendes_q_learning/umgang-mit-chancen-und-risiken
dev.inf-schule.de/5.1.3.5.5
dev.inf-schule.de/@/page/vGwy5xgMExGmoUkD

Rückmeldung geben