i

Implementation

Aufgabe 1: Neu-Implementation der Funktion lerne_dazu

Schreibe die Funktion lerne_dazu so um, dass sie den Überlegungen aus dem letzten Abschnitt entspricht. Nutze hierfür die bereits implementierte Funktion beste_aktion. Bedenke dabei, dass es vorkommen kann, dass in der Folgesituation gar keine Aktionen mehr möglich sind, dass also die Liste naechste_moegliche_aktionen leer ist. Dieser Fall muss dann gesondert behandelt werden, wie im letzten Abschnitt beschrieben.

Aufgabe 2: Test des Lernalgorithmus lerne_dazu

Starte das Programm spiel_ki.py und drücke den Knopf "Lernen". Warte solange, bis mehrfach der Safe geöffnet wurde. Brich dann den Lernvorgang mit "Stop" ab und überprüfe mit dem Knopf "Spiele optimal", ob der Agent gelernt hat, das Spiel optimal zu spielen.

Suche

v
5.1.3.5.4.3
dev.inf-schule.de/ki/menueansicht/maschinelles_lernen_mit_python/verstaerkendes_q_learning/anpassung-von-q/implementation
dev.inf-schule.de/5.1.3.5.4.3
dev.inf-schule.de/@/page/yRp58seBZETIclFX

Rückmeldung geben