i

Verhalten aus der Q-Tabelle

Aufgabe 1: Ausgabe der möglichen Aktionen

Ergänze die Funktion beste_aktion am Anfang um einige Programmzeilen, die mit einer Schleife nacheinander alle Aktionen ausgeben, die bei Situation Nr. s möglich sind.
Tipp: Die Liste kann in Python einfach durchlaufen werden mit
for a in moegliche_aktionen:
    # tue irgendwas mit dem Listenelement a

Aufgabe 2: Zugriff auf Werte der Q-Tabelle

Ergänze die Funktion beste_aktion so, dass zu den möglichen Aktionen auch die entsprechenden Q-Werte angezeigt werden.
Tipp: Der Q-Wert zu Situation 5 und Aktion 3 kann ausgegeben werden mit
print(Q[5][3])    

Aufgabe 3: Bestimmung des Verhaltens aus der Q-Tabelle

Ändere die Funktion beste_aktion so ab, dass die hartkodierten if-Anweisungen wieder gelöscht werden. Stattdessen soll für die Situation s durch eine Schleife die beste Aktion, also die mit dem größten Q-Wert gefunden werden. Die Nummer dieser besten Aktion soll dann das Ergebnis der Funktion sein, also mit return zurück gegeben werden.
Dabei sollen nur die Aktionen betrachtet werden, die in der Liste moegliche_aktionen stehen.

Aufgabe 4: Test

Teste das Verhalten des Programms, indem du spiel_ki.py startest und dir den Spielverlauf anschaust.

Suche

v
5.1.3.5.3.2
dev.inf-schule.de/ki/menueansicht/maschinelles_lernen_mit_python/verstaerkendes_q_learning/weich-kodierte-intelligenz/verhalten-aus-q
dev.inf-schule.de/5.1.3.5.3.2
dev.inf-schule.de/@/page/pCLM8ZjfuFNKeTuz

Rückmeldung geben