Verhalten aus der Q-Tabelle
Aufgabe 1: Ausgabe der möglichen Aktionen
Ergänze die Funktionbeste_aktion
am Anfang um einige
Programmzeilen, die mit einer Schleife nacheinander alle Aktionen
ausgeben, die bei Situation Nr. s
möglich sind.
Tipp: Die Liste kann in Python einfach durchlaufen werden mit
for a in moegliche_aktionen:
# tue irgendwas mit dem Listenelement a
Aufgabe 2: Zugriff auf Werte der Q-Tabelle
Ergänze die Funktionbeste_aktion
so, dass zu den
möglichen Aktionen auch die entsprechenden Q-Werte angezeigt werden.
Tipp: Der Q-Wert zu Situation 5 und Aktion 3 kann ausgegeben werden mit
print(Q[5][3])
Aufgabe 3: Bestimmung des Verhaltens aus der Q-Tabelle
Ändere die Funktionbeste_aktion
so ab, dass die
hartkodierten if
-Anweisungen wieder gelöscht werden.
Stattdessen soll für die Situation s
durch eine Schleife
die beste Aktion, also die mit dem größten Q-Wert gefunden werden. Die
Nummer dieser besten Aktion soll dann das Ergebnis der Funktion sein, also mit
return
zurück gegeben werden.Dabei sollen nur die Aktionen betrachtet werden, die in der Liste
moegliche_aktionen
stehen.
Aufgabe 4: Test
Teste das Verhalten des Programms, indem duspiel_ki.py
startest und dir den
Spielverlauf anschaust.