Anpassung der Q-Werte
Bislang hat unser Computer zwar in Abhängigkeit der Situation Entscheidungen getroffen, aber diese waren mehr oder weniger von der Q-Tabelle geleitet, die mit "natürlicher Intelligenz" bzw. mit "menschlichem Lernen" erstellt wurde. In den folgenden Abschnitten soll nun die Q-Tabelle selbst als Ergebnis eines maschinellen Lernens angepasst werden, also aufgrund von Erfahrungen, die der Agent mit dem Spiel macht.