Fachkonzept: Wahrnehmungs-Aktions-Schleife
- Die vom Agenten jeweils wahrgenommene Situation. In unseren Überlegungen werden wir die Situationen einfach durchnummerieren und bezeichnen die Situationsnummer mit dem Variablennamen $s$.
- Die vom Agenten jeweils ausgeführte Aktion. Auch die Aktionen nummerieren wir durch und nennen sie die entsprechnede Variable $a$.
- Die Belohnung, die der Agent für eine bestimmte Aktion in einer bestimmten Situation erhält (wobei „Bestrafungen“ als „negative Belohnungen“ gedeutet werden). Wegen der englischen Bezeichnung „reward“ für Belohnung verwenden wir das Formelsymbol $r$.
Quellen
- [1]: Wahrnehmungs-Handlungs-Schleife - Urheber: Peter Dauscher - Lizenz: inf-schule.de