Standardního agenta jsme popsali funkcí z běhů končících stavy do akcí.
Čistě reaktivní agent nemá historii, je to funkce ze stavů do akcí.
Vnímající systém překládá stavy prostředí do svých vjemů (funkce see) a jeho akce je určena sekvencí vjemů (funkce action).
Stavový systém má vnitřní datovou strukturu (vnitřní stavy). Funkce see zůstává stejná jako u vnímajícího systému, akce je určena aktuálním vnitřním stavem, aktuální vnitřní stav je určen vjemem a předchozím vnitřním stavem (funkce next). Řídící smyčka: action(next(i, see(e))).
Nevýhody užitkových funkcí: Jak si máme vymyslet výsledky? Neuvažujeme v pojmech užitkovosti. Těžko formulujeme úkoly.
Předpokládaná užitkovost: užitkovost běhu násobená pravděpodobností, že běh nastane.
Optimální agent v prostředí maximalizuje očekávanou užitkovost.
Nebyli jste na přednášce?
Wooldridge, kapitola 2.
Čtení
"Cihličky" jsou odlehčenou verzí Tilewordu:
M. E. Pollack, M. Ringuette: Introducing the Tileworld: Experimentally Evaluating Agent Architectures
Zajímá vás Tileworld víc? Podívejte se na samotnou hru a třeba si stáhněte zdrojáky a zkuste svůj algoritmus implementovat: J.M. Vidal: Tileworld.
Užitkovost: Jen okrajově, pro skutečné zájemce:
Wikipedia: Utility. K pojmům sociální blaho a Pareto efektivita/optimálnost se dostaneme za několik týdnů.
Gonçalo Fonseca: Choice Under Risk And Uncertainty. Když už nic jiného, tak aspoň kapitolku o Petěrburgském paradoxu.Domácí úloha
Ukažte, že standardní, vnímající a stavový agent jsou ekvivalentní systémy. Ekvivalence agentů se ukazuje přes běhy (běh jednoho agenta je možné simulovat během druhého agenta).