výuka

Petr Olmer, MFF UK

14.11.2007

5. přednáška (7. listopadu 2007)

Standardní, čistě reaktivní, vnímající a stavové systémy. Dokončení užitkových funkcí.

Standardního agenta jsme popsali funkcí z běhů končících stavy do akcí.

Čistě reaktivní agent nemá historii, je to funkce ze stavů do akcí.

Vnímající systém překládá stavy prostředí do svých vjemů (funkce see) a jeho akce je určena sekvencí vjemů (funkce action).

Stavový systém má vnitřní datovou strukturu (vnitřní stavy). Funkce see zůstává stejná jako u vnímajícího systému, akce je určena aktuálním vnitřním stavem, aktuální vnitřní stav je určen vjemem a předchozím vnitřním stavem (funkce next). Řídící smyčka: action(next(i, see(e))).

Nevýhody užitkových funkcí: Jak si máme vymyslet výsledky? Neuvažujeme v pojmech užitkovosti. Těžko formulujeme úkoly.

Předpokládaná užitkovost: užitkovost běhu násobená pravděpodobností, že běh nastane.

Optimální agent v prostředí maximalizuje očekávanou užitkovost.

Nebyli jste na přednášce?

Wooldridge, kapitola 2.

Čtení

"Cihličky" jsou odlehčenou verzí Tilewordu:

M. E. Pollack, M. Ringuette: Introducing the Tileworld: Experimentally Evaluating Agent Architectures  

Zajímá vás Tileworld víc? Podívejte se na samotnou hru a třeba si stáhněte zdrojáky a zkuste svůj algoritmus implementovat: J.M. Vidal: Tileworld.

Užitkovost: Jen okrajově, pro skutečné zájemce:

Wikipedia: Utility. K pojmům sociální blaho a Pareto efektivita/optimálnost se dostaneme za několik týdnů.

Gonçalo Fonseca: Choice Under Risk And Uncertainty. Když už nic jiného, tak aspoň kapitolku o Petěrburgském paradoxu.

Domácí úloha

Ukažte, že standardní, vnímající a stavový agent jsou ekvivalentní systémy. Ekvivalence agentů se ukazuje přes běhy (běh jednoho agenta je možné simulovat během druhého agenta).
Petr Olmer, 14.11.2007, 14:41:00, trvalý odkaz,

Komentáře (0)

Přidání komentáře