Optimism in the Face of Uncertainty Should be Refutable

Abstract We give an example from the theory of Markov decision processes which shows that the “optimism in the face of uncertainty” heuristics may fail to make any progress. This is due to the impossibility to falsify a belief that a (transition) probability is larger than 0. Our example shows the u...
Ausführliche Beschreibung

Gespeichert in:
Autor*in:

Ortner, Ronald [verfasserIn]

Format:

Artikel

Sprache:

Englisch

Erschienen:

2008

Schlagwörter:

Markov decision processes

Refutability

Reinforcement learning

Anmerkung:

© Springer Science+Business Media B.V. 2008

Übergeordnetes Werk:

Enthalten in: Minds and machines - Springer Netherlands, 1991, 18(2008), 4 vom: 09. Sept., Seite 521-526

Übergeordnetes Werk:

volume:18 ; year:2008 ; number:4 ; day:09 ; month:09 ; pages:521-526

Links:

Volltext

DOI / URN:

10.1007/s11023-008-9115-5

Katalog-ID:

OLC204778722X

Nicht das Richtige dabei?

Schreiben Sie uns!