Online regret bounds for Markov decision processes with deterministic transitions

Gespeichert in:
Autor*in:

Ortner, Ronald [verfasserIn]

Format:

Artikel

Erschienen:

2010

Systematik:

Umfang:

12

Übergeordnetes Werk:

Enthalten in: Theoretical computer science - Amsterdam [u.a.] : Elsevier, 1975, 411(2010), 29 vom: 17. Juni, Seite 2684-2696

Übergeordnetes Werk:

volume:411 ; year:2010 ; number:29 ; day:17 ; month:06 ; pages:2684-2696 ; extent:12

Katalog-ID:

OLC1842231936

Nicht das Richtige dabei?

Schreiben Sie uns!