Online Reinforcement Learning Using a Probability Density Estimation

Function approximation in online, incremental, reinforcement learning needs to deal with two fundamental problems: biased sampling and nonstationarity. In this kind of task, biased sampling occurs because samples are obtained from specific trajectories dictated by the dynamics of the environment and...
Ausführliche Beschreibung

Gespeichert in:
Autor*in:

Alejandro Agostini [verfasserIn]

Enric Celaya

Format:

Artikel

Sprache:

Englisch

Erschienen:

2017

Schlagwörter:

Probability

Estimating techniques

Sampling

Neural networks

Übergeordnetes Werk:

Enthalten in: Neural computation - Cambridge, Mass. : MIT Press, 1989, 29(2017), 1, Seite 220-246

Übergeordnetes Werk:

volume:29 ; year:2017 ; number:1 ; pages:220-246

Links:

Volltext
Link aufrufen

DOI / URN:

10.1162/NECO_a_00906

Katalog-ID:

OLC1989106862

Nicht das Richtige dabei?

Schreiben Sie uns!