Evolutionary direct policy search in noisy environments

Verstärkungslernen (Reinforcement learning, RL) ist ein Untergebiet des Maschinellen Lernens. Ein Agent befindet sich in einer Umwelt und kommuniziert mit dieser durch fest vorgegebene Kanäle. Der Agent beobachtet den Zustand seiner Umwelt und wählt basierend auf dieser Beobachtung und seiner internen Handlungsstrategie eine Aktion, die von der Umwelt ausgeführt wird. Schließlich erhält der Agent von der Umwelt ein skalares Verstärkungslernsignal, das das Verhalten des Agenten bewertet. Im ersten Teil werden die konzeptuellen Gemeinsamkeiten und Unterschiede zwischen policy gradient Methoden und evolutionärem RL untersucht und experimentell nachgewiesen. Der zweite Teil der Arbeit befasst sich mit der weiteren Verbesserung der Rauschkontrolle für evolutionäre Algorithmen. Selektionsrennen werden hergeleitet, ihre theoretischen Eigenschaften dargestellt und ihr Verhalten wird experimentell untersucht und mit einem kompetitiven Verfahren verglichen.

Metadaten
Author:	Verena Heidrich-Meisner GND
URN:	urn:nbn:de:hbz:294-32726
Referee:	Gregor Schöner ORCiD GND, Christian Igel ORCiD GND
Document Type:	Doctoral Thesis
Language:	English
Date of Publication (online):	2011/11/14
Date of first Publication:	2011/11/14
Publishing Institution:	Ruhr-Universität Bochum, Universitätsbibliothek
Granting Institution:	Ruhr-Universität Bochum, Fakultät für Physik und Astronomie
Date of final exam:	2011/07/14
Creating Corporation:	Fakultät für Physik und Astronomie
GND-Keyword:	Bestärkendes Lernen (Künstliche Intelligenz); Evolutionsstrategie; Algorithmus; Optimierung; Rauschen
Institutes/Facilities:	Institut für Neuroinformatik
Dewey Decimal Classification:	Naturwissenschaften und Mathematik / Physik
faculties:	Fakultät für Physik und Astronomie
Licence (German):	Keine Creative Commons Lizenz - es gelten der Veröffentlichungsvertrag und das deutsche Urheberrecht

RUB » Bibliotheksportal