Evolutionary direct policy search in noisy environments
- Verstärkungslernen (Reinforcement learning, RL) ist ein Untergebiet des Maschinellen Lernens. Ein Agent befindet sich in einer Umwelt und kommuniziert mit dieser durch fest vorgegebene Kanäle. Der Agent beobachtet den Zustand seiner Umwelt und wählt basierend auf dieser Beobachtung und seiner internen Handlungsstrategie eine Aktion, die von der Umwelt ausgeführt wird. Schließlich erhält der Agent von der Umwelt ein skalares Verstärkungslernsignal, das das Verhalten des Agenten bewertet. Im ersten Teil werden die konzeptuellen Gemeinsamkeiten und Unterschiede zwischen policy gradient Methoden und evolutionärem RL untersucht und experimentell nachgewiesen. Der zweite Teil der Arbeit befasst sich mit der weiteren Verbesserung der Rauschkontrolle für evolutionäre Algorithmen. Selektionsrennen werden hergeleitet, ihre theoretischen Eigenschaften dargestellt und ihr Verhalten wird experimentell untersucht und mit einem kompetitiven Verfahren verglichen.
Author: | Verena Heidrich-MeisnerGND |
---|---|
URN: | urn:nbn:de:hbz:294-32726 |
Referee: | Gregor SchönerORCiDGND, Christian IgelORCiDGND |
Document Type: | Doctoral Thesis |
Language: | English |
Date of Publication (online): | 2011/11/14 |
Date of first Publication: | 2011/11/14 |
Publishing Institution: | Ruhr-Universität Bochum, Universitätsbibliothek |
Granting Institution: | Ruhr-Universität Bochum, Fakultät für Physik und Astronomie |
Date of final exam: | 2011/07/14 |
Creating Corporation: | Fakultät für Physik und Astronomie |
GND-Keyword: | Bestärkendes Lernen (Künstliche Intelligenz); Evolutionsstrategie; Algorithmus; Optimierung; Rauschen |
Institutes/Facilities: | Institut für Neuroinformatik |
Dewey Decimal Classification: | Naturwissenschaften und Mathematik / Physik |
faculties: | Fakultät für Physik und Astronomie |
Licence (German): | Keine Creative Commons Lizenz - es gelten der Veröffentlichungsvertrag und das deutsche Urheberrecht |