Bei dem Reinforcement Learning handelt es sich um eine Methode / Strategie des natürlichen Lernens, diese baut auf dem Verfahren des Machine Learnings auf, darunter versteht man die künstliche Entwicklung von Wissen indem man Erfahrungen sammelt und so eine Lösung entwickelt. In den Grundzügen ähnelt das Machine Learning in vielen Aspekten dem Supervised Learning und dem Unsupervised Learning, allerdings richtet man die Form des Lernens auf die Strategien des natürlichen Lernprozesses aus.
Die Form des Lernens ähnelt in gewisser Weise einer Konditionierung, wenn das System korrekt lernt und reagiert werden sowohl Belohnungen als auch Strafen ausgegeben, wenn das Ergebnis nicht den Erwartungen entspricht. Durch das Belohnen, wenn etwas korrekt durchgeführt wurde, spricht man von einem bestärkendem Lernen, dieses wurde bereits in der Vergangenheit im Bereich der Kybernetik eingesetzt. Durch Belohnungen versuchen bestimmte Anbieter im Netz, wie zum Beispiel Ladbrokes Aktionscode ,ein bestimmtes verhalten zu bestärken.
Ablauf des Reinforcement Learnings
Bei dem Reinforcement Learning handelt es sich um ein sehr umfangreiches und komplexes System, dieses kann jedoch relativ einfach beschrieben werden: Der Lernprozess wird als Agent bezeichnet und sollte sich in einer Umgebung befinden in der eine Vielzahl an Aktionen und Abläufe stattfinden. Dem Agent werden diverse Zeitpunkte vorgegeben zu denen dieser den aktuellen Zustand in seiner Umgebung ermitteln soll, nachdem diese Analyse durchgeführt wurde muss der Agent mit einer passenden Aktion auf seine Umgebung reagieren. Je nachdem, ob die Aktion korrekt oder falsch ausgeführt wurde, erhält der Agent von der Umgebung eine Belohnung oder eine Strafe und ist so in der Lage seine Handlung bei Wiederholung beizubehalten oder entsprechend zu verändern. Bei einer Belohnung weiß der Agent, dass seine Ausführung in Ordnung gewesen ist und diese Aktion in Zukunft wieder ausgeführt werden darf, bei einer Bestrafung muss der Agent seine Handlung in dieser Situation verändern.
Dieser Vorgang kann auf ein Hundetraining übertragen werden, hier wird ein Hund trainiert auf unterschiedliche Situationen zu reagieren, handelt der Hund richtig erhält er eine Belohnung oder eine Bestrafung für eine falsche Handlung. Genau auf diese Weise erlernt, der Hund und der Agent eines Reinforcement Learning-Systems.
Der Agent ist in einem Markov Decision Process eingebettet, dort sind alle Aktionen und Statusmeldungen hinterlegt. Das System / der Agent muss in dieser Umgebung nun erlernen welche Aktionen korrekt sind und welche falsch, dieser Ablauf nennt sich Reinforcement Learning.
Reinforcement Learning soll ein System sein, welches auf Menschen in seinem Umfeld reagieren kann und sich selbstständig weiterentwickelt. Ein System welches ohne menschliche Hilfe imstande ist zu lernen und korrekt zu reagieren. Die Funktion ist nur in einer für das System bekannten Umgebung möglich.
Grafik von Megajuice – Own work, CC0, Link
Hallo, ich bin der Gründer dieses Blogs. Am Anfang habe ich hier nur über SEO-Themen und Suchmaschinen geschrieben. Jetzt schreibe ich hier zusätzlich noch über Technik Themen und andere Dinge, die mich interessieren. Wenn ich Dich inspiriert habe, oder Du Hilfe bei einem Onlinemarketing Thema benötigst, scheue Dich nicht mich zu kontaktieren.