Film: Darya über ihr Masterprojekt
Montag, Juli 15, 2019
Kurzfilm "Intelligente Systeme": Darya über ihr Masterprojekt II
Darya erläutert ihr Masterprojekt im 2. Semester zum Thema "Reinforcement-Lernen mit Gegner" im Schwerpunkt Intelligente Systeme
Ziel des Projektes II ist die Weiterentwicklung der im Projekt I
begonnenen Anwendung, die es einem NAO-Roboter ermöglicht, das NIM-Spiel
mit einem menschlichen Gegner zu spielen. Der Roboter soll selbstständig
die Spielsituation erkennen, die Strategie planen, eigene Spielzüge
erledigen und mit dem Gegner interagieren.
Im Projekt II sollen folgende Aufgaben gelöst werden:
-
Bildverarbeitung: Automatische Erkennung der Region of Interest.
Im Projekt I sind die Koordinaten der Region of Interest (Abk.: ROI) fest vorgegeben. Im Rahmen des Projektes II soll die ROI automatisch bestimmt werden -
Bildverarbeitung: Erkennung des Spielfeldzustandes.
Es gibt keine vorgegebene Reihenfolge, wie die Legosteine weggestoßen werden sollen. Deswegen soll der Roboter genau erkennen, welche der Legosteine sich noch im Spiel befinden und welche nicht. -
Bildverarbeitung: Ermitteln des Spielzugendes.
Die im Projekt I umgesetzte Methode zur Ermittlung des Spielzugendes des Gegners basierte auf der Handerkennung in der ROI. Jedoch weist dieser Ansatz einige Probleme auf. Aus diesem Grund soll statt der aktuell verwendeten Methode die Idee mit der Beobachtung der Anzahl von Legosteine in der ROI zur Ermittlung des Spielzugendes des Nutzers realisiert werden. Dabei soll der Roboter einen Betrug erkennen können und wenn nötig, dem Gegner eine Warnung aussprechen. -
Interaktion: Gestaltung eines menschenähnlichen Verhaltens des
Roboters.
Der Roboter soll ein lebhaftes und engagiertes Verhalten zeigen. Das bedeutet, dass der Roboter den Nutzer wahrnehmen, mit ihm einen Dialog führen, gestikulieren sowie die Emotionen zeigen soll. -
Strategie: Das selbstständige Erlernen einer Spielstrategie.
Der Roboter muss versuchen das Spiel zu gewinnen. Mithilfe eines Verfahrens aus der Familie der Reinforcement Learning-Algorithmen muss der Roboter eine optimale Strategie bestimmen und ihr folgen bzw. sich an einem neuen Gegner anpassen.