Direkt zum Inhalt

Fachbereich Informatik

Fortgeschrittene Themen in AI und Robotik

Datum

Montag, 26. Juni 2023

Zeit

17:00 - 18:30

Online event

Online

Zum WebEx-Meeting über LEA
In der Vortragsreihe "Fortgeschrittene Themen in AI und Robotik" begrüßt Prof. Dr. Teena Hassan (H-BRS) Mehdi Khamassi, Research director (CNRS), vom Institute of Intelligent Systems and Robotics, Sorbonne University, Paris, zum Thema: " Robot active reinforcement learning to maximize child engagement during child-robot interaction".

Zusammenfassung

Dynamische, unkontrollierte Mensch-Roboter-Interaktionen (HRIs) erfordern, dass sich Roboter an Änderungen des menschlichen Verhalten und Absichten des Menschen anzupassen. Zu den relevanten Signalen gehören nonverbale Hinweise wie der Blick des Menschen, die dem Roboter wichtige Informationen über das aktuelle Engagement des Menschen bei der Aufgabe und darüber, ob der Roboter sein sein aktuelles Verhalten fortsetzen sollte oder nicht. Die Fähigkeiten des Roboters, sich an diese nonverbalen Hinweise anzupassen, sind jedoch nonverbalen Hinweisen anzupassen, sind noch unterentwickelt. Wir haben einen aktiven Explorationsalgorithmus für RL während HRI vorgeschlagen, bei dem die Belohnungsfunktion die gewichtete Summe aus dem aktuellen Engagement des Menschen und Variationen dieses Engagements ist. Wir einen parametrisierten Aktionsraum, in dem ein Meta-Lernalgorithmus angewendet wird, um gleichzeitig die Exploration im diskreten Aktionsraum (z.B. Bewegen eines Objekts) und im Raum der kontinuierlichen Charakteristika der Bewegung (z.B. Geschwindigkeit, Richtung, Stärke und Ausdruckskraft). In diesem Vortrag werde ich zunächst zeigen, dass dieser Algorithmus im nicht-stationären Multiarmed-Bandit-Paradigma eine Spitzenleistung erreicht. Dann werde ich die Anwendung Anwendung auf eine simulierte HRI-Aufgabe zeigen und zeigen, dass er eine kontinuierliche parametrisierte RL mit passiver oder aktiver Exploration, die auf verschiedenen existierenden Methoden basiert, übertrifft. Schließlich werde ich Tests der Leistung in einer realistischeren Version derselben HRI-Aufgabe zeigen, bei der ein praktischer Ansatz verfolgt wird, um das menschliche Engagement durch visuelle durch visuelle Hinweise auf die Kopfhaltung. Der Algorithmus kann Störungen des menschlichen Engagements mit unterschiedlicher Dauer erkennen und sich an diese Dauer. Insgesamt deuten diese Ergebnisse auf einen neuen effizienten und robusten Rahmen für das Lernen von Robotern in dynamischen HRI-Szenarien.

 

Kurzer Lebenslauf

Mehdi Khamassi ist Forschungsdirektor am Centre National de la Recherche Scientifique (CNRS) und arbeitet am Institut für Intelligente Systeme und Robotik (ISIR) auf dem Campus der Sorbonne Université, Paris, Frankreich. Er hat einen doppelten Hintergrund in Informatik (Ingenieurdiplom 2003 an der Ecole Nationale Supérieure d'Informatique pour l'Industrie et l'Entreprise, Evry, mit Spezialisierung auf künstliche Intelligenz und statistische Modellierung) und Kognitionswissenschaften (Cogmaster 2003 an der Université Pierre et Marie Curie (UPMC), Paris). Anschließend promovierte er zwischen 2003 und 2007 in kognitiven Neurowissenschaften an der UPMC und am Collège de France. Er ist Co-Direktor des CogMaster-Programms an der Ecole Normale Supérieure (PSL) / EHESS / Universität Paris Cité. Er ist Chefredakteur von Intellectica und Herausgeber mehrerer anderer Fachzeitschriften, darunter Frontiers in Neurorobotics, Frontiers in Decision Neuroscience, ReScience X und Neurons, Behavior, Data analysis and Theory. Zu seinen Hauptforschungsthemen gehören Entscheidungsfindung und Verstärkungslernen bei Robotern und Menschen, die Rolle sozialer und nicht-sozialer Belohnungen beim Lernen und ethische Fragen, die sich durch maschinelle autonome Entscheidungsfindung stellen. Seine wichtigsten Methoden sind die computergestützte Modellierung, die Entwicklung neuer neurowissenschaftlicher Experimente zur Prüfung von Modellvorhersagen, die Analyse experimenteller Daten, die Entwicklung von KI-Algorithmen für Roboter und Verhaltensexperimente mit Menschen, nichtmenschlichen Tieren und Robotern.

 

Relevante Literatur zu diesem Vortrag

1. Rémi Dromnelle, Erwan Renaudo, Mohamed Chetouani, Petros Maragos, Raja Chatila, et al.. Reducing computational cost during robot navigation and human-robot interaction with a human-inspired reinforcement learning architecture. International Journal of Social Robotics, 2022, ⟨10.1007/s12369-022- 00942-6⟩. ⟨hal-03829879⟩

2. Abolfazl Zaraki, Mehdi Khamassi, Luke J Wood, Gabriella Lakatos, Costas S Tzafestas, et al.. A Novel Reinforcement-Based Paradigm for Children to Teach the Humanoid Kaspar Robot. International Journal of Social Robotics, 2020, 12 (3), pp.709-720. ⟨10.1007/s12369-019-00607-x⟩. ⟨hal-02408941⟩

3. Mehdi Khamassi, George Velentzas, Theodore Tsitsimis, Costas Tzafestas. Robot Fast Adaptation to Changes in Human Engagement During Simulated Dynamic Social Interaction With Active Exploration in Parameterized Reinforcement Learning. IEEE Transactions on Cognitive and Developmental Systems, 2018, 10 (4), pp.881-893. ⟨10.1109/TCDS.2018.2843122⟩. ⟨hal-02324064⟩

 

Der Vortrag findet in englischer Sprache statt und richtet sich an die Studierenden und Mitarbeitenden der H-BRS. Interessierte sind herzlich eingeladen.

Kontakt

20230403_fbinf_Hassan_Teena_001

Teena Chakkalayil Hassan

Professorin

Standort

Sankt Augustin

Raum

C 216

Adresse

Grantham-Allee 20

Sankt Augustin