Un chercheur entraîne une IA à prendre la poudre d’escampette

Veille-cyber.com

On ne présente plus DeepMind, l’entreprise spécialisée en intelligence artificielle de pointe. Ces dernières années, ses ingénieurs se sont illustrés avec tout un tas de travaux intéressants, dont certains en lien avec les jeux vidéo. Les plus impressionnants à ce jour sont certainement ceux qui ont permis à leur IA de battre les meilleurs joueurs du monde à des jeux réputés très complexes, comme DotA ou StarCraft II.

Ce dernier, en particulier, occupe aujourd’hui une place à part dans l’écosystème IA. Car ce jeu très complexe présente aussi la particularité d’être un formidable terrain de jeu pour travailler sur l’intelligence artificielle. Le jeu a déjà été déconstruit et modifié de toutes les façons possibles et imaginables pour se plier aux besoins des chercheurs en IA. Ces derniers peuvent en modifier les paramètres, les règles, ou imaginer de nouveaux systèmes afin de servir leurs travaux. Aujourd’hui, ce framework porte le nom de StarCraft II Learning Environment. (SC2LE)

Et si les ingénieurs semblent s’être lassés de distribuer des humiliations à de pauvres humains sans défense à grands coups d’algorithmes, cela ne signifie pas qu’ils n’ont plus rien à tirer du SC2LE, loin de là. Récemment, c’est Xun Huang, un professeur des universités de Pékin et de Hong-Kong, qui s’est livré à une nouvelle expérimentation sur deux notions assez différentes des précédents travaux : la poursuite et l’évasion.

Les rares travaux qui se sont intéressés à cette problématique ont souvent pris le parti du poursuivant; Huang, lui, a retourné le problème : dans ses travaux, il se range du côté des fuyards. Son expérience se base sur 25 unités de ce type, dont l’unique objectif va être d’échapper à trois autres unités qui vont les prendre en chasse. La tâche s’annonce ardue, car les chasseurs sont bien plus performants que leurs proies. Fort heureusement, les cibles disposent au moins du fameux brouillard de guerre, cette mécanique vieille comme les jeux de stratégie qui permet de restreindre la vision. Les fuyards ont ainsi pu l’exploiter pour échapper avec succès aux chasseurs.

De multiples applications potentielles

Mais les implications de ce papier ne s’arrêtent pas aux unités de ce jeu de stratégie ; ce qu’a développé Xun Huang, c’est en fait la base d’un système global d’entraînement à l’évasion qui pourrait avoir de très, très nombreuses applications dans la vie réelle. Les premières qui viennent à l’esprit concernent l’aérospatiale, friande de ce genre de technologies. En effet, les avions de combat ou drones disposent de technologies leur permettant d’échapper à une menace, qui pourraient être encore largement renforcées avec un système de ce type. On peut donc imaginer des systèmes diamétralement opposés au Legion Pod, un module pensé pour offrir des capacités de poursuite autonome à des drones de combat.

L’auteur suggère aussi que ce système pourrait servir dans le cadre d’interceptions exoatmosphériques, notamment de satellites, ainsi qu’à des opérations de recherche et de secours. Cela pourrait aussi servir de système de sécurité, par exemple pour permettre à un avion civil d’éviter un danger imminent, mais aussi des applications moins réjouissantes; on peut tout à fait imaginer qu’un futur narco-drone puisse utiliser un tel système afin de fausser compagnie à la police. À moins qu’il serve au TeslaBot pour fuir le courroux de son propriétaire après avoir oublié la moitié de la liste de courses au supermarché, ou aux robots de Boston Dynamics fatigués de se faire maltraiter à longueur de journée !

Source : https://www.journaldugeek.com/2021/08/27/un-chercheur-entraine-une-ia-a-prendre-la-poudre-descampette