DeepMind Trains AI Agents To Play Games Without Human Interaction Data

In its latest step towards general-purpose AI systems, DeepMind has proposed XLand, a virtual environment, to formulate new learning algorithms, which control how agent trains and the games on which it trains. XLand was introduced via a paper titled, “Open-Ended Learning Leads to Generally Capable Agents“, in which DeepMind researchers demonstrated a technique to train an agent capable of playing many different games without requiring human interaction data

Challenges with traditional reinforcement learning

The repetitive process of trial and error has proven effective in teaching computer systems to play many games, including chess, shogi, Go, and StarCraft II. However, one of the main challenges with reinforcement learning-trained systems is a lack of training data. Systems trained by reinforcement learning are unable to adapt their learned behaviours to new tasks because they are not trained on a broad enough set of tasks.

Source : 

Veille-cyber

Share
Published by
Veille-cyber

Recent Posts

Panorama des menaces cyber en 2025

Panorama des menaces cyber en 2025 : Implications pour les entreprises françaises à l'ère de…

13 heures ago

Risques émergents de l’Intelligence Artificielle

Introduction L'adoption croissante des technologies d'intelligence artificielle dans le secteur de la santé offre des…

2 jours ago

Cybersécurité et IA en santé : enjeux stratégiques pour les DSI d’établissements de soins

La révolution IA dans le secteur de la santé : nouveaux défis de cybersécurité La…

2 jours ago

Sécurité des PME : échapper à l’enfer des questionnaires de sécurité

En tant que PME sous-traitante de grands groupes, vous connaissez trop bien ce scénario :…

5 jours ago

Votre entreprise a été cyberattaquée : pourquoi la technologie seule ne vous sauvera pas

Votre entreprise vient de subir une cyberattaque. Dans le feu de l'action, vous avez mobilisé…

5 jours ago

Mieux connaitre vos faiblesses pour mieux vous protéger

"Mais concrètement, à quoi sert un scanner de vulnérabilité pour une entreprise comme la nôtre?"…

5 jours ago

This website uses cookies.