Neural MMO, un MMO pour l'apprentissage des IA

Après avoir appris à jouer à Dota 2 en équipe, les « agents » conçus par les chercheurs d'OpenAI apprennent à survivre dans l'univers persistant de Neural MMO. Selon les bots, éviter les conflits et se partager les ressources augmentent la durée de vie

Ce n’est pas une surprise, l’intelligence artificielle fait aujourd’hui l’objet d’une attention toute particulière et le jeu est en l’un des terrains d’expérimentation, notamment pour OpenAI – le groupe de chercheurs a notamment travaillé sur une IA conçue pour apprendre à jouer à Dota 2 en équipe (les cinq bots ont appris à collaborer et jouent maintenant suffisamment bien pour battre régulièrement des équipes de vrais joueurs).
OpenAI poursuit ses expérimentations et à plus grande échelle : après avoir appris à leur IA à jouer au MOBA de Valve, les chercheurs ont imaginé un MMO (baptisé Neural MMO) pour que leur intelligence artificielle apprenne à survivre dans un environnement persistant.

Neural MMO, un MMO pour l'apprentissage des IA

Concrètement, Neural MMO repose sur un univers persistant composé d’une centaine de serveur accueillant chacun entre 16 et 128 « agents » (des bots contrôlés par l’IA). Ces « agents » doivent survivre le plus longtemps possible dans ces univers, en se nourrissant et s’hydratant régulièrement. Pour y parvenir, ils doivent trouver des ressources (des points d’eau et des zones de forêts produisant de la nourriture qui se renouvelle lentement), mais aussi survivre aux autres agents puisque chaque bot dispose de capacités d’attaques (en mêlée, à distance ou en utilisant la magie). On le comprend, les agents doivent donc explorer leur environnement plus ou moins vaste pour assurer leur subsistance et concilier cette exploration avec les autres agents, parfois dans un contexte « chacun pour soi », parfois dans un contexte de « factions » (dans la configuration où plusieurs factions cohabitent, les agents ne peuvent pas attaquer les autres agents de leur faction).

Dans ce contexte, les « agents » apprennent donc les meilleurs moyens de survivre et les chercheurs d’OpenAI commencent à en tirer quelques conclusions. Il apparait d’abord que les bots évoluant dans les environnements les plus vastes et les plus peuplés deviennent plus efficaces pour survivre (lorsque des serveurs sont fusionnés, les agents issus du monde le plus grands survivent plus longtemps que ceux issus du monde le plus modeste, même dans un contexte de jeu chacun pour soi).
Parallèlement, on constate que les agents sont naturellement enclins à étendre leur terrain d’exploration : ils vont de plus en plus loin pour trouver des ressources et éviter les affrontements avec les autres bots. Dans un contexte de jeu de faction, chaque faction est encline à s’installer sur le territoire qui permettra de tous ses représentants de survivre (chaque faction s’arroge un territoire).
En d’autres termes, là où les joueurs humains ont souvent tendance à affronter les autres joueurs pour s’approprier les ressources d’un univers, l’IA considère que la stratégie la plus efficace (la plus intelligente ?) consiste à se partager l’univers de jeu pour éviter les conflits. OpenAI entend poursuivre ces recherches en modifiant différents paramètres (notamment en augmentant la population étudiée et surtout en générant des univers plus complexes), mais d’ici là, le fait que la stratégie la plus intelligente soit le pacifisme est peut-être un enseignement en soi – pour peu qu’il y ait assez ressources pour tous.

Réactions (41)


  • En chargement...