DeepMind de Google s’est déjà illustré dans les jeux de stratégie, comme le jeu de Go. Cette fois, Google a testé son IA sur un jeu moins complexe mais avec des directives précises : l’IA devait apprendre par l’échec, grâce à la technique du « reinforcement learning ». Aucune information à part celle mise à la disposition de tous les joueurs n’est donnée à l’IA. Les bots avaient pour unique consigne de gagner. Durant le jeu, les bots avaient 74% de probabilité de victoire contre 52% pour les joueurs humains.
Au bout de 500.000 parties de 5 minutes, l’IA a réussi à être parfait dans le jeu. A chaque échec, la machine progressait. Si au début, elle se contentait de ramener le drapeau, au cours des autres tentatives, elle a appris à mettre en place diverses stratégies coopératives pour gagner plus rapidement. DeepMind disposait de 30 agents (bots). Quand l’IA a compris la stratégie à suivre, elle a organisé la partie en équipes de 2 joueurs humains, de 2 bots puis le reste en mixte.