L’IA di DeepMind batte gli umani in 57 videogiochi di Atari

Un’intelligenza artificiale chiamata Agent57 sa giocare a tutti i videogame dell’ambiente Arcade Learning, una raccolta di giochi classici di Atari che i ricercatori utilizzano per testare i limiti dei loro modelli di apprendimento profondo.

di Will Douglas Heaven

Sviluppato da DeepMind, Agent57 utilizza lo stesso algoritmo di apprendimento di rinforzo profondo per raggiungere livelli di gioco sovrumani anche in quelle situazioni in cui le precedenti IA hanno mostrato seri limiti. Essere in grado di apprendere 57 compiti diversi rende Agent57 più versatile dei precedenti sistemi di IA.

I giochi rappresentano un ottimo modo per testare l’IA, in quanto forniscono una varietà di sfide che costringono un’intelligenza artificiale a elaborare una serie di strategie e indicano chiaramente il risultato raggiunto grazie al punteggio. Ma quattro giochi Atari in particolare si sono dimostrati difficili da battere.

In Revenge and Pitfall di Montezuma, un’intelligenza artificiale deve attuare molte strategie diverse prima di trovarne una vincente. In Solaris e Skiing ci possono essere lunghe attese tra azione e ricompensa, rendendo difficile per un’intelligenza artificiale apprendere quali mosse permettono di raggiungere il miglior profitto.

Per rispondere a queste sfide, Agent57 raccoglie molti miglioramenti che DeepMind ha introdotto alla sua rete Deep-Q, l’IA che ha battuto per la prima volta alcuni giochi Atari nel 2012, tra cui un tipo di memoria che gli consente di basare le decisioni su quanto visto in precedenza nel gioco e sistemi di ricompensa che incoraggiano l’IA a esplorare le sue opzioni in modo più completo prima di decidere una strategia.

Queste tecniche sono gestite da un meta-controller, che bilancia i vantaggi e svantaggi di un’azione ed è in grado di analizzare le conseguenze delle mosse future. Malgrado il loro successo, i migliori modelli di apprendimento profondo oggi a disposizione non sono molto versatili. La maggior parte tende a far bene una cosa sola. La creazione di un’intelligenza artificiale per eccellere in più di un’attività è una delle sfide aperte nel settore dell’apprendimento profondo.

La capacità di apprendere 57 compiti diversi rende Agent57 più versatile rispetto alle precedenti IA, anche se il sistema non riesce ancora a fare più di un gioco alla volta. Agent57 può imparare a giocare 57 partite diverse, ma non contemporaneamente. Deve risettarsi per ogni nuovo gioco anche se può usare lo stesso algoritmo per farlo.

Sotto questo punto di vista Agent57 è simile a AlphaZero, l’algoritmo di apprendimento profondo di DeepMind, che può imparare a giocare a scacchi, Go e shogi, ma non tutti in una volta. La vera versatilità, che si ritrova nelle menti dei bambini, è ancora ben al di là della portata dell’IA.

Immagine: Cartucce per giochi Atari.Flickr / Digital Game Museum

(rp)

Related Posts
Total
0
Share