Googles AI mestrer Space Invaders (men det stinker fortsatt på Pac-Man)

Ta en ny seier for maskinene. Programvare fra Googles DeepMind-gruppe for kunstig intelligens har lært å spille det klassiske Atari 2600-spillet Space Invaders til et overmenneskelig nivå.

Google DeepMinds programvare tar på seg det klassiske Atari 2600-spillet Space Invaders.

Den nyheten kommer via en nytt papir i det vitenskapelige tidsskriftet Natur , som sier at programvaren lærte å spille 22 klassiske Atari-titler bedre enn en ekspert videospilltester kunne. Verket oppdaterer en tidligere papir på den samme programvaren som ble publisert på en AI-konferanse sent i 2013. Den gang tok programvaren syv titler, og den kunne bare overgå mennesker på tre. På den tiden var DeepMind en uavhengig oppstart.



Ikke lenge etter ble DeepMind kjøpt opp av Google for 628 millioner dollar, og Google-sjef Larry Page viste frem programvaren på TED-konferansen i 2014. MIT Technology Review fordypet seg i arbeidet i en profil av DeepMinds leder Demis Hassabis i desember i fjor (se Googles etterretningsdesigner).

Hassabis team, ringte Google DeepMind , har nå utviklet en mer kompleks, finjustert versjon av det dype Q-nettverket som tok fatt på 49 forskjellige Atari-spill. At det ble en overmenneskelig spiller av 22 av dem, inkludert Space Invaders, understreker kraften til DeepMinds teknologi. Men måten den la etter menneskelig ytelse på 20 andre, og bare matchet den for resten, er en påminnelse om at selv denne uvanlig kapable programvaren fortsatt har begrenset intelligens.

Det klassiske spillet Ms. Pac-Man illustrerer pent programvarens største begrensning: det er ikke i stand til å legge planer så langt som noen få sekunder frem. Det forhindrer systemet i å finne ut hvordan det skal komme seg trygt over labyrinten for å spise de siste pellets og fullføre et nivå. Det er heller ikke i stand til å lære at å spise visse magiske pellets lar deg spise spøkelsene som du ellers må unngå for enhver pris.

DeepMinds programvare sitter i hovedsak fast i nåtiden. Den ser bare tilbake på de fire siste videobildene i spillet (bare et 15. av et sekund) for å finne ut hvilke trekk som lønner seg eller hvordan man bruker tidligere erfaring til å velge neste trekk. Det betyr at det bare kan mestre spill der du kan gjøre fremskritt ved å bruke taktikker som gir svært umiddelbare gevinster. Det er begrensende, selv om det fungerer bra for noen Atari-spill. Likevel har DeepMinds programvare vist seg å være i stand til å utarbeide tilsynelatende komplekse strategier, som å grave ballen rundt baksiden av muren av blokker i spillet Breakout, noe ekspertspillere gjør.

Hassabis sier at teamet hans jobber med å utvide programvarens oppmerksomhet og minnespenn, samt å gjøre den i stand til å utforske et spill mer systematisk enn bare ved å gjøre tilfeldige bevegelser slik det gjør i dag. Han sier at slike justeringer bør tillate programvaren å mestre mye mer komplekse miljøer. Arbeidet har allerede startet med å få den til å spille spill for Super Nintendo-konsollen og tidlige PC-er, hvorav mange har enkle 3D-miljøer.

Testing av flere og mer komplekse spill kan til og med gi en bro til den virkelige verden. Til syvende og sist er ideen at hvis denne algoritmen kan kjøre en bil i et racingspill, vil den med noen få justeringer kunne kjøre en ekte bil, sa Hassabis på en pressekonferanse tirsdag.

Ikke forvent at DeepMind-programvaren tar rattet i en av Googles autonome biler med det første. Det arbeidet som gjøres for å anvende gruppens forskning på reelle problemer i dag er fokusert på selskapets kjerneprodukter som søk, mobilassistentfunksjoner og oversettelse, sier Hassabis. Tenk om du kunne be Google-appen om noe så komplekst som «Ok, Google, planlegg meg en flott ryggsekktur gjennom Europa», sa han MIT Technology Review .

Tjenester som mobile assistenter og automatisk oversettelse er kjente og brukbare i dag, men de kan være frustrerende begrenset. Programvare som kan lære å slå deg i videospill kan være spennende, men dens første virkelige innvirkning på verden vil sannsynligvis bringe ny (du kan si forsinket) polering til tjenester vi allerede bruker.

gjemme seg