DeepMind AlphaStar AI vence jogadores de StarCraft II pro 10-1
Como se não bastasse que uma IA esteja batendo humanos em um jogo que é considerado parte estratégica, mas principalmente memorização de estratégias, agora uma IA também os está vencendo em um jogo que exige pensamento estratégico rápido e mouse rápido. clicando. É claro que o primeiro é provavelmente muito fácil para um computador, já que não requer dedos, mas o novo AlphaStar da DeepMind bateu os profissionais humanos em StarCraft II dez vezes antes de finalmente deixar os orgânicos ganharem pelo menos uma vez.
StarCraft II pode ser um jogo estranho para escolher, mas não só é ainda popular, ainda é considerado um dos mais desafiadores jogos de estratégia em tempo real (RTS) de todos os tempos. Como tal, foi o jogo perfeito para testar as capacidades de aprendizagem e tomada de decisão de uma IA. E para ajudar a provar ou refutar as habilidades da AlphaStar, a DeepMind contou com a ajuda da Blizzard, assim como com dois dos melhores jogadores de StarCraft II do mundo, Dario “TLO” Wünsch e Grzegorz “MaNa” Komincz, este último classificado como um dos melhores .
A maneira que o AlphaStar aprendeu a jogar o jogo antes de cada partida é bem interessante. Começou analisando replays de fósforos humanos para estudá-los. Em seguida, ele bifurcou (criou várias versões de si mesmo) para gerar novos players virtuais que se especializaram em diferentes estratégias e lutaram entre si. Claro, no final, a IA AlphaStar aprendeu com tudo isso. A DeepMind então escolheu cinco agentes para cada uma das duas partidas que achava que tinham a melhor chance de ganhar contra os humanos. Você pode pensar que o AlphaStar teria uma espécie de vantagem em quadra doméstica em um jogo de computador. Afinal, demorou apenas uma semana para “jogar” anos de jogos a fim de aprender. E tinha a vantagem de não ter que se concentrar em uma única seção do mapa de cada vez, ao contrário do modo como os olhos e o cérebro humanos funcionam. Dito isto, ainda estava sujeito a regras regulares do jogo, como neblina de guerra, e seu tempo de reação foi reduzido a uma velocidade mais lenta que a dos profissionais. Foi até observado ter realizado menos ações, mas mais eficientes, que os humanos fizeram.
No final, AlphaStar ganhou contra ambos TLO e MaNa em partidas de cinco jogos. Mas para tornar as coisas ainda mais interessantes, o DeepMind ajustou o AlphaStar para limitar sua capacidade de foco de modo que ele tivesse que decidir em que focar, como um ser humano. Ele aprendeu essa nova habilidade em uma semana, mas não teve tempo de praticar, e foi só então que MaNa conseguiu sua única vitória para a humanidade.
Via: Slash Gear
Nenhum comentário