A equipe de inteligência artificial da DeepMind ensinou humanóides virtuais a trabalhar juntos enquanto jogavam bola. Ao mesmo tempo, ninguém explicava as regras do jogo para a máquina; ela alcançava tudo sozinha, através da observação e da repetição. Aos poucos, sob a orientação de algoritmos, homenzinhos desajeitados com proporções e massa realistas se tornaram profissionais em seu campo. A IA levou 24 horas em tempo real para adquirir as habilidades básicas de jogar futebol. E mais três semanas para aprender a jogar em equipe.
Para a DeepMind, empresa de propriedade da Alphabet, ensinar uma rede neural a jogar se tornou uma coisa comum. No passado, especialistas britânicos já ajudaram a IA a dominar o xadrez e o jogo, e depois o pôquer e a estratégia de computador Starcraft. Agora parece que eles estão prontos para praticar esportes ao ar livre.
Os pesquisadores treinaram um modelo de jogador de futebol para jogar bola de dois a dois como parte de um experimento para criar um sistema avançado de coordenação de IA para IA. Não é apenas o amor ao futebol inerente aos britânicos - os esforços dos desenvolvedores estão subordinados à tarefa global de construir uma inteligência artificial universal ou forte capaz de compreender o mundo em pé de igualdade com os humanos, escreve a ZME Science.
O novo projeto DeepMind é uma tentativa de estudar a chamada inteligência corporal. É possível que um dia a IA universal tenha que se mover no mundo material em alguma forma física, e a natureza dessa forma determinará seu comportamento no espaço.
“Nossos agentes adquiriram habilidades como agilidade, passagem e divisão de trabalho que foram demonstradas estatisticamente”, escreveram os autores em um post no blog. “Os jogadores mostram tanto a regulação motora de alta frequência quanto a tomada de decisão a longo prazo, que inclui avaliar o comportamento dos membros da equipe, levando a um jogo coordenado em equipe.”
Esse resultado foi alcançado em várias etapas: primeiro, eles coletaram vídeos de partidas reais de futebol e os mostraram à IA para que ela tentasse imitar os movimentos dos jogadores. Os modelos de aprendizado de máquina baseados em recompensas ajudaram os stickmen virtuais a praticar o drible e acertar a bola com precisão. Essas duas fases exigiram 1,5 anos em escala de tempo de simulação ou 24 horas em tempo real.
No entanto, comportamentos mais complexos só começaram a surgir após a modelagem subsequente. Os pesquisadores desafiaram os humanóides digitais a marcar o máximo de pontos possível em partidas de dois contra dois. No processo, eles passaram três semanas aprendendo a jogar em equipe, como passar um passe a tempo.
Os treinos foram jogados sob regras simplificadas de faltas, sem tiros de meta ou confrontos.
Recentemente, a rede neural DeepMind revelou a estrutura de quase todas as proteínas conhecidas pela ciência. Anteriormente, o algoritmo AlphaFold, desenvolvido em 2018, era capaz de desvendar a estrutura de apenas uma pequena fração dessas proteínas.
2022-09-06 17:47:37
Autor: Vitalii Babkin