Um grupo de cientistas lançou um projeto para decifrar os sons produzidos pelos cachalotes. A iniciativa se chama Projeto CETI (Cetacean Translation Initiative). O objetivo é criar uma inteligência artificial capaz de decifrar os cliques que os cachalotes usam para se comunicarem, também conhecidos como "códigos". Para isso, os pesquisadores se armaram com o programa de processamento de linguagem natural NLP (Natural-Language Processing) - uma espécie de IA, aprimorada para a análise da linguagem escrita e falada.
Os objetivos do projeto são promissores, mas há um obstáculo: ele precisa de dados. Muitos dados. O primeiro objetivo do CETI é coletar quatro bilhões de códigos de cachalotes. Anteriormente, cerca de 100.000 códigos já foram coletados no âmbito do Projeto Dominica Sperm Whale. Em comparação, GPT-3 - um modelo avançado de processamento de linguagem natural - foi treinado em 175 bilhões de palavras humanas.
Em seguida, os cientistas precisarão contextualizar os códigos coletados. Afinal, palavras sem contexto não têm significado. E isso levará anos de pesquisa sobre o habitat natural dos cachalotes.
Se o projeto CETI chegar ao final com sucesso, o modelo da linguagem da "baleia" pode mudar para sempre a percepção das pessoas sobre a natureza e nossa interação com ela. “Se descobrirmos de repente que toda uma civilização de baleias está sob nossos narizes - talvez isso leve a uma mudança de atitude em relação ao meio ambiente e a um maior respeito pelo mundo animal”, disse Michael Bronstein, chefe de aprendizado de máquina do CETI.
2021-10-31 08:17:12
Autor: Vitalii Babkin