과학자 그룹이 향유고래가 내는 소리를 해독하는 프로젝트를 시작했습니다. 이 이니셔티브는 프로젝트 CETI(Cetacean Translation Initiative)라고 합니다. 목표는 향유고래가 서로 통신하는 데 사용하는 클릭("코드"라고도 함)을 해독할 수 있는 인공 지능을 만드는 것입니다. 이를 위해 연구원들은 문자 및 구어 분석을 위해 예리한 AI의 일종인 자연어 처리 프로그램 NLP(자연어 처리)로 무장했습니다.
프로젝트의 목표는 유망하지만 데이터가 필요하다는 장애물이 있습니다. 많은 데이터. CETI의 첫 번째 목표는 40억 개의 향유고래 코드를 수집하는 것입니다. 이전에는 Dominica Sperm Whale Project의 프레임워크 내에서 약 100,000개의 코드가 이미 수집되었습니다. 이에 비해 고급 자연어 처리 모델인 GPT-3은 1,750억 개의 인간 단어로 훈련되었습니다.
다음으로 과학자들은 수집된 코드를 상황에 맞게 배치해야 합니다. 결국 문맥이 없는 말은 의미가 없습니다. 그리고 이것은 향유고래의 자연 서식지에 대한 수년간의 연구가 필요할 것입니다.
CETI 프로젝트가 성공적으로 최종 단계에 도달하면 "고래" 언어 모델이 자연에 대한 사람들의 인식과 자연과의 상호 작용을 영원히 바꿀 수 있습니다. CETI의 기계 학습 책임자인 Michael Bronstein은 "갑자기 고래 문명 전체가 우리의 코 밑에 있다는 것을 알게 되면 환경에 대한 태도의 변화와 동물 세계에 대한 더 큰 존중으로 이어질 것"이라고 말했습니다.
2021-10-31 08:17:12
작가: Vitalii Babkin