사람이 없는 통제된 공간에서 로봇이 반복적인 작업을 수행하도록 가르치는 것입니다. 비록 가장 쉽지는 않지만 충분히 해결할 수 있는 작업입니다. 사람도 함께 있는 공간에서 음성 명령을 기반으로 다양한 작업을 해결하도록 로봇을 가르치는 것은 훨씬 더 어렵습니다. 우리는 로봇 청소기와 같은 모델에 대해 이야기하는 것이 아닙니다. 로봇 청소기는 바닥에 아무 것도 만지지 않도록 단순히 프로그래밍되어 있습니다.
구글은 인간이 사용할 수 있는 로봇에 의한 자연어 이해 수준에서 어느 정도 진전을 이뤘다. PaLM(Pathways Language Model) 자연어 처리 시스템의 도움으로 이 회사는 말 그대로 말을 하는 것이 아니라 로봇이 사람이 정말로 원하는 것을 로봇이 이해하고 구의 정확한 처리를 달성할 수 있었습니다.
다음 작업은 로봇이 실제로 무엇을 할 수 있는지 이해하는 것입니다. 로봇은 선반에서 물건을 꺼내달라는 요청을 이해할 수 있지만, 문제는 선반이 너무 높아 손이 닿지 않는다는 점이다. Google은 로봇이 어느 정도 성공적으로 수행할 수 있는 것을 "기능"이라고 부릅니다. 여기에는 간단한 작업("계량기 진행"), 더 복잡한 작업("주방에서 콜라 한 캔 찾기"), 로봇이 자신의 능력과 능력을 이해해야 하는 복잡한 다단계 작업이 있습니다. 주위의 세계. 예를 들어 “어, 콜라를 바닥에 쏟았어. 웅덩이를 청소하고 나에게 새로운 음료수를 가져다 줄 수 있습니까?" 후자의 경우 로봇은 작업을 여러 단계로 나누어야 합니다. 액체가 엎질러진 장소를 결정하고, 부엌으로 가고, 스폰지를 찾고, 돌아가고, 물을 모으고, 부엌으로 돌아가서 스펀지 등을 짜내십시오. 그는 결정해야 할 수도 있지만 먼저 콜라 캔을 가져온 다음 웅덩이 청소를 시작하는 것이 더 나을 수도 있습니다.
로봇 공학이 직면한 또 다른 문제는 언어 모델이 물리적 세계에 묶여 있지 않다는 것입니다. 예를 들어 "음료를 쏟았는데 도와주시겠어요?" GPT-3 언어 모델은 "진공 청소기를 사용해 볼 수 있습니다."라고 응답합니다. 언어 모델이 진공 청소기를 청소 프로세스와 연관시키기 때문에 이것은 그녀에게 의미가 있습니다. 진공 청소기는 웅덩이를 제거하도록 설계되지 않았지만 그렇게 하려고 하면 웅덩이가 깨질 수 있습니다.
Google에 따르면 로봇이 할 수 있는 것과 할 수 없는 것과 다양한 상황에서 가장 먼저 해야 할 일을 판단하도록 가르치는 것이 중요합니다.
2022-08-17 17:05:37
작가: Vitalii Babkin