制御された空間で人がいない場所で反復作業を実行するようにロボットに教えること。人がいる空間で、音声コマンドに基づいてさまざまなタスクを解決するようにロボットに教えるのは、はるかに困難です。床に何も触れないようにプログラムされているロボット掃除機などのモデルについては話していません。
Google は、人間が使用できるロボットによる自然言語の理解レベルである程度の進歩を遂げました。 Pathways Language Model (PaLM) 自然言語処理システムの助けを借りて、会社はフレーズの正確な処理を達成し、文字通り言われたことを行うのではなく、人が本当に望んでいることをロボットが理解することができました.
次のタスクは、ロボットが実際に何ができるかを理解することです。ロボットは棚からアイテムを取り出そうとする要求を理解できますが、棚が高すぎて届かないという問題があります。 Google では、ロボットが多かれ少なかれ成功できることを「機能」と呼んでいます。これらは、単純なタスク (「1 メートル先に進む」) から、より複雑なタスク (「キッチンでコーラの缶を見つける」) のほか、ロボットが自身の能力とその周りの世界。たとえば、「うーん、コーラを床にこぼしてしまった。水たまりを掃除して、新しい飲み物をくれませんか?」後者の場合、ロボットはタスクをいくつかの段階に分割する必要があります - 液体がこぼれた場所を特定し、キッチンに行き、スポンジを見つけ、戻って水を集め、キッチンに戻ってスポンジなどを絞り出します。しかし、おそらく彼は決める必要があります-最初にコーラの缶を持ってきて、水たまりを片付け始める方がよいでしょうか?
ロボティクスが直面するもう 1 つの問題は、言語モデルが物理的な世界に結び付けられていないことです。たとえば、「飲み物をこぼしてしまったのですが、手伝ってもらえますか?」というリクエストに対して。 GPT-3 言語モデルは、「掃除機を使ってみてください」と応答します。言語モデルは掃除機を掃除プロセスに関連付けているため、これは彼女にとって理にかなっています。掃除機は水たまりを取り除くようには設計されていませんが、そうしようとすると壊れる可能性があります。
Googleによると、ロボットにできることとできないこと、そしてさまざまな状況で最初に何をするのが理にかなっているのかを判断するようにロボットに教えることが重要です。
2022-08-17 17:05:37
著者: Vitalii Babkin