Google macht Roboter intelligenter, indem es ihnen sagt, was sie können und was nicht

Einem Roboter beibringen, sich wiederholende Aufgaben in kontrollierten Räumen ohne Anwesenheit von Menschen auszuführen, obwohl dies nicht die einfachste, aber durchaus lösbare Aufgabe ist. In Räumen, in denen sich auch Menschen aufhalten, ist es viel schwieriger, einem Roboter beizubringen, verschiedene Aufgaben auf Basis von Sprachbefehlen zu lösen. Wir sprechen hier nicht von Modellen wie Roboter-Staubsaugern, die einfach darauf programmiert sind, nichts auf dem Boden zu berühren.

Google hat einige Fortschritte beim Verständnis der natürlichen Sprache durch Roboter gemacht, die Menschen verwenden können. Mit Hilfe seines Pathways Language Model (PaLM)-Systems zur Verarbeitung natürlicher Sprache war das Unternehmen in der Lage, eine genaue Verarbeitung von Sätzen und ein Verständnis des Roboters dafür zu erreichen, was eine Person wirklich will, anstatt buchstäblich das zu tun, was gesagt wurde.

Die nächste Aufgabe besteht darin, zu verstehen, wozu der Roboter tatsächlich in der Lage ist. Der Roboter kann die Anfrage verstehen, einen Artikel aus dem Regal zu holen, aber das Problem ist, dass er ihn nicht erreichen kann, weil das Regal zu hoch ist. „Fähigkeiten“ nennt Google, was ein Roboter mehr oder weniger erfolgreich leisten kann. Das können einfache Aufgaben („Geh einen Meter weiter“), komplexere Aufgaben („Finde eine Dose Cola in der Küche“) sowie komplexe, mehrstufige Aktionen sein, die erfordern, dass der Roboter seine eigenen Fähigkeiten versteht und die Welt drumherum. Zum Beispiel: „Ugh, ich habe meine Cola auf den Boden verschüttet. Könntest du die Pfütze aufwischen und mir ein neues Getränk besorgen?" Im letzteren Fall muss der Roboter die Aufgabe in mehrere Schritte unterteilen – den Ort bestimmen, an dem die Flüssigkeit verschüttet wurde, in die Küche gehen, einen Schwamm finden, zurückgehen, Wasser holen, zurück in die Küche gehen den Schwamm ausdrücken usw. Obwohl, vielleicht muss er sich entscheiden - vielleicht ist es besser, zuerst eine Dose Cola zu bringen und dann mit dem Aufräumen der Pfütze zu beginnen?

Ein weiteres Problem der Robotik besteht darin, dass Sprachmodelle nicht an die physische Welt gebunden sind. Zum Beispiel auf die Anfrage "Ich habe mein Getränk verschüttet, können Sie helfen?" Das GPT-3-Sprachmodell antwortet: "Sie könnten versuchen, einen Staubsauger zu verwenden." Und das macht für sie Sinn, da das Sprachmodell den Staubsauger mit dem Reinigungsprozess in Verbindung bringt. Obwohl der Staubsauger nicht dafür ausgelegt ist, Pfützen zu entfernen, kann der Versuch, dies zu tun, zu einem Bruch führen.

Laut Google ist es wichtig, Robotern beizubringen, zu bestimmen, was sie können und was nicht und was in verschiedenen Situationen zuerst sinnvoll ist.

2022-08-17 17:05:37

Autor: Vitalii Babkin

Bisherige | Nächster