Google は Imagen ニューラルネットワークへのアクセスを開放し、説明によって画像を生成します

OpenAI の DALL-E 2 や Stable Diffusion の Stability などのアナログと同様に機能するという事実にもかかわらず、Google は、テキストの説明から画像を作成できる新しい Imagen ニューラルネットワークを公開することを急いでいません。ただし、現在 Imagen は AI Test Kitchen アプリケーションの限られた数のユーザーが利用できるため、同社はニューラルネットワークの作業に関するフィードバックを受け取ることを期待しています。

ニューラルネットワークに基づくさまざまなアルゴリズムをテストするために、今年初めに Google が AI Test Kitchen アプリをリリースしたことを思い出してください。現在、アプリケーションのユーザーは、LaMDA 2 言語モデルに基づいて構築された高度なチャットボットと対話できます.まもなく、開発者は Imagen へのアクセスを開始し、AI Test Kitchen ユーザーはテキストから画像を生成できるようになります説明。

報告によると、Google は Imagen ニューラルネットワークとの 2 つの対話モードを提供します。 1 つ目は City Dreamer と呼ばれ、ユーザーが選択したテーマで作成された都市の要素を生成できます。与えられたテーマに基づいて、Imagen は、ゲーム SimCity で見られるものと同様に、建物、街区、空港、その他のオブジェクトをアイソメトリックモデルの形で再現します。

Wobble モードでは、ユーザーは面白いモンスターを作成するよう求められます。ゴムや粘土などで構成されているものを選択し、そのための服を考え出す必要があります。 Imagen は、ユーザーの説明に従って仮想モンスターを形成し、名前を付けます。その後、それと対話して踊らせることができます。

ソースは、現在の形式では、Imagen アルゴリズムと対話するためのオプションが非常に限られていることを指摘しています。これは、他のいくつかのアナログの背景に対して特に顕著です。ユーザーは、いかなる種類の画像も作成できません。しかし今のところ、Google の目標は、システムがどのように機能し、ユーザーがどのように使用しているかについて、早期にフィードバックを得ることです。また、Google は AI Test Kitchen アプリケーションのユーザー数を開示しておらず、将来の Imagen アルゴリズムと、同社の一部の公開製品への統合の可能性についても何も述べていません。

2022-11-02 20:33:24

著者: Vitalii Babkin

前 | 次

Google は Imagen ニューラル ネットワークへのアクセスを開放し、説明によって画像を生成します

Google は Imagen ニューラルネットワークへのアクセスを開放し、説明によって画像を生成します