Google은 Imagen 신경망에 대한 액세스를 열어 설명별로 이미지를 생성합니다.

Google은 OpenAI의 DALL-E 2 또는 Stable Diffusion의 Stability와 같은 유사체뿐만 아니라 작동한다는 사실에도 불구하고 텍스트 설명에서 이미지를 생성할 수 있는 새로운 Imagen 신경망을 공개하는 데 서두르지 않습니다. 그러나 이제 Imagen은 AI Test Kitchen 애플리케이션의 제한된 수의 사용자만 사용할 수 있으므로 회사는 신경망 작업에 대한 피드백을 받을 것으로 예상합니다.

Google은 올해 초 AI Test Kitchen 앱을 출시하여 신경망을 기반으로 다양한 알고리즘을 테스트했음을 상기하십시오. 현재 응용 프로그램 사용자는 LaMDA 2 언어 모델을 기반으로 구축된 고급 챗봇과 상호 작용할 수 있으며 곧 개발자는 Imagen에 대한 액세스를 열어 AI Test Kitchen 사용자가 텍스트에서 이미지를 생성할 수 있습니다. 설명.

보고서에 따르면 Google은 Imagen 신경망과의 두 가지 상호 작용 모드를 제공합니다. 첫 번째는 City Dreamer라고 하며 사용자가 선택한 테마에 따라 생성된 도시의 요소를 생성할 수 있습니다. Imagen은 주어진 테마를 기반으로 SimCity 게임에서 볼 수 있는 것과 유사한 건물, 도시 블록, 공항 및 기타 물체를 등각 투영 모델 형태로 재창조합니다.

Wobble 모드에서 사용자는 재미있는 괴물을 만들라는 메시지가 표시됩니다. 예를 들어 고무 또는 점토로 구성된 것을 선택한 다음 옷을 만들어야합니다. Imagen은 사용자의 설명에 따라 가상의 괴물을 형성하고 이름을 부여한 후 상호 작용하여 춤을 추게 됩니다.

소스는 현재 형태에서 Imagen 알고리즘과 상호 작용하는 옵션이 매우 제한적이며 특히 다른 아날로그의 배경에 대해 눈에 띄게 나타납니다. 사용자는 어떤 종류의 이미지도 만들 수 없습니다. 그러나 현재로서는 Google의 목표는 시스템 작동 방식과 사용자가 시스템을 사용하는 방식에 대한 초기 피드백을 얻는 것입니다. Google은 또한 AI Test Kitchen 애플리케이션의 사용자 수를 공개하지 않으며 향후 Imagen 알고리즘과 회사의 일부 공개 제품에 대한 통합 가능성에 대해서도 언급하지 않습니다.

2022-11-02 20:33:24

작가: Vitalii Babkin

이전 | 다음