A NVIDIA revela a rede neural de vídeo LDM capaz de criar vídeo a partir de descrição de texto

O anúncio foi feito durante a conferência IEEE. A rede neural Video LDM pode gerar vídeos curtos de até 4 segundos com base em uma descrição de texto.

O modelo AI entende tanto frases curtas como "madeira queimando" quanto consultas mais complexas como "ursinho de pelúcia tocando guitarra elétrica", produzindo vídeos com uma resolução de até 2048 × 1280 pixels e uma taxa de quadros de 24 fps. O novo modelo de IA é baseado na rede neural Stable Diffusion.

No total, o modelo tem 4,1 bilhões de parâmetros, dos quais 2,7 bilhões foram treinados usando vídeo. Atualmente, o Vídeo LDM tem o status de um trabalho de pesquisa com acesso limitado. A NVIDIA não revela o cronograma da versão pública da rede neural.

Mais exemplos da rede neural podem ser encontrados na seção relevante no site oficial da NVIDIA.

2023-04-20 06:10:05

Autor: Vitalii Babkin

URL da fonte

Anterior | Próximo