O anúncio foi feito durante a conferência IEEE. A rede neural Video LDM pode gerar vídeos curtos de até 4 segundos com base em uma descrição de texto.
O modelo AI entende tanto frases curtas como "madeira queimando" quanto consultas mais complexas como "ursinho de pelúcia tocando guitarra elétrica", produzindo vídeos com uma resolução de até 2048 × 1280 pixels e uma taxa de quadros de 24 fps. O novo modelo de IA é baseado na rede neural Stable Diffusion.
No total, o modelo tem 4,1 bilhões de parâmetros, dos quais 2,7 bilhões foram treinados usando vídeo. Atualmente, o Vídeo LDM tem o status de um trabalho de pesquisa com acesso limitado. A NVIDIA não revela o cronograma da versão pública da rede neural.
Mais exemplos da rede neural podem ser encontrados na seção relevante no site oficial da NVIDIA.
2023-04-20 06:10:05
Autor: Vitalii Babkin
URL da fonte