NVIDIA stellt neuronales Video-LDM-Netzwerk vor, das Videos aus Textbeschreibungen erstellen kann

Die Ankündigung wurde auf der IEEE-Konferenz gemacht. Das neuronale Netzwerk Video LDM kann kurze Videos mit einer Länge von bis zu 4 Sekunden auf der Grundlage einer Textbeschreibung erzeugen.

Das KI-Modell versteht sowohl kurze Sätze wie "brennendes Holz" als auch komplexere Abfragen wie "Teddybär spielt E-Gitarre" und produziert Videos mit einer Auflösung von bis zu 2048 × 1280 Pixeln und einer Bildrate von 24 fps. Das neue KI-Modell basiert auf dem neuronalen Netzwerk Stable Diffusion.

Insgesamt verfügt das Modell über 4,1 Milliarden Parameter, von denen 2,7 Milliarden anhand von Videos trainiert wurden. Derzeit hat Video LDM den Status einer Forschungsarbeit mit begrenztem Zugang. NVIDIA macht keine Angaben zum Zeitpunkt der öffentlichen Version des neuronalen Netzwerks.

Weitere Beispiele für das neuronale Netzwerk finden Sie im entsprechenden Abschnitt auf der offiziellen NVIDIA-Website.

2023-04-20 06:10:05

Autor: Vitalii Babkin

Quell-URL

Bisherige | Nächster