• Startseite
  • Wagen
  • Kryptowährung
  • Spiel
  • Hightech
  • Hollywood
  • Wissenschaft
  • Universum
  • Welt

Google hat ein neuronales Netzwerk eingeführt, das HD-Videos aus einer Textbeschreibung generiert

Google hat ein neuronales Netzwerk eingeführt, das HD-Videos aus einer Textbeschreibung generiert

Google sprach von dem künstlichen Intelligenzsystem Imagen Video, das aus einer Textbeschreibung ein hochauflösendes Video (1280 × 768 Pixel, 24 Bilder pro Sekunde) generiert. Aus Angst, dass das Modell unangemessene Inhalte generiert, hat sich das Unternehmen jedoch entschieden, den Quellcode des Projekts vorerst nicht zu veröffentlichen.

In der Beschreibung (PDF) der Lösung stellt Google fest, dass Imagen Video in der Lage ist, in einem bestimmten Stil zu arbeiten, beispielsweise die Manieren berühmter Künstler zu imitieren, rotierende 3D-Objekte zu erstellen und dabei ihre Form beizubehalten oder Text in verschiedenen Animationen darzustellen Genres. Die Technologie basiert auf einer „Kaskade“ von Modellen, die basierend auf einer textuellen Beschreibung ein Prototyp-Video (16 Frames in einer Auflösung von 24×48 Pixel bei einer Frequenz von 3 Frames pro Sekunde) erstellen, das dann in ein umgewandelt wird hochauflösendes Video mit höherer Bildrate in mehreren Schritten. Das letzte Video ist 5,3 Sekunden lang.

Die auf Imagen Video gezeigten Beispiele reichen von einfachen Szenen wie „Schmelzendes Pistazieneis tropft in eine Tasse“ bis hin zu komplizierten Szenarien wie „Durch eine Schlacht von Piratenschiffen in einem stürmischen Ozean fliegen“. Die Bilder enthalten offensichtliche Artefakte, aber ihre Detailtreue und Glätte sind merklich höher als bei bestehenden Gegenstücken. Parallel dazu debütierte ein weiteres KI-Modell von Google, um Videos aus einer Textbeschreibung zu generieren – Phenaki erstellt längere Videos.

Laut Google wurde das Imagen Video-System auf dem öffentlich verfügbaren LAION-400M trainiert, das „14 Millionen Video-Text-Paare und 60 Millionen Bild-Text-Paare“ enthält. Nach Angaben des Unternehmens handelt es sich dabei um „Problemdaten“, und obwohl Experten versucht haben, sie zu filtern, bleibt es möglich, dass das Modell unangemessene Inhalte mit sensiblen Szenen, Gewalt, sozialen Stereotypen und kulturellen Vorurteilen generiert. Und „bis diese Bedenken ausgeräumt sind“, wird der Quellcode des Imagen-Video-Modells nicht veröffentlicht.


2022-10-06 18:35:36

Autor: Vitalii Babkin

Bisherige | Nächster

• Der Fahrradcomputer Coros Dura mit GPS und Solarladung wurde vorgestellt

• Realme hat eine neue Version des P1 Pro 5G-Smartphones mit 12 GB RAM veröffentlicht

• OnePlus Nord CE4 Lite mit 5500-mAh-Akku vorgestellt

• Lenovo Tab Plus mit Audiosystem von JBL vorgestellt

• Hisense S7N CanvasTV 4K QLED vorgestellt

• MSI bringt den Gaming-Monitor MAG 27QRF QD E2 Monster Hunter Edition auf den Markt

• AOC bringt den Gaming-Monitor C27G2Z3/BK mit Fast VA-Bildschirm und 280 Hz heraus

• Samsung hat sich nach dem Vorbild von Apple von seinen Ambitionen im Bereich des Autopiloten verabschiedet

• Großbritannien startet Plattform zur Bewertung der KI-Sicherheit

• Gericht verurteilt Microsoft zu 242 Millionen US-Dollar Strafe wegen Diebstahls von Technologie bei der Entwicklung von Cortana

• Xiaomi zeigt ungewöhnliches Design des Telefons Civi 4 Pro

• Der kompakte PC GEEKOM Mini Air12 mit einem Intel N100-Prozessor und 16 GB RAM wurde mit 249 US-Dollar bewertet

• Ein Update der Apple Watch führt zu übermäßig schnellem Batterieverbrauch

• Das Smartphone iQOO 12 kann Fotos mit 70-fachem Zoom aufnehmen

© 2021-2023 Yoopply Deutsch - Weltnachrichten jeden Tag
Deutsch | 日本 | France | Italy | 한국어 | Portugues

Wagen | Kryptowährungen | Spiel | Hightech | Hollywood | Wissenschaft | Universum | Sport | Welt | Software

Über uns | Datenschutz-Bestimmungen
Facebook | Twitter
Yoopply
40004, Ukraine, Sumska, Sumy, Pratsi str. building 37
Phone: +380958165974
Email: acca.in.ua@gmail.com