• Pagina iniziale
  • High Tech
  • Criptovalute
  • Gioco
  • Hollywood
  • Scienza
  • Spazio
  • Auto
  • Sport
  • Mondo

Google ha introdotto una rete neurale che genera video HD da una descrizione testuale

Google ha introdotto una rete neurale che genera video HD da una descrizione testuale

Google ha parlato del sistema di intelligenza artificiale Imagen Video, che genera video ad alta risoluzione (1280 × 768 pixel, 24 fotogrammi al secondo) da una descrizione testuale. Tuttavia, per paura che il modello generi contenuti inappropriati, l'azienda ha deciso di astenersi dal pubblicare per il momento il codice sorgente del progetto.

Nella descrizione (PDF) della soluzione, Google ha notato che Imagen Video è in grado di funzionare in un determinato stile, imitando, ad esempio, le maniere di artisti famosi, creare oggetti 3D rotanti mantenendone la forma o rappresentare testi in varie animazioni generi. La tecnologia si basa su una “cascata” di modelli che, sulla base di una descrizione testuale, creano un video prototipo (16 fotogrammi con una risoluzione di 24×48 pixel ad una frequenza di 3 fotogrammi al secondo), che viene poi convertito in un video ad alta risoluzione con un frame rate più elevato in più passaggi. Il video finale dura 5,3 secondi.

Gli esempi presenti su Imagen Video vanno da scene semplici come "gelato al pistacchio che si scioglie gocciola da una tazza" a scenari intricati come "Volare attraverso una battaglia di navi pirata in un oceano in tempesta". Le immagini contengono evidenti artefatti, ma il loro dettaglio e la loro levigatezza sono notevolmente superiori a quelli delle controparti esistenti. Parallelamente, ha debuttato un altro modello AI di Google per generare video da una descrizione testuale: Phenaki crea video più lunghi.

Google ha affermato che il sistema Imagen Video è stato addestrato sul LAION-400M disponibile al pubblico, che contiene "14 milioni di coppie video-testo e 60 milioni di coppie immagine-testo". Secondo l'azienda, si tratta di "dati problematici" e, sebbene gli esperti abbiano cercato di filtrarli, resta possibile che il modello generi contenuti inappropriati contenenti scene di natura sensibile, violenza, stereotipi sociali e pregiudizi culturali. E "finché queste preoccupazioni non saranno risolte", il codice sorgente del modello Imagen Video non verrà pubblicato.


2022-10-06 18:35:36

Autore: Vitalii Babkin

Precedente | Il prossimo

• Presentato il ciclocomputer Coros Dura con GPS e ricarica solare

• Realme ha lanciato una nuova versione dello smartphone P1 Pro 5G con 12 GB di RAM

• Presentato OnePlus Nord CE4 Lite con batteria da 5500 mAh

• Presentato il tablet Lenovo Tab Plus con sistema audio JBL

• Presentata la TV Hisense S7N CanvasTV 4K QLED

• MSI ha rilasciato il monitor da gioco MAG 27QRF QD E2 Monster Hunter Edition

• AOC ha lanciato il monitor Gaming C27G2Z3/BK con schermo Fast VA e frequenza di 280 Hz

• Samsung, seguendo l'esempio di Apple, ha rinunciato alle ambizioni nel settore dell'auto-pilota

• Nel Regno Unito è stata lanciata una piattaforma per valutare la sicurezza dell'IA

• Un tribunale ha multato Microsoft per 242 milioni di dollari per la violazione di tecnologia nella creazione di Cortana

• Xiaomi ha mostrato il design insolito del telefono Civi 4 Pro

• Il PC compatto GEEKOM Mini Air12 con processore Intel N100 e 16 GB di RAM è stato valutato a 249 dollari

• L'aggiornamento di Apple Watch porta a un'eccessiva rapida scarica della batteria

• Lo smartphone iQOO 12 potrà scattare foto con uno zoom 70x

© 2021-2023 Yoopply Italy - Notizie dal mondo ogni giorno
Deutsch | 日本 | France | Italy | 한국어 | Portugues

Auto | Criptovalute | Gioco | High Tech | Hollywood | Scienza | Spazio | Sport | Mondo | Software

Chi siamo | Politica sulla riservatezza
Facebook | Twitter
Yoopply
40004, Ukraine, Sumska, Sumy, Pratsi str. building 37
Phone: +380958165974
Email: acca.in.ua@gmail.com