• Pagina iniziale
  • High Tech
  • Criptovalute
  • Gioco
  • Hollywood
  • Scienza
  • Spazio
  • Auto
  • Sport
  • Mondo

Google presenta DiffusionGemma, un rapido modello IA per la generazione di testo

Google presenta DiffusionGemma, un rapido modello IA per la generazione di testo

Google ha annunciato il rilascio del modello linguistico sperimentale DiffusionGemma, che utilizza un approccio insolito alla generazione di testo ed è in grado di funzionare fino a quattro volte più velocemente rispetto ai modelli IA tradizionali di questa classe. Il progetto è distribuito con licenza open source Apache 2.0 ed è rivolto a ricercatori e sviluppatori.

La maggior parte delle IA moderne, incluse ChatGPT e simili, creano testo in modo sequenziale, una parola dopo laltra. Con DiffusionGemma, Google ha seguito una strada diversa. Il modello non genera parole, ma blocchi di testo utilizzando un insieme di token casuali. Successivamente, in diverse passate, il modello perfeziona il testo illeggibile risultante fino a portarlo a uno stato normale. Il principio ricorda in parte il funzionamento dei generatori di immagini, che prima creano una tela rumorosa e poi la migliorano gradualmente.

Il valore pratico di DiffusionGemma risiede nella velocità operativa significativamente più elevata. Secondo i dati di Google, il modello è in grado di produrre oltre 1000 token al secondo sugli acceleratori server NVIDIA H100 e oltre 700 token al secondo su schede video di livello GeForce RTX 5090. Il modello gestisce 26 miliardi di parametri, ma grazie allarchitettura Mixture of Experts (MoE) ne vengono effettivamente utilizzati solo 3,8 miliardi in ogni momento. Per il funzionamento della rete neurale sono necessari almeno 18 GB di memoria video.

Google sottolinea che per qualità delle risposte DiffusionGemma è ancora inferiore al normale modello testuale Gemma 4, ma la sua velocità di inferenza è molto più alta. Proprio a causa della precisione non ancora elevata, DiffusionGemma si trova attualmente in fase sperimentale.

Lobiettivo principale del progetto è mostrare la promettente prospettiva dellapproccio diffusivo per i futuri modelli di IA. Google ritiene che in futuro la velocità di inferenza diventerà un parametro importante quanto la qualità della generazione.


2026-06-11 19:29:41

Autore: Vitalii Babkin

URL di origine
Precedente | Il prossimo

• ASUS presenta la compatta Radeon RX 9070 GRE PRIME EVO OC

• Google presenta DiffusionGemma, un rapido modello IA per la generazione di testo

• Presentato il ciclocomputer Coros Dura con GPS e ricarica solare

• Realme ha lanciato una nuova versione dello smartphone P1 Pro 5G con 12 GB di RAM

• Presentato OnePlus Nord CE4 Lite con batteria da 5500 mAh

• Presentato il tablet Lenovo Tab Plus con sistema audio JBL

• Presentata la TV Hisense S7N CanvasTV 4K QLED

• MSI ha rilasciato il monitor da gioco MAG 27QRF QD E2 Monster Hunter Edition

• AOC ha lanciato il monitor Gaming C27G2Z3/BK con schermo Fast VA e frequenza di 280 Hz

• Samsung, seguendo l'esempio di Apple, ha rinunciato alle ambizioni nel settore dell'auto-pilota

• Nel Regno Unito è stata lanciata una piattaforma per valutare la sicurezza dell'IA

• Un tribunale ha multato Microsoft per 242 milioni di dollari per la violazione di tecnologia nella creazione di Cortana

• Xiaomi ha mostrato il design insolito del telefono Civi 4 Pro

• Il PC compatto GEEKOM Mini Air12 con processore Intel N100 e 16 GB di RAM è stato valutato a 249 dollari

© 2021-2023 Yoopply Italy - Notizie dal mondo ogni giorno
Deutsch | 日本 | France | Italy | 한국어 | Portugues

Auto | Criptovalute | Gioco | High Tech | Hollywood | Scienza | Spazio | Sport | Mondo | Software

Chi siamo | Politica sulla riservatezza
Facebook | Twitter
Yoopply
40004, Ukraine, Sumska, Sumy, Pratsi str. building 37
Phone: +380958165974
Email: acca.in.ua@gmail.com