Google ha annunciato il rilascio del modello linguistico sperimentale DiffusionGemma, che utilizza un approccio insolito alla generazione di testo ed è in grado di funzionare fino a quattro volte più velocemente rispetto ai modelli IA tradizionali di questa classe. Il progetto è distribuito con licenza open source Apache 2.0 ed è rivolto a ricercatori e sviluppatori.
La maggior parte delle IA moderne, incluse ChatGPT e simili, creano testo in modo sequenziale, una parola dopo laltra. Con DiffusionGemma, Google ha seguito una strada diversa. Il modello non genera parole, ma blocchi di testo utilizzando un insieme di token casuali. Successivamente, in diverse passate, il modello perfeziona il testo illeggibile risultante fino a portarlo a uno stato normale. Il principio ricorda in parte il funzionamento dei generatori di immagini, che prima creano una tela rumorosa e poi la migliorano gradualmente.
Il valore pratico di DiffusionGemma risiede nella velocità operativa significativamente più elevata. Secondo i dati di Google, il modello è in grado di produrre oltre 1000 token al secondo sugli acceleratori server NVIDIA H100 e oltre 700 token al secondo su schede video di livello GeForce RTX 5090. Il modello gestisce 26 miliardi di parametri, ma grazie allarchitettura Mixture of Experts (MoE) ne vengono effettivamente utilizzati solo 3,8 miliardi in ogni momento. Per il funzionamento della rete neurale sono necessari almeno 18 GB di memoria video.
Google sottolinea che per qualità delle risposte DiffusionGemma è ancora inferiore al normale modello testuale Gemma 4, ma la sua velocità di inferenza è molto più alta. Proprio a causa della precisione non ancora elevata, DiffusionGemma si trova attualmente in fase sperimentale.
Lobiettivo principale del progetto è mostrare la promettente prospettiva dellapproccio diffusivo per i futuri modelli di IA. Google ritiene che in futuro la velocità di inferenza diventerà un parametro importante quanto la qualità della generazione.
2026-06-11 19:29:41
Autore: Vitalii Babkin
URL di origine