BI@Work 17 Aprile 2026 Nessun commento

Gemma 3 12B e Gemma 4 26B in E17 NEXUS: l’AI aziendale on-premise che si adatta al tuo hardware

L’AI in azienda non si misura solo in parametri, ma in utilizzabilità reale: velocità, accuratezza, capacità di analizzare documenti interi senza spezzarli e, soprattutto, possibilità di girare su hardware che l’azienda può effettivamente permettersi.

Per questo E17® NEXUS oggi supporta ufficialmente due modelli, scelti e verificati sul campo:

Gemma 3 12B per schede da 12 GB e 16 GB di VRAM
Gemma 4 26B per schede da 32 GB di VRAM

Due configurazioni, entrambe testate in produzione, che coprono la quasi totalità dei casi reali in ambito aziendale.

Gemma 3 12B: l’AI on-premise accessibile

Gemma 3 12B è il modello consigliato per configurazioni con VRAM contenuta. È maturo, stabile, ampiamente testato e offre un equilibrio eccellente tra qualità delle risposte e fluidità di utilizzo.

Quando sceglierlo

16 GB VRAM (RTX 4060 Ti, RTX 5060 Ti, RTX 4080): configurazione consigliata in produzione, sweet spot per piccoli team e PMI
12 GB VRAM (RTX 3060, RTX 4060): configurazione solo per valutazione — tirata al massimo, adatta a testare E17® NEXUS in tutte le sue funzioni prima di investire nell’hardware definitivo

La configurazione da 12 GB non è consigliata per l’uso quotidiano, ma abbassa drasticamente la soglia d’ingresso per un test completo della piattaforma: permette di verificare il flusso RAG, l’ingestione documentale, l’analisi di prompt complessi e l’integrazione con i workflow aziendali senza acquistare nuovo hardware.

Per il passaggio in produzione consigliamo di salire a 16 GB di VRAM o, quando possibile, alla configurazione completa con Gemma 4 26B.

Cosa offre in E17® NEXUS

Risposte affidabili in linguaggio naturale
Buona gestione del contesto su documenti di media lunghezza
Tempi di risposta rapidi su hardware da 16 GB
Piena integrazione con il motore RAG e l’analisi documentale

Per molte realtà aziendali – studi professionali, PMI, team operativi – Gemma 3 12B su 16 GB è la scelta giusta: copre la maggior parte dei casi d’uso senza richiedere investimenti hardware impegnativi.

Gemma 4 26B: il salto generazionale

Per chi dispone di una scheda da 32 GB di VRAM (RTX 5090 e workstation professionali), E17® NEXUS integra Gemma 4 26B, rilasciato da Google DeepMind nell’aprile 2026.

Non è un semplice aggiornamento: è un salto generazionale, reso possibile da una nuova architettura.

La novità tecnica: Mixture of Experts

Gemma 4 26B adotta un’architettura MoE (Mixture of Experts):

25,2 miliardi di parametri totali nel modello
Solo 3,8 miliardi attivati per ogni token generato
Qualità di un modello grande, velocità di un modello molto più piccolo
Finestra di contesto estesa a 256.000 token

In pratica, a parità di hardware di fascia alta, Gemma 4 26B offre risposte molto più rapide di un modello dense equivalente, mantenendo una qualità superiore.

Vantaggi concreti

Maggiore accuratezza: risposte più aderenti ai documenti aziendali
Contesto più ampio: 256K token permettono di elaborare interi contratti, manuali o report senza spezzarli
Riduzione delle allucinazioni: maggiore aderenza ai dati reali forniti dal retrieval
Velocità superiore: grazie all’architettura MoE, tempi di risposta molto più rapidi

Quale modello per quale azienda

La scelta tra i due modelli dipende da tre fattori: hardware disponibile, complessità dei documenti, numero di utenti.

Gemma 3 12B (16 GB VRAM in produzione, 12 GB solo per test): ideale per studi professionali, PMI, team operativi con documenti di media lunghezza e query standard. La configurazione da 12 GB permette di valutare E17® NEXUS anche su hardware molto accessibile, prima di passare alla soluzione di produzione.
Gemma 4 26B (32 GB VRAM): consigliato per aziende che lavorano su contratti complessi, report estesi, analisi multi-documento e richiedono il massimo in termini di qualità delle risposte e ampiezza del contesto.

Nessun vincolo architetturale: E17® NEXUS permette di cominciare con Gemma 3 12B e passare a Gemma 4 26B aggiornando l’hardware, senza cambiare il workflow o riaddestrare gli utenti.

AI aziendale davvero in locale

Qualunque sia il modello scelto, il principio di E17® NEXUS non cambia: i dati restano sempre sull’infrastruttura aziendale.

Questo significa:

Nessuna dipendenza dal cloud
Controllo totale su sicurezza e accessi
Possibilità di utilizzo su documenti riservati e dati sensibili
Piena compatibilità con le normative europee sulla protezione dei dati

Grazie al motore di retrieval integrato, il modello non risponde in modo generico: utilizza i dati aziendali reali per fornire risposte contestuali, tracciabili e verificabili.

Analisi documentale: dove si vede davvero la differenza

La vera utilità di un modello AI in azienda emerge nell’analisi dei documenti. Qui le due configurazioni si differenziano per casi d’uso:

Con Gemma 3 12B

Ricerca di informazioni nella base di conoscenza aziendale
Riassunti di documenti di media lunghezza
Risposte in linguaggio naturale su procedure e policy
Interrogazione contestuale di archivi documentali

Con Gemma 4 26B

Analisi integrale di contratti complessi e relative clausole
Confronto e sintesi di documenti tecnici estesi
Verifica di conformità su policy e procedure interne
Ricerca fine su grandi volumi di documenti mantenendo il contesto completo

La finestra di contesto da 256K token di Gemma 4 26B permette di elaborare documenti molto lunghi senza perderne la coerenza – un vantaggio decisivo su contrattualistica, reportistica normativa e analisi di conformità.

Due tagli, entrambi verificati

Entrambe le configurazioni sono testate e supportate ufficialmente da E17® NEXUS. I due modelli non sono semplicemente “compatibili”: sono il risultato di una selezione basata su test reali, con parametri di quantizzazione, contesto e prompt ottimizzati per l’uso aziendale.

E17® NEXUS funziona anche con modelli di dimensioni superiori: l’architettura è pronta per scalare su configurazioni a 48 o 96 GB di VRAM e sui modelli open source di nuova generazione. I due tagli descritti sopra sono quelli che oggi raccomandiamo perché coprono la quasi totalità dei casi aziendali con performance certificate, ma la piattaforma non pone limiti: chi dispone di hardware superiore può utilizzarlo subito.

Conclusione

Con Gemma 3 12B e Gemma 4 26B, E17® NEXUS copre due scenari aziendali distinti ma complementari: l’AI accessibile per chi parte da hardware consumer, e l’AI di fascia alta per chi vuole il meglio oggi disponibile in ambito open source.

Due modelli, due configurazioni hardware, un’unica piattaforma – sempre in locale, sempre sotto il controllo dell’azienda.

Vuoi provare E17® NEXUS sul tuo hardware? Bastano 12 GB di VRAM per un test completo. Prenota una demo o richiedi la tua licenza.

Informazioni di Contatto BI@Work Srl

Dettagli articolo