Cos'è GLM (Z.ai)?
GLM è la famiglia di grandi modelli linguistici di Zhipu AI (che presenta il suo assistente e la sua API con il marchio Z.ai), un laboratorio cinese nato come spin-off dell'Università Tsinghua. Il suo attuale modello di punta, GLM-5.2, è un modello a pesi aperti costruito per l'ingegneria del software agentica e su scala di repository, più che per la chat.
GLM-5.2 è un modello Mixture-of-Experts (circa 753B di parametri totali con all'incirca 40B attivi per token) rilasciato sotto la licenza permissiva MIT su Hugging Face. Abbina un context window utilizzabile di un milione di token a un doppio sistema di sforzo di ragionamento (modalità High e Max), così può pianificare ed eseguire lunghe esecuzioni con uso di strumenti su un intero codebase.
Nei benchmark pubblici di programmazione il modello è competitivo con i modelli chiusi di punta a una frazione del costo, ed è questa la ragione per valutarlo: una capacità agentica e di programmazione notevole che puoi ospitare da te, da soppesare rispetto alle questioni di governance di un servizio ospitato con sede in Cina per i dati sensibili.
Dove eccelle
- L'ingegneria del software agentica: lunghe esecuzioni con uso di strumenti che pianificano e modificano su molti file.
- Il lavoro su scala di repository, dove il context window di un milione di token tiene in vista un grande codebase.
- L'autohosting: i pesi con licenza MIT ti permettono di eseguire l'inferenza interamente nel tuo ambiente.
- I team attenti ai costi: la tariffazione dell'API si colloca ben al di sotto dei modelli chiusi di punta per un lavoro analogo.
- Regolare lo sforzo: modalità High per i compiti quotidiani, modalità Max per il ragionamento più difficile.
Dove fa cilecca
- I dati sensibili o regolamentati sul servizio ospitato, che funziona su un'infrastruttura con sede in Cina. L'autohosting dei pesi aperti evita questo problema.
- I temi soggetti alle restrizioni sui contenuti cinesi sull'assistente ospitato.
- I team che vogliono supporto enterprise occidentale e un set di funzionalità consumer maturo.
Modi per accedere
Usa l'assistente di chat Z.ai per l'esperienza ospitata. Per sviluppare, l'API di Zhipu è il percorso verso GLM-5.2, e la maggior parte del codice che punta a un endpoint compatibile con OpenAI si adatta con una modifica dell'URL di base e del nome del modello.
Per il pieno controllo, scarica i pesi con licenza MIT da Hugging Face e fai autohosting. Metti in conto le risorse di calcolo: un modello Mixture-of-Experts da 753B di parametri richiede una memoria GPU importante anche con soli 40B attivi per token.
Ottenere il massimo
Trattalo come un agente, non come un chatbot: dagli l'obiettivo, gli strumenti che può chiamare e i file pertinenti, poi lascia che pianifichi ed esegua i passaggi. Il context window lungo serve a contenere la reale struttura del repository, quindi includila.
Scegli lo sforzo di ragionamento in modo deliberato. Usa la modalità High per le modifiche di routine e la modalità Max per il ragionamento più difficile, dove le risorse di calcolo extra ripagano.
Per il lavoro con dati sensibili, preferisci i pesi aperti al servizio ospitato e conferma che le condizioni della licenza MIT coprano il tuo uso.
Quanto costa GLM (Z.ai)
Indicativo, in USD, aggiornato al giugno 2026. I prezzi cambiano spesso. Verifica sul sito ufficiale prima di farci affidamento.
Assistente Z.ai
$0
Assistente di chat gratuito, soggetto a limiti.
Pesi aperti
$0 (self-host)
I pesi di GLM-5.2 sono pubblicati sotto la licenza MIT su Hugging Face; paghi solo le tue risorse di calcolo.
API
~$0.95-2 / 1M in, ~$3-6 / 1M out
A consumo sulla piattaforma di Zhipu, all'incirca l'80-90% in meno rispetto ai principali modelli chiusi per un lavoro analogo. Conferma le tariffe attuali sul sito ufficiale.
Esempi di prompt
Copiali in GLM (Z.ai) come punto di partenza, poi adattali al tuo compito.
Ecco il repository. Puoi leggere, modificare ed eseguire i file. Implementa questa funzionalità dall'inizio alla fine, elenca ogni file che hai modificato e perché, ed esegui i test prima di finire.
Ho incollato l'intero modulo. Traccia come i dati scorrono dalla route dell'API al database, e segnala ogni punto in cui un errore viene ingoiato in silenzio.
Adatta questa chiamata all'API in stile OpenAI in modo che usi l'endpoint di Zhipu (GLM-5.2), cambiando solo l'URL di base e il nome del modello.
Stiamo valutando GLM-5.2 per uno strumento interno che tratta dati dei clienti. Elenca le domande da risolvere prima di usare l'API ospitata, e cosa cambia se facciamo autohosting dei pesi con licenza MIT.
GLM (Z.ai)
domande frequenti.
Risposte dirette alle domande che ci vengono poste più spesso. Se la tua non c'è, scrivi al team.