Vai al contenuto
Impara · Guida · Zhipu AI (China)

GLM (Z.ai)

La famiglia di modelli a pesi aperti GLM di Zhipu AI, ora guidata dal modello di programmazione agentica GLM-5.2: un modello con licenza permissiva e ospitabile da te, costruito per l'ingegneria del software a lungo termine e su scala di repository.

Zhipu AI (China)8 min di letturaz.ai

Cos'è GLM (Z.ai)?

GLM è la famiglia di grandi modelli linguistici di Zhipu AI (che presenta il suo assistente e la sua API con il marchio Z.ai), un laboratorio cinese nato come spin-off dell'Università Tsinghua. Il suo attuale modello di punta, GLM-5.2, è un modello a pesi aperti costruito per l'ingegneria del software agentica e su scala di repository, più che per la chat.

GLM-5.2 è un modello Mixture-of-Experts (circa 753B di parametri totali con all'incirca 40B attivi per token) rilasciato sotto la licenza permissiva MIT su Hugging Face. Abbina un context window utilizzabile di un milione di token a un doppio sistema di sforzo di ragionamento (modalità High e Max), così può pianificare ed eseguire lunghe esecuzioni con uso di strumenti su un intero codebase.

Nei benchmark pubblici di programmazione il modello è competitivo con i modelli chiusi di punta a una frazione del costo, ed è questa la ragione per valutarlo: una capacità agentica e di programmazione notevole che puoi ospitare da te, da soppesare rispetto alle questioni di governance di un servizio ospitato con sede in Cina per i dati sensibili.

Punti di forza

Dove eccelle

  • L'ingegneria del software agentica: lunghe esecuzioni con uso di strumenti che pianificano e modificano su molti file.
  • Il lavoro su scala di repository, dove il context window di un milione di token tiene in vista un grande codebase.
  • L'autohosting: i pesi con licenza MIT ti permettono di eseguire l'inferenza interamente nel tuo ambiente.
  • I team attenti ai costi: la tariffazione dell'API si colloca ben al di sotto dei modelli chiusi di punta per un lavoro analogo.
  • Regolare lo sforzo: modalità High per i compiti quotidiani, modalità Max per il ragionamento più difficile.
Limiti

Dove fa cilecca

  • I dati sensibili o regolamentati sul servizio ospitato, che funziona su un'infrastruttura con sede in Cina. L'autohosting dei pesi aperti evita questo problema.
  • I temi soggetti alle restrizioni sui contenuti cinesi sull'assistente ospitato.
  • I team che vogliono supporto enterprise occidentale e un set di funzionalità consumer maturo.
Come usarlo

Modi per accedere

Usa l'assistente di chat Z.ai per l'esperienza ospitata. Per sviluppare, l'API di Zhipu è il percorso verso GLM-5.2, e la maggior parte del codice che punta a un endpoint compatibile con OpenAI si adatta con una modifica dell'URL di base e del nome del modello.

Per il pieno controllo, scarica i pesi con licenza MIT da Hugging Face e fai autohosting. Metti in conto le risorse di calcolo: un modello Mixture-of-Experts da 753B di parametri richiede una memoria GPU importante anche con soli 40B attivi per token.

Come usarlo

Ottenere il massimo

Trattalo come un agente, non come un chatbot: dagli l'obiettivo, gli strumenti che può chiamare e i file pertinenti, poi lascia che pianifichi ed esegua i passaggi. Il context window lungo serve a contenere la reale struttura del repository, quindi includila.

Scegli lo sforzo di ragionamento in modo deliberato. Usa la modalità High per le modifiche di routine e la modalità Max per il ragionamento più difficile, dove le risorse di calcolo extra ripagano.

Per il lavoro con dati sensibili, preferisci i pesi aperti al servizio ospitato e conferma che le condizioni della licenza MIT coprano il tuo uso.

Prezzi

Quanto costa GLM (Z.ai)

Indicativo, in USD, aggiornato al giugno 2026. I prezzi cambiano spesso. Verifica sul sito ufficiale prima di farci affidamento.

Assistente Z.ai

$0

Assistente di chat gratuito, soggetto a limiti.

Pesi aperti

$0 (self-host)

I pesi di GLM-5.2 sono pubblicati sotto la licenza MIT su Hugging Face; paghi solo le tue risorse di calcolo.

API

~$0.95-2 / 1M in, ~$3-6 / 1M out

A consumo sulla piattaforma di Zhipu, all'incirca l'80-90% in meno rispetto ai principali modelli chiusi per un lavoro analogo. Conferma le tariffe attuali sul sito ufficiale.

Visita il sito ufficiale di GLM (Z.ai)
Provalo

Esempi di prompt

Copiali in GLM (Z.ai) come punto di partenza, poi adattali al tuo compito.

Esecuzione di programmazione agenticaCopia il prompt
Ecco il repository. Puoi leggere, modificare ed eseguire i file. Implementa questa funzionalità dall'inizio alla fine, elenca ogni file che hai modificato e perché, ed esegui i test prima di finire.
Revisione a context window lungoCopia il prompt
Ho incollato l'intero modulo. Traccia come i dati scorrono dalla route dell'API al database, e segnala ogni punto in cui un errore viene ingoiato in silenzio.
Test di sostituzioneCopia il prompt
Adatta questa chiamata all'API in stile OpenAI in modo che usi l'endpoint di Zhipu (GLM-5.2), cambiando solo l'URL di base e il nome del modello.
Verifica di governanceCopia il prompt
Stiamo valutando GLM-5.2 per uno strumento interno che tratta dati dei clienti. Elenca le domande da risolvere prima di usare l'API ospitata, e cosa cambia se facciamo autohosting dei pesi con licenza MIT.
FAQ

GLM (Z.ai)
domande frequenti.

Risposte dirette alle domande che ci vengono poste più spesso. Se la tua non c'è, scrivi al team.

Lavorare con SDEN

Portare l'IA in produzione?

Aiutiamo i team a scegliere i modelli giusti e a metterli in produzione in sicurezza, self-hosted quando i dati lo richiedono. E ti consegniamo le chiavi per gestirli in autonomia.

GLM (Z.ai) guide · SDEN