Aller au contenu
Learn · Guide · Zhipu AI (China)

GLM (Z.ai)

La famille de modèles à poids ouverts GLM de Zhipu AI, désormais menée par le modèle de programmation agentique GLM-5.2 : un modèle sous licence permissive et autohébergeable, conçu pour l'ingénierie logicielle de long horizon à l'échelle du dépôt.

Zhipu AI (China)8 min readz.ai

What is GLM (Z.ai)?

GLM est la famille de grands modèles de langage de Zhipu AI (qui présente son assistant et son API sous la marque Z.ai), un laboratoire chinois issu de l'université Tsinghua. Son fleuron actuel, GLM-5.2, est un modèle à poids ouverts conçu pour l'ingénierie logicielle agentique à l'échelle du dépôt plutôt que pour le chat.

GLM-5.2 est un modèle Mixture-of-Experts (environ 753B de paramètres au total, avec à peu près 40B actifs par jeton) publié sous la licence permissive MIT sur Hugging Face. Il associe une fenêtre de contexte exploitable d'un million de jetons à un système double d'effort de réflexion (modes High et Max), afin de pouvoir planifier et exécuter de longues exécutions utilisant des outils à travers tout un code.

Sur les benchmarks publics de programmation, le modèle rivalise avec les modèles fermés de pointe à une fraction du coût, et c'est la raison de l'évaluer : une capacité agentique et de programmation que vous pouvez héberger vous-même, pesée face aux questions de gouvernance d'un service hébergé basé en Chine pour les données sensibles.

Strengths

What it's best for

  • L'ingénierie logicielle agentique : de longues exécutions utilisant des outils qui planifient et éditent à travers de nombreux fichiers.
  • Le travail à l'échelle du dépôt, où le contexte d'un million de jetons garde en vue un grand code.
  • L'autohébergement : les poids sous licence MIT vous permettent d'exécuter l'inférence entièrement dans votre propre environnement.
  • Les équipes sensibles au coût : la tarification de l'API se situe bien en dessous des modèles fermés de pointe pour un travail similaire.
  • Le réglage de l'effort : le mode High pour les tâches courantes, le mode Max pour le raisonnement le plus difficile.
Limits

Where it falls short

  • Les données sensibles ou réglementées sur le service hébergé, qui fonctionne sur une infrastructure basée en Chine. L'autohébergement des poids ouverts évite cela.
  • Les sujets soumis aux restrictions de contenu chinoises sur l'assistant hébergé.
  • Les équipes souhaitant un support entreprise occidental et un ensemble de fonctionnalités grand public mature.
How to use it

Façons d'accéder

Utilisez l'assistant de chat Z.ai pour l'expérience hébergée. Pour développer, l'API de Zhipu est le chemin vers GLM-5.2, et la plupart du code visant un point de terminaison compatible OpenAI s'adapte avec un changement d'URL de base et de nom de modèle.

Pour un contrôle total, téléchargez les poids sous licence MIT depuis Hugging Face et autohébergez. Prévoyez le calcul : un modèle Mixture-of-Experts de 753B de paramètres demande une mémoire GPU sérieuse même avec seulement 40B actifs par jeton.

How to use it

Obtenir de meilleures réponses

Traitez-le comme un agent, pas comme un agent conversationnel : donnez-lui l'objectif, les outils qu'il peut appeler et les fichiers pertinents, puis laissez-le planifier et exécuter les étapes. Le long contexte est là pour contenir une vraie structure de dépôt, alors incluez-la.

Choisissez délibérément l'effort de réflexion. Utilisez le mode High pour les changements de routine et le mode Max pour le raisonnement le plus difficile, là où le calcul supplémentaire est rentable.

Pour le travail sur données sensibles, préférez les poids ouverts au service hébergé et confirmez que les conditions de la licence MIT couvrent votre usage.

Pricing

What GLM (Z.ai) costs

Approximate, in USD, as of juin 2026. Prices change often. Confirm on the official site before you rely on them.

Assistant Z.ai

$0

Assistant de chat gratuit, sous réserve de limites.

Poids ouverts

$0 (self-host)

Les poids de GLM-5.2 sont publiés sous la licence MIT sur Hugging Face ; vous ne payez que vos propres ressources de calcul.

API

~$0.95-2 / 1M in, ~$3-6 / 1M out

À l'usage sur la plateforme de Zhipu, environ 80-90% en dessous des principaux modèles fermés pour un travail comparable. Confirmez les tarifs actuels sur le site officiel.

Visit the official GLM (Z.ai) site
Try it

Example prompts

Copy these into GLM (Z.ai) as starting points, then adapt them to your task.

Exécution de programmation agentiqueCopier le prompt
Voici le dépôt. Tu peux lire, éditer et exécuter des fichiers. Implémente cette fonctionnalité de bout en bout, liste chaque fichier que tu as modifié et pourquoi, et exécute les tests avant de terminer.
Revue à long contexteCopier le prompt
J'ai collé le module entier. Trace comment les données circulent de la route d'API à la base de données, et signale tout endroit où une erreur est avalée silencieusement.
Test de substitutionCopier le prompt
Adapte cet appel d'API de style OpenAI pour utiliser le point de terminaison Zhipu (GLM-5.2), en changeant uniquement l'URL de base et le nom du modèle.
Vérification de gouvernanceCopier le prompt
Nous évaluons GLM-5.2 pour un outil interne qui touche aux données clients. Liste les questions à résoudre avant d'utiliser l'API hébergée, et ce qui change si nous autohébergeons les poids sous licence MIT.
FAQ

GLM (Z.ai)
common questions.

Des réponses directes aux questions qu'on nous pose le plus souvent. Si la vôtre n'y est pas, écrivez à l'équipe.

Work with SDEN

Putting AI into production?

We help teams choose the right models and ship them securely, self-hosted when data demands it. And we hand you the keys to run them in-house.

GLM (Z.ai) guide · SDEN