Qu'est-ce que GLM (Z.ai) ?
GLM est la famille de grands modèles de langage de Zhipu AI (qui présente son assistant et son API sous la marque Z.ai), un laboratoire chinois issu de l'université Tsinghua. Son fleuron actuel, GLM-5.2, est un modèle à poids ouverts conçu pour l'ingénierie logicielle agentique à l'échelle du dépôt plutôt que pour le chat.
GLM-5.2 est un modèle Mixture-of-Experts (environ 753B de paramètres au total, avec à peu près 40B actifs par jeton) publié sous la licence permissive MIT sur Hugging Face. Il associe une fenêtre de contexte exploitable d'un million de jetons à un système double d'effort de réflexion (modes High et Max), afin de pouvoir planifier et exécuter de longues exécutions utilisant des outils à travers tout un code.
Sur les benchmarks publics de programmation, le modèle rivalise avec les modèles fermés de pointe à une fraction du coût, et c'est la raison de l'évaluer : une capacité agentique et de programmation que vous pouvez héberger vous-même, pesée face aux questions de gouvernance d'un service hébergé basé en Chine pour les données sensibles.
Ce pour quoi il excelle
- L'ingénierie logicielle agentique : de longues exécutions utilisant des outils qui planifient et éditent à travers de nombreux fichiers.
- Le travail à l'échelle du dépôt, où le contexte d'un million de jetons garde en vue un grand code.
- L'autohébergement : les poids sous licence MIT vous permettent d'exécuter l'inférence entièrement dans votre propre environnement.
- Les équipes sensibles au coût : la tarification de l'API se situe bien en dessous des modèles fermés de pointe pour un travail similaire.
- Le réglage de l'effort : le mode High pour les tâches courantes, le mode Max pour le raisonnement le plus difficile.
Où il faiblit
- Les données sensibles ou réglementées sur le service hébergé, qui fonctionne sur une infrastructure basée en Chine. L'autohébergement des poids ouverts évite cela.
- Les sujets soumis aux restrictions de contenu chinoises sur l'assistant hébergé.
- Les équipes souhaitant un support entreprise occidental et un ensemble de fonctionnalités grand public mature.
Façons d'accéder
Utilisez l'assistant de chat Z.ai pour l'expérience hébergée. Pour développer, l'API de Zhipu est le chemin vers GLM-5.2, et la plupart du code visant un point de terminaison compatible OpenAI s'adapte avec un changement d'URL de base et de nom de modèle.
Pour un contrôle total, téléchargez les poids sous licence MIT depuis Hugging Face et autohébergez. Prévoyez le calcul : un modèle Mixture-of-Experts de 753B de paramètres demande une mémoire GPU sérieuse même avec seulement 40B actifs par jeton.
Obtenir de meilleures réponses
Traitez-le comme un agent, pas comme un agent conversationnel : donnez-lui l'objectif, les outils qu'il peut appeler et les fichiers pertinents, puis laissez-le planifier et exécuter les étapes. Le long contexte est là pour contenir une vraie structure de dépôt, alors incluez-la.
Choisissez délibérément l'effort de réflexion. Utilisez le mode High pour les changements de routine et le mode Max pour le raisonnement le plus difficile, là où le calcul supplémentaire est rentable.
Pour le travail sur données sensibles, préférez les poids ouverts au service hébergé et confirmez que les conditions de la licence MIT couvrent votre usage.
Ce que coûte GLM (Z.ai)
Approximatif, en USD, en date de juin 2026. Les prix changent souvent. Confirmez sur le site officiel avant de vous y fier.
Assistant Z.ai
$0
Assistant de chat gratuit, sous réserve de limites.
Poids ouverts
$0 (self-host)
Les poids de GLM-5.2 sont publiés sous la licence MIT sur Hugging Face ; vous ne payez que vos propres ressources de calcul.
API
~$0.95-2 / 1M in, ~$3-6 / 1M out
À l'usage sur la plateforme de Zhipu, environ 80-90% en dessous des principaux modèles fermés pour un travail comparable. Confirmez les tarifs actuels sur le site officiel.
Exemples de prompts
Copiez-les dans GLM (Z.ai) comme points de départ, puis adaptez-les à votre tâche.
Voici le dépôt. Tu peux lire, éditer et exécuter des fichiers. Implémente cette fonctionnalité de bout en bout, liste chaque fichier que tu as modifié et pourquoi, et exécute les tests avant de terminer.
J'ai collé le module entier. Trace comment les données circulent de la route d'API à la base de données, et signale tout endroit où une erreur est avalée silencieusement.
Adapte cet appel d'API de style OpenAI pour utiliser le point de terminaison Zhipu (GLM-5.2), en changeant uniquement l'URL de base et le nom du modèle.
Nous évaluons GLM-5.2 pour un outil interne qui touche aux données clients. Liste les questions à résoudre avant d'utiliser l'API hébergée, et ce qui change si nous autohébergeons les poids sous licence MIT.
GLM (Z.ai)
questions fréquentes.
Des réponses directes aux questions qu'on nous pose le plus souvent. Si la vôtre n'y est pas, écrivez à l'équipe.