Saltar al contenido
Aprende · Guía · Zhipu AI (China)

GLM (Z.ai)

La familia de modelos de pesos abiertos GLM de Zhipu AI, ahora liderada por el modelo de programación agéntica GLM-5.2: un modelo de licencia permisiva y autoalojable, construido para la ingeniería de software de largo horizonte y a escala de repositorio.

Zhipu AI (China)8 min de lecturaz.ai

¿Qué es GLM (Z.ai)?

GLM es la familia de grandes modelos de lenguaje de Zhipu AI (que presenta su asistente y su API bajo la marca Z.ai), un laboratorio chino surgido de la Universidad de Tsinghua. Su buque insignia actual, GLM-5.2, es un modelo de pesos abiertos construido para la ingeniería de software agéntica y a escala de repositorio en lugar del chat.

GLM-5.2 es un modelo Mixture-of-Experts (alrededor de 753B de parámetros totales con unos 40B activos por token) publicado bajo la licencia permisiva MIT en Hugging Face. Combina una ventana de contexto utilizable de un millón de tokens con un sistema de doble esfuerzo de razonamiento (modos High y Max), de modo que puede planificar y ejecutar ejecuciones largas con uso de herramientas en todo un código base.

En los benchmarks públicos de programación el modelo es competitivo con los modelos cerrados de frontera a una fracción del coste, que es la razón para evaluarlo: capacidad agéntica y de programación competente que puedes alojar tú mismo, sopesada frente a las cuestiones de gobernanza de un servicio alojado con sede en China para los datos sensibles.

Fortalezas

En lo que brilla

  • La ingeniería de software agéntica: ejecuciones largas con uso de herramientas que planifican y editan entre muchos archivos.
  • El trabajo a escala de repositorio, donde el contexto de un millón de tokens mantiene a la vista un código base grande.
  • El autoalojamiento: los pesos con licencia MIT te permiten ejecutar la inferencia enteramente en tu propio entorno.
  • Los equipos sensibles al coste: el precio de la API queda muy por debajo de los modelos cerrados de frontera para un trabajo similar.
  • Ajustar el esfuerzo: el modo High para las tareas del día a día, el modo Max para el razonamiento más difícil.
Límites

Dónde se queda corto

  • Los datos sensibles o regulados en el servicio alojado, que funciona sobre infraestructura con sede en China. El autoalojamiento de los pesos abiertos evita esto.
  • Los temas sujetos a las restricciones de contenido chinas en el asistente alojado.
  • Los equipos que quieren el soporte de empresa occidental y un conjunto de funciones de consumo maduro.
Cómo usarlo

Vías de acceso

Usa el asistente de chat Z.ai para la experiencia alojada. Para desarrollar, la API de Zhipu es la vía a GLM-5.2, y la mayor parte del código que apunta a un endpoint compatible con OpenAI se adapta con un cambio de la URL base y del nombre del modelo.

Para un control total, descarga los pesos con licencia MIT desde Hugging Face y autoaloja. Prevé el cómputo: un modelo Mixture-of-Experts de 753B de parámetros necesita una memoria de GPU considerable aunque solo haya 40B activos por token.

Cómo usarlo

Sacarle el máximo partido

Trátalo como un agente, no como un chatbot: dale el objetivo, las herramientas que puede llamar y los archivos relevantes, y luego deja que planifique y ejecute los pasos. El contexto largo está ahí para mantener la estructura real del repositorio, así que inclúyela.

Elige el esfuerzo de razonamiento de forma deliberada. Usa el modo High para los cambios rutinarios y el modo Max para el razonamiento más difícil, donde el cómputo extra compensa.

Para el trabajo con datos sensibles, prefiere los pesos abiertos antes que el servicio alojado y confirma que las condiciones de la licencia MIT cubren tu uso.

Precios

Cuánto cuesta GLM (Z.ai)

Aproximado, en USD, a fecha de junio de 2026. Los precios cambian a menudo. Confírmalos en el sitio oficial antes de fiarte de ellos.

Asistente Z.ai

$0

Asistente de chat gratuito, sujeto a límites.

Pesos abiertos

$0 (self-host)

Los pesos de GLM-5.2 se publican bajo la licencia MIT en Hugging Face; solo pagas tu propia infraestructura de cómputo.

API

~$0.95-2 / 1M in, ~$3-6 / 1M out

Según uso en la plataforma de Zhipu, en torno a un 80-90% por debajo de los modelos cerrados líderes para un trabajo comparable. Confirma las tarifas actuales en el sitio oficial.

Visita el sitio oficial de GLM (Z.ai)
Pruébalo

Ejemplos de prompts

Cópialos en GLM (Z.ai) como punto de partida y luego adáptalos a tu tarea.

Ejecución de programación agénticaCopiar el prompt
Aquí está el repositorio. Puedes leer, editar y ejecutar archivos. Implementa esta función de principio a fin, enumera cada archivo que cambiaste y por qué, y ejecuta las pruebas antes de terminar.
Revisión de contexto largoCopiar el prompt
He pegado el módulo completo. Traza cómo fluyen los datos desde la ruta de la API hasta la base de datos, y señala cualquier punto donde un error se trague en silencio.
Prueba de sustituciónCopiar el prompt
Adapta esta llamada a la API al estilo de OpenAI para que use el endpoint de Zhipu (GLM-5.2), cambiando solo la URL base y el nombre del modelo.
Comprobación de gobernanzaCopiar el prompt
Estamos evaluando GLM-5.2 para una herramienta interna que maneja datos de clientes. Enumera las preguntas que debemos resolver antes de usar la API alojada, y qué cambia si autoalojamos los pesos con licencia MIT.
FAQ

GLM (Z.ai)
preguntas frecuentes.

Respuestas directas a las preguntas que más nos hacen. Si la tuya no está, escribe al equipo.

Trabaja con SDEN

¿Llevar la IA a producción?

Ayudamos a los equipos a elegir los modelos adecuados y a desplegarlos con seguridad, autoalojados cuando los datos lo exigen. Y te entregamos las llaves para pilotarlos con autonomía.

GLM (Z.ai) guide · SDEN