GLM-5.2 es el modelo de pesos abiertos buque insignia de Zhipu AI, publicado bajo la licencia MIT. Es un modelo Mixture-of-Experts construido para la ingeniería de software agéntica y a escala de repositorio, con una ventana de contexto de un millón de tokens y los modos de razonamiento High y Max.

¿Cuál es la diferencia entre GLM, Zhipu y Z.ai?

GLM es la familia de modelos, Zhipu AI es la empresa que la construye y Z.ai es la marca de su asistente y sus productos para desarrolladores. Se refieren a la misma gama.

¿Puedo autoalojar GLM-5.2?

Sí. Los pesos se publican bajo la licencia permisiva MIT en Hugging Face, así que puedes descargarlos, modificarlos y ejecutarlos en tu propio entorno. Prevé una memoria de GPU considerable: es un modelo de 753B de parámetros, aunque solo unos 40B están activos por token.

¿Es seguro GLM para los datos de empresa?

El asistente y la API alojados funcionan sobre infraestructura con sede en China, lo que plantea cuestiones de residencia de los datos y de gobernanza para los datos sensibles o regulados. El autoalojamiento de los pesos con licencia MIT mantiene la inferencia dentro de tu propio entorno.

¿En qué destaca GLM-5.2?

En la ingeniería de software agéntica: ejecuciones largas con uso de herramientas que planifican y editan en todo un código base, con la ayuda del contexto de un millón de tokens. Es competitivo con los modelos cerrados de frontera en los benchmarks de programación a un precio mucho menor.

¿Cómo se compara GLM con Qwen o DeepSeek?

Los tres son familias chinas capaces de pesos abiertos. GLM-5.2 destaca por su fuerza agéntica y de programación y por una licencia MIT permisiva; Qwen, por la gama de tamaños más amplia; DeepSeek, por el razonamiento transparente de bajo coste. Evalúalos en tus propias tareas y autoaloja para el trabajo con datos sensibles.

GLM (Z.ai) guide

¿Qué es GLM (Z.ai)?

GLM es la familia de grandes modelos de lenguaje de Zhipu AI (que presenta su asistente y su API bajo la marca Z.ai), un laboratorio chino surgido de la Universidad de Tsinghua. Su buque insignia actual, GLM-5.2, es un modelo de pesos abiertos construido para la ingeniería de software agéntica y a escala de repositorio en lugar del chat.

GLM-5.2 es un modelo Mixture-of-Experts (alrededor de 753B de parámetros totales con unos 40B activos por token) publicado bajo la licencia permisiva MIT en Hugging Face. Combina una ventana de contexto utilizable de un millón de tokens con un sistema de doble esfuerzo de razonamiento (modos High y Max), de modo que puede planificar y ejecutar ejecuciones largas con uso de herramientas en todo un código base.

En los benchmarks públicos de programación el modelo es competitivo con los modelos cerrados de frontera a una fracción del coste, que es la razón para evaluarlo: capacidad agéntica y de programación competente que puedes alojar tú mismo, sopesada frente a las cuestiones de gobernanza de un servicio alojado con sede en China para los datos sensibles.

Fortalezas

En lo que brilla

La ingeniería de software agéntica: ejecuciones largas con uso de herramientas que planifican y editan entre muchos archivos.
El trabajo a escala de repositorio, donde el contexto de un millón de tokens mantiene a la vista un código base grande.
El autoalojamiento: los pesos con licencia MIT te permiten ejecutar la inferencia enteramente en tu propio entorno.
Los equipos sensibles al coste: el precio de la API queda muy por debajo de los modelos cerrados de frontera para un trabajo similar.
Ajustar el esfuerzo: el modo High para las tareas del día a día, el modo Max para el razonamiento más difícil.

Límites

Dónde se queda corto

Los datos sensibles o regulados en el servicio alojado, que funciona sobre infraestructura con sede en China. El autoalojamiento de los pesos abiertos evita esto.
Los temas sujetos a las restricciones de contenido chinas en el asistente alojado.
Los equipos que quieren el soporte de empresa occidental y un conjunto de funciones de consumo maduro.

Cómo usarlo

Vías de acceso

Usa el asistente de chat Z.ai para la experiencia alojada. Para desarrollar, la API de Zhipu es la vía a GLM-5.2, y la mayor parte del código que apunta a un endpoint compatible con OpenAI se adapta con un cambio de la URL base y del nombre del modelo.

Para un control total, descarga los pesos con licencia MIT desde Hugging Face y autoaloja. Prevé el cómputo: un modelo Mixture-of-Experts de 753B de parámetros necesita una memoria de GPU considerable aunque solo haya 40B activos por token.

Cómo usarlo

Sacarle el máximo partido

Trátalo como un agente, no como un chatbot: dale el objetivo, las herramientas que puede llamar y los archivos relevantes, y luego deja que planifique y ejecute los pasos. El contexto largo está ahí para mantener la estructura real del repositorio, así que inclúyela.

Elige el esfuerzo de razonamiento de forma deliberada. Usa el modo High para los cambios rutinarios y el modo Max para el razonamiento más difícil, donde el cómputo extra compensa.

Para el trabajo con datos sensibles, prefiere los pesos abiertos antes que el servicio alojado y confirma que las condiciones de la licencia MIT cubren tu uso.

Precios

Cuánto cuesta GLM (Z.ai)

Aproximado, en USD, a fecha de junio de 2026. Los precios cambian a menudo. Confírmalos en el sitio oficial antes de fiarte de ellos.

Asistente Z.ai

Asistente de chat gratuito, sujeto a límites.

Pesos abiertos

$0 (self-host)

Los pesos de GLM-5.2 se publican bajo la licencia MIT en Hugging Face; solo pagas tu propia infraestructura de cómputo.

API

~$0.95-2 / 1M in, ~$3-6 / 1M out

Según uso en la plataforma de Zhipu, en torno a un 80-90% por debajo de los modelos cerrados líderes para un trabajo comparable. Confirma las tarifas actuales en el sitio oficial.

Visita el sitio oficial de GLM (Z.ai)

Pruébalo

Ejemplos de prompts

Cópialos en GLM (Z.ai) como punto de partida y luego adáptalos a tu tarea.

Ejecución de programación agénticaCopiar el prompt

Aquí está el repositorio. Puedes leer, editar y ejecutar archivos. Implementa esta función de principio a fin, enumera cada archivo que cambiaste y por qué, y ejecuta las pruebas antes de terminar.

Revisión de contexto largoCopiar el prompt

He pegado el módulo completo. Traza cómo fluyen los datos desde la ruta de la API hasta la base de datos, y señala cualquier punto donde un error se trague en silencio.

Prueba de sustituciónCopiar el prompt

Adapta esta llamada a la API al estilo de OpenAI para que use el endpoint de Zhipu (GLM-5.2), cambiando solo la URL base y el nombre del modelo.

Comprobación de gobernanzaCopiar el prompt

Estamos evaluando GLM-5.2 para una herramienta interna que maneja datos de clientes. Enumera las preguntas que debemos resolver antes de usar la API alojada, y qué cambia si autoalojamos los pesos con licencia MIT.

FAQ

GLM (Z.ai)
preguntas frecuentes.

Respuestas directas a las preguntas que más nos hacen. Si la tuya no está, escribe al equipo.

Contacta con el equipo

GLM (Z.ai)

En lo que brilla

Dónde se queda corto

Vías de acceso

Sacarle el máximo partido

Cuánto cuesta GLM (Z.ai)

Ejemplos de prompts

GLM (Z.ai)
preguntas frecuentes.

Guías relacionadas

Qwen

DeepSeek

Kimi

¿Llevar la IA a producción?

En lo que brilla

Dónde se queda corto

Vías de acceso

Sacarle el máximo partido

Cuánto cuesta GLM (Z.ai)

Ejemplos de prompts

GLM (Z.ai)preguntas frecuentes.

¿Qué es GLM-5.2?

¿Cuál es la diferencia entre GLM, Zhipu y Z.ai?

¿Puedo autoalojar GLM-5.2?

¿Es seguro GLM para los datos de empresa?

¿En qué destaca GLM-5.2?

¿Cómo se compara GLM con Qwen o DeepSeek?

Guías relacionadas

Qwen

DeepSeek

Kimi

¿Llevar la IA a producción?

GLM (Z.ai)
preguntas frecuentes.