¿Qué es GLM (Z.ai)?
GLM es la familia de grandes modelos de lenguaje de Zhipu AI (que presenta su asistente y su API bajo la marca Z.ai), un laboratorio chino surgido de la Universidad de Tsinghua. Su buque insignia actual, GLM-5.2, es un modelo de pesos abiertos construido para la ingeniería de software agéntica y a escala de repositorio en lugar del chat.
GLM-5.2 es un modelo Mixture-of-Experts (alrededor de 753B de parámetros totales con unos 40B activos por token) publicado bajo la licencia permisiva MIT en Hugging Face. Combina una ventana de contexto utilizable de un millón de tokens con un sistema de doble esfuerzo de razonamiento (modos High y Max), de modo que puede planificar y ejecutar ejecuciones largas con uso de herramientas en todo un código base.
En los benchmarks públicos de programación el modelo es competitivo con los modelos cerrados de frontera a una fracción del coste, que es la razón para evaluarlo: capacidad agéntica y de programación competente que puedes alojar tú mismo, sopesada frente a las cuestiones de gobernanza de un servicio alojado con sede en China para los datos sensibles.
En lo que brilla
- La ingeniería de software agéntica: ejecuciones largas con uso de herramientas que planifican y editan entre muchos archivos.
- El trabajo a escala de repositorio, donde el contexto de un millón de tokens mantiene a la vista un código base grande.
- El autoalojamiento: los pesos con licencia MIT te permiten ejecutar la inferencia enteramente en tu propio entorno.
- Los equipos sensibles al coste: el precio de la API queda muy por debajo de los modelos cerrados de frontera para un trabajo similar.
- Ajustar el esfuerzo: el modo High para las tareas del día a día, el modo Max para el razonamiento más difícil.
Dónde se queda corto
- Los datos sensibles o regulados en el servicio alojado, que funciona sobre infraestructura con sede en China. El autoalojamiento de los pesos abiertos evita esto.
- Los temas sujetos a las restricciones de contenido chinas en el asistente alojado.
- Los equipos que quieren el soporte de empresa occidental y un conjunto de funciones de consumo maduro.
Vías de acceso
Usa el asistente de chat Z.ai para la experiencia alojada. Para desarrollar, la API de Zhipu es la vía a GLM-5.2, y la mayor parte del código que apunta a un endpoint compatible con OpenAI se adapta con un cambio de la URL base y del nombre del modelo.
Para un control total, descarga los pesos con licencia MIT desde Hugging Face y autoaloja. Prevé el cómputo: un modelo Mixture-of-Experts de 753B de parámetros necesita una memoria de GPU considerable aunque solo haya 40B activos por token.
Sacarle el máximo partido
Trátalo como un agente, no como un chatbot: dale el objetivo, las herramientas que puede llamar y los archivos relevantes, y luego deja que planifique y ejecute los pasos. El contexto largo está ahí para mantener la estructura real del repositorio, así que inclúyela.
Elige el esfuerzo de razonamiento de forma deliberada. Usa el modo High para los cambios rutinarios y el modo Max para el razonamiento más difícil, donde el cómputo extra compensa.
Para el trabajo con datos sensibles, prefiere los pesos abiertos antes que el servicio alojado y confirma que las condiciones de la licencia MIT cubren tu uso.
Cuánto cuesta GLM (Z.ai)
Aproximado, en USD, a fecha de junio de 2026. Los precios cambian a menudo. Confírmalos en el sitio oficial antes de fiarte de ellos.
Asistente Z.ai
$0
Asistente de chat gratuito, sujeto a límites.
Pesos abiertos
$0 (self-host)
Los pesos de GLM-5.2 se publican bajo la licencia MIT en Hugging Face; solo pagas tu propia infraestructura de cómputo.
API
~$0.95-2 / 1M in, ~$3-6 / 1M out
Según uso en la plataforma de Zhipu, en torno a un 80-90% por debajo de los modelos cerrados líderes para un trabajo comparable. Confirma las tarifas actuales en el sitio oficial.
Ejemplos de prompts
Cópialos en GLM (Z.ai) como punto de partida y luego adáptalos a tu tarea.
Aquí está el repositorio. Puedes leer, editar y ejecutar archivos. Implementa esta función de principio a fin, enumera cada archivo que cambiaste y por qué, y ejecuta las pruebas antes de terminar.
He pegado el módulo completo. Traza cómo fluyen los datos desde la ruta de la API hasta la base de datos, y señala cualquier punto donde un error se trague en silencio.
Adapta esta llamada a la API al estilo de OpenAI para que use el endpoint de Zhipu (GLM-5.2), cambiando solo la URL base y el nombre del modelo.
Estamos evaluando GLM-5.2 para una herramienta interna que maneja datos de clientes. Enumera las preguntas que debemos resolver antes de usar la API alojada, y qué cambia si autoalojamos los pesos con licencia MIT.
GLM (Z.ai)
preguntas frecuentes.
Respuestas directas a las preguntas que más nos hacen. Si la tuya no está, escribe al equipo.