Aller au contenu
Apprendre · Guide · AI21 Labs (Israel)

Jamba

La famille de modèles à poids ouverts d'AI21 Labs, construite sur une architecture hybride Mamba-Transformer pour un travail efficace à très long contexte.

AI21 Labs (Israel)7 min de lecturewww.ai21.com

Qu'est-ce que Jamba ?

Jamba est une famille de modèles de langage à poids ouverts d'AI21 Labs, une entreprise israélienne. Sa caractéristique distinctive est l'architecture : un hybride qui combine des couches à espace d'états de style Mamba avec des couches Transformer, ce qui rend l'inférence à long contexte plus économe en mémoire qu'un Transformer pur.

Cette efficacité se traduit par une grande fenêtre de contexte à moindre coût, ce qui convient au travail sur de longs documents et à haut débit. Vous utilisez Jamba via l'API et le Studio d'AI21, via les places de marché cloud, ou en autohébergeant les poids ouverts publiés.

Jamba vaut la peine d'être évalué lorsque le long contexte et l'efficacité sont la priorité, et lorsque vous voulez des poids ouverts d'un laboratoire occidental que vous pouvez déployer dans votre propre environnement.

Forces

Ce pour quoi il excelle

  • Les tâches à long contexte : traiter de grands documents efficacement grâce à l'architecture hybride.
  • Les charges de travail à haut débit où l'efficacité mémoire abaisse le coût par requête.
  • L'autohébergement de poids ouverts d'un laboratoire occidental pour le contrôle des données.
  • La génération augmentée par récupération et les flux de travail d'entreprise grâce aux outils d'AI21.
  • Les équipes qui veulent évaluer une architecture alternative aux côtés des Transformers standard.
Limites

Où il faiblit

  • Une expérience d'agent conversationnel grand public : AI21 cible les développeurs et les entreprises.
  • La génération native d'images, d'audio ou de vidéo ; Jamba est une famille de modèles de texte.
  • Dominer les classements généralistes sur toutes les tâches ; son avantage est l'efficacité à long contexte plutôt que d'être le modèle le plus performant partout.
Comment l'utiliser

Façons d'accéder

Les développeurs commencent dans AI21 Studio : obtenez une clé et appelez les modèles Jamba par API. Les modèles sont aussi disponibles via les grandes places de marché cloud pour un déploiement proche de vos données.

Pour un contrôle total, téléchargez les poids ouverts et autohébergez-les sous des environnements d'exécution courants.

Comment l'utiliser

Bien utiliser le long contexte

Transmettez les longues entrées directement plutôt que de les pré-découper lorsque vous le pouvez ; l'architecture est conçue pour garder efficacement de grands contextes en mémoire.

Pour des réponses ancrées, fournissez les documents récupérés et demandez au modèle de répondre uniquement à partir d'eux et de citer les sources.

Tarifs

Ce que coûte Jamba

Approximatif, en USD, en date de janvier 2026. Les prix changent souvent. Confirmez sur le site officiel avant de vous y fier.

Poids ouverts

0 $ (autohébergement)

Téléchargez et exécutez les modèles à poids ouverts Jamba ; vous ne payez que vos propres ressources de calcul.

API AI21 Studio

À l'utilisation

Facturée par jeton selon le modèle ; crédits gratuits pour l'évaluation.

Entreprise / cloud

Sur mesure

Déploiement via les places de marché cloud et accords d'entreprise.

Visiter le site officiel de Jamba
Essayez

Exemples de prompts

Copiez-les dans Jamba comme points de départ, puis adaptez-les à votre tâche.

Questions-réponses sur un long documentCopier le prompt
À partir du document complet ci-dessous, réponds à ces questions une par une. Pour chaque réponse, cite la phrase sur laquelle elle se fonde. Si le document ne répond pas à une question, dis-le.
Résumé efficaceCopier le prompt
Résume cette longue transcription en un brief d'une page : décisions clés, questions ouvertes et actions à mener avec leurs responsables. Reste factuel et n'ajoute rien qui ne soit pas énoncé.
RAG ancréCopier le prompt
Réponds à la question en utilisant uniquement les passages récupérés. Cite le passage source de chaque affirmation et signale toute lacune que les passages ne couvrent pas.
Évaluation d'architectureCopier le prompt
Nous traitons de très longues entrées à grand volume. Explique comment la conception hybride Mamba-Transformer de Jamba affecte la mémoire et le coût par rapport à un Transformer standard de qualité similaire.
FAQ

Jamba
questions fréquentes.

Des réponses directes aux questions qu'on nous pose le plus souvent. Si la vôtre n'y est pas, écrivez à l'équipe.

Travailler avec SDEN

Mettre l'IA en production ?

Nous aidons les équipes à choisir les bons modèles et à les livrer en toute sécurité, auto-hébergés quand les données l'exigent. Et nous vous remettons les clés pour les piloter en autonomie.

Jamba guide · SDEN