Aller au contenu

Les agents d'IA en entreprise : où ils fonctionnent, et où un flux l'emporte

Les agents sont puissants et faciles à rater. Quand une tâche a vraiment besoin d'un agent, quand un simple flux est la meilleure réponse, et comment garder un agent sûr et abordable en production.

Équipe SDEN10 min de lecture

Le constat de départ

Un agent d'IA est un système qui, à partir d'un objectif, planifie ses propres étapes, utilise des outils et s'adapte selon ce qu'il observe, plutôt que de suivre un script fixe. Cette autonomie est ce qui rend les agents puissants, et c'est aussi ce qui les rend risqués : un agent qui peut agir dans le monde peut agir à tort, de façon coûteuse, et à la vitesse de la machine.

La question intéressante pour une entreprise n'est presque jamais comment construire un agent. C'est de savoir si la tâche devant vous en a réellement besoin. La plupart des problèmes qualifiés d'agentiques sont mieux résolus par un flux déterministe avec un ou deux appels de modèle : moins cher, plus prévisible, bien plus facile à tester et à mettre en confiance.

Ce texte en est la version honnête : ce qu'est réellement un agent, le petit ensemble de cas où il gagne véritablement sa place, pourquoi un simple flux l'emporte habituellement, et comment garder un agent sûr et abordable si vous en construisez un.

L'honnête première question

Cette tâche a-t-elle réellement besoin d'un agent ?

Un agent bâti là où un flux suffirait est une source permanente de coût, de latence et de surprise.

Un flux est le bon schéma quand les étapes sont connues d'avance : faire ceci, puis appeler cela, puis mettre en forme le résultat. La plupart des tâches d'affaires sont ainsi. Classer un billet et l'acheminer. Extraire des champs d'un document et les écrire dans un système. Récupérer du contexte et rédiger une réponse. Cela peut utiliser un modèle à une ou deux étapes, mais l'orchestration est fixe, ce qui veut dire qu'elle est testable, déboguable et bon marché.

Un agent ne gagne sa place que lorsque la tâche ne peut véritablement pas s'exprimer comme une séquence fixe : quand il doit décider quelles étapes prendre selon ce qu'il trouve, utiliser des outils dans un ordre qui n'est pas connu à l'avance, et se sortir d'impasses sur plusieurs tours. La recherche ouverte à travers des systèmes, le dépannage en plusieurs étapes et les tâches dont le chemin se ramifie de façon imprévisible sont du vrai territoire d'agent. Le test est simple : si vous pouvez dessiner l'organigramme, construisez le flux.

Bien trancher ce choix représente l'essentiel de la valeur que nous apportons, et cela signifie habituellement dissuader un client de prendre un agent. Un agent introduit du non-déterminisme, un coût plus élevé, des tests plus difficiles et de nouveaux modes d'échec ; vous ne les assumez que lorsque la tâche les paie.

Cette tâche a-t-elle réellement besoin d'un agent ?
Fig. · Cette tâche a-t-elle réellement besoin d'un agent ?
Quand un agent est le bon choix

L'autonomie que la tâche exige réellement

Le cas le plus net est le travail ouvert sur de nombreux outils où l'étape suivante dépend du dernier résultat. Un agent enquêtant sur un incident en production pourrait interroger les journaux, puis, selon ce qu'il voit, tirer un tableau de bord connexe, puis vérifier un déploiement récent, puis former une hypothèse, un chemin qu'aucun flux fixe ne pourrait énumérer à l'avance. Un agent de recherche qui rassemble et concilie de l'information à travers plusieurs systèmes est semblable : la valeur réside dans l'adaptation du plan à mesure qu'il apprend.

Même là, les conceptions les plus solides gardent l'agent en laisse courte : un ensemble borné d'outils, un nombre limité d'étapes, et un humain dans la boucle partout où une action est lourde de conséquences ou difficile à inverser. Les agents de production les plus fiables sont étroits et supervisés, pas ouverts sur le monde et autonomes. L'étendue des capacités est habituellement un passif, pas un atout.

Et la question est rarement du tout ou rien. Beaucoup de bons systèmes sont surtout un flux avec un petit cœur agentique : un pipeline déterministe qui passe la main à un agent contraint seulement pour l'unique étape véritablement ouverte, puis reprend le contrôle. Cela garde l'essentiel du système testable tout en réservant l'autonomie là où elle est réellement nécessaire.

L'autonomie que la tâche exige réellement
Fig. · L'autonomie que la tâche exige réellement
En exploiter un en toute sûreté

Garde-fous, évaluations et un plafond de coût strict

Un agent capable de poser des actions a besoin de garde-fous sur les actions qu'il peut poser, et sur celles qui requièrent l'approbation d'un humain. Le rayon de souffle d'une erreur est défini par les outils que vous lui donnez ; un agent en lecture seule est un risque très différent d'un agent qui peut envoyer des courriels, déplacer de l'argent ou modifier des enregistrements. Limitez les outils au minimum dont la tâche a besoin.

Il a aussi besoin d'un harnais d'évaluation : un ensemble noté de scénarios qui vous dit, à chaque changement, si l'agent s'améliore ou se dégrade, car le comportement d'un agent est émergent et un ajustement d'invite peut discrètement casser un chemin qui fonctionnait. Et il a besoin de plafonds stricts de coût et d'étapes, afin qu'une boucle de raisonnement qui dérape soit bornée par conception plutôt que découverte sur une facture. Un agent sans limite de budget est un passif financier qui attend un mauvais jour.

Ce ne sont pas des suppléments optionnels pour la production. L'écart entre une démonstration d'agent impressionnante et un agent sur lequel vous pouvez réellement compter tient presque entièrement aux garde-fous, aux évaluations, à la surveillance et à la discipline de garder la chose étroite.

Garde-fous, évaluations et un plafond de coût strict
Fig. · Garde-fous, évaluations et un plafond de coût strict
Comment SDEN aborde les agents

Trois engagements sur chaque mandat d'agent

Nous vous dirons honnêtement si la tâche a besoin d'un agent ou d'un flux, puis nous construisons et exploitons le bon, et nous le remettons.

Le flux d'abord, l'agent seulement au besoin

Nous optons par défaut pour la conception la plus simple qui résout la tâche. Un agent se justifie par une véritable ouverture, pas par l'ambition, et nous le disons avant de construire quoi que ce soit.

Étroit, borné, supervisé

Les agents de production reçoivent un jeu d'outils minimal, des plafonds d'étapes et de coût, et un humain dans la boucle partout où les enjeux l'exigent. Le rayon de souffle est conçu, pas découvert.

Évalué et exploité

Chaque agent est livré avec un harnais d'évaluation et une surveillance, et nous l'exploitons avec vous pendant une fenêtre de soutien avant de remettre le code et les guides d'exploitation.

À quoi ressemble la réussite

Un agent qui gagne sa place, ou un flux qui a fait le travail

Un an plus tard, soit vous exploitez un agent étroit et supervisé qui fait de façon fiable un travail qu'aucun flux ne pourrait faire, soit vous avez économisé l'argent et livré le flux qui était la bonne réponse depuis le début.

La marque d'un programme d'IA mûr n'est pas le nombre d'agents qu'il exploite ; c'est que chaque agent en production y est pour une raison qui résiste à l'examen, et que chaque tâche qui n'en avait pas besoin est un flux propre, bon marché et testable. La frénésie récompense le contraire, des agents partout, ce qui amène les équipes à se retrouver avec des systèmes qu'elles ne peuvent ni tester, ni prévoir, ni se payer.

Les agents qui durent sont étroits et supervisés, avec des garde-fous et des évaluations présents dès le départ. Ceux qu'on éteint discrètement étaient larges, autonomes et impressionnants à la démonstration. La différence tient à la discipline d'ingénierie, pas à la capacité du modèle.

Quel que soit le côté où atterrit la tâche, vous devriez en posséder le résultat : le code dans vos dépôts, les évaluations, et une équipe qui comprend pourquoi c'est un agent ou un flux. Cette compréhension est ce qui vous permet de bien construire le suivant.

Un agent qui gagne sa place, ou un flux qui a fait le travail
Fig. · Un agent qui gagne sa place, ou un flux qui a fait le travail
FAQ

L'IA pour les fondateurs
les questions qu'on nous pose le plus.

Des réponses directes aux questions qu'on nous pose le plus souvent. Si la vôtre n'y est pas, écrivez à l'équipe.

De l'analyse à l'action

Prêt à construire et à posséder votre IA ?

Dites-nous ce que vous construisez. La première phase est le cadrage : une architecture, un registre des risques et un go / no-go que nous assumons.

Les agents d'IA en entreprise : où ils fonctionnent, et où un flux l'emporte · SDEN