Cyberéthique et libertés numériques

Bonjour M. Anderson

OpenAI dégaine son ChatGPT Agent, qui prétend pouvoir presque tout faire

L’entreprise vient de lancer un nouveau produit, qui promet de réaliser et d’automatiser la plupart des tâches du quotidien. Indisponible en Europe et réservé pour l’instant aux formules payantes, ChatGPT Agent marque en quelque sorte un aboutissement.

Les agents sont souvent présentés comme l’émanation ultime de l’IA générative. Ce sont des automates à qui l’on confie une mission. Ils sont chargés d’effectuer une ou plusieurs tâches, selon leur programmation et le contexte. Leur rôle premier est d’automatiser des tâches, en fonction des données reçues. L’industrie de l’IA est en ébullition autour du concept et des technologies transversales émergent, comme A2A chez Google (reprise par d’autres) pour standardiser la manière dont les agents exposent leurs capacités aux autres éléments.

ChatGPT Agent se définit comme un agent général, conçu pour effectuer un vaste ensemble de tâches via un prompt. Contrairement à des sociétés comme Perplexity qui lancent leur propre navigateur pour descendre dans l’arène, le nouveau produit d’OpenAI arrive sous la forme d’une fonction supplémentaire dans le client ChatGPT, équipée d’un navigateur pour réaliser ses missions en ligne (quand il y en a).

La société évoque « un système agentique unifié combinant le navigateur à distance d’Operator, la synthèse web de Deep Research, et les forces conversationnelles de ChatGPT ».

Ce que sait faire ChatGPT Agent

OpenAI annonce que son produit est beaucoup plus performant que tous les agents généraux lancés jusqu’à présent. Les possibilités annoncées sont ainsi nombreuses. On peut y connecter notamment de nombreuses sources de données, notamment les services de Google, pour automatiser des tâches. Dans sa présentation, OpenAI indique qu’Agent permet justement de répondre à la plus grosse critique faite jusqu’à présent à Deep Search : l’impossibilité de se connecter sur des sites pour en récupérer les informations.

Dans les exemples donnés, OpenAI cite la planification et l’achat des ingrédients nécessaires à l’organisation d’un petit-déjeuner japonais pour quatre personnes ou encore l’analyse de plusieurs concurrents pour créer un jeu de diapositives. On peut en citer d’autres : automatiser la récupération des pièces jointes provenant de certains courriels pour les stocker dans un dossier spécifique dans un drive, planifier un voyage en s’occupant de toutes les démarches, etc.

« Au travail, vous pouvez automatiser des tâches répétitives, comme la conversion de captures d’écran ou de tableaux de bord en présentations composées d’éléments vectoriels modifiables, la réorganisation de réunions, la planification et la réservation de réunions hors site, et la mise à jour de feuilles de calcul avec de nouvelles données financières tout en conservant le même formatage », ajoute l’entreprise.

ChatGPT Agent est disponible partout, sauf en Europe et en Suisse. De plus, les comptes gratuits n’y ont pas accès. Il faut avoir au moins un abonnement Plus ou Team pour en profiter, avec une limite de 40 utilisations par mois. Dans la formule Pro, à 200 dollars par mois, on peut s’en servir 400 fois par mois.

Côté technique et sécurité

On ne peut pas dire que les agents aient particulièrement brillé jusqu’à présent quand ils se sont frottés au monde réel. OpenAI indique que sa fonction Agent se débrouille beaucoup mieux, avec un score de 41,6 % au test Humanity’s Last Exam, jugé difficile. C’est le double des résultats obtenus par deux autres modèles de l’entreprise, o3 et o4-mini. Sur FrontierMath, ChatGPT Agent a obtenu 27,4 %, à comparer aux 6,3 % d’o4-mini. OpenAI ne donne cependant pas de résultats pour les modèles concurrents, à l’exception notable de Copilot pour des opérations sur les fichiers Excel.

La société indique que ChatGPT Agent exécute les tâches « à l’aide de son propre ordinateur virtuel, passant avec fluidité du raisonnement à l’action pour gérer des flux de travail complexes du début à la fin, en fonction de vos instructions ».

La sécurité de la fonction pourrait cependant poser problème. Le rapport de sécurité attenant pointe « une capacité élevée » de la fonction dans le domaine des armes biologiques et chimiques. La société indique ne pas avoir constaté réellement ces capacités, mais le potentiel d’amplification des « voies existantes vers des dommages graves » est jugé sérieux. Des protections supplémentaires ont donc été activées, dont une fonction de surveillance chargée d’inspecter les résultats au fur et à mesure. Un autre outil inspecte la réponse générale.

En outre, la fonction Mémoire a été désactivée sur Agent. Selon OpenAI, le risque existerait sinon que des attaques par injection permettent la récupération d’informations sensibles lors des requêtes. Il est également important de noter qu’aucune action irréversible n’est effectuée sans demander l’autorisation. Une protection valable aussi bien pour un paiement en ligne que l’envoi d’un e-mail. Ce qui fait dire à OpenAI que son produit est un « agent qui travaille pour vous, avec vous ». En outre, certaines actions à haut risque sont explicitement bloquées, comme les virements bancaires.

ChatGPT ne ferait qu’exploiter les données existantes. OpenAI affirme que les entrées restent privées et qu’Agent « ne collecte ni ne stocke les données que vous saisissez au cours de ces sessions, telles que les mots de passe, car le modèle n’en a pas besoin et il est plus sûr qu’il ne les voie jamais ».

Du temps devant soi

OpenAI indique que ChatGPT Agent n’en est qu’à ses débuts et qu’il peut faire des erreurs. Ce serait particulièrement vrai avec la génération de diapositives, dont les résultats « peuvent parfois sembler rudimentaires en termes de formatage et de finition ». Cette fonction est d’ailleurs présentée comme étant en bêta. Une nouvelle version de ce composant est en cours de formation.

De manière générale, on manque encore de retours réels sur la fonction. On sait en revanche que certaines actions peuvent prendre de temps, voire beaucoup de temps, jusqu’à 15 ou 30 minutes selon la complexité de la requête.

L’ensemble sera suivi de près, car les ambitions d’OpenAI sont nombreuses avec son Agent. La question de la sécurité est également prégnante, même si l’entreprise aborde directement la question dans son annonce, en plus de son rapport de sécurité.



Auteur : Vincent Hermann

Aller à la source

Artia13

Bonjour ! Je m'appelle Cédric, auteur et éditeur basé à Arles. J'écris et publie des ouvrages sur la désinformation, la sécurité numérique et les enjeux sociétaux, mais aussi des romans d'aventure qui invitent à l'évasion et à la réflexion. Mon objectif : informer, captiver et éveiller les consciences à travers mes écrits.