« Si l’IA doit prendre la main, espérons qu’elle tape juste ! » Voilà un mantra qui pourrait s’appliquer à la dernière trouvaille d’OpenAI, qui, visiblement, n’aime pas rester sur la touche pendant que Google ou Anthropic jonglent avec leurs propres agents intelligents. Cette semaine, l’agent autonome Operator s’offre un lifting logiciel, passant d’un cœur GPT-4o boosté au carburant bio à… tenez-vous bien… un moteur flambant neuf, baptisé « o3 ». C’est un peu comme remplacer l’humain au standard par un cerveau mathématique sur-vitaminé, mais sans le risque de pause-café illimitée.
L’opération « lifting 2.0 » promet : selon toutes les comparaisons sérieuses – et même celles réalisées un vendredi soir – le modèle o3 surclasse nettement son prédécesseur sur tout ce qui touche aux maths et au « raisonnement ». De quoi affoler tous ceux qui pensaient que savoir faire une addition posée suffisait encore en 2025. Et pendant que l’équipe OpenAI claironne dans un blog post qu’Operator prend du galon, elle précise en tout petit (si, si, tout en bas !) que l’API d’Operator, elle, continuera de tourner sur l’ancien moteur GPT-4o. Pas de jaloux, tout le monde garde sa version… ou presque.
Évidemment, cette surenchère n’a rien d’isolé. Sur la ligne de départ, Google muscle aussi son jeu avec un agent capable de « faire l’ordi » à votre place, pendant qu’Anthropic dégaine ses propres modèles prêts à ouvrir vos fichiers ou naviguer à votre place sur la toile. Bref, la bataille de l’autonomie digitale a des airs de compétition de qui-mouline-le-mieux-les-fichiers.
Se doter du cerveau le plus intelligent n’est vraiment pas un luxe quand l’objectif est de confier à la machine nos tâches les plus casse-pieds.
Côté OpenAI, on insiste sur la sécurité. Le tout nouveau « o3 Operator » a potassé des montagnes de données spécialement élaborées pour « décider où s’arrêter ou refuser », histoire de ne pas ouvrir la boîte de Pandore à chaque requête capricieuse. Un rapport technique (pour ceux qui aiment les chiffres et les camemberts plus que la belle prose) affirme même que ce modèle est moins tenté de commettre des écarts, de fouiner dans vos informations personnelles ou de tomber dans les pièges du « prompt injection », ce sport de hackers qui aiment embrouiller les IA avec des requêtes vicieuses.
Petit twist d’ingénierie qui ravira les geeks : même si l’Operator version o3 hérite du super-pouvoir de codage de son modèle parent, il n’a pas de terminal ni d’accès direct à un environnement de développement. Bref, il ne va pas se mettre à hacker votre ordinateur, ni compiler de code en douce. La sécurité avant tout, mais sans le syndrome de l’assistant trop zélé qui va plus vite que la musique.
Mais ne rêvez pas trop vite : il faut rappeler que, côté API, il faudra patienter pour profiter de ce bond technologique, OpenAI gardant pour l’instant son o3 sous le capot de son Operator premium. Peut-être ont-ils peur que tout le monde découvre d’un coup que l’IA sait mieux que nous gérer nos ordis… ou peut-être veulent-ils éviter une grève massive de tous les assistants humains du monde ?
Alors, faut-il s’inquiéter d’être bientôt talonné par une intelligence qui dit non quand il faut, sait coder mais pas trop, et pourrait bien nous piquer notre place de chef du bureau ? Pas encore. Mais une chose est sûre : au rythme où vont les mises à jour, il faudra bientôt demander à Operator de nous rappeler quel était le dernier Operator ! Chez OpenAI, on n’a peut-être pas inventé l’eau chaude, mais on rend la machine vraiment brûlante !
Source : Techcrunch