
OpenAI lance un nouveau modèle d’IA « o1 » doté de capacités de raisonnement avancées
Créé le 12 septembre 2024 • Actualités • 3,889 vues • 5 minutes de lecture
OpenAI dévoile le modèle d'IA o1, améliorant les capacités de résolution de problèmes et de raisonnement
Le 12 septembre 2024, OpenAI a présenté son nouveau modèle d’IA très attendu, l’o1, dans le cadre de sa série continue de systèmes d’IA conçus pour améliorer les capacités de raisonnement. Nom de code interne « Strawberry » pendant le développement, le modèle o1 est désormais commercialisé aux côtés d’une variante plus petite et plus abordable appelée o1-mini. Ces modèles sont les premiers d’une série prévue de systèmes d’IA axés sur la résolution de tâches complexes qui nécessitent un raisonnement logique, un codage et une résolution de problèmes en plusieurs étapes, des tâches qui dépassaient auparavant les capacités de ses prédécesseurs comme GPT-4o.
La sortie d'OpenAI marque une avancée significative dans la technologie de l'IA, offrant une version préliminaire d'o1 pour les abonnés ChatGPT Plus et Team à partir d'aujourd'hui, tandis que les utilisateurs professionnels et éducatifs devraient y avoir accès au début de la semaine prochaine. L'accès des développeurs au modèle o1 via l'API d'OpenAI a cependant un prix élevé, avec des coûts nettement supérieurs à ceux du GPT-4o largement utilisé.
Une percée dans le raisonnement
Le modèle o1 se distingue des précédentes itérations d’IA, notamment GPT-4o, par ses capacités de raisonnement affinées. Contrairement à ses prédécesseurs, qui étaient formés pour imiter des modèles issus de vastes ensembles de données, o1 a été spécifiquement conçu pour résoudre des problèmes de manière autonome grâce à l’apprentissage par renforcement. Cette nouvelle méthode de formation permet à o1 de traiter les requêtes en les décomposant étape par étape, à la manière du raisonnement humain.
Selon Jerry Tworek, responsable de la recherche chez OpenAI, o1 a été formé avec un nouvel algorithme d'optimisation et un ensemble de données spécialisé conçu pour mettre à l'épreuve ses capacités de raisonnement. Cette nouvelle approche rend o1 plus apte à résoudre des problèmes de codage complexes, des mathématiques avancées et des tâches scientifiques. Malgré ses avancées, Tworek reconnaît que le modèle a ses limites, notamment en ce qui concerne les « hallucinations » ou la génération d'informations incorrectes ou trompeuses.
« Nous avons remarqué que ce modèle provoque moins d’hallucinations », a déclaré Tworek. « Mais le problème persiste. Nous ne pouvons pas dire que nous avons résolu le problème des hallucinations. »
Les améliorations du raisonnement sont évidentes dans les tests pratiques. Bob McGrew, directeur de la recherche d'OpenAI, a souligné comment o1 a surpassé GPT-4o dans les défis mathématiques et logiques. Par exemple, o1 a obtenu 83 % à un examen de qualification pour l'Olympiade internationale de mathématiques, contre 4 % de réussite pour GPT-13o.
« Nous avons passé plusieurs mois à travailler sur le raisonnement, car nous pensons qu’il s’agit d’une avancée décisive », a déclaré McGrew. « Fondamentalement, il s’agit d’une nouvelle modalité pour les modèles afin de pouvoir résoudre les problèmes vraiment difficiles nécessaires pour progresser vers des niveaux d’intelligence semblables à ceux de l’homme. »
Codage avancé et résolution de problèmes en plusieurs étapes
L’un des domaines clés dans lesquels o1 se distingue est sa capacité à gérer des tâches de codage complexes. OpenAI affirme que le modèle est particulièrement performant dans les concours de codage tels que Codeforces, où il a atteint le 89e percentile des participants. Le modèle est également plus efficace pour expliquer son raisonnement lorsqu’il résout des problèmes, offrant aux utilisateurs une compréhension plus claire de la manière dont il parvient à des solutions.
OpenAI a conçu le modèle o1 pour traiter les tâches de manière similaire aux processus de pensée humaine. Dans les démonstrations, le modèle a démontré sa capacité à décomposer les énigmes et les problèmes mathématiques étape par étape, en utilisant souvent des phrases telles que « Je réfléchis » ou « Laissez-moi voir » pour simuler un raisonnement humain. Cependant, OpenAI s'empresse de noter que même si le modèle peut sembler plus humain dans son approche du raisonnement, il ne « pense » pas réellement comme un humain.
Lors d'une démonstration, le modèle o1 a été invité à résoudre une énigme complexe impliquant l'âge d'un prince et d'une princesse. Il a fallu environ 30 secondes au modèle pour donner la bonne réponse tout en montrant chaque étape de son raisonnement, imitant un processus de déduction logique.
Cette nouvelle capacité de raisonnement rend o1 particulièrement adapté aux secteurs qui nécessitent une résolution de problèmes complexes, tels que la santé, l’ingénierie et la recherche scientifique avancée. OpenAI a suggéré qu’o1 pourrait aider à annoter des données complexes de séquençage cellulaire en biologie ou aider les physiciens à générer des formules mathématiques complexes pour l’optique quantique.
Prix et accessibilité
Bien que le modèle o1 apporte des avancées significatives en matière de raisonnement, son prix est élevé. Dans l'API OpenAI, le modèle o1-preview coûte 15 $ par million de jetons d'entrée et 60 $ par million de jetons de sortie, soit bien plus cher que GPT-4o, dont le prix est respectivement de 5 $ et 15 $ pour le même nombre de jetons.
Malgré son coût, OpenAI rend le modèle o1-mini plus accessible. Cette version plus petite du modèle est conçue pour des réponses plus rapides et plus abordables, ce qui la rend idéale pour les utilisateurs ayant des besoins plus simples ou ceux qui se concentrent sur des requêtes liées aux STEM. OpenAI a déclaré que o1-mini sera mis à la disposition de tous les utilisateurs de ChatGPT gratuit, bien qu'aucune date de sortie spécifique n'ait été fixée.
À partir d'aujourd'hui, les abonnés ChatGPT Plus et Team pourront essayer o1-preview et o1-mini avec une limite de 30 et 50 messages respectivement. Les utilisateurs professionnels et éducatifs y auront accès la semaine prochaine, tandis que les développeurs pourront créer des prototypes avec les deux modèles via l'API d'OpenAI, mais avec certaines limites de débit.
Limites et développements futurs
Bien qu'o1 excelle dans le raisonnement et la résolution de problèmes, il lui manque certaines des fonctionnalités présentes dans GPT-4o. Par exemple, le modèle o1 ne prend pas en charge la navigation sur le Web, le traitement de fichiers ou d'images, ni la gestion des messages système personnalisés. Ces omissions signifient qu'o1 n'est pas un remplacement direct de GPT-4o dans de nombreuses applications, mais se positionne plutôt comme un outil complémentaire pour résoudre des tâches plus complexes et exigeantes en raisonnement.
Malgré ses limites, OpenAI estime que le modèle o1 représente une avancée significative dans le développement de l'IA. Alors que l'entreprise continue d'affiner le modèle et de recueillir des commentaires, les futures mises à jour d'o1 devraient introduire de nouvelles fonctionnalités et améliorations. OpenAI prévoit également d'améliorer la série o1 avec des fonctionnalités telles que la navigation et le téléchargement de fichiers, rendant les modèles plus polyvalents et pratiques pour une plus large gamme d'applications.
« Avec ce modèle, nous remettons le compteur à 1 », a déclaré McGrew, en faisant référence à la convention de dénomination du modèle. « C'est la première étape vers une nouvelle classe de capacités d'IA, et il y en a d'autres à venir. »
La sortie d’o1 et de sa variante mini marque un tournant dans le paysage de l’IA. Grâce à ses capacités de raisonnement améliorées, le modèle o1 est sur le point d’apporter des contributions significatives aux domaines qui nécessitent une résolution de problèmes complexes, du codage à la recherche scientifique avancée. Bien qu’il ne remplace pas encore complètement GPT-4o dans de nombreux cas d’utilisation, o1 représente le début d’une nouvelle ère dans le développement de l’IA.
Alors qu'OpenAI continue de repousser les limites de ce que l'IA peut accomplir, les futures mises à jour de la série o1 promettent d'apporter des capacités encore plus puissantes, réduisant encore davantage l'écart entre l'intelligence humaine et celle de la machine.