OpenAI lance o1, un modèle d’IA doué de «raison»

«o1 réfléchit avant de répondre», indique OpenAI dans un communiqué publié en ligne. (Photo: Getty Images)

San Francisco — OpenAI, le créateur de ChatGPT, a lancé jeudi o1, un modèle d’intelligence artificielle (IA) générative d’un nouveau genre: selon la start-up californienne, o1 est capable de raisonner et donc de répondre à des questions plus complexes, notamment mathématiques.

«o1 réfléchit avant de répondre», indique OpenAI dans un communiqué publié en ligne. «Il peut produire une longue chaîne de pensée interne avant de répondre à l’utilisateur», ajoute la start-up.

L’entreprise progresse ainsi vers l’objectif qu’elle s’est fixé de mettre au point une IA «générale», c’est-à-dire une intelligence artificielle mais semblable à celle des humains.

Elle l’a testée sur la résolution de problèmes mathématiques ou la production de lignes de codes, et « dans de nombreux tests de référence qui requièrent une forte capacité à raisonner, o1 rivalise avec les performances des experts humains », souligne OpenAI.

Dans une compétition de maths destinée aux lycéens américains, o1 s’est placée «parmi les 500 meilleurs élèves», ajoute la société.

Avec ChatGPT, OpenAI a lancé fin 2022 la vague de l’IA générative (production de contenus sur simple requête en langage courant) et est devenue la star de la Silicon Valley.

Depuis, de son investisseur principal Microsoft à Google et Meta (Facebook, Instagram), tous les grands groupes technologiques rivalisent à coup d’outils censés aider les humains au quotidien, de la rédaction de messages à l’éducation et à la création artistique.

Mais ces «assistants IA» restent des machines qui prédisent — de façon très convaincante — des suites de mots ou des arrangements de pixels, sans conscience et donc sans compréhension de leurs phrases ou de leurs images.

Entraînés sur des montagnes de données récoltées en ligne, ils peuvent donc halluciner (inventer des faits) et peiner à résoudre des problèmes mathématiques simples. Et ils fonctionnent comme des boîtes noires pour les utilisateurs.

«À l’instar d’un être humain qui peut réfléchir longuement avant de répondre à une question difficile, o1 utilise une chaîne de pensée (…) Il apprend à reconnaître et à corriger ses erreurs. Il apprend à décomposer les étapes délicates en étapes plus simples. Il apprend à essayer une approche différente lorsque l’approche actuelle ne fonctionne pas», détaille OpenAI.

La start-up estime que le nouveau modèle représente une amélioration en matière de sécurité et d’alignement sur les valeurs humaines, car la « chaîne de pensée nous permet d’observer le raisonnement du modèle de manière lisible, et le raisonnement du modèle sur les règles de sécurité est plus robuste ».

La version bêta de o1, qui est connu en interne sous le surnom de Strawberry, selon des médias américains, a été mise à disposition des utilisateurs payants de ChatGPT pour commencer.