Bryan Harris, le directeur technologique de l'entreprise SAS, un des principaux fournisseurs mondiaux de solutions d’analyses de données (Photo: SAS)
TECHNO SANS ANGLES MORTS décortique les technologies du moment, rencontre les cerveaux derrière ces innovations et explore les outils numériques offerts aux entreprises du Québec. Cette rubrique permet de comprendre les tendances d’aujourd’hui afin d’être prêt pour celles de demain.
TECHNO SANS ANGLES MORTS. L’intérêt de l’intelligence artificielle (IA) générative pour la génération de textes et d’images est bien connu. Mais celle-ci commence aussi à s’immiscer dans l’analyse de données. Attention toutefois, elle ne peut pas être utilisée à toutes les sauces.
«S’il y a une leçon que nous avons apprise dans la dernière année et demie avec nos clients, c’est que les grands modèles de langage (NDLR: large language models en anglais, ou LLM, la technologie à la base des robots conversationnels) ne peuvent résoudre vos problèmes d’affaires à eux seuls. L’IA générative est un outil parmi tant d’autres, et parfois, ce n’est pas l’outil qu’il vous faut», lance d’emblée Marinela Profi, responsable mondiale de la stratégie d’IA chez SAS, à l’occasion de la conférence SAS Innovate, qui s’est tenue en avril à Las Vegas.
SAS est l’un des principaux fournisseurs mondiaux de solutions d’analyses de données, surtout pour les grandes entreprises et les gouvernements. L’IA générative était au cœur de sa dernière conférence annuelle, comme il fallait s’y attendre, mais tandis que certains de ses concurrents semblent prêts à tout miser sur cette nouvelle technologie, la prudence était de mise chez SAS, surtout par rapport à l’analytique avancée.
«Nous sommes une entreprise de 47 ans, alors nous avons déjà vu ce film. Une technologie devient à la mode et s’embrase, puis, ce qu’il en reste n’est pas ce qui était annoncé», explique Bryan Harris, le directeur technologique de SAS, dont l’entrée en bourse est prévue pour 2025.
L’IA générative pourra tout de même avoir son rôle dans le traitement des mégadonnées, prédit SAS, qui a d’ailleurs déjà adapté plusieurs de ses logiciels pour faire une place à cette technologie. «Dans tout scénario commercial, environ 20% des tâches et des outils risquent d’être liés à l’IA générative. Pour tout le reste, on a encore besoin de l’IA qui n’est pas générative», note Marinela Profi.
Voici trois exemples d’usages où l’IA générative pourrait particulièrement être utile dans les entreprises qui souhaitent créer de la valeur avec leurs données.
Usage 1: interagir plus facilement avec les mégadonnées
Terminé l’époque où il fallait absolument passer par un spécialiste pour obtenir des informations à partir des données de votre entreprise. Un robot conversationnel qui a accès à vos données peut en effet permettre à n’importe quel employé de poser des questions en langage clair pour obtenir des réponses à ses questions.
Plusieurs entreprises sur le marché offrent déjà des outils du genre, comme DataChat.AI, par exemple.
Pour SAS, cette possibilité est réelle, mais elle doit aussi être utilisée avec précaution. «On risque d’avoir le même problème que dans les réunions : les gens posent de mauvaises questions!», illustre Bryan Harris.
Il est heureusement possible d’encadrer la pratique. SAS a par exemple développé un outil où les requêtes pouvant être demandées au modèle sont préapprouvées et préenregistrées par des spécialistes. L’IA générative et des outils d’analyse sémantique permettent de convertir la demande d’un utilisateur en ces requêtes approuvées, et un autre outil d’IA générative permet d’afficher la réponse d’une manière simple à comprendre, et dans certains cas lui indiquer ce qu’il devrait faire par la suite.
Notons que l’IA n’est pas utilisée ici pour remplacer les outils d’analyse de données existants, mais plutôt pour permettre à plus de personnes d’y accéder. Selon les besoins de l’entreprise, une solution peut profiter autant à un cadre supérieur qui veut obtenir une information rapidement qu’à un employé sur le terrain.
Usage 2: générer des données synthétiques
Les grands modèles de langage peuvent aussi être utilisés pour générer des données synthétiques. Pour SAS, cet usage risque d’être particulièrement intéressant pour créer des modèles d’IA à partir de données biaisées, ou à partir de données où les informations importantes sont sous-représentées.
«Prenons par exemple la détection de fraude. Il est difficile pour un modèle d’IA d’apprendre à les reconnaître avec les données brutes d’une banque, puisque ce sont des événements qui sont rares», explique Stu Bradley, vice-président directeur responsable des solutions de gestion des risques de fraude et de la conformité chez SAS.
La génération de données synthétiques permet de créer de nouveaux jeux de données, où ces événements recherchés sont plus fréquents. Les modèles entraînés sur ces nouveaux jeux de données devraient donc être plus aptes à détecter les prochaines fraudes. Jusqu’ici, pour développer de tels modèles, les entreprises comme SAS devaient employer d’autres tactiques, comme combiner les transactions de différentes banques.
Cette stratégie peut d’ailleurs aussi être utilisée avec des images. La papetière Georgia-Pacific a par exemple présenté à SAS Innovate des images de troncs d’arbre déformés créés avec des IA génératives, qui sont utilisés pour entraîner ses modèles de reconnaissance d‘image.
«C’est un moyen que nous avons développé pour mettre l’accent sur des événements rares. Ces images synthétiques permettent à nos systèmes de mieux reconnaître ces événements dans le monde réel par la suite», précise Sam Coyne, directeur de l’intelligence artificielle chez Georgia-Pacific.
Usage 3: générer du code pour traiter ses données
L’IA générative est évidemment aussi utilisée pour aider les développeurs qui analysent les données, notamment avec des outils comme ChatGPT d’OpenAI, GitHub Copilot de GitHub, Gemini de Google ou Viya Copilot de SAS.
Ces outils ne transformeront pas l’analyse de données elle-même, mais ils devraient rendre les développeurs et les analyses plus efficaces. «Des tâches comme la programmation à partir de zéro ne seront plus d’actualité, le débogage ne nécessitera plus de nuits et de semaines passées sur le clavier et la migration de code sera extrêmement accélérée, prédit Marinela Profi. Ils auront donc plus de temps libre pour se concentrer sur des questions telles que « Quelles nouvelles choses puis-je construire? » et « Comment puis-je améliorer le code généré par l’IA? »».