Se connecter

goodpods headphones icon

Pour accéder à toutes nos fonctionnalités

Ouvrez l’application Goodpods
Close icon
Decideo - Data Science, Big Data, Intelligence Augmentée - #5.2 IA ? Et si nous parlions français !

#5.2 IA ? Et si nous parlions français !

09/11/24 • 2 min

Decideo - Data Science, Big Data, Intelligence Augmentée

Vous en avez assez d’entendre parler de LLM, de prompt, de text token, ou de adversarial machine learning ? Ça tombe bien, le 6 septembre dernier, le Journal Officiel de la République Française a publié, pour la rentrée des classes, la liste relative au vocabulaire de l’intelligence artificielle. La commission d’enrichissement de la langue française a retenu quatorze termes ; elle les a traduits, et définit.

Ainsi, vous pourrez parler de Grands Modèles de Langage, les GML ; d’instructions génératives pour les prompts, de jeton textuel pour les text token, et d’apprentissage antagoniste pour l’adversarial machine learning.

Plus aucune excuse pour truffer vos textes et vos vidéos de ces anglicismes qui ne rendent pas hommage à notre langue. Ça fait plus chic ? C’est plus court ? Tout le monde le dit ? Toutes ces excuses sont valables, mais avec un petit effort, vous verrez que vos textes en ressortiront de meilleure facture. Et ne devenez pas ces directeurs marketing que je rencontre régulièrement et qui commencent leur présentation en s’excusant des mots anglais qu’ils utiliseront... sous prétexte que, vous savez, je vis aux States depuis plusieurs années, et je ne sais plus comment on dit en français.

Cinq pages du JO du 6 septembre à imprimer donc, et à garder bien visible sur votre bureau.

Ah tiens d’ailleurs, il y en a un qui manque ! Je n’ai pas trouvé la traduction de RAG, Retrieval Augmented Generation. Il va falloir continuer l’enrichissement du dictionnaire. J’ai trouvé sur Internet une traduction sous forme de Génération Augmentée de Récupération. Pourquoi pas. Qu’en pensez-vous ?

A tiens, amis québécois qui nous écoutez, vous qui êtes si prompts à défendre la langue française, montrez l’exemple ! Le problème c’est que nous ne sommes pas toujours d’accord sur les traductions... Ainsi l’Office Québécois de la Langue Française recommande d’utiliser le terme de « requête » pour désigner les prompts. Alors requête ou instruction générative ? Qu’en pensez-vous ?

plus icon
bookmark

Vous en avez assez d’entendre parler de LLM, de prompt, de text token, ou de adversarial machine learning ? Ça tombe bien, le 6 septembre dernier, le Journal Officiel de la République Française a publié, pour la rentrée des classes, la liste relative au vocabulaire de l’intelligence artificielle. La commission d’enrichissement de la langue française a retenu quatorze termes ; elle les a traduits, et définit.

Ainsi, vous pourrez parler de Grands Modèles de Langage, les GML ; d’instructions génératives pour les prompts, de jeton textuel pour les text token, et d’apprentissage antagoniste pour l’adversarial machine learning.

Plus aucune excuse pour truffer vos textes et vos vidéos de ces anglicismes qui ne rendent pas hommage à notre langue. Ça fait plus chic ? C’est plus court ? Tout le monde le dit ? Toutes ces excuses sont valables, mais avec un petit effort, vous verrez que vos textes en ressortiront de meilleure facture. Et ne devenez pas ces directeurs marketing que je rencontre régulièrement et qui commencent leur présentation en s’excusant des mots anglais qu’ils utiliseront... sous prétexte que, vous savez, je vis aux States depuis plusieurs années, et je ne sais plus comment on dit en français.

Cinq pages du JO du 6 septembre à imprimer donc, et à garder bien visible sur votre bureau.

Ah tiens d’ailleurs, il y en a un qui manque ! Je n’ai pas trouvé la traduction de RAG, Retrieval Augmented Generation. Il va falloir continuer l’enrichissement du dictionnaire. J’ai trouvé sur Internet une traduction sous forme de Génération Augmentée de Récupération. Pourquoi pas. Qu’en pensez-vous ?

A tiens, amis québécois qui nous écoutez, vous qui êtes si prompts à défendre la langue française, montrez l’exemple ! Le problème c’est que nous ne sommes pas toujours d’accord sur les traductions... Ainsi l’Office Québécois de la Langue Française recommande d’utiliser le terme de « requête » pour désigner les prompts. Alors requête ou instruction générative ? Qu’en pensez-vous ?

Épisode précédent

undefined - #5.1 Le MIT classe 777 risques potentiels liés à l'IA

#5.1 Le MIT classe 777 risques potentiels liés à l'IA

Le MIT a recensé 777 risques potentiels liés à l’IA dans une base de données partagée gratuitement

Cet été, le MIT nous a fait un cadeau ! Le prestigieux organisme de recherche américain a publié un référentiel complet des risques liés à l’intelligence artificielle. L’objectif : vous aider à cartographier l’ensemble des risques qui pèsent sur votre entreprise afin de les mesurer, les quantifier et les mitiger par la suite.

Si vous suivez mes contenus sur le thème de la gouvernance des données et de l’intelligence artificielle, vous avez déjà été sensibilisé au fait que la mise en place d’un cadre de gouvernance passe par l’identification et la cartographie des risques.

Comment en effet atténuer quelque chose que l’on n’a pas référencé et mesuré ?

Première tâche donc, l’identification et la cartographie des risques en matière d’intelligence artificielle. Risques liés aux données, aux modèles, aux usages, les risques sont nombreux. Et l’IA Act européen prévoit d’ailleurs l’obligation de les identifier et de les suivre, afin de classifier les modèles d’IA en fonction des risques encourus.

Mais partir d’une feuille blanche et se gratter la tête en faisant le tour des bureaux n’est pas la méthode la plus efficace. Or il n’existait pas jusqu’à présent un référentiel unique, mais plusieurs référentiels, tous incomplets, et orientés.

Ces derniers mois, les équipes du MIT ont réalisé un travail de compilation et d’organisation de l’ensemble des référentiels qu’ils ont pu identifier ; regroupant l’ensemble des risques dans une taxonomie commune. The AI Risk Repository est donc un travail de synthèse des risques en provenance de 43 taxonomies différentes. Au total, 777 risques ont été identifiés, regroupés et ordonnés dans la taxonomie du MIT.

Ce travail de synthèse est fourni sous forme d’un fichier Excel ou Google Sheets. Avec 777 risques décrits, c’est évidemment beaucoup trop pour la très grande majorité des entreprises, et un important travail de compréhension et de sélection reste à faire.

Par ailleurs chaque entreprise devra évaluer le degré de survenance de ce risque dans sa propre organisation ; ainsi que les impacts de cette survenance sur son métier. Personne ne peut faire ce travail à votre place. Mais bien sûr, remercions le MIT pour cette synthèse qui permet de partir de quelque chose, d’envisager à peu près tous les cas possibles, et ainsi de progresser dans cette cartographie des risques liés à l’IA.

Le framework à déployer est donc le suivant :

Commencez par prendre connaissance de la base de données des risques du MIT ;

Sensibilisez la direction générale à l’importance, et parfois à l’obligation, de connaitre le niveau d’exposition de l’entreprise ;

Programmez des ateliers avec les différentes personnes concernées, métier et informatique, afin de sélectionner dans la base du MIT les risques applicables à l’entreprise ;

N’hésitez pas à vous faire accompagner dans cette phase afin de démarrer correctement ; un consultant spécialisé peut être un booster et un garde-fou ;

Pour chacun de ces risques, évaluez leur probabilité de survenance, et les impacts, financiers et autres, de cette survenance éventuelle ;

Reportez tout cela dans un outil spécialisé de gestion de risques ou à défaut dans une feuille Excel ;

Mettez en place les stratégies de modération de ces risques ;

Ne pas oublier de répéter ce processus, lorsque les risques changent ou au minimum une fois par an, afin de maintenir à jour cette cartographie.

Alors je vous entends déjà critiquer ! Jamais je n’aurai le temps de faire cela, la DG ne nous donnera pas de budget, encore un truc qui va rester sur les étagères, bla bla bla...

Vous avez raison de vous inquiéter ! Mais en même temps soyons direct, ce n’est pas un choix. Bien sûr, une PME peut choisir de prendre des risques, sans les mesurer, et en assumer par la suite les conséquences. Mais assurez-vous que cette décision de ne pas cartographier les risques liés à l’IA soit bien prise au plus haut niveau. Et un conseil, protégez vos arrières, et conservez bien la trace de cette décision.

Et si votre DG est plus raisonnable, et comprend l’importance de connaitre et mesurer ces risques, allez-y progressivement. Posez les premiers jalons, et commencez les ateliers. Tiens, par exemple, commencez par les nouveaux projets ! Un nouveau POC d’IA ? Dès la phase de POC, rapprochez-vous des équipes, abordez le sujet, et cartographiez les risques à la volée. En incluant la gouvernance de l’IA dans la phase de design des projets, le fameux « Governance by design », vous rendrez le sujet beaucoup plus fluide. C’est ce que j’appelle le DevSecGovOps, penser à la gouvernance dès la phase de conception, et en faire un élément essentiel de la mise en production.

Épisode suivant

undefined - #5.3 Cartographie des données et des systèmes avec David Bougearel de Cartographit

#5.3 Cartographie des données et des systèmes avec David Bougearel de Cartographit

Dans cet épisode, nous recevons David Bougearel, fondateur de Cartographit, un nouvel outil de cartographie du système d'information, qui s'appuie sur les normes de cartographie de l'ANSSI. Les différentes couches cartographiées incluent donc les couches des données, des processus et des applications.

Cela fait-il de Cartographit un outil potentiel de gouvernance des données ?

Nous abordons ce sujet et différentes questions connexes.

La cartographie du Système d'Information (SI) offre une vue d'ensemble, un inventaire global du SI, incluant les données (objets d'information). Cartographit permet non seulement de réaliser cet inventaire des données, mais aussi de les classifier selon leur niveau de sensibilité, de déterminer si elles sont des PII (données personnelles) et de connaître leur DICT. Cela offre ainsi une vision précise et détaillée des données. - Cependant, connaître les données est une première étape. Comprendre comment elles sont utilisées et où elles se trouvent ajoute une dimension essentielle. Cartographit permet de relier ces données aux processus métiers (vue fonctionnelle), aux actions techniques (quelles bases de données, quels flux ou quelles applications utilisent ces données) et de localiser physiquement ces données (par exemple : Bâtiment 1, Salle 44, Baie 1.1). - Grâce à une interface utilisateur (UI/UX) optimisée et à une navigation cartographique fluide, Cartographit permet de parcourir l'ensemble de son SI et d'explorer le fonctionnement de son entreprise, tant d’un point de vue technique que fonctionnel.

Commentaires de l'épisode

Générer un badge

Obtenez un badge pour votre site web qui renvoie vers ce episode

Sélectionnez le type et la taille
Open dropdown icon
share badge image

<a href="https://goodpods.com/podcasts/decideo-data-science-big-data-intelligence-augment%c3%a9e-621095/52-ia-et-si-nous-parlions-fran%c3%a7ais-82061960"> <img src="https://storage.googleapis.com/goodpods-images-bucket/badges/generic-badge-1.svg" alt="listen to #5.2 ia ? et si nous parlions français ! on goodpods" style="width: 225px" /> </a>

Copier