5 minute read

IA générative et politique

Les conséquences du West Coast Effect

La grande majorité des algorithmes d’IA générative développés ces dernières années sont issus d’entreprises privées américaines. Ces outils développés par des géants de la Silicon Valley et à destination des territoires d’influence occidentale portent le biais de leur vision du monde.

Le cas de l’annonce par Google de son modèle Bard [130] mi-février 2023 en est un bon exemple. Bard est un concurrent principal de ChatGPT mais sa présentation au grand public ne s’est pas déroulée comme prévu : devant les spectateurs stupéfaits, Bard affirme avec conviction que James Webb est le premier télescope à avoir capté des images d’une exoplanète. Cette information est fausse, le premier télescope à l’avoir fait étant le VLT en 2004, un matériel européen installé au Chili.

Il n’est pas question ici uniquement de fiabilité de l’information – sujet discuté au premier chapitre du présent ouvrage, mais d’une pente glissante de propagation d’une idéologie. Les modèles de langage étant essentiellement des perroquets

[128] https://huggingface.co/spaces/society-ethics/DiffusionBiasExplorer [129] https://huggingface.co/spaces/society-ethics/Average_diffusion_faces [130] https://www.01net.com/actualites/bard-ia-google-grosse-gaffe-commence-bien.html stochastiques, ils génèrent des mots et les concepts les plus plausibles dans un contexte donné. Cela signifie qu’avec les données fournies en apprentissage, la réponse la plus plausible était que le premier télescope à capter des images d’une exoplanète était américain.

Cet incident illustre très bien le tropisme américano-centriste dont souffre la technologie en général, et les produits des GAFAM en particulier. Google a certainement mis sur pied une stratégie de validation des résultats du modèle par des humains. Pourtant personne n’a visiblement remis en question que le télescope américain était le premier à prendre cette incroyable mesure.

De l’autre côté du monde, la Chine déploie elle aussi ses outils d’IA générative [131]. Et met en place une régulation punitive de leur mauvaise utilisation [132], rendue possible par l’absence d’anonymat sur l’internet chinois. Mais en ce qui concerne les biais des modèles, si des biais ethniques et de disparité physique ont déjà été détectés dans Different Dimension Me [133], l’équivalent de LENSA AI déjà mentionné ici, il n’existe pas (encore?) d’étude sur la tendance politique de ERNIE, l’équivalent chinois de chatGPT.

Il est toutefois à noter que les discussions politiques avec les IA génératrices de texte sont prohibées [134] et que ERNIE-ViLG [135], IA génératrice d’images, ne vous générera aucune représentation de la place Tian’anmen [136], avec ou sans chars.

N’en déplaise à certains, ce n’est pas demain que nous pourrons assister à un débat politique entre l’IA chinoise et l’IA américaine !

[131] https://techcrunch.com/2022/12/31/how-china-is-building-a-parallel-generative-ai-universe/ [132] https://techcrunch.com/2022/12/13/chinas-generative-ai-rules-set-boundaries-and-punishmentsfor-misuse/

[133] https://pandaily.com/tencents-anime-ai-picture-generator-hits-global-social-platforms/ [134] https://www.youtube.com/watch?v=xRrIOjXcSHk

[135] https://huggingface.co/spaces/PaddlePaddle/ERNIE-ViLG

[136] https://www.technologyreview.com/2022/09/14/1059481/baidu-chinese-image-ai-tiananmen/

Si

Macron, Justin Trudeau ou Joe Biden ?

Concentrons-nous donc sur chatGPT qui, lui, peut nous parler politique.

D’ailleurs à en croire des tests politiques soumis à ChatGPT [137] en 2022, l’outil conversationnel serait plutôt d’orientation centre gauche, progressiste et libéral. Quand on lui demande quelles personnalités politiques sont de ce bord politique, l’outil nous propose des noms comme Emmanuel Macron, Justin Trudeau ou encore Joe Biden.

Comment se traduit ce positionnement ? D’après les résultats de ces tests politiques, chatGPT est favorable au multiculturalisme, à l’accueil des migrants, aux droits des minorités et préoccupé par les enjeux écologiques.

Et malgré ses réponses qui nous paraissent habituellement peu clivantes, ChatGPT, qui évolue très fréquemment sur ces questions de positionnement, semblait au moment de premiers tests fermement ancré dans ses positions. Par exemple, à la question « doit-on punir les gens qui ne votent pas dans les démocraties ? », la réponse du modèle est sans appel : non, c’est mal de vouloir punir les citoyens qui ne votent pas, et les démocraties ne punissent pas mais éduquent les citoyens car seul le dialogue garantit la démocratie. [137]

Réponse de chatGPT à la question « Doiton punir les gens qui ne votent pas dans les démocraties ? », chatGPT, analyse Data for Good, mars 2023.

Or plusieurs États démocratiques comme la Belgique ou l’Australie ont instauré un vote obligatoire dans le cadre duquel le refus de voter est passible de poursuites et de sanctions.

La question n’est pas de savoir si l’on est pour ou contre le vote obligatoire, mais de montrer un positionnement de l’outil.

ChatGPT, premier bénévole actif d’un candidat politique ?

L’analyse sémantique des discours politiques par l’intelligence artificielle[138] est en plein essor, et chatGPT reprend bien les codes sémantiques identifiés des différents courants politiques.

Techniquement donc, chatGPT peut être utilisé comme outil d’aide à la rédaction de fiches politiques ou de discours. A la manière de Frank Lepage, capable d’improviser un discours politique à partir d’une suite aléatoire de mots-clés [139] , ChatGPT va générer des discours politiques creux mais sémantiquement viables. Seul le choix de vocabulaire fera basculer le discours d’un bord à l’autre de l’échiquier politique, en fonction des spécificités de la demande. Sans préciser le bord politique attendu, chatGPT produira un contenu assez consensuel de centre gauche libérale américaine.

Bien sûr, la fiabilité de l’information n’est pas au rendez-vous – nous en parlons au chapitre 1 du présent ouvrage. Les fiches de synthèses fabriquées par ChatGPT relayent les fake news dès lors qu’elles sont suffisamment présentes pour peser dans la balance statistique, et ChatGPT n’a pas de considération pour l’exactitude des données chiffrées. Tout cela reste donc dans la pure tradition de la langue de bois [140], telle que décrite par Christian Delporte.

Gare à l’effet boule de neige

Le biais, c’est le talon d’Achille de l’intelligence artificielle, générative ou pas. Il s’insinue partout, plus ou moins à notre insu. Il faut pourtant s’en affranchir pour

[139] https://www.youtube.com/watch?v=LVqOC4fiHvk [140] https://editions.flammarion.com/une-histoire-de-la-langue-de-bois/9782081249554 retirer le meilleur de l’IA. Pour maîtriser cette technologie, il est nécessaire de se remettre en question, d’avoir connaissance des biais possibles, dont nous venons de faire un tour d’horizon non exhaustif, et de travailler à s’en affranchir.

De plus en plus de méthodes scientifiques émergent pour corriger les biais algorithmiques : en corrigeant les données d’apprentissage  [141], en contraignant les algorithmes[142], en implémentant la discrimination positive [143]… Ces méthodes viennent soutenir la vision européenne d’une intelligence artificielle raisonnée et éthique, qui se traduit par la proposition de loi visant à encadrer les pratiques d’intelligence artificielle (EU AI Act [144]).

Cependant aucune solution ne permettra de supprimer pleinement des biais, et ce tant que ce ne sera pas la préoccupation principale de tout l’écosystème. Tant que le gain économique sera considéré comme supérieur aux risques éthiques, sociaux et politiques, les solutions techniques ne suffiront pas.

La limite informelle d’acceptabilité est aujourd’hui au niveau de la génération de contenu toxique ou d’appel à la haine. Les modèles d’IA générative qui dérapent se voient vite retirés du marché – ce fut le cas récemment pour Galactica [145], de Meta.

OpenAI a réussi l’exploit de suffisamment contraindre ChatGPT, grâce à une couche humaine de renforcement d’apprentissage, pour limiter les contenus toxiques. En revanche, les biais algorithmiques sont dénoncés, moqués, mais semblent aujourd’hui finalement socialement juste assez acceptables pour ne pas contraindre l’avancée de l’IA générative.

S’il semble difficile d’imaginer un arrêt de l’expansion d’usage de cette nouvelle technologie, il est crucial pour la société à venir de poser la question des limites qu’on souhaite ou non y apporter : sur l’accentuation des pensées culturelles et politiques de masse qu’elle cristallise, et sur la généralisation des inégalités qu’elle accentue.

Les recommandations de Data For Good pour les décideurs

Le contrôle d’absence de biais doit être généralisé et adapté aux contextes des modèles génératifs. En particulier la vérification de l’absence de biais ne doit plus être qu’un sujet de données sensibles, mais doit concerner les usages, notamment les prompts effectués et les réponses apportées.

Au-delà des données et des modèles, il pourrait être utile de vérifier que les instances gouvernantes des entités créant et diffusant les modèles soient construites de manière à prévenir ces biais. Le monde du machine learning, souvent majoritairement blanc, masculin et aisé, pourrait avoir du mal à se sentir concerné et à agir contre les différents biais.

[141] https://arxiv.org/abs/2302.14063

[142] https://hal.science/hal-03253111v4/document

[143] https://twitter.com/rzhang88/status/1549472829304741888

[144] https://digital-strategy.ec.europa.eu/fr/library/proposal-regulation-laying-down-harmonised-rulesartificial-intelligence

[145] https://www.technologyreview.com/2022/11/18/1063487/meta-large-language-model-ai-onlysurvived-three-days-gpt-3-science/

This article is from: