LE SOIR Un simulateur de droits

d’auteur brise le modèle

de piratage de l’IA

Un think tank a mis au point un outil permettant de retrouver les contenus originaux pillés par l’intelligence artificielle. Et d’évaluer la rétribution équitable due aux auteurs. Un pavé dans la mare du « business model » des exploitants d’IA.

Pourra-­t-­on un jour réconcilier les robots et les créateurs de conte­nus? Le bras de fer auquel se livrent ces deux maillons de la chaîne de valeur de l’intelligence artificielle (IA), un marché évalué à 700 milliards de dol­ lars d’ici 2030, a viré à la guerre de tran­chée stérile. D’un côté, des exploitants d’IA générative (des agents conversa­tionnels comme ChatGPT, mais aussi des générateurs d’images, de vidéos, de sons...) qui, en vertu du «droit de fouille », moissonne les contenus du web (souvent protégés par le droit d’auteur) pour alimenter leurs modèles de lan­gage. De l’autre, des créateurs (artistes, éditeurs, médias...) qui dénoncent le plus grand pillage de propriété intellectuelle de l’histoire, au profit d’une poi­gnée de géants technologiques.

L’équation, que l’on présente volon­tiers comme insoluble, une menace exis­tentielle ou un mal nécessaire pour le progrès de l’humanité, n’a pas été éludée lors du Sommet pour l’action sur l’IA qui s’est tenu du 6 au 11 février dernier à Pa­ris. Une première balayée aussi vite par Sam Altman, le patron d’Open AI, ap­puyant que toute tentative «pro culture » était synonyme d’anti-­innova­tion.

Pas si vite, ont rétorqué plus de 34.000 artistes, un millier de médias, 25.000 journalistes, dans une tribune, rappelant quelques principes de base à leurs yeux : la possibilité de fermer la porte aux robots « crawlers », la traçabi­lité des sources d’information. Et s’ac­quitter des droits d’exploitation des contenus. « Impossible », répondent in­lassablement les exploitants d’IA, invo­quant tant la survie de leur secteur que l’impossibilité technique de répondre à ces revendications.

Vraiment? «Faux», avance l’écono­miste Vincent Lorphelin, fondateur de Controv3rse, groupe de réflexion et d’études sur l’économie numérique, qui, pour le compte de l’Assemblée nationale en France, a co­piloté un rapport sur la rémunération des ayants droit par les ex­ploitants d’IA générative. Il manquait une brique : le prototype démontrant la faisabilité technique d’une juste rétribu­tion. Avec l’appui d’un ingénieur «re­penti » (passé par les Gafam), le think tank a donc dégainé son « reward simu­lator » (un simulateur de rétributions), à l’occasion du Sommet de Paris.

« Le moment iTunes de l’IA »

Le résultat est bluffant : téléchargez une image générée par une IA (un chat ou une rose, comme sur notre illustration), cliquez. Et l’interface vous renvoie, en quelques secondes, une liste d’ayants droit dont l’œuvre a nourri l’artefact syn­thétique. Il suggère aussi la répartition équitable des droits d’auteur. Le concept a été bâti sur une base de données « open source » de 10 millions de photos. Mais, il pourrait tourner sur n’importe quelle base de données, comme celles des orga­nismes de gestion de droits, avec des images, des vidéos, du texte, des sons, des contenus mixtes...

Une claque pour les exploitants d’IA, comme OpenAI, Google, Meta? «On livre ici une base de négociations pour les organismes de gestion collective », ap­puie Vincent Lorphelin qui y décèle le « moment iTunes de l’IA ». « La période que nous vivons actuellement avec l’IA est comparable à ce qui s’est passé avec Napster dans le monde de l’édition mu­sicale. Il y a eu trois phases. La première, c’est le piratage massif, qui a entraîné un effondrement des marchés de la mu­sique. C’est le temps de la sidération. En­ suite, il y a eu le temps judiciaire et régle­mentaire. On a tenté de développer une sorte de police d’internet (avec Hadopi en France), mais cela n’a pas permis d’arrêter le piratage. Le moment charnière, c’est lorsque iTunes et Spotify ont proposé un nouveau modèle économique qui permettait de mettre tout le monde autour de la table. La solution a donc été entrepreneuriale. On en est à la seconde phase pour l’IA. »

« Si on va dans le sens du Musk­-trumpisme, l’IA est là pour extraire au mieux les savoir­-faire, les connaissances, la culture. On appelle cela le capital culturel ou le capital hu­main. Cette matière première, dont l’Eu­rope regorge, est extraite pour être concentrée dans les modèles des Gafam. On assiste à une concentration de ri­chesses. Cette matière première cogni­tive semble insaisissable. Elle ne rentre pas bien dans l’économie, on n’arrive pas à lui donner de la valeur. Or la promesse de l’IA, c’est de moissonner tout cela. Le message n’est pas encore passé, mais en réalité, c’est la totalité du patrimoine culturel et humain qui va y passer. »

A l’exception de quelques deals entre exploitants d’IA et éditeurs presse (entre OpenAI et Associated Press, El Pais, Le Monde, Die Welt...), «chacun reste coincé dans un jeu de postures politiques, où chacun défend ses droits, va se perdre dans le terrain judiciaire. On n’en sortira pas avant de nombreuses an­nées», relève le cofondateur de Controv3rse. « Il faut préparer dès au­ jourd’hui la solution entrepreneuriale. On doit juste s’assurer d’être suffisam­ment malin pour que la solution soit eu­ropéenne. »

Combien vaut ce chat ?

Question subsidiaire: combien vaut cette matière première? «Ici, nous avons un outil pour éclairer le débat pu­blic. La seconde étape consiste à analyser la chaîne de valeur et évaluer à combien des contenus participent à leur réussite commerciale. C’est ici que l’on invente le modèle économique, pour partager le gâteau. Ils ne font pas encore de béné­fices ? Ce n’est pas grave. Rien que leur valorisation boursière donne une idée de la valorisation de nos stocks d’auteurs. » L’économiste Ernst Fehr avait ainsi éva­lué à 14% la valeur qu’apportent les agences de presse et les médias à Google Search, précurseur de l’IAG.

Verdict pour les contenus d’apprentis­ sage des IA? «15%», avance Vincent Lorphe­lin. A charge pour les or­ganismes de gestion de droits de les collecter et de les redistribuer. «Pour prendre un comparable plus établi, le taux de 15 % est celui que retiennent les pays producteurs de pétrole sur le prix du baril. On a suffisamment dit que les propriétés intel­lectuelles étaient le pé­trole du XXIe siècle pour ne pas s'en inspirer."

Après, «on est dans l’épaisseur du trait». « Mais pas de quoi bous­culer le business model des Gafam», assure Vincent Lorphelin. «Les exploitants d’IA ne sont pas en danger. C’est juste que ça les barbe. Aujourd’hui les mar­chés ne sont pas encore clairs, les usages sont très variables, la concurrence n’est pas encore établie. Donc la segmenta­tion du marché est encore chaotique. On est dans une phase effervescente ou tout s’invente et se réinvente tous les deux jours. On commence à savoir que ChatGPT, ça vaut environ 20 dollars par mois. C'est un ordre de grandeur.»