Un think tank a mis au point un outil permettant de retrouver les contenus originaux pillés par l’intelligence artificielle. Et d’évaluer la rétribution équitable due aux auteurs. Un pavé dans la mare du « business model » des exploitants d’IA.
Pourra-t-on un jour réconcilier les robots et les créateurs de contenus? Le bras de fer auquel se livrent ces deux maillons de la chaîne de valeur de l’intelligence artificielle (IA), un marché évalué à 700 milliards de dol lars d’ici 2030, a viré à la guerre de tranchée stérile. D’un côté, des exploitants d’IA générative (des agents conversationnels comme ChatGPT, mais aussi des générateurs d’images, de vidéos, de sons...) qui, en vertu du «droit de fouille », moissonne les contenus du web (souvent protégés par le droit d’auteur) pour alimenter leurs modèles de langage. De l’autre, des créateurs (artistes, éditeurs, médias...) qui dénoncent le plus grand pillage de propriété intellectuelle de l’histoire, au profit d’une poignée de géants technologiques.
L’équation, que l’on présente volontiers comme insoluble, une menace existentielle ou un mal nécessaire pour le progrès de l’humanité, n’a pas été éludée lors du Sommet pour l’action sur l’IA qui s’est tenu du 6 au 11 février dernier à Paris. Une première balayée aussi vite par Sam Altman, le patron d’Open AI, appuyant que toute tentative «pro culture » était synonyme d’anti-innovation.
Pas si vite, ont rétorqué plus de 34.000 artistes, un millier de médias, 25.000 journalistes, dans une tribune, rappelant quelques principes de base à leurs yeux : la possibilité de fermer la porte aux robots « crawlers », la traçabilité des sources d’information. Et s’acquitter des droits d’exploitation des contenus. « Impossible », répondent inlassablement les exploitants d’IA, invoquant tant la survie de leur secteur que l’impossibilité technique de répondre à ces revendications.
Vraiment? «Faux», avance l’économiste Vincent Lorphelin, fondateur de Controv3rse, groupe de réflexion et d’études sur l’économie numérique, qui, pour le compte de l’Assemblée nationale en France, a copiloté un rapport sur la rémunération des ayants droit par les exploitants d’IA générative. Il manquait une brique : le prototype démontrant la faisabilité technique d’une juste rétribution. Avec l’appui d’un ingénieur «repenti » (passé par les Gafam), le think tank a donc dégainé son « reward simulator » (un simulateur de rétributions), à l’occasion du Sommet de Paris.
« Le moment iTunes de l’IA »
Le résultat est bluffant : téléchargez une image générée par une IA (un chat ou une rose, comme sur notre illustration), cliquez. Et l’interface vous renvoie, en quelques secondes, une liste d’ayants droit dont l’œuvre a nourri l’artefact synthétique. Il suggère aussi la répartition équitable des droits d’auteur. Le concept a été bâti sur une base de données « open source » de 10 millions de photos. Mais, il pourrait tourner sur n’importe quelle base de données, comme celles des organismes de gestion de droits, avec des images, des vidéos, du texte, des sons, des contenus mixtes...
Une claque pour les exploitants d’IA, comme OpenAI, Google, Meta? «On livre ici une base de négociations pour les organismes de gestion collective », appuie Vincent Lorphelin qui y décèle le « moment iTunes de l’IA ». « La période que nous vivons actuellement avec l’IA est comparable à ce qui s’est passé avec Napster dans le monde de l’édition musicale. Il y a eu trois phases. La première, c’est le piratage massif, qui a entraîné un effondrement des marchés de la musique. C’est le temps de la sidération. En suite, il y a eu le temps judiciaire et réglementaire. On a tenté de développer une sorte de police d’internet (avec Hadopi en France), mais cela n’a pas permis d’arrêter le piratage. Le moment charnière, c’est lorsque iTunes et Spotify ont proposé un nouveau modèle économique qui permettait de mettre tout le monde autour de la table. La solution a donc été entrepreneuriale. On en est à la seconde phase pour l’IA. »
« Si on va dans le sens du Musk-trumpisme, l’IA est là pour extraire au mieux les savoir-faire, les connaissances, la culture. On appelle cela le capital culturel ou le capital humain. Cette matière première, dont l’Europe regorge, est extraite pour être concentrée dans les modèles des Gafam. On assiste à une concentration de richesses. Cette matière première cognitive semble insaisissable. Elle ne rentre pas bien dans l’économie, on n’arrive pas à lui donner de la valeur. Or la promesse de l’IA, c’est de moissonner tout cela. Le message n’est pas encore passé, mais en réalité, c’est la totalité du patrimoine culturel et humain qui va y passer. »
A l’exception de quelques deals entre exploitants d’IA et éditeurs presse (entre OpenAI et Associated Press, El Pais, Le Monde, Die Welt...), «chacun reste coincé dans un jeu de postures politiques, où chacun défend ses droits, va se perdre dans le terrain judiciaire. On n’en sortira pas avant de nombreuses années», relève le cofondateur de Controv3rse. « Il faut préparer dès au jourd’hui la solution entrepreneuriale. On doit juste s’assurer d’être suffisamment malin pour que la solution soit européenne. »
Combien vaut ce chat ?
Question subsidiaire: combien vaut cette matière première? «Ici, nous avons un outil pour éclairer le débat public. La seconde étape consiste à analyser la chaîne de valeur et évaluer à combien des contenus participent à leur réussite commerciale. C’est ici que l’on invente le modèle économique, pour partager le gâteau. Ils ne font pas encore de bénéfices ? Ce n’est pas grave. Rien que leur valorisation boursière donne une idée de la valorisation de nos stocks d’auteurs. » L’économiste Ernst Fehr avait ainsi évalué à 14% la valeur qu’apportent les agences de presse et les médias à Google Search, précurseur de l’IAG.
Verdict pour les contenus d’apprentis sage des IA? «15%», avance Vincent Lorphelin. A charge pour les organismes de gestion de droits de les collecter et de les redistribuer. «Pour prendre un comparable plus établi, le taux de 15 % est celui que retiennent les pays producteurs de pétrole sur le prix du baril. On a suffisamment dit que les propriétés intellectuelles étaient le pétrole du XXIe siècle pour ne pas s'en inspirer."
Après, «on est dans l’épaisseur du trait». « Mais pas de quoi bousculer le business model des Gafam», assure Vincent Lorphelin. «Les exploitants d’IA ne sont pas en danger. C’est juste que ça les barbe. Aujourd’hui les marchés ne sont pas encore clairs, les usages sont très variables, la concurrence n’est pas encore établie. Donc la segmentation du marché est encore chaotique. On est dans une phase effervescente ou tout s’invente et se réinvente tous les deux jours. On commence à savoir que ChatGPT, ça vaut environ 20 dollars par mois. C'est un ordre de grandeur.»