Les médias face à l’IA : to deal or not to deal (1/2)
Les géants du numérique ne généraliseront pas les accords passés avec quelques groupes de presse sur l’usage des contenus éditoriaux. Ce n’est pas une raison pour s’avouer vaincu.
• • • La version bullet points
• Au Congrès mondial des médias la semaine dernière à Marseille, le patron du New York Times A.G. Sulzberger a secoué l’auditoire avec un discours offensif en direction de la Big Tech.
• Il préconise de ne rien lâcher face au pillage des contenus par les géants de l’IA, de se défendre par tous les moyens, en tout cas à ne pas négocier en position de faiblesse.
• Les éditeurs ont du mal à se résigner à ne pas obtenir d’accords de licence (hormis quelques cas) sur leurs contenus dont se repaît la Big Tech pour entraîner et perfectionner les grands modèles de langage (LLM).
• Face à un OpenAI qui réplique les tactiques des GAFAM historiques — diviser pour affaiblir — les médias vont pourtant devoir trouver des solutions pour éviter une vassalisation certaine.
• • • La version Longue
Lors de la grand-messe des médias à Marseille, le confessionnal tenu par OpenAI n’a pas donné les résultats escomptés. Reprenant à leur compte la tactique de la fracturation relationnelle avec la presse, ses représentants ont reçu un à un les patrons de presse, en les baladant avec des promesses vagues. “Pour résumer, ils s’en fichent” a estimé lors d’un panel Madhav Chinnappa, l’ancien responsable des partenariats chez Google qui en connaît un rayon sur l’obstruction de la Big Tech (il travaille aujourd’hui sur des schémas alternatifs).
Les éditeurs sont revenus bredouilles de Marseille sans espoir de voir émerger une valorisation décente pour leurs fonds éditoriaux, malgré l’appétit gargantuesque des grands modèles de langage. Les articles, vidéos, podcasts, produits par les médias professionnels sont pourtant du caviar face au magma hétérogène dont sont gavés les modèles. Ils sont précieux pour recaler les imprécisions des résultats des chatbots et les actualiser via le Retrieval-Augmented Generation (RAG) qui rend plus exploitable les restitutions des IA. Maintenant, sur la question de payer…
Aujourd’hui, une quinzaine d’accords ont été signés, dont cinq aux Etats-Unis et une dizaine en Europe. Les périmètres sont très variables et vont d’un simple référencement dans des réponses des chatbots à la possibilité d’utiliser des millions d’articles, vidéos, ou podcasts, pour entraîner les LLM. Les sommes obtenues par les groupes de médias sont elles aussi très variables mais elles ne reflètent pas la valeur des actifs éditoriaux cédés. Un grand éditeur européen signataire d’un accord de licence m’a avoué que la tech ne paie guère plus de 30% de la valeur des contenus cédés et il cite certains ses collègues qui dénoncent des arrangements encore plus bradés — il n’y a de toute façon pas de place de marché pour juger.
Dans tous les cas, il y a peu de chances de voir se multiplier de gros deals avec les médias, le acteurs de l’IA estiment qu’il vaut mieux signer avec quelques grands groupes dans chaque pays plutôt que de se lancer dans des négociations collectives — cela correspond d’ailleurs aux pratiques d’une presse notoirement réticente à offrir un front commun, au contraire d’autres secteurs plus enclins à une approche de type cartel. La Big Tech n’a donc aucune difficulté à jouer la division.
Que faire ? Si on part de l’hypothèse selon laquelle dans moins de dix ans les acteurs de l’IA seront les principaux distributeurs de news en raison de leur capacité à individualiser les contenus, comment faire en sorte qu’en dehors de quelques grands groupes, la presse ne soit pas vassalisée par les géants de la tech ?
L’offensive de “A.G.”
Arthur Gregg Sulzberger est l’héritier de la famille fondatrice du Times qui contrôle encore le trust propriétaire du titre. A 45 ans, il est aux commandes du groupe depuis 2018 après une solide expérience de journaliste. Celui qui aime à se faire appeler “A.G.” est un type sympa, curieux, passionné par toutes les innovations qui peuvent pérenniser le journalisme de qualité.
Après huit ans comme éditeur du Times, il n’entend pas voir la profession se faire tondre par la Big Tech comme jadis avec Google, Meta, et d’autres qui n’ont cessé de renier leurs engagements, de détourner les audiences, d’assécher le marché publicitaire et de capter la distribution de l’information. (Soyons honnêtes, tout le monde s’est fait gruger par les géants de la tech).
En attendant, le Times s’en sort bien avec 13 millions d’abonnés, un chiffre d’affaires de 2,8 milliards de dollars pour 544 millions d’EBITDA et une valorisation boursière de 13 milliards.
Le président de la New York Times Company et éditeur du titre a donc surpris l’auditoire de la conférence de la WAN-IFRA avec un discours très offensif en direction des géants de l’IA à commencer par OpenAI. Le NYT a assigné en justice l’entreprise de Sam Altman pour violation massive des droits d’auteur, estimant (et démontrant) que les bots d’OpenAI ont pillé sans vergogne les 175 ans d’archives du Times, pour entraîner les différentes versions de ChatGPT.
Voici quelques extraits de son discours (le texte intégral traduit et annoté est disponible sur le site de Grand Continent) :
Les géants de la tech pillent les sites d’information sans autorisation ni compensation. Ils recèlent et reconditionnent ces biens volés comme s’ils leur appartenaient, détournant ainsi l’audience et les revenus qui, autrement, reviendraient aux organes de presse ayant créé ce contenu.
Notre profession s’est montrée trop silencieuse, trop passive et trop fragmentée face aux abus des entreprises leaders dans la révolution de l’IA.
Nous ne pouvons pas les laisser dominer le débat public sans intervenir pour défendre l’importance du vrai journalisme. Nous ne pouvons pas rester les bras croisés tandis que les entreprises d’IA nient les droits qui nous permettent de contrôler notre travail. Nous ne pouvons pas rester passifs alors que ce travail est utilisé dans des produits de substitution qui sapent notre capacité à préserver l’audience et les revenus nécessaires à la couverture de l’actualité. (...)
Les modèles d’IA sont basés sur quatre ingrédients.
Le premier est le talent, ceux qui conçoivent les algorithmes. Le deuxième est la puissance de calcul, les microprocesseurs et les datacenters. Le troisième est l’électricité nécessaire pour alimenter ces infrastructures. Le quatrième, ce sont les données. Le mot lui-même semble presque conçu pour faire passer le travail créatif et expressif pour quelque chose de trivial, une marchandise omniprésente. Pourtant, le terme de données couvre les livres, les films, la musique et les articles de journalisme. Autrement dit : « du contenu protégé par le droit d’auteur ».
Sulzberger note que les trois premiers — les concepteurs des modèles, la puissance de calcul et l’énergie — sont payés à leur juste prix (et même au-delà avec un salaire médian chez OpenAI de 875 000 dollars par an), mais ils souligne que les données qui nourrissent les LLM ne sont en général pas rémunérées. Ou en tout cas très peu, selon lui : il rappelle que les accords signés entre les médias et les opérateurs d’IA, représentent “moins de 0,5%” des 350 milliards d’investissements effectués en 2025 par la Big Tech (ceux-ci vont tripler cette année). Cette compensation est donc une misère au regard des principales charges d’exploitation des LLM.
Sulzberger de poursuivre :
[Les entreprises de tech] prétendent que la doctrine du fair use [la tolérance pour un usage gratuit, très extensive aux Etats-Unis] leur permet de toute façon d’utiliser ce contenu gratuitement. Elles vont jusqu’à invoquer la sécurité nationale : selon elles, si les entreprises d’IA étaient contraintes de payer, les États-Unis perdraient la course technologique face à la Chine. (...)
OpenAI a admis qu’il serait « impossible d’entraîner les principaux modèles d’IA actuels sans utiliser de contenus protégés par le droit d’auteur ». L’un des ingénieurs de l’entreprise a écrit que le succès des modèles « ne dépend pas de l’architecture, des hyperparamètres ou des choix d’optimisation. Il dépend de votre ensemble de données, et de rien d’autre ». En d’autres termes, on est ce qu’on mange.
Le patron du New York Times a aussi rappelé le coût exorbitant du journalisme : l’an dernier le Times a produit plus de 500 000 éléments d’information (articles, photos, vidéos, podcasts, infographies). La seule couverture de l’Ukraine mobilise 70 personnes et personnels de soutien sur le terrain. Au total, les dépenses éditoriales du Times dépassent les deux milliards de dollars annuels, pour un effectif de 2400 journalistes, selon son rapport annuel, et 3000 personnes affectées au news sur l’ensemble de ses divisions.
Étendez ces contributions sur 175 ans et 20 millions d’œuvres originales, et vous obtiendrez une image plus complète de ce que notre rédaction a apporté à la compréhension du monde par le public. (...) Le journal a été la plus grande source de données propriétaires dans un ensemble de données majeur utilisé pour entraîner de nombreux modèles différents, suivi par un certain nombre d’autres organes de presse, comme The Guardian et le Los Angeles Times. (...)
Pourtant, les géants de la tech ont toujours soutenu qu’on ne devait pas s’attendre à devoir demander la permission d’utiliser, et encore moins de payer, pour cette propriété intellectuelle. Leur argument, comme le montrent leurs actions, est qu’ils sont dans leur droit. Meta a entraîné son modèle sur une base de données tristement célèbre de livres piratés illégalement. Perplexity a ouvertement défié la norme établie de longue date selon laquelle les sites web ne peuvent pas être crawlés au mépris de leurs objections explicites. OpenAI a fait pression sur le gouvernement américain pour obtenir une immunité juridique contre la saisie des travaux d’autrui. Même Anthropic, souvent citée en exemple pour son engagement en faveur d’un développement éthique de l’IA, s’est montrée réticente à payer pour le journalisme de haute qualité qu’elle utilise dans ses produits.
Les trois procès intentés à OpenAI et son partenaire historique Microsoft, ainsi qu’à et Perplexity ont coûté jusqu’ici 20 millions de dollars en frais d’avocats à la New York Times Company a indiqué son chairman. A entendre son président, il n’a pas l’intention de lâcher, car il estime que la situation est critique. Il a évoqué la disparition de 75% des journalistes aux Etats-Unis consécutives à la fermeture de 3000 journaux dans le pays au cours des 20 dernières années. Il a aussi mentionné la rupture du contrat implicite souscrit par la presse du monde entier auprès de partenaires comme Google qui ne redirige plus qu’une fraction du trafic vers les sites médias. Aujourd’hui, Google est devenu un site de destination où l’utilisateur trouve ce qu’il cherche sans rebondir vers un site tiers : “Selon des études du secteur, il est 10 fois plus difficile aujourd’hui qu’il y a dix ans d’amener un utilisateur de Google à cliquer sur un lien”. Et le développement de l’IA comme accès vers l’information a encore dégradé la situation au détriment des médias indique Sulzberger : “Une autre étude montre que les modèles d’IA concurrents génèrent un trafic de référence à un taux inférieur de 96 % à celui de la recherche Google”.
L’étude en question a été produite il y a un an par CloudFlare et ses conclusions sont inquiétantes :
Avec OpenAI, générer du trafic est 750 fois plus difficile qu’avec l’ancien Google. Avec Anthropic, c’est 30 000 fois plus difficile. La raison est simple : nous consommons de moins en moins de contenu original, mais des dérivés. Le web piloté par l’IA ne récompense pas les créateurs de contenu comme le faisait l’ancien web axé sur la recherche. Autrement dit, l’accord passé avec Google, qui consistait à obtenir du contenu en échange de trafic, n’a plus aucun sens. Au lieu d’un échange équitable, le web est pillé par les robots d’exploration de l’IA, les créateurs de contenu ne percevant quasiment aucun trafic et donc aucune valeur.
Le réquisitoire de Sulzberger est donc sans appel :
Les géants de la tech sont pleinement conscients des implications de cette évolution sur les modèles économiques déjà fragiles des organes de presse. (...) Cette dynamique a, bien sûr, entraîné une chute vertigineuse du trafic vers les sites d’information. Les plus grands journaux suivis par Comscore ont enregistré des baisses de plus de 45 % en moyenne, alors que la course à l’IA s’est intensifiée au cours des quatre dernières années. Les éditeurs d’information mondiaux interrogés par le Reuters Institute se préparent à ce que les baisses significatives de trafic se poursuivent dans les années à venir.
Une baisse du trafic vers les éditeurs signifie une érosion des revenus publicitaires, qui restent une source de chiffre d’affaires importante pour la plupart des organes de presse. Au cours des deux dernières décennies, le montant total des recettes publicitaires des journaux a déjà chuté de 80 %.
À elle seule, l’entreprise Meta génère désormais huit fois plus de revenus publicitaires que tous les journaux de la planète réunis.(...)
Selon un chercheur senior de Microsoft, l’une des « promesses fondamentales des LLM » est leur capacité à utiliser « leurs données d’entraînement pour se substituer au travail rémunéré de ceux qui ont créé ces données ».
A.G. a enjoint les médias à mener quatre actions :
“Défendez vos droits. Cela demandera du courage — et parfois des ressources, qui font défaut — mais l’alternative, qui consiste à tolérer en silence le vol systématique de votre travail, finira par vous priver de la possibilité de poursuivre votre activité.
Négociez avec prudence. Il est raisonnable que les organes de presse signent des accords de licence de contenu avec des entreprises d’IA. Mais je vous invite instamment à examiner la viabilité à long terme de chaque accord. Les géants de la tech disposent d’un levier de négociation extraordinaire : ils ont déjà pris votre contenu et ont l’intention de l’utiliser quoi qu’il arrive. Avant d’accepter une offre, il faut se demander si la rémunération reflète une valeur décente et si vous conservez un droit de regard sur la manière dont votre travail est utilisé.
Faites pression sur vos législateurs. L’IA est de plus en plus impopulaire auprès du public. Alors que les législateurs réfléchissent à la manière de réagir, notre secteur doit se mobiliser avec des demandes claires et convaincantes.
Unissons nos forces. Nous sommes confrontés à des entreprises d’IA qui dépensent des millions dans le marketing, le lobbying et les dons politiques pour persuader le public et coopter les politiciens. Les sociétés de capital-risque à l’origine de nombreux investissements dans l’IA sont désormais les premiers donateurs politiques aux États-Unis.
La seule façon pour le secteur de l’information de contrer cette influence est de travailler ensemble et — c’est un point crucial — avec d’autres industries créatives. Intervenez dans les procédures judiciaires et impliquez-vous activement dans vos associations professionnelles.
Nous ne pouvons pas nous permettre d’être aussi naïfs que par le passé.
Les organes de presse sont collectivement plus petits et plus faibles qu’il y a vingt ans. Les géants de la tech sont plus grands et plus puissants, et bien plus enclins à user de leur taille et de leur pouvoir. Parallèlement, la vague de l’IA elle-même pourrait être plus importante et plus rapide à mesure que la technologie progresse. Même si tout semble aller bien pour l’instant, rappelez-vous que ces premières vagues annoncent un tsunami imminent. •
• • •
Pourquoi ce discours est important
Dans le grand auditorium du palais du Pharo à Marseille, A.G. Sulzberger a été ovationné. Personne ne s’attendait à un discours aussi sévère et aussi argumenté (il avait bossé). Les quelques critiques se répartissaient entre les résignés (“il va finir par caler et négocier un bon deal”) et les cyniques (“il a déjà signé avec Amazon, donc sa grande leçon de résistance, il peut se la garder…”).
A mon sens, la prise de position du patron du New York Times est marquante pour plusieurs raisons:
Le New York Times est sans doute la dernière ligne de défense avant la reddition totale des médias face à la Big Tech. Les sceptiques ont peut-être raison : plutôt que de se voir débouter par la Cour fédérale du Southern district de Manhattan à l’issue d’un procès fin 2027, les avocats du Times proposeront éventuellement un règlement à l’amiable (un settlement), assorti de quelques centaines de millions de dollars d’indemnités (sur les milliards réclamés) et un accès rigoureusement encadré aux données du NYT. C’est une possibilité car la notion de fair use est tellement large aux Etats-Unis qu’elle peut se retourner contre le Times. Et rien ne serait pire pour l’industrie qu’un procès qui confirmerait purement et simplement l’interprétation la plus favorable du droit d’usage des contenus protégés, autrement dit, une jurisprudence open bar pour la Big Tech.
Sulzberger ne recommande d’ailleurs pas d’éviter les négociations avec les géants de la tech (il y a tout juste un an, il annonçait un large accord de licence avec Amazon). Il préconise de se battre par tous les moyens — techniques, juridiques, politiques, législatifs — pour mettre un terme au pillage et protéger une production éditoriale onéreuse à produire, et en faire payer le juste prix.
• • •
Dans un prochain article je reviendrai sur les stratégies des médias face aux pratiques prédatrices de la Big Tech. Certains éditeurs comme Le Monde ou le Guardian ont opté pour des deals rapidement ficelés — on ne peut décemment pas leur reprocher. Mais outre leur faible valeur unitaire (quelques millions par an), ces accords compromettent toute négociation collective car OpenAI et les autres n’iront pas au-delà d’un accord par pays non anglophone. Au Royaume-Uni et en Europe du Nord des groupements travaillent de leur côté à des solutions techniques inédites de nature à changer la relation entre les éditeurs et la tech.
— A suivre.
frederic@episodiqu.es
The Wald Brief est une newsletter anglophone sur les technologies de défense confrontées à l’évolution stratégique de l’Europe que nous l’avons lancée il y a quelques semaines avec Gilles Delafon.
Nos sujets actuels : comment la guerre en Ukraine a stimulé l’innovation de défense ; l’Europe spatiale face à une défection américaine ; les technologies de rupture qui vont bouleverser les équilibres ; la pertinence (ou non) des grands programmes européens aéronautiques et navals et la fin de la rente à laquelle l’industrie de défense s’était habituée...
➡️ Abonnez-vous à Wald, c’est gratuit, indépendant et intéressant
⇒ The Wald Brief




