IA : un nombre croissant de sites web bloquent les robots d’indexation d’OpenAI

4 septembre 2023 Intelligence Artificielle

Un nombre croissant de sites web de presse ont commencé à bloquer le robot d’indexation qu’OpenAI fait passer sur les sites Web pour aspirer leur contenu et entraîner ses modèles d’IA, dont le célèbre agent conversationnel ChatGPT, rapporte Le Monde.

« Nous avons bloqué cet été le robot OpenAI, qui puisait sans consentement dans nos contenus », a précisé Sibyle Veil, la présidente de radio France, afin d’éviter de voir « ses contenus pillés sans autorisation ».

France Médias Monde (France 24, RFI…), TF1 et le groupe Sipa – Ouest-France (Actu.fr) auraient fait de même, tout comme le New York Times, CNN, The Washington Post, The Atlantic, Axios, Insider, Reuters, Bloomberg ainsi que les groupes Disney, Condé Nast, Hearst et Vox Media.

D’après Le Monde, ces blocages « reflètent plus largement la volonté, affichée depuis plusieurs mois par de très nombreux médias, d’obtenir une rémunération en contrepartie de l’utilisation des contenus de presse par les géants de l’IA ».

La pertinence des réponses proposées par les robots conversationnels de type ChatGPT repose en effet sur leur entraînement sur des corpus de textes, et les éditeurs de presse ne voient pas pourquoi OpenAI et ses pairs pourraient exploiter leurs contenus sans rétribution.

Et ce, d’autant que ces robots ont vocation à être intégrés dans les moteurs de recherche Google et Bing, et donc à se substituer à la consultation des sites de presse. L’AFP a ainsi cosigné une tribune dénonçant dans l’IA une « menace pour la viabilité financière » des médias, et plusieurs médias américains espèrent négocier des « contrats de licence » rémunérant les contenus d’entraînement des IA.

Source