Dans un article publié le 23 mars 2023, la fondation Wikimedia détaille certaines des questions soulevées par ChatGPT.

Construit à partir du modèle GPT 3.5, la machine a en effet été entraînée à partir de larges quantités de données récupérées en ligne, notamment depuis Wikipédia.

Les contenus produits et hébergés par la Fondation Wikimedia étant sous licence Creative Commons, ils sont techniquement mis à disposition du public qui peut les réutiliser et de les reproduire librement et gratuitement.

Wikimédia souligne d’ailleurs que de tels usages de masses peuvent tomber dans la catégorie d’« usage loyaux » (donc acceptables) tels que définis par la loi américaine.

D’autres usages de masse ont déjà été décrétés « loyaux » par la justice, parmi lesquels la reproduction de masse d’images pour faciliter l’indexation/recherche de contenu, de même que la reproduction d’extraits de livres pour en faciliter la sauvegarde numérique.

La Fondation Wikimedia souligne toutefois que des exceptions légales pourraient être trouvées pour ChatGPT et des programmes similaires si un tribunal considérait que les publications accumulées pour entraîner les machines servent, à terme, à remplacer les travaux qui ont servi à leur entraînement.

La Fondation Wikimedia s’attarde ensuite sur la complexité légale que pose la question des droits d’auteurs relatifs aux productions d’une IA.

Le Copyright Act américain n’exclut pas les intelligences artificielles, pointe l’organisation, cela dit, elle définit une œuvre intellectuelle selon trois critères (originalité, créativité et œuvre fixée sur un médium tangible) que les technologies récentes peuvent permettre de remplir… ou pas.

En définitive, la Fondation souligne le besoin de clarification sur la vaste série de questions juridiques qu’ouvre la brusque profusion de modèles génératifs.