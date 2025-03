La première décision importante sur la responsabilité en matière de droit d'auteur dans le domaine de l'IA, Thomson Reuters v Ross Intelligence(en anglais seulement), fournit un aperçu critique de la façon dont les lois sur le droit d'auteur seront appliquées dans le contexte de l'entraînement de systèmes d'IA générative. Le 11 février 2025, le juge Bibas de la Cour d'appel (Third Circuit) du district du Delaware a statué que Ross avait violé les droits d'auteur de Thomson Reuters relativement aux sommaires juridiques accessibles sur Westlaw, qui ont servi à entraîner le moteur de recherche juridique intelligent de Ross.

Le présent bulletin se penche sur ces conclusions clés et propose une analyse comparative d'un point de vue canadien. Ceux et celles qui travaillent dans le domaine de l'intelligence artificielle devraient prendre note de cette décision et de son incidence sur l'utilisation de matériel protégé par le droit d'auteur pour entraîner des systèmes d'intelligence artificielle.

Résumé du dossier

Thomson Reuters, propriétaire de la plateforme de recherche juridique Westlaw, a accusé Ross, une société de recherche juridique axée sur l'IA, d'utiliser sans autorisation ses sommaires juridiques pour entraîner son outil de recherche en IA. Les sommaires, qui résument les principaux points de droit des décisions judiciaires, font partie intégrante du système de recherche juridique de Westlaw. Ross a cherché à obtenir une licence pour ces sommaires, mais Thomson Reuters a refusé de lui concéder une telle licence, ce qui a amené Ross à acquérir des données similaires par l'intermédiaire d'un tiers, LegalEase. LegalEase avait rédigé des notes de recherche juridiques fondées sur les sommaires de Westlaw et les avait vendues à Ross, qui les a ensuite utilisées pour entraîner son IA.»

Dans un renversement de sa décision précédente, la Cour a accordé à Thomson Reuters un jugement sommaire partiel quant à la violation du droit d'auteur et a rejeté la défense d'usage loyal (« fair use ») de Ross, estimant que Ross avait violé le droit d'auteur de Thomson Reuters relatif à 2 243 sommaires (sur un total de 2 830). La Cour a conclu que les notes de recherche de LegalEase étaient essentiellement semblables à 2 243 sommaires de Westlaw et que, puisque Ross avait copié les notes de recherche telles quelles, elle avait violé le droit d'auteur de Westlaw relatif à ces sommaires. Les autres sommaires feront l'objet d'un procès. Le jugement sommaire a été accordé parce que, comme l'a déclaré la Cour, [traduction libre] « la reproduction proprement dite [était] si évidente qu'aucun jury raisonnable ne pourrait conclure autrement ».

Ross a soutenu que cette reproduction ne devrait pas être retenue contre elle parce que les sommaires ne figuraient pas dans le contenu généré par l'IA pour les utilisateurs finaux. Elle a fait valoir que l'utilisation intermédiaire des sommaires à des fins d'entraînement n'était pas assimilable à une reproduction directe de ceux-ci dans son produit. Cependant, la Cour a rejeté cet argument, soulignant que la reproduction non autorisée d'une partie importante des sommaires à des fins commerciales, même à un stade intermédiaire, constituait quand même une violation du droit d'auteur.

Pour évaluer la défense d'usage loyal de Ross, la Cour a examiné les quatre facteurs prévus par la loi américaine en matière de droit d'auteur et a conclu que, après avoir soupesé ces facteurs, l'utilisation faite par Ross ne constituait pas un usage loyal.

But et caractère de l'utilisation : L'utilisation de Ross était commerciale et non transformative, car l'outil d'IA de Ross servait un but similaire (et concurrent) à celui de Westlaw, n'ajoutant aucune nouvelle expression, signification ou valeur qui soit significative. Étant donné l'utilisation « intermédiaire » de Ross, la Cour a écarté des décisions antérieures, comme celle rendue dans Google v. Oracle, où la reproduction intermédiaire était permise en raison du premier facteur d'usage loyal, parce que ces causes portaient sur la reproduction de code informatique, et non d'œuvres littéraires, et que dans l'affaire Google, la reproduction était nécessaire à l'innovation. La Cour a souligné que ce dossier s'apparentait plus à la décision de la Cour suprême des États-Unis dans l'affaire Warhol Foundation v. Goldsmith, où la nature commerciale et concurrente de l'utilisation violant le droit d'auteur était déterminante. Ce facteur a favorisé Thomson Reuters. Nature de l'œuvre protégée par droit d'auteur : La Cour a jugé que chaque sommaire était une œuvre individuelle protégée par le droit d'auteur. Toutefois, bien que le contenu de Westlaw ait eu plus que le minimum d'originalité requis pour valider un droit d'auteur, la Cour a conclu que les sommaires n'étaient finalement pas si créatifs que cela. La Cour a souligné que plus le droit d'auteur est « mince » (ou moins expressif), plus la reproduction doit être exacte. Ce facteur a favorisé Ross. Ampleur de l'utilisation : Ce facteur tient compte de l'importance et de la qualité de l'utilisation violant le droit d'auteur. Ross a copié un nombre important de sommaires (2 243 au total), ce que la Cour a jugé excessif et qui a joué en défaveur d'un usage loyal. Néanmoins, comme Ross n'a pas mis les sommaires de Westlaw à la disposition du public (puisqu'ils n'ont été utilisés qu'à un stade intermédiaire), ce facteur a finalement favorisé Ross. Effet sur le marché : La Cour a conclu que l'utilisation de Ross avait un effet négatif sur le marché potentiel des sommaires de Westlaw. De plus, Ross aurait pu entraîner son IA sans violer le droit d'auteur de Thomson Reuters, puisque l'entreprise aurait pu créer elle-même des sommaires ou retenir les services de LegalEase pour le faire. Ce facteur a favorisé Thomson Reuters. Selon la Cour, ce facteur est [traduction] « sans aucun doute l'élément le plus important de [l'analyse de] l'usage loyal ».

Cette décision souligne les limites de la défense de l'usage loyal dans les cas de concurrence directe et d'exploitation commerciale, en particulier dans le contexte de l'IA.

En quoi cette décision aurait‐elle pu être différente au Canada?

Si la décision dans le dossier Thomson Reuters avait été rendue en vertu du droit canadien, l'analyse aurait été différente en raison du cadre distinct de l'utilisation équitable au Canada, mais le résultat aurait probablement été le même.

Les tribunaux canadiens appliquent un critère en deux étapes pour se prononcer sur l'utilisation équitable. Premièrement, ils déterminent si l'utilisation est visée par l'un des objets énumérés dans la Loi sur le droit d'auteur : recherche, étude privée, critique, compte rendu ou communication des nouvelles. Puis, pour évaluer le caractère équitable de l'utilisation, ils tiennent compte de six facteurs : le but de l'utilisation, la nature de l'utilisation, l'ampleur de l'utilisation, les solutions de rechange à l'utilisation, la nature de l'œuvre et l'effet de l'utilisation sur l'œuvre.

Il est intéressant de noter que l'une des décisions les plus importantes en matière de droit d'auteur et d'utilisation équitable au Canada, CCH Canadienne Ltée c Barreau du Haut-Canada, traite de l'utilisation de sommaires et de résumés jurisprudentiels. Dans l'affaire CCH, la Cour suprême a estimé que la photocopie de sommaires et de résumés jurisprudentiels à des fins de recherche et d'étude privée constituait une utilisation équitable.

En l'espèce, Ross pourrait faire valoir que l'utilisation des sommaires de Westlaw pour l'entraînement de son outil d'intelligence artificielle relève des fins de recherche. Bien que l'analyse du caractère équitable soit différente, elle mènerait probablement à la même conclusion.

Le but de l'utilisation : Ross pourrait soutenir que l'objectif était l'élaboration d'un outil de recherche juridique (c.-à-d. aux fins permises de « recherche »), mais la nature commerciale de l'utilisation pèserait contre le caractère équitable. La nature de l'utilisation : Selon le droit canadien, ce facteur tient compte de la manière dont les œuvres sont traitées, par exemple si les œuvres reproduites sont largement distribuées, si une seule reproduction est effectuée, si des pratiques industrielles sont en jeu, etc. En l'occurrence, la reproduction systématique et à grande échelle de sommaires pourrait être considérée comme une utilisation moins équitable, d'autant plus que les documents reproduits ont été utilisés pour créer un produit concurrent. Toutefois, le fait que les sommaires n'aient finalement pas été diffusés au public pourrait atténuer ce facteur. L'ampleur de l'utilisation : À l'instar du troisième facteur de l'analyse américaine de l'usage loyal, ce facteur tient compte de l'importance et de la qualité de l'utilisation violant le droit d'auteur. Dans l'affaire Ross, le nombre important de sommaires reproduits (2 243) serait probablement considéré comme excessif, d'autant plus que la reproduction comportait des éléments clés des œuvres originales. Les solutions de rechange à l'utilisation : Au Canada, la question de savoir s'il existe des solutions de rechange qui ne violent pas le droit d'auteur est un facteur distinct, tandis qu'aux États-Unis, elle est imbriquée dans le quatrième facteur. En l'espèce, Ross aurait pu développer son outil d'IA sans copier les sommaires, puisqu'elle aurait pu embaucher LegalEase pour élaborer les sommaires sans copier les œuvres de Thomson Reuters. Ce fait aurait pesé en défaveur d'une conclusion d'utilisation équitable. La nature de l'œuvre : Les sommaires, bien que factuels, impliquent des décisions éditoriales et de la créativité, que les tribunaux canadiens sont susceptibles de protéger, à l'instar des États-Unis. En effet, l'arrêt canadien de référence en matière de droit d'auteur, CCH, portait sur des sommaires juridiques similaires. L'effet de l'utilisation sur l'œuvre : L'incidence négative sur le marché de Thomson Reuters, étant donné que le produit de Ross était en concurrence directe avec Westlaw, pèserait fortement contre le caractère équitable, comme cela a été le cas dans l'analyse de l'usage loyal aux États-Unis.

Bien que le cadre canadien ne prenne pas explicitement en compte le « caractère transformateur », l'accent mis sur le caractère équitable de l'utilisation, y compris la nature commerciale et l'effet sur le marché, conduirait probablement à une conclusion similaire. Ainsi, malgré les différences dans l'approche analytique, le résultat, c'est-à-dire un jugement contre Ross, resterait probablement le même en raison de la nature substantielle et concurrente de la reproduction.

Les dossiers canadiens à surveiller

Au Canada, deux affaires importantes à suivre concernant la violation du droit d'auteur et l'IA générative sont CanLII v Caseway AI(Cour suprême de la Colombie-Britannique) et Toronto Star, Metroland Media, Postmedia, The Globe and Mail, The Canadian Press, and CBC v OpenAI (Cour supérieure de l'Ontario).

L'affaire CanLII v Caseway AI concerne l'allégation de l'Institut canadien d'information juridique selon laquelle Caseway AI a utilisé sans autorisation ses bases de données juridiques pour entraîner des modèles d'IA, ce qui soulève des questions sur la protection des bases de données juridiques par le droit d'auteur et sur l'applicabilité de l'utilisation équitable.

L'action intentée par les organisations médiatiques contre OpenAI est centrée sur des allégations selon lesquelles OpenAI a utilisé leur contenu protégé par le droit d'auteur pour entraîner ses modèles d'IA, ce qui constitue une violation potentielle de leurs droits d'auteur. Dans cette affaire, la Cour examinera si l'utilisation par OpenAI d'articles et de reportages peut être justifiée en vertu des dispositions canadiennes relatives à l'utilisation équitable.

Les deux affaires sont sur le point de créer des précédents importants sur la façon dont les tribunaux canadiens traitent les questions de droit d'auteur dans le contexte de l'IA et fourniront des indications précieuses au secteur de la technologie.

