2024年11月10日 (日)

第504回:非営利でのAI学習用データの提供は研究目的データマイニングの権利制限に該当し著作権侵害とならないとする2024年9月27日のドイツ・ハンブルク地裁の判決

 人工知能(AI)と知財の問題を問う事件としてはアメリカのものが世界的に見て大きな影響を持つと思うが、ドイツでも最近地裁でAI学習は研究目的データマイニングの権利制限に該当し著作権侵害とならないとする判決が出されており、非常に興味深いものと思うので、今回はこの判決について取り上げる。

 この判決(ドイツ語)はドイツのハンブルク地裁が2024年9月27日に出したものであり、事件の概要としては、判決の事実を記載した部分に書かれている事から明らかな様に、ドイツでAI学習用データを提供する非営利団体LAION(そのWikipediaも参照)をある写真の著作権者が訴えたものである。

 この判決は、その理由の最初の段落に以下の様に書かれている通り、本件のAI学習用データの提供について、より一般的なデータマイニングに関する権利制限を既定するドイツ著作権法第44b条に関する判断を避けながら、研究目的でのデータマイニングに関する権利制限を既定する第60d条に該当するとして、著作権侵害にならないとしたものである。(以下、いつも通り翻訳は全て拙訳。なお、以下の翻訳において引用は省略したので、元の原文を参照頂ければと思う。)

Die zulassige Klage hat in der Sache keinen Erfolg. Der Beklagte hat durch die Vervielfaltigung der streitgegenstandlichen Fotografie zwar in die Verwertungsrechte des Klagers eingegriffen. Dieser Eingriff ist aber durch die Schrankenregelung des §60d UrhG gedeckt. Ob sich der Beklagte erganzend auf die Schrankenregelung des §44b UrhG berufen kann, bedarf vor diesem Hintergrund keiner abschliessenden Beurteilung.

訴えは許されるが、その内容において成功しない。被告による本件写真の複製は確かに原告の複製権の対象となるものである。しかし、これは著作権法第66d条の権利制限によりカバーされているものである。被告が補足的に著作権法第44b条の権利制限に依拠できるかどうかについては、この背景において決定的な判断を必要としない。

 送信のための技術的な付随利用に関するドイツ著作権法第44a条に関するかなり無理筋な議論の部分は省略するが、ハンブルク地裁は、まず以下の様に述べ、一般的なデータマイニングに関する権利制限を既定する第44b条については、AI学習のためのデータの複製は基本的にデータマイニングの目的には合致するものの、本件においてウェブサイトに書かれていた文章に対して著作権者による留保の適用がないとは必ずしも言えないとしている。

Ob sich der Beklagte auf die Schrankenregelung des §44b UrhG berufen kann, erscheint im vorliegenden Fall durchaus als zweifelhaft. Zwar unterfallt der von dem Beklagten vorgenommene Download grundsatzlich der Schrankenregelung des §44b Abs. 2 UrhG, insbesondere erfolgte er zum Zwecke des Text und Data Mining im Sinne des §44b Abs. 1 UrhG (im Folgenden lit. a). Allerdings spricht - ohne dass dies vorliegend einer abschliessenden Entscheidung bedurfte - Einiges dafur, dass aufgrund eines wirksam erklarten Nutzungsvorbehalts im Sinne des §44b Abs. 3 die Vervielfaltigungshandlung nicht bereits nach §44b Abs. 2 UrhG zulassig war (im Folgenden lit. b).

...

Allerdings spricht einiges dafur, dass vorliegend die Schrankenregelung des §44b Abs. 2 UrhG - ohne dass dies einer abschliessenden Entscheidung bedurfte - nicht eingreift, da ein wirksam erklarter Nutzungsvorbehalts im Sinne von Abs. 3 der Vorschrift vorlag; insbesondere durfte der auf der Webseite B..com unstreitig erklarte Nutzungsvorbehalt wohl den Anforderungen an eine Maschinenlesbarkeit i.S.d. §44b Abs. 3 S. 2 UrhG genugen.

...

(4) Schliesslich durfte auch Einiges dafur sprechen, dass der Nutzungsvorbehalt den Anforderungen an eine Maschinenlesbarkeit i.S.d. §40b Abs. 3 S. 2 UrhG genugt.

...

Es ware zudem aus Sicht der Kammer ein gewisser Wertungswiderspruch, den Anbietern von KI-Modellen einerseits uber die Schranke in §44b Abs. 2 UrhG die Entwicklung immer leistungsfahigerer textverstehender und -kreierender KI-Modelle zu ermoglichen, ihnen aber andererseits im Rahmen der Schranken-Schranke von §44b Abs. 3 S. 2 UrhG die Anwendung bereits bestehender KI-Modelle nicht abzuverlangen.

Ob und in welchem Masse zum Zeitpunkt der streitgegenstandlichen Vervielfaltigungshandlung im Jahr 2021 eine ausreichende Technologie zur automatisierten inhaltlichen Erfassung des streitgegenstandlichen Nutzungsvorbehalts bereits zur Verfugung stand, ist zwar klagerseits bislang nicht dargetan; der Klager hat insoweit nur auf im Jahr 2023 verfugbare Dienste verwiesen (Replik S. 14 ff., Bl. 48 ff. d.A.). Allerdings bestehen Anzeichen dafur, dass der Beklagte bereits uber geeignete Technologie verfugte. Denn nach eigenem Vortrag des Beklagten erforderte die im Rahmen der Erstellung des Datensatzes L. durchgefuhrte Analyse in Form eines Abgleichs von Bildinhalten mit vorbestehenden Bildbeschreibungen ersichtlich auch und gerade eine inhaltliche Erfassung dieser Bildbeschreibungen durch die eingesetzte Software. Vor diesem Hintergrund spricht einiges dafur, dass - insbesondere auch dem Beklagten - bereits im Jahr 2021 Systeme zur Verfugung standen, die in der Lage waren, einen in naturlicher Sprache formulierten Nutzungsvorbehalt in automatisierter Weise zu erfassen.

被告が著作権法第44b条の権利制限に依拠できるかどうか、本件において疑義なしとしない。確かに被告によりなされたダウンロードは基本に著作権法第44b条第2項の権利制限に該当し、それは特に著作権法第44b条第1項の意味におけるテキスト及びデータマイニングの目的でなされている。しかしながら、-本件において決定的な判断を必要とするものではないが-幾つかの事は、第44b条第3項の意味における有効に宣言された利用の留保に基づき、著作権法第44b条第2項による複製が許されないという事に肯定的であると言える。

(略)

しかしながら、-これは決定的な判断を必要とするものではないが-幾つかの事は、本件においては著作権法第44b条第2項の権利制限に基づく事ができないとする事に肯定的であると言え、そこで同条第3項の意味における有効に宣言された利用の留保があるとも言える。特に、争いなくウェブサイトB..com上で宣言された利用の留保が著作権法第44条第2項第2文の意味における機械可読性の要件を十分満たすという事があり得る。

(略)

(4)最後に、幾つかの事は、その利用の保留は著作権法第40b条第3項第2文の意味における機械可読性の要件を満たすという事に肯定的であると言える。

(略)

当裁判所の見地では、一方でAIモデルの提供者に著作権法第44b条第2項の権利制限に基づき常により効率的に文章を理解し、生成するAIモデルの開発が可能となっている事と、他方で著作権法第44b条第3項第2文の権利制限の制限において既に存在しているAIモデルの適用を求めない事は本質的に相反するものではないかと見える。

2021年の本件複製行為の時点で本件利用の留保の自動的な内容の把握のための十分な技術が入手可能であったのか及びどの程度そのような事ができたのかは確かに今までの所原告側から示されていない。原告は今の所2023年において入手可能なサービスを示しているのみである。しかしながら、被告が既に十分な技術を入手できていた事を示す気配は存在している。そうであるならば、被告の主張の様に、データセットL.の作成において実行される分析において、画像の内容とその前にある画像の説明との照合の中で、明確にまた正しくこの画像の説明の内容の把握を、導入したソフトウェアにより行う事は求められたであろう。この様な背景の下、幾つかの事は、-特に被告においても-自然言語により書かれた利用の留保を自動的に把握する事が可能なシステムは既に2021年に入手可能であったという事に肯定的であると言える。

 そして、最後に、ハンブルク地裁は、以下の様に述べ、本件の様な非営利・無償のAI学習データの提供は、研究目的でのデータマイニングの権利制限に該当するものであり、著作権侵害にならないとの結論を導いている。

Danach kann - entgegen der Auffassung des Klagers - auch bereits die Erstellung eines Datensatzes der streitgegenstandlichen Art, der Grundlage fur das Trainieren von KI-Systemen sein kann, durchaus als wissenschaftliche Forschung im vorstehenden Sinne anzusehen sein. Zwar mag die Erstellung des Datensatzes als solche noch nicht mit einem Erkenntnisgewinn verbunden sein; sie ist aber grundlegender Arbeitsschritt mit dem Ziel, den Datensatz zum Zwecke spateren Erkenntnisgewinns einzusetzen. Dass eine solche Zielsetzung auch im vorliegenden Fall bestand, kann bejaht werden. Dafur genugt es, dass der Datensatz - unstreitig - kostenfrei veroffentlicht und damit gerade (auch) auf dem Gebiet kunstlicher neuronaler Netze Forschenden zur Verfugung gestellt wurde. Ob der Datensatz - wie es der Klager hinsichtlich der Dienste DALL-E 2 und MidJourney behauptet - daneben auch von kommerziellen Unternehmen zum Training bzw. zur Weiterentwicklung ihrer KI-Systeme genutzt wird, ist schon deshalb unerheblich, weil auch die Forschung kommerzieller Unternehmen noch Forschung - wenn auch nicht als solche nach §§60c f. UrhG privilegiert - ist.

...

Die nicht-kommerzielle Zweckverfolgung des Beklagten in Bezug auf die streitgegenstandliche Erstellung des Datensatzes L. ergibt sich dabei bereits daraus, dass der Beklagte diesen unstreitig kostenfrei offentlich zur Verfugung stellt. Dass die Entwicklung des streitgegenstandlichen Datensatzes daruber hinaus zumindest auch der Entwicklung eines eigenen kommerziellen Angebots des Beklagten dienen wurde (vgl. zu diesem Kriterium BeckOK IT-Recht/Paul, 14. Ed. 1.4.2024, UrhG §60d Rn. 10), ist weder klagerseits vorgetragen noch sonst ersichtlich. Dass der streitgegenstandliche Datensatz auch von kommerziell tatigen Unternehmen zum Training bzw. zur Weiterentwicklung ihrer KI-Systeme genutzt werden mag, ist fur die Einordnung der Tatigkeit des Beklagten hingegen ohne Relevanz. Allein der Umstand, dass einzelne Mitglieder des Beklagten neben ihrer Tatigkeit fur den Verein auch bezahlten Tatigkeiten bei solchen Unternehmen nachgehen, genugt nicht, die Tatigkeit dieser Unternehmen dem Beklagten als eigene zuzurechnen.

この事から、-原告の主張に反し-既に本件のやり方によるデータセットの作成は、AIシステムの学習の基礎となり得るものであり、そこから主要な意味において研究と見る事ができる。確かにデータセットの作成それ自体はなお知見の獲得と結びつくとは限らないものである。しかし、それは後の知見の獲得の目的でデータセットを導入するという目標において基礎となる作業工程である。本件においてもこの様な目標設定がある事を認める事ができる。その事について、データセットが-争いなく-無償で公開され、それにより正しく人工ニューラルネットワークの領域において(も)研究者に提供されている事で十分である。データセットが-原告がDALL-EやMidJourneyのサービスに関して主張している様に-それと並んで営利企業によってもそのAIシステムのさらなる開発のための学習に場合により使われるかどうかは、-それ自体著作権法第60c条、第60f条(訳注:研究のための権利制限に関する条項と美術館等のための権利制限に関する条項)により特別な権限を与えられていない場合でも-商業的企業の研究もまた研究であるから、特に問題とならない。

(略)

本件データセットL.の作成に関する被告の非営利の目的追求は、被告は争いなく無償で一般にそれを提供している事から既に十分見て取れる。本件データセットの開発がそれを超えて少なくとも被告自身の商業的提供の開発のためにも利用されている事は、原告側から主張されておらず、他にそうと見える事もない。本件データセットが商業的に活動する企業によってそのAIシステムのさらなる開発のために場合により利用され得る事は、被告の活動に関する位置づけに関係しない。被告の個々の構成員が団体のための活動と並行してその様な企業において給付を受ける活動にも従事している事だけでは、これらの企業の活動が被告自身のものとして考えられるのに十分でない。

 ドイツの裁判所が、上の翻訳では省略したが欧州新著作権指令とそれに基づくドイツ著作権法改正の立法経緯なども踏まえ、AI学習のための複製が基本的にデータマイニングの権利制限に当たるとしているのはある意味当然の事であり、最終的に、非営利でのAI学習データの提供に対して留保なく認められる研究目的のデータマイニングに関する権利制限の適用が認められるとしているのも妥当な事だろう。(欧州新著作権指令とAIの関係に関しては第481回参照。今のドイツ著作権法の権利制限もこの欧州新著作権指令に沿って書かれている。)

 しかし、私が見る所、その事について決定的な判断をしているとい事はないものの、ウェブサイトに書かれた著作権の留保についても自然言語処理によって自動的に判断ができたであろうというこの判決の傍論は根拠が薄弱であって、かなり乱暴である。ドイツの裁判所としてはAIと著作権の関係について厳しい事も言っておきたかったのではないかと思い、技術的に対応可能ならそうした方が良いのもその通りだろうとも思うが、如何なる形でも書かれ得る著作権の留保について正しく判断する自然言語処理が現実的に可能なのか、今現在のAI技術でもかなり怪しいのではないだろうか。

 これはAIとの関係で欧州新著作権指令及びドイツの著作権法のデータマイニングに関する権利制限の解釈を示したドイツで初の、恐らくヨーロッパでも初の判決であり、非常に興味深いものと思うが、まだドイツで1つ地裁判決が出されたに過ぎない。ヨーロッパにおいては、今後も、AI学習のための著作物の利用がどこまで可能かという事について各国法の権利制限とその元となった欧州新著作権指令との関係が必ず問題となるであろうし、この判決でも言われている様に、機械可読な著作権の留保とは何かという事などが争われて行く事だろう。この事件か他の事件によるかは不明だが、いずれどこかで欧州司法裁判所への質問付託がされ、何らかの統一的解釈が示される事になるのではないかと思うが、それまでかなりの時間を要するのではないかと私は見ている。

(2024年11月16日の追記:判決を読む上でこれもあった方が良いかと思ったので、今のドイツ著作権法のテキスト及びデータマイニングに関する権利制限を規定する第44b条と第60d条を以下に訳出しておく。上で欧州新著作権指令との関係で書いた通りだが、このドイツの権利制限は、第382回で取り上げた2017年のドイツ著作権法改正で最初導入された後、第430回でも書いた通り、欧州新著作権指令への対応としてパロディに関する権利制限などとともに今の形に書き改められたものである。

§44b Text und Data Mining

(1) Text und Data Mining ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere uber Muster, Trends und Korrelationen zu gewinnen.

(2) Zulassig sind Vervielfaltigungen von rechtmasig zuganglichen Werken fur das Text und Data Mining. Die Vervielfaltigungen sind zu loschen, wenn sie fur das Text und Data Mining nicht mehr erforderlich sind.

(3) Nutzungen nach Absatz 2 Satz 1 sind nur zulassig, wenn der Rechtsinhaber sich diese nicht vorbehalten hat. Ein Nutzungsvorbehalt bei online zuganglichen Werken ist nur dann wirksam, wenn er in maschinenlesbarer Form erfolgt.

§60d Text und Data Mining fur Zwecke der wissenschaftlichen Forschung

(1) Vervielfaltigungen fur Text und Data Mining (§ 44b Absatz 1 und 2 Satz 1) sind fur Zwecke der wissenschaftlichen Forschung nach Massgabe der nachfolgenden Bestimmungen zulassig.

(2) Zu Vervielfaltigungen berechtigt sind Forschungsorganisationen. Forschungsorganisationen sind Hochschulen, Forschungsinstitute oder sonstige Einrichtungen, die wissenschaftliche Forschung betreiben, sofern sie
1. nicht kommerzielle Zwecke verfolgen,
2. samtliche Gewinne in die wissenschaftliche Forschung reinvestieren oder
3. im Rahmen eines staatlich anerkannten Auftrags im offentlichen Interesse tatig sind.

Nicht nach Satz 1 berechtigt sind Forschungsorganisationen, die mit einem privaten Unternehmen zusammenarbeiten, das einen bestimmenden Einfluss auf die Forschungsorganisation und einen bevorzugten Zugang zu den Ergebnissen der wissenschaftlichen Forschung hat.

(3) Zu Vervielfaltigungen berechtigt sind ferner
1. Bibliotheken und Museen, sofern sie offentlich zuganglich sind, sowie Archive und Einrichtungen im Bereich des Film- oder Tonerbes (Kulturerbe-Einrichtungen),
2. einzelne Forscher, sofern sie nicht kommerzielle Zwecke verfolgen.

(4) Berechtigte nach den Absatzen 2 und 3, die nicht kommerzielle Zwecke verfolgen, durfen Vervielfaltigungen nach Absatz 1 folgenden Personen offentlich zuganglich machen:
1. einem bestimmt abgegrenzten Kreis von Personen fur deren gemeinsame wissenschaftliche Forschung sowie
2. einzelnen Dritten zur Uberprufung der Qualitat wissenschaftlicher Forschung.

Sobald die gemeinsame wissenschaftliche Forschung oder die Uberprufung der Qualitat wissenschaftlicher Forschung abgeschlossen ist, ist die offentliche Zuganglichmachung zu beenden.

(5) Berechtigte nach den Absatzen 2 und 3 Nummer 1 durfen Vervielfaltigungen nach Absatz 1 mit angemessenen Sicherheitsvorkehrungen gegen unbefugte Benutzung aufbewahren, solange sie fur Zwecke der wissenschaftlichen Forschung oder zur Uberprufung wissenschaftlicher Erkenntnisse erforderlich sind.

(6) Rechtsinhaber sind befugt, erforderliche Massnahmen zu ergreifen, um zu verhindern, dass die Sicherheit und Integritat ihrer Netze und Datenbanken durch Vervielfaltigungen nach Absatz 1 gefahrdet werden.

第44b条 テキスト及びデータマイニング

第1項 テキスト及びデータマイニングとは、そこから情報、特にパターン、傾向及び相関に関するものを得るために個々の又は複数のデジタル又はデジタル化された著作物の自動化された分析の事である。

第2項 適法に入手可能とされた著作物のテキスト及びデータマイニングのための複製は許される。テキスト及びデータマイニングのためにもはや必要でなくなったとき、複製は消去されなくてはならない。

第3項 第2項第1文による利用は、権利者がそれを留保していない場合のみ許される。オンラインで入手可能とされた著作物における利用の留保は、機械可読な形式でなされた場合のみ有効である。

第60d条 研究目的のためのテキスト及びデータマイニング

第1項 テキスト及びデータマイニングのための複製(第44b条第1項及び第2項第1文)は次の条件により研究目的のために許される。

第2項 研究機関は複製する権限を有する。研究機関とは高等教育機関、研究所又は研究に従事するその他の機関、ただし、次のものに限られる
第1号 非商業的目的を追求するものであるか、
第2号 全収益を研究に再投資するものであるか又は
第3号 国によって認められた任務の範囲内で公益のための活動をしているもの。

その研究機関に特定の影響を持ち、研究成果に対して有利なアクセスを有する私企業と協業する研究機関は第1文による権限を有しない。

第3項 さらに次のものも複製する権限を有する
第1号 公衆にアクセス可能である図書館及び博物館並びに映像音声遺産の領域における文書館及び機関(文化遺産機関)、
第2号 非商業的目的を追求する個々の研究者

第4項 非商業的目的を追求する、第2項及び第3項により権限を有する者は第1項による複製を次の者に公開する事ができる:
第1号 その共同研究のための特定の限定された人の集団
第2号 研究の品質を評価する個々の第三者。

共同研究又は品質の評価が終わるとすぐに公開は終了しなければならない。

第5項 第2項及び第3項第1号により権限を有する者は、研究目的のため又は研究の知見の確認のために必要となる限りにおいて、正当でない利用に対する適切なセキュリティ措置とともに第1項による複製を保持する事が許される。

第6項 著作権者は第1項による複製によりそのネットワーク及びデータベースのセキュリティ及び完全性が危うくされる事を抑止するために必要な手段を取る権限を有する。

| | コメント (0)

«第503回:主要政党の2024年衆院選公約案比較(知財政策・情報・表現規制関連)