第481回:欧州連合のAI法案(欧州議会可決版の知的財産関連部分)、生成AIと2019年の欧州新著作権指令の関係
今回は、今後の日本のAIに関する検討でも何かと参照されるだろう、欧州連合(EU)の人口知能(AI)法案、生成AIと2019年の欧州新著作権指令の関係について取り上げる。
(1)欧州連合のAI法案(欧州議会可決版の知的財産関連部分)
そのリリースにある通り、先月6月14日に欧州議会が欧州委員会提案のAI法案を修正して可決した。
EUの場合、欧州議会で可決されたからと言って直ちに成立するという事はなく、欧州の最上位機関である欧州理事会と協議して最終的な条文を決める事になるので、本当の意味でEU規則すなわち法律として成立・公布・施行されるまでにはもうしばらく掛かるののだが、AIを包括的に規制しようとする法案としては恐らく世界の主要国(連合)で初めてのものであり、このタイミングでその内容を見ておく。
欧州委員会HPのAIに対するアプローチに書かれている通り、EUでのAIに関する検討は2018年位から始まり、2021年4月に欧州委員会がAI規則案を提案し、2022年12月に欧州理事会が規則案に対する意見を出し、この2023年6月に欧州議会で可決されたというのがこのAI規則案に対する経緯の概要となる。
なお、このAI規則は最終的に成立すれば規則なのでEU加盟国による国内法制化なしに直接EU法として適用されるが、これとは別に、国内法制化が必要な指令案として、2022年9月に欧州委員会がAIの責任に関する指令案も提案している。
ここでは、このAI法案も含め欧州におけると知的財産の関係に特にフォーカスして話をしたいと思っているが、最初に書いておくと、このAI法案で知的財産に直接的に言及している箇所は少ない。
2021年4月の欧州委員会提案版AI法案は、第1編の一般規定で、AIなどについて定義し、第2編の禁止されるAI運用で、一般的な人の信用評価や遠隔での人の特定などへのAI利用を禁止し、第3編の高リスクAIシステムで、高リスクAIシステムに分類されるものに対してデータガバナンスや透明性などを求め、第4編のAIシステムに対する透明性に関する義務で、利用者は生成したディープフェイクについてAI生成物である事を開示しなくてはならないなどの透明性に関する一般的な義務を規定し、第5編のイノベーションに対するサポート措置で、事前テストのためにAI規制サンドボックスを作るとし、第6編のガバナンスで、EU規制当局などの体制を規定し、第7編のスタンドアローン高リスクAIシステムに関するEUデータベースで、高リスクAIシステムに関するデータベースを作るとし、第8編の市場モニタリングで、当局によるモニタリングや情報共有について規定し、第9編の行動規範で、行動規範の作成を促すとし、第10編の機密情報と罰則で、機密情報の取り扱いに注意すべき事や罰則について規定し、第11編の権限の移譲等で、欧州委員会の権限について規定し、第12編の最終規定で、規則の適用などについて規定する。
この章立てとその概要からも分かる通り、この欧州委員会提案版のAI法案は、付録Ⅲで人の特定、主要インフラ、教育訓練、人事、政府機関などに利用されるものと定義される、高リスクAIシステムに比較的強い規制を及ぼそうとする事が主眼で、条文上は第10編の第70条に規制当局が扱う情報に関して知的財産を守るべきという記載が一応あるが、AIと知的財産の関係に関して、何か直接的な言及があるという事はなく、提案趣旨の所で、2020年11月の欧州議会のAI技術の開発と知的財産に関する報告(バランスの取れたアプローチが必要とする一般的なもの)があるという事や、透明性の向上は知的財産の保護にも役立つであろう事を述べているに留まる。
2022年10月の欧州理事会意見の修正提案版(pdf)では、第IA章として一般目的AIシステムに関する規定を追加するべきとしており、その第4b条第5項で一般目的AIシステムのプロバイダーは互いに必要な情報共有をするべきと、この情報共有において知的財産を守るべきとしているが、これもAIと知的財産の関係に関して直接的に何か言おうとするものではない。
そして、2023年6月の欧州議会修正可決版のポイントは、そのリリースにもある通り、人の特定に使われるAIについて規制される類型を広げ、規制対象となる高リスクAIについて大きなソーシャルメディアプラットフォームで利用されるものなども含まれる事を明確化し、生成AIなどの一般目的AIに対する義務を明記したという事になるだろう。
この欧州議会版で、AIと知的財産権の関係で特に注目すべきは、様々な議論の盛り上がりを受けたためだろう、前文28aにおいて影響を受ける権利として知的財産権もあげ、前文60aにおいて生成AIと著作権の問題について注視すべきと述べ、以下の様に、基本モデルプロバイダーの規制に関する新規の第28b条の第4項で、著作物の利用に関する概要を公衆に開示するべきとしている点である。(以下、翻訳は全ていつも通り拙訳である。なお、それ以外に、前文60、79、83、第28条第2b項、第61条第2項、第64条第2項、付録Ⅶの4.5でも、情報開示、当局による調査等との関係で知的財産を守るべきとの明示的な記載が追加されているという事もあるにはあるが、これらは前のもの同様にAIと知的財産の関係に関して直接的に何か言おうとするものではない。)
Article 28b Obligations of the provider of a foundation model
...
4. Providers of foundation models used in AI systems specifically intended to generate, with varying levels of autonomy, content such as complex text, images, audio, or video ("generative AI") and providers who specialise a foundation model into a generative AI system, shall in addition
a) comply with the transparency obligations outlined in Article 52 (1),
b) train, and where applicable, design and develop the foundation model in such a way as to ensure adequate safeguards against the generation of content in breach of Union law in line with the generally-acknowledged state of the art, and without prejudice to fundamental rights, including the freedom of expression,
c) without prejudice to Union or national or Union legislation on copyright, document and make publicly available a sufficiently detailed summary of the use of training data protected under copyright law.第28b条 基本モデルプロバイダーの義務
(第1項~第3項:略(基本モデルプロバイダーはリスクを考慮して設計を行い、技術文書を保存する事が求められる事などを規定)。)
第4項 様々な自動化のレベルで、複雑な文章、画像、音声又は映像等のコンテンツを生成する事を特に目的とするAIシステム(「生成AI」)で使われる基本モデルのプロバイダー及び基本モデルを生成AIシステムに特化するプロバイダーは、さらに、以下の事をしなければならない
a)第52条第1項に述べられる透明性に関する義務を果たす事、
b)一般的に認められる技術水準に合わせ、かつ、表現の自由を含む基本的な権利に影響を与える事なく、EU法に違反するコンテンツの生成に対する適切な防止を確保する様な形で基本モデルを学習させ、可能な場合、設計し、開発する事、
c)著作権に関する国内又はEU法に影響を与える事なく、著作権法によって保護される学習データの利用に関する十分詳細な概要を文書化し、公衆に入手可能とする事。
合わせて、ディープフェイクについてAI生成物である事を開示しなくてはならない事を規定する第52条の例外に関する第3a項でも著作権に関する表示は必要な範囲でなされるべき事が書かれている。
Article 52 Transparency obligations
...
3a. Paragraph 3 shall not apply where the use of an AI system that generates or manipulates text, audio or visual content is authorized by law or if it is necessary for the exercise of the right to freedom of expression and the right to freedom of the arts and sciences guaranteed in the Charter of Fundamental Rights of the EU, and subject to appropriate safeguards for the rights and freedoms of third parties. Where the content forms part of an evidently creative, satirical, artistic or fictional cinematographic, video games visuals and analogous work or programme, transparency obligations set out in paragraph 3 are limited to disclosing of the existence of such generated or manipulated content in an appropriate clear and visible manner that does not hamper the display of the work and disclosing the applicable copyrights, where relevant. It shall also not prevent law enforcement authorities from using AI systems intended to detect deep fakes and prevent, investigate and prosecute criminal offences linked with their use
第52条 透明性に関する義務
(第1項~第3項:略(プロバイダーは提供しているものがAIである事を知らせなくてはならない事等を規定)。)
第3a項 文章、音声又は映像コンテンツを生成又は加工するAIシステムの利用が法によって認められているか、第3者の権利及び自由を適切に保護しつつ、EUの基本権憲章によって保障されている表現の自由に関する権利並びに芸術及び科学に関する権利を行使するのに必要なとき、第3項(訳注:利用者はディープフェイクについてAI生成物である事を開示しなくてはならない事を規定する条項)は適用されない。コンテンツが明らかに創造的な、風刺の、芸術的な又は架空の映画、ビデオゲーム、映像又はその他の類似の著作物又はプログラムの一部を構成する場合、第3項に規定される透明性に関する義務は、著作物の表示の妨げとならない明確で目に見える適切な形での、その様な生成又は加工コンテンツの存在の開示及び、関係する場合、適用される著作権の開示に限定される。これは法執行当局にディープフェイクを検知し、その利用と結びついた犯罪を防止し、調査し、訴追する事を目的とするAIシステムを利用する事を妨げるものではない。
ここで、AIの定義規定も一緒に訳出しておくと以下の様になる。
Article 3 Definitions
For the purpose of this Regulation, the following definitions apply:
(1) ''artificial intelligence system' (AI system) means a machine-based system that is designed to operate with varying levels of autonomy and that can, for explicit or implicit objectives, generate outputs such as predictions, recommendations, or decisions, that influence physical or virtual environments;
...
(1c) 'foundation model' means an AI system model that is trained on broad data at scale, is designed for generality of output, and can be adapted to a wide range of distinctive tasks;
(1d) 'general purpose AI system' means an AI system that can be used in and adapted to a wide range of applications for which it was not intentionally and specifically designed;
...
第3条 定義
本規則の目的のため、以下の定義が適用される:
(1)「人工知能システム」(AIシステム)とは、様々な自動化のレベルで動作するよう設計され、明示の又は暗黙の目的のために、物理的な又は仮想の環境に影響を与える、予想、提案、決定の様な出力を生成する事ができる機械に基づくシステムを意味する。
((1a)、(1b):略(リスクに関する定義規定)。)
(1c)「基本モデル」とは、大規模な広いデータにより学習が行われ、一般的な出力のために設計され、広い範囲の特徴的なタスクに適用される事ができるAIシステムモデルを意味する。
(1d)「一般目的AI」とは、そのために意図的にかつ特別に設計されたものでない広い範囲の応用に使われ、適用される事ができるAIシステムを意味する。
(略)
この様な定義も合わせて考えると、この欧州議会可決版の条文に従うと、今現在、広く生成AIと呼ばれているものに用いられる機械学習モデルを提供する者に「著作権法によって保護される学習データの利用に関する十分詳細な概要」を公開する義務が課される事になる。
しかし、まず、この事はAIに用いられる機械学習への著作物の利用が著作権侵害となると言う様なものでは全くない。
次に、「十分詳細な概要」とは何かという事があり、意図としては利用した個々の著作物の明示が望ましいと考えているのではないかと思うが、大量のデータによる学習を前提とする機械学習でその様な事はおよそ現実的ではないので、どこかで現実的な線が引かれる事になるだろう。
まだEUの機関の間での協議が残っており、最終的な条文がどうなるかは分からないが、学習に利用した著作物の概要の公開義務が残って何年か後に施行されたとしても、各AIサービス提供者がそれぞれ適法にアクセス可能なインターネット上の著作物を用いて機械学習を行っているという程度の事を公開するだけで終わり、大して意味のある結果をもたらす事はないのではないかと私は見ている(その程度の事であれば既に公開している所もあるし、たとえ公開しなくてもそうしているだろう事は誰でも分かる事である)。
このEUの新AI法案について、報道などで著作権に関する情報開示が取沙汰される事もあるが、上で書いた様に、著作権との関係は少ないと、その主眼は人の特定などに用いられる高リスクAIの規制、AIによる偽情報作成への対策などにあると言って良いだろう。
(2)生成AIと2019年の欧州新著作権指令の関係
したがって、最近話題になっている生成AIと著作権の問題で、欧州においてより考えるべきは、2019年の欧州新著作権指令に含まれるテキスト及びデータマイニングに関する権利制限との関係であると私は考えている。
この欧州指令第2019/790号については、第368回でリーク条文案を、第408回と第459回でアップロードフィルタ等とその後の欧州司法裁の判決について取り上げているが、テキスト及びデータマイニングの権利制限に関する部分は翻訳していなかったので、まず、定義と合わせ以下に訳出する。(なお、この権利制限とは関係ないので、今回はひとまずおくが、欧州委員会の2023年2月のリリースにある通り、一部の加盟国で国内法制化がなお遅れているなど、上でリンクを張った各回でも書いた通り、この欧州新著作権指令自体かなり問題があると思われるものである。)
Article 2 Definitions
For the purposes of this Directive, the following definitions apply:
...
(2) 'text and data mining' means any automated analytical technique aimed at analysing text and data in digital form in order to generate information which includes but is not limited to patterns, trends and correlations;
...
Article 3 Text and data mining for the purposes of scientific research
1. Member States shall provide for an exception to the rights provided for in Article 5(a) and Article 7(1) of Directive 96/9/EC, Article 2 of Directive 2001/29/EC, and Article 15(1) of this Directive for reproductions and extractions made by research organisations and cultural heritage institutions in order to carry out, for the purposes of scientific research, text and data mining of works or other subject matter to which they have lawful access.
2. Copies of works or other subject matter made in compliance with paragraph 1 shall be stored with an appropriate level of security and may be retained for the purposes of scientific research, including for the verification of research results.
3. Rightholders shall be allowed to apply measures to ensure the security and integrity of the networks and databases where the works or other subject matter are hosted. Such measures shall not go beyond what is necessary to achieve that objective.
4. Member States shall encourage rightholders, research organisations and cultural heritage institutions to define commonly agreed best practices concerning the application of the obligation and of the measures referred to in paragraphs 2 and 3 respectively.
Article 4 Exception or limitation for text and data mining
1. Member States shall provide for an exception or limitation to the rights provided for in Article 5(a) and Article 7(1) of Directive 96/9/EC, Article 2 of Directive 2001/29/EC, Article 4(1)(a) and (b) of Directive 2009/24/EC and Article 15(1) of this Directive for reproductions and extractions of lawfully accessible works and other subject matter for the purposes of text and data mining.
2. Reproductions and extractions made pursuant to paragraph 1 may be retained for as long as is necessary for the purposes of text and data mining.
3. The exception or limitation provided for in paragraph 1 shall apply on condition that the use of works and other subject matter referred to in that paragraph has not been expressly reserved by their rightholders in an appropriate manner, such as machine-readable means in the case of content made publicly available online.
4. This Article shall not affect the application of Article 3 of this Directive.
第2条 定義
本規則の目的のため、以下の定義が適用される:
(略)
(2)「テキスト及びデータマイニング」とは、パターン、傾向及び相関を含むがこれらに限られない情報を生成するためにデジタル形式のテキスト及びデータを分析する事を目的とするあらゆる自動分析技術を意味する;
(略)
第3条 科学研究目的のためのテキスト及びデータマイニング
第1項 加盟国は、適法なアクセスを有する著作物又はその他の対象のテキスト及びデータマイニングを実行する、研究機関及び文化遺産機関によってなされる複製及び抽出のため、欧州指令第96/9号の第5条(a)及び第7条第1項、欧州指令第2001/29号の第2条並びに本指令の第15条第1項に規定された権利に対する例外を規定しなければならない。
第2項 第1項に合致してなされた著作物又はその他の対象の複製は、適切なセキュリティレベルで蓄積されなくてはならない、また、研究結果の検証を含む科学研究目的のために保持される事ができる。
第3項 権利者には、著作物又はその他の対象がホストされたネットワーク及びデータベースの安全性及び完全性を確保するための措置を適用することが許されなければならない。このような措置はその目的を達成するために必要なことを超えてはならない。
第4項 加盟国は、権利者、研究機関及び文化遺産機関が第2項及び第3項のそれぞれに記載された義務及び措置の適用に関して共同で合意されるベストプラクティスを定めるよう促進しなければならない。
第4条 テキスト及びデータマイニングのための例外又は制限
第1項 加盟国は、テキスト及びデータマイニングの目的のための適法にアクセス可能な著作物又はその他の対象の複製及び抽出のため、欧州指令第96/9号の第5条(a)及び第7条第1項、欧州指令第2001/29号の第2条、欧州指令第2009/24号の第4条第1項(a)及び(b)並びに本指令の第15条第1項に規定された権利に対する例外又は制限を規定しなければならない。
第2項 第1項に従ってなされた複製及び抽出は、テキスト及びデータマイニングの目的に必要な限りにおいて保持される事ができる。
第3項 第1項に規定される例外又は制限は、その項に記載される著作物及びその他の対象の利用が、オンラインで公衆に入手可能とされたコンテンツの場合機械的に読む事が可能な手段による様に、適切なやり方でその権利者により明示的に留保されていないという条件で適用されなくてはならない。
第4項 本条は本指令の第3条の適用に影響を与えない。
ここで、この欧州著作権指令が明示的にAIについて言及しているという事はないが、第2条のテキスト及びデータマイニング定義で生成情報に対する限定がされているという事はなく、情報を生成するために用いられるあらゆる自動分析技術を意味するとされているので、いわゆる生成AIをも十分カバーするものとなっている。
また、このテキスト及びデータマイニングのための例外又は制限に関する規定は、研究目的の第3条とその他の一般目的の第4条で微妙な書き分けがされているが、一般目的の方を見ても、情報を生成するための自動分析技術である生成AIの学習のために適法にアクセス可能な著作物を複製及び抽出して用いる事は権利制限の範囲内でできると考えられる。
生成AIと日本の非享受目的利用の権利制限の関係については第477回で書いたが、日本の権利制限と比べた時に、欧州新著作権指令の権利制限においては、条文上、適法アクセスについて明記されている事と、権利者側からの明示による留保が可能であるとされている事が主な違いとなる。
この様に適法アクセスについて明記される事により、違法にアップロードされている著作物を複製して学習に用いる事などは除外されるだろうが、ビジネスとしてAIサービスの提供を行う者であれば、訴訟になった時のリスク回避は当然考えるので、明らかな違法サイトまで含めてインターネット上のあらゆるデータを集めて学習に用いるとは私にはちょっと思えない。特に問題となるのは適法か違法か分からない場合だろうが、その様な場合まで除外されるとするとこの権利制限の意味がほぼなくなるので、この規定は学習に用いる前にあらゆるデータの適法違法をあらかじめ確認しろというものではなく、明らかな違法著作物は除くべきという当然の事を言っているに過ぎないだろう。
また、権利者側の留保についても、EU法でこの様な留保が可能とされている事自体あまり知られていない上、どのようにすれば良いのかという問題があり、本当に機械的に自動処理可能な統一された留保の記載方法がある訳ではなく、ほぼ全ての場合で留保されていないと見えるか、留保されているかどうか分からないという事になり、この留保が使われて機能する事は非常に少ないだろう。
これらの点について、著作物が公開されるプラットフォームの利用規約やアクセス方法との関係も出て来るので、単純化して考える事は難しいが、日本の非享受目的のための権利制限が利用著作物の適法性を問題にしておらず、留保についても明記していないにしても、もし具体的なケースにおいて明らかに除外可能な違法著作物の利用や機械的に自動処理可能な留保が実際に持ち出される事があれば、権利制限の目的等との関係でその取り扱いはかなり微妙な問題となり得るものである。
すなわち、日本の非享受目的の権利制限が広いと言われる事があり、それは確かに欧州指令の1つの権利制限と比べた時に必ずしも間違いではないが、生成AIとの関係で考えた時に、欧州指令におけるテキスト及びデータマイニングに関する権利制限も実質的には日本とほぼ同様であって十分に広く、インターネット上で適法にアクセス可能な著作物を用いる様な通常想定される場合において、生成AIの学習のための著作物の利用が権利侵害にはなるとは考え難いというのが私の見る所の現状の整理である。
最後に、AI生成物と著作権侵害の関係についても言及しておくと、欧州各国でAI生成物による著作権侵害が争われたケースはまだないと思うので、具体的な判決などに基づいて言う事はできないが、これも日本と同様であって、AIサービスの利用者が既存の著作物と十分類似する生成物を公衆提供した場合まで、テキスト及びデータマイニングの権利制限が適用されるなどという事はなく、当然の様に著作権侵害を問われる事になるだろう。
ただし、最終的にはEU法とこれに対応する各国著作権法の解釈は欧州司法裁と各国の裁判所が実際の事件において示す事になるだろうと思うので、まだかなりの時間が掛かると思うが、今後関係する判決が出されたら、ここでも紹介して行きたいと思っている。
(2023年10月29日の追記:1箇所繰り返しの誤記があったので修正した(「、、」→「、」)。)
(2024年11月10日の追記:翻訳で条文のタイトルを太字にし忘れていたのを直した。)
最近のコメント