第477回:生成AI(人工知能)と日本の著作権法
既にいろいろと書かれている中でどうしようかと思ったが、昨今の議論の盛り上がりから考えて、ネット上にもう1つ記事があっても良いかと思うので、生成AIと日本の著作権法の関係について私なりのまとめを書いておく。
そもそもの話をすれば、AI、人工知能という言い方や定義自体についても問題があると思っているが、ここではその事はひとまずおいておき、生成AIとは、大量の計算リソースを使う機械学習を用いたものであって、利用者側の簡単な指示の入力によって対応する文章や画像などの出力が可能なサービスの事を指すものと考えて以下整理して行く。(これは最近特に話題になっているChatGPT(Wiki参照)やStable Diffusion(Wiki参照)などの生成AIサービスの事と思ってもらって差し支えない。)
生成AIと著作権法の関係の問題は多岐に渡るが、大きく分ければ、(1)機械学習における著作物の利用とAIサービスの提供というサービス提供側の話と、(2)利用者による入力結果のAI生成物の利用という利用者側の話の2つに分けられるので、それぞれについて、日本の現行の著作権法上どう考えられるかを見て行く。
(1)機械学習における著作物の利用とAIサービスの提供
おそらく各個別の権利制限の利用に特化したサービスがあれば、それぞれの権利制限の適用も考えなければならないと思うが、今ここで対象とする文章や画像などを出力する生成AIサービスについて、一般的に適用可能と考えられるのが以下の著作権法第30条の4である。
(著作物に表現された思想又は感情の享受を目的としない利用)
第三十条の四 著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
一 著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合
二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。)の用に供する場合
三 前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機による情報処理の過程における利用その他の利用(プログラムの著作物にあつては、当該著作物の電子計算機における実行を除く。)に供する場合
これは、いわゆる日本版フェアユース議論の結果として2018年の法改正によって導入されたものであり、私自身は完全なフェアユース条項として評価していないが、各号は例示であって閉じた選択形式になっておらず、「著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合」に対して一般的に適用可能であり、元の著作物そのものの享受を目的としない限り著作物の利用が可能であり、利用する著作物の量や適法性の確認、サービスの営利非営利などが条件になっているという事もない。(当時の議論の結果としての法改正条文について、第389回参照。)
この第30条の4の権利制限の適用を直接的に争った判例はないので、具体的な解釈が司法判断により示されているという事はないが、法改正議論の際の2017年の文化審議会著作権分科会報告書(pdf)で、既に、人工知能の様な新技術のイノベーション促進の必要性について言及され、権利制限が必要な類型として大量の原文と翻訳文の蓄積をしなければならない機械翻訳サービスの提供などが考えられていた事は重要であり(この報告書の中間まとめの時点での内容について、第375回参照)、文化庁の法解説ページの2018年法改正解説(pdf)でも、
・さらに,今日,デジタル化・ネットワーク化の更なる進展により,著作物の利用等を巡る環境は更なる変化に直面している。具体的には,IoT・ビッグデータ・人工知能などの技術革新とともに,情報の集積・加工・発信の容易化・低コスト化が進んだことを受け,大量の情報を集積し,組み合わせ,解析することで付加価値を生み出す新しいイノベーションの創出が期待されており,政府の知的財産戦略本部における議論においても,これを促進するとともに,社会を豊かにする新しい文化の発展に結び付けていくための次世代の知財システムの構築の必要性が述べられている。(第2ページ)
・本条第2号は,情報解析を行うことを目的とする場合を例示として掲げている。同号は現行法第47条の7を元とするものであるが,今般の改正に伴い,一部要件の見直しを行っている。具体的には,現行法第47条の7では権利制限が認められる場面を「電子計算機による情報解析」に限定しているが,本条の正当化根拠からすれば,人の手で行われる情報解析であっても,著作物に表現された思想又は感情の享受を目的としないものであれば,権利制限の対象とされるべきであるため,「電子計算機による」との限定は削除している。次に,現行法第47条の7は,情報解析の定義に「統計的な」という要件を課していたところ,時代の変化に応じて様々な解析が想定し得る状況となっていることを踏まえ,そのような解析も本条の権利制限の趣旨が妥当するものであることから,情報解析の定義のうち「統計的な」との限定を削除している。これにより,例えば,深層学習(ディープラーニング)の方法による人工知能の開発のための学習用データとして著作物をデータベースに記録するような場合も対象となるものと考えられる。さらに,現行法第47条の7では「記録媒体への記録又は翻案」を権利制限の対象としていたが,後述のとおり,情報解析目的での「利用」を幅広く認めることとしている(権利制限の対象となる利用行為については後述する)。(第24ページ)
・本条の権利制限の対象となる利用行為については,いずれの方法によるかを問わず,利用を行えるものとしており,複製に限らず,公衆送信,譲渡,上映,翻訳・翻案等の二次的著作物の創作,これにより創作された二次的著作物の利用など,支分権の対象となる行為は全て権利制限の対象となるものとしている。これにより,例えば人工知能の開発を例にとると,自ら人工知能の開発を行うために著作物を学習用データとして収集して利用する場合のみならず,自ら収集した学習用データを第三者に提供(譲渡や公衆送信等)する行為についても,当該学習用データの利用が人工知能の開発という目的に限定されていれば,本条に該当するものと考えられる。もっとも,その利用は,必要と認められる限度において行うものでなければならない。(第25ページ)
と書かれ、同じく文化庁のデジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定に関する基本的な考え方(pdf)でも、
・問3 「柔軟な権利制限規定」の整備によって,どのような効果が生じるか。
今般整備する「柔軟な権利制限規定」は,IoT・ビッグデータ・人工知能(AI)等の技術を活用したイノベーションに関わる著作物の利用に係るニーズのうち,著作物の市場に大きな影響を与えないものについて,相当程度柔軟性を確保する形で,著作物の利用の円滑化を図るものとなっている。
具体的には,人工知能(AI)開発のための深層学習,サイバーセキュリティ確保のためのソフトウェアの調査解析,所在検索サービス,情報解析サービス等,通常権利者に不利益を及ぼさないもの,又は権利者に及ぼし得る不利益が軽微なものに留まる形で著作物の利用行為が行われる様々なサービス等の実施について,権利者の許諾なく行うことが可能となり,イノベーションの創出等が促進されることが期待される。
・問11 人工知能の開発に関し,人工知能が学習するためのデータの収集行為,人工知能の開発を行う第三者への学習用データの提供行為は,それぞれ権利制限の対象となるか。
著作権法の目的は,通常の著作物の利用市場である,人間が著作物の表現を「享受」することに対する対価回収の機会を確保することにあると考えられることから,法第30条の4における「享受」は人が主体となることを念頭に置いて規定しており,人工知能が学習するために著作物を読む等することは,法第30条の4の「著作物に表現された思想又は感情を享受」することには当たらないことを前提としている。
したがって,人工知能の開発のための学習用データとして著作物をデータベースに記録する行為は,「著作物に表現された思想又は感情を享受」することを目的としない行為に当たり,法第30条の4による権利制限の対象となるものと考えられる。
また,収集した学習用データを第三者に提供する行為についても,当該学習用データの利用が人工知能の開発という目的に限定されている限りは,「著作物に表現された思想又は感情を享受」することを目的としない著作物の利用に該当し,法第30条の4による権利制限の対象となるものと考えられる。
通常は,人工知能が学習用データを学習する行為は,「情報解析」すなわち「…大量の情報から,当該情報を構成する…要素に係る情報を抽出し,…解析を行うこと」に当たると考えられることから,いずれの行為も第2号に当たるものと考えられる。
なお,旧第47条の7においては「情報解析」を「多数の著作物その他の大量の情報から,当該情報を構成する言語,音,影像その他の要素に係る情報を抽出し,比較,分類その他の統計的な解析を行うこと」と定義されていたところ,時代の変化に応じて様々な解析が想定し得る状況となっていることを踏まえ,情報解析の定義のうち「統計的な」との限定を削除している。これにより,例えば,深層学習(ディープラーニング)の方法による人工知能の開発のための学習用データとして著作物をデータベースに記録するような場合も権利制限の対象となるものと考えられる。
とほぼ同様の事が書かれている。
文化庁の説明は機械学習の後のAIサービスの提供について微妙にぼかして書いている点で嫌らしいが、人工知能を含む情報技術のイノベーション促進という導入趣旨から考えても、最終的にサービスの提供ができなければ意味がないので、この権利制限は、機械学習に利用された著作物の表現の享受を目的としない限りにおいて、生成AIサービスの提供にも適用されるものと考えられる。
ただし、この場合にポイントとなるのが、条文の通り、「当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的」とするかどうかであって、AIサービスが、特定の著作者や著作物の表現のみを学習させて利用者がその表現と同一又は類似した生成物を享受するためにのみ作られている場合や、特定の著作者や著作物の表現と同一又は類似した生成物の出力が可能であってその様な出力に専ら利用されている様な場合は、この権利制限の対象とならないだろう。(利用者側の問題については(2)で述べるが、機械的な出力であったからと言って他人の著作権の侵害にならないなどという事はなく、これは、AIサービスが専ら著作権侵害となる生成物の出力を目的とする場合には権利制限の対象とならないだろうという事である。なお、条文には、「ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。」というただし書きもあるが、これはベルヌ条約のスリーステップテストを確認的に書いたものであって、実質的には上の目的条件に包摂されていると私は考える。)
ここで間接侵害との関係について詳細に述べる事は省略するが、さらに、汎用の生成AIサービスの提供者が、そのサービスで特定の著作者や著作物の表現と同一又は類似した生成物の出力が可能である事を知り、かつ、それを止める事ができるにも関わらず止めなかった場合は、サービス提供者は著作権の間接侵害責任も問われ得るだろう。
サービス規約(契約)によって利用者に何らかの制約を課す事はできるだろうが、それ以上にAIサービス提供者に何か著作権が発生しているという事もない。
つまり、法改正経緯等から考えて、機械学習に利用された元の著作物の表現と異なる生成物の出力を行う事を目的とする通常の生成AIサービスや学習データの提供については権利制限の対象となると考えられるが、特定の著作者や著作物の表現と同一又は類似した生成物の出力に専ら利用されている様な場合は別であって、実際に個別の著作権侵害との関係で争いになれば、機械学習の内容、利用の実態、規約の実効性、権利侵害に対して技術的に取り得る手段などを論点として、サービス提供がこの権利制限の対象となるかについて判断される事になるだろう。
合わせ書いておくと、生成AIと言った時に通常考えられるサービスとは少し異なるものになると思うが、著作物の一部を示す検索サービス類似のAIサービスについては、以下の第47条の5の適用も考えられる。(第389回で書いた様に、これは元々2009年の著作権法改正で導入された情報検索目的の権利制限が2018年改正で今の形に整理されたものである。)
(電子計算機による情報処理及びその結果の提供に付随する軽微利用等)
第四十七条の五 電子計算機を用いた情報処理により新たな知見又は情報を創出することによつて著作物の利用の促進に資する次の各号に掲げる行為を行う者(当該行為の一部を行う者を含み、当該行為を政令で定める基準に従つて行う者に限る。)は、公衆への提供等(公衆への提供又は提示をいい、送信可能化を含む。以下同じ。)が行われた著作物(以下この条及び次条第二項第二号において「公衆提供等著作物」という。)(公表された著作物又は送信可能化された著作物に限る。)について、当該各号に掲げる行為の目的上必要と認められる限度において、当該行為に付随して、いずれの方法によるかを問わず、利用(当該公衆提供等著作物のうちその利用に供される部分の占める割合、その利用に供される部分の量、その利用に供される際の表示の精度その他の要素に照らし軽微なものに限る。以下この条において「軽微利用」という。)を行うことができる。ただし、当該公衆提供等著作物に係る公衆への提供等が著作権を侵害するものであること(国外で行われた公衆への提供等にあつては、国内で行われたとしたならば著作権の侵害となるべきものであること)を知りながら当該軽微利用を行う場合その他当該公衆提供等著作物の種類及び用途並びに当該軽微利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
一 電子計算機を用いて、検索により求める情報(以下この号において「検索情報」という。)が記録された著作物の題号又は著作者名、送信可能化された検索情報に係る送信元識別符号(自動公衆送信の送信元を識別するための文字、番号、記号その他の符号をいう。第百十三条第二項及び第四項において同じ。)その他の検索情報の特定又は所在に関する情報を検索し、及びその結果を提供すること。
二 電子計算機による情報解析を行い、及びその結果を提供すること。
三 前二号に掲げるもののほか、電子計算機による情報処理により、新たな知見又は情報を創出し、及びその結果を提供する行為であつて、国民生活の利便性の向上に寄与するものとして政令で定めるもの2 前項各号に掲げる行為の準備を行う者(当該行為の準備のための情報の収集、整理及び提供を政令で定める基準に従つて行う者に限る。)は、公衆提供等著作物について、同項の規定による軽微利用の準備のために必要と認められる限度において、複製若しくは公衆送信(自動公衆送信の場合にあつては、送信可能化を含む。以下この項及び次条第二項第二号において同じ。)を行い、又はその複製物による頒布を行うことができる。ただし、当該公衆提供等著作物の種類及び用途並びに当該複製又は頒布の部数及び当該複製、公衆送信又は頒布の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
(2)利用者による入力結果のAI生成物の利用
利用者側の話については、前回紹介したアメリカ著作権局のペーパーで書かれている事が日本でもあてはまるだろう。
日本の著作権法では以下の第2条第1項第1号と第2号で著作物と著作者がそれぞれ定義されている。
(定義)
第二条 この法律において、次の各号に掲げる用語の意義は、当該各号に定めるところによる。
一 著作物 思想又は感情を創作的に表現したものであつて、文芸、学術、美術又は音楽の範囲に属するものをいう。
二 著作者 著作物を創作する者をいう。
日本国内で、人間以外の者が著作者となり得るか、人間以外の者が作成した物が著作物となり得るかが争われた事件はないと思うが、著作権法という創作保護法の基本原理から考えて、ここで言われている所の著作物を創作する者は原則として人間のみであるとする解釈について敢えて異論が唱えられる事はないに違いない。(法人著作などがあり得る事を法律的に定めているのはこの原則に対する例外であって、人間以外の者が創作者・著作者となり得る事を一般的に認めているのではない。)
そして、創作的表現である著作物の創作に関与した者に著作権があるかどうかは、その者が最終的な表現にどこまで創作的に寄与したかで決まるので、今話題になっている、簡単な指示の入力によって文章や画像を出力する生成AIサービスにおいて、その利用者に、出力された生成物の最終的な表現に対する創作的な寄与があり、その結果として著作権があるとは考え難い。その様な利用者は一次創作者たり得ず、無論二次創作者でもあり得ない。(機械的出力が問題になった事件ではないが、創作者に関する判断を示したものとして最も有名だろう、1993年3月30日の智惠子抄事件最高裁判決(pdf)で、出版者の編集著作に対する関与が「企画案ないし構想の域にとどまるにすぎない」場合に編集著作権がその者に帰属する事はないと示されている様に、生成AIサービスに対する簡単な指示の入力はアイデア、企画、構想の指示に類するものに過ぎず、最終的な表現に対する創作的な寄与たり得ないものだろう。また、前回取り上げたアメリカ著作権局のペーパーにも書かれていた通り、元の入力文自体に著作権があり得る事も、最終的な表現に対する創作的な寄与の判断を左右するものではないだろう。)
すなわち、生成AIサービスの利用者にも生成物に関する著作権は通常ないと考えられるのだが、この事は、サービス提供者の著作権も利用者の著作権もないと考えられる生成物が他人の著作権の侵害を構成しない事を意味しない。
既存の著作物に依拠して類似した表現物を作成して他の者に提供した場合に著作権侵害となり得るのは当たり前の事であって、この事はどの様なツールを使うかに依存しないし、生成AIサービスを利用した場合であっても同じと考えられるべきである。(生成AIサービスに限らず、著作物に対しては様々な機械的処理による変更が考えられるが、元の著作物とは似つかない物を作る場合ならともかく、何かしらの機械的処理を加えるだけで元の著作物と類似する表現物について著作権侵害が回避できるなどという事はあり得ないだろう。著作権侵害における依拠と類似の判断に関して、やはり最も有名だろう参考判例として、2001年6月28日の江差追分事件最高裁判決(pdf)をあげておくが、これは、「既存の著作物に依拠して創作された著作物が,思想,感情若しくはアイデア,事実若しくは事件など表現それ自体でない部分又は表現上の創作性がない部分において,既存の著作物と同一性を有するにすぎない」場合に該当するので著作権侵害とならないとされた事件だが、判旨の1つとして、著作権侵害となる「言語の著作物の翻案(著作権法27条)とは,既存の著作物に依拠し,かつ,その表現上の本質的な特徴の同一性を維持しつつ,具体的表現に修正,増減,変更等を加えて,新たに思想又は感情を創作的に表現することにより,これに接する者が既存の著作物の表現上の本質的な特徴を直接感得することのできる別の著作物を創作する行為をいう」と述べている。)
機械学習に使った元の著作物に対し、そのままの又は類似した生成物の出力についてまで権利処理をしたサービスであれば別だが、世の中で提供されている通常の生成AIサービスでは、その利用規約で、利用者による生成物の利用に対する免責条項を入れている事がほとんどだろう。自己目的利用であれば私的複製の権利制限の範囲で気にする事はないし、普通に著作権侵害となる生成物を出力しない様に利用している限り問題ない筈だが、利用者は、生成物の他の者への提供を含む利用について、利用者が責任を負うだろう事について、また、既存の著作物との関係で著作権侵害とならないかについて十分注意する必要がある。(これは、ある者が著作権を侵害して提供した物を別の者がさらに転載した場合にこの別の者も著作権の侵害者となる事と同様であり、AI生成物を転載する場合も同様だろう。)
上で書いた事をまとめておくと、現行の著作権法第30条の4の非享受目的利用の範囲内で、著作権侵害とならない生成物を出力する事を通常の目的とする限りにおいて、生成AIサービスの提供者による既存の著作物の利用も、利用者のサービス利用も問題なく行えると考えて良いだろうが、サービス提供者にも利用者にも著作権はなく、それぞれ、サービスが専ら著作権侵害となる生成物の出力に利用されていないか、生成物の利用が他人の著作権を侵害しないかについて十分注意する必要があるという事になるだろう。
私は、著作権法が技術の発展の阻害となってはならないと考えているが、その目的を超えて余計な社会的混乱を招くだけの権利や補償金などを新たに付与するべきではないとも思っており、著作権侵害とならない生成物を作ろうとする限りにおいて、AIサービスの提供と利用の著作権リスクを相当程度低減している、この今の日本の著作権法のバランスは決して悪くないと思っている。
第475回に載せた知財計画パブコメの(2)a)で、
機械学習の発展により、かなりの精度で文章や絵などを自動的に計算して生成するいわゆる生成AI・人工知能が話題となっている事から、政府・与党でもこの様な生成AIと著作権の関係について今後検討を行う事が予想される。
その様な検討自体に反対はしないが、検討する場合は、この様な新技術の発展が速い事や国際動向等にも照らし、かえって社会的混乱を招き、技術の発展を阻害する恐れの強い、法改正によって新たな規制を行う事や新しい権利を付与する事には極めて慎重であるべきである。
知財計画2023において生成AI・人工知能の様な新技術と著作権の関係に関する検討について記載する場合には、技術の発展や国際動向等にも留意し、法改正によって新たな規制を行う事や新しい権利を付与する事には慎重である事を基本的な方針として合わせ明記するべきである。
なお、今国会に提出されている、デジタル空間に形態模倣規制を導入する不正競争防止法改正案には賛同するが、メタバースとの関連でも、これ以上の法改正には慎重であるべきである。
と書いたのも、そう思っての事である。
ついでに書いておくと、生成AIサービスを提供しているのは主にアメリカの企業なので、この問題は、日本の著作権法がどうあれ、世界的には、アメリカで幾つか既に起こされている生成AIサービスに対する著作権訴訟の行方に否応なく引き擦られる事になるだろうとも思っているが、同じ様に、著作権侵害となる生成物の出力を目的としない通常のAIサービスはフェアユースの範囲内と整理される事を期待している。
最後に、これもついでだが、twitterで少し書いた通り、生成AIに関する検討の本質的対象は、知財に関する論点以上に、偽情報作成、情報漏洩リスク、教育研究倫理との関係ではないかとも私は思っている。
(2023年5月2日の追記:誤記を直すとともに、少しだけ言葉を追加した方が良いと思えた点を1箇所直した(「利用する著作物の量やサービスの営利非営利が」→「利用する著作物の量や適法性の確認、サービスの営利非営利などが」)。
(2023年6月11日の追記:twitterの方で少し触れた通り、5月15日に開かれたAI戦略チームの第3回で、AIと著作権の関係について(pdf)としてほぼ上で書いた事と同様の資料が政府から公開されているので、ここにリンクを張っておく。)
(2023年6月25日の追記:基本的に言われている事は同じだが、さらに詳細なものとして、文化庁のHPで6月19日の著作権セミナーの資料(pdf)とYouTubeのアーカイブ動画へのリンクが公開されたので、ここにリンクを張っておく。)
最近のコメント