2025年5月18日 (日)

第512回:人口知能(AI)の学習のための著作物の利用に関するアメリカ著作権局のプレ公開版の報告書第3部

 もう少し時間が掛かると思っていたが、先週、アメリカ著作権局は、第508回で取り上げた著作権保護適格性に関する第2部に続き、人口知能(AI)の学習のための著作物の利用に関する報告書第3部をプレ公開版としてそのAI関連ページで公表した。

 このアメリカ著作権局のプレ公開版報告書第3部(pdf)は、その結論に以下の様に書かれている通り、AI学習のための著作物の利用が著作権侵害となるかどうかはそれがフェアユースと評価されるかどうかにに懸かっている事、今までの判例や意見などをまとめながら、フェアユースとなる場合もならない場合もあるだろうという事を言うに留まり、当然と言えば当然だが、この利用形態について決定的な判断を示しているなどという事はない。(以下、いつも通り翻訳は全て拙訳。)

VI. CONCLUSION

Throughout its history, copyright law has adapted to new technology, furthering its progress while preserving incentives for creative activity. This has enabled our nation's creative and technology industries to become global leaders in their fields. While the use of copyrighted works to power current generative AI systems may be unprecedented in scope and scale, the existing legal framework can address it as in prior technological revolutions. The fair use doctrine in particular has served to flexibly accommodate such change. We believe it can do so here as well.

In applying current law, we conclude that several stages in the development of generative AI involve using copyrighted works in ways that implicate the owners' exclusive rights. The key question, as most commenters agreed, is whether those acts of prima facie infringement can be excused as fair use.

The fair use determination requires balancing multiple statutory factors in light of all relevant circumstances. Although it is not possible to prejudge the result in any particular case, precedent supports the following general observations:

Various uses of copyrighted works in AI training are likely to be transformative. The extent to which they are fair, however, will depend on what works were used, from what source, for what purpose, and with what controls on the outputs - all of which can affect the market. When a model is deployed for purposes such as analysis or research - the types of uses that are critical to international competitiveness - the outputs are unlikely to substitute for expressive works used in training. But making commercial use of vast troves of copyrighted works to produce expressive content that competes with them in existing markets, especially where this is accomplished through illegal access, goes beyond established fair use boundaries.

For those uses that may not qualify as fair, practical solutions are critical to support ongoing innovation. Licensing agreements for AI training, both individual and collective, are fast emerging in certain sectors, although their availability so far is inconsistent. Given the robust growth of voluntary licensing, as well as the lack of stakeholder support for any statutory change, the Office believes government intervention would be premature at this time. Rather, licensing markets should continue to develop, extending early successes into more contexts as soon as possible. In those areas where remaining gaps are unlikely to be filled, alternative approaches such as extended collective licensing should be considered to address any market failure.

In our view, American leadership in the AI space would best be furthered by supporting both of these world-class industries that contribute so much to our economic and cultural advancement. Effective licensing options can ensure that innovation continues to advance without undermining intellectual property rights. These groundbreaking technologies should benefit both the innovators who design them and the creators whose content fuels them, as well as the general public.

Finally, as in prior Parts of this Report, the Office recognizes that facts on the ground are evolving at a rapid pace. We will continue to monitor developments in technology, case law, and markets, and to offer further assistance to Congress as it considers these issues.

Ⅵ.結論

その歴史を通じて、著作権は新技術に適応して来ており、さらに創作活動のためのインセンティブを保持しながらその歩みを進めている。これは私たちの国の創作的技術産業がその分野において世界的リーダーとなる事を可能として来た。現在の生成AIシステムを作動させるための著作物の利用は、範囲と規模において前例のないものであろうが、現行の法的枠組みは過去の技術革新と同じくそれに対処できる。フェアユースの法理は特にこの様な変化に柔軟に対応するために役に立って来た。私たちは今回もそれは同じ様にできると信じる。

現行法を適用するに際し、私たちは生成AIの開発における幾つかの段階に権利者の排他的権利に関わるやり方で著作物を利用する事が含まれていると結論する。主たる問題は、ほとんどの意見提出者が認める通り、この一応の侵害行為がフェアユースとして許され得るかである。

フェアユースの判断には関係するあらゆる状況に照らして法定の複数の要素を衡量する事が求められる。特定のケースにおける結果を予断する事はできないが、先例は次の一般的な所見を支持する:

AI学習における著作物の様々な利用は変形的なものとなる事が多いだろう。それがどれほど公正であるかは、しかしながら、どの様な元から、どの様な目的で、どの様な作品が使われているのか、そして、その出力にどの様な制御があるのか-市場に影響し得るあらゆる事-に懸かっている。モデルが分析や研究-国際競争において重要なものである利用の形-の様な目的のために展開される場合、出力は学習に用いられた表現的作品を置き換える事はありそうにない。しかし、既存の市場において競合する表現的コンテンツを製造するために著作物の大宝庫を商業利用する事は、特にこれが違法アクセスを通じて達成される場合、確立されたフェアユースの境界を超える。

公正とは評価され得ないこれらの利用について、進展するイノベーションにとって実務的な解決が重要である。その利用可能性はまちまちであるが、AI学習のための個別及び包括の両方のライセンス契約が幾つかの分野において急速に立ち上がっている。自主的なライセンスが安定的に成長している事とともに、法令の変更に対する関係者の支持が欠けている事からも、アメリカ著作権局は政府の介入は現時点で時期尚早であると考える。むしろ、ライセンス市場こそ、できる限り早く初期の成功をさらなる文脈に広げ、発展を続けるべきである。残る隔たりが埋められそうにない領域において、拡大集中ラリセンスの様な代替アプローチが市場の失敗に対応するために検討されるべきである。

私たちの見解では、AI領域におけるアメリカのリーダーシップは、私たちの経済的及び文化的進展に大いに寄与している、これらの世界レベルの産業の両方によって支持され、進められるのが最良であろう。効果的なライセンスの選択肢はイノベーションが知的財産権を危うくする事なく進展し続ける事を保証する。この画期的な技術はそれを設計するイノベーター及びそのコンテンツがそれを加速するクリエーター並びに一般公衆をともに裨益するべきものである。

最後に、本報告の先行部分同様、アメリカ著作権局はこの領域における事実は急速に進展している事を認める。私たちは技術における発展、判例及び市場を注視し続け、議会がこの問題を検討するに際しさらなる支援を提供し続けるであろう。

 同時にアメリカ著作権局長のパールムッター氏が解任されたという事も報道されており、この報告書の内容が権利者寄りである事がトランプ現米大統領とその幹部の癇に障ったので解任されたなどという事も噂されているのだが、上でも書いた通り、この報告書の内容は今までの判例などから中立的に言える事を言ったに留まり、特に権利者寄りであるとも、AI事業者・利用者寄りであるとも言い難い。トランプ政権の主要幹部が1日でこの大部の報告書の内容をまともに評価して著作権局長の解任を決めたなどという事はありそうになく、おそらく何かの事情で近く解任される事を知ったパールムッター氏が第3部を急ぎプレ公開版として公表したという方が妥当なのではないかと私は思っている。

 上の結論の部分で、「既存の市場において競合する表現的コンテンツを製造するために著作物の大宝庫を商業利用する事は、特にこれが違法アクセスを通じて達成される場合、確立されたフェアユースの境界を超える」と書かれているのも、今までのフェアユースに関する判例などを踏まえて考えればほぼ当たり前の事に近く、同一市場で競合する類似コンテンツを生成するため、違法アクセスにより入手した大量の著作物をそうと知ってAI学習に利用する事がフェアユースに該当するなどと心の底から思っている法律の専門家はアメリカでもいないに違いない(置かれた立場からそう主張する事はあるかも知れないが)。

 最終的にはアメリカ最高裁により決められる事になるであろうが、この報告書でまとめられていることを見ても、AI学習への著作物利用のフェアユース該当性に関する判断は、既存の著作物に依拠して類似した物を意図的に出力させようとするものであるかどうか、著作権侵害とならない出力を作り出そうとするものであるかどうかが大きな判断要素となり得るだろうと思え、日本の著作権法第30条の4の非享受目的利用の例外や、ヨーロッパにおけるテキスト及びデータマイニングの例外の適用の判断とも収斂して行くのではないかと私は期待している。(日欧でもまだ判例はほぼ出ていない状況だが、それぞれ、日本の著作権法における考え方をまとめた文化庁の報告書について第492回、欧州新著作権指令との関係について第481回参照。なお、まだ地裁レベルだが、第504回で取り上げた様に、ドイツにおいて非営利でのAI学習用データの提供は研究目的データマイニングの権利制限に該当するとした判決が存在している。)

 また、このアメリカ著作権局の報告書は全て読むに値するものと思うが、フェアユースの4つの法定要素、(1)商業的かどうかなど利用の目的及び性格、(2)著作物の性質、(3)著作物全体に対する利用部分の量と本質性、(4)著作物の市場又は価値に対する利用の潜在的影響の中でも、ここでは、特に評価が微妙な最初の要素における変形性と違法アクセスについて述べた部分について以下に訳出しておく。

IV. FAIR USE

...

A. Factor One

...

2. Transformativeness

...

As discussed above, Warhol requires examining not just the immediate act of copying but its ultimate goal.[Note 259: See Warhol, 598 U.S. at 550-51; see also Authors Guild, Inc. v. HathiTrust, 755 F.3d 87, 97-105 (2d Cir. 2014) (looking beyond copying books for "digitization" and "storage" to consider the ultimate purposes of those uses: full-text search functionality, accessibility for the print-disabled, and preservation); Sony Comput. Ent., Inc. v. Connectix Corp., 203 F.3d 596, 601, 606-07 (9th Cir. 2000) (evaluating purpose of copying to reverse engineer software by considering the final product that the reverse engineering enabled); Infinity Broad. Corp. v. Kirkwood, 150 F.3d 104, 108-09 (2d Cir. 1998); A&M Recs., Inc. v. Napster, Inc., 239 F.3d 1004, 1015 (9th Cir. 2001); Flo & Eddie, Inc. v. Sirius XM Radio, Inc., 821 F.3d 265, 270 n.4 (2d Cir. 2016) ("The fair-use analysis applicable to [creating an internal database of recordings] … is bound up with whether the ultimate use of the internal copies [to make public performances] is permissible."). See supra Section IV.A.1.] Accordingly, whether copying a work to compile a training dataset is transformative depends on whether the dataset will be used for a transformative purpose.

In the Office's view, training a generative AI foundation model on a large and diverse dataset will often be transformative. The process converts a massive collection of training examples into a statistical model that can generate a wide range of outputs across a diverse array of new situations. It is hard to compare individual works in the training data - for example, copies of The Big Sleep in various languages - with a resulting language model capable of translating emails, correcting grammar, or answering natural language questions about 20th-century literature, without perceiving a transformation. The purpose of creating works of authorship is to disseminate them for human enjoyment and education. Many AI models, however, are meant to perform a variety of functions, some of which may be distinct from the purpose of the copyrighted works they are trained on.[Note 260: Cf. Authors Guild v. Google, Inc. (Google Books), 804 F.3d 202, 216-18 (2d Cir. 2015); HathiTrust, 755 F.3d at 97; Perfect 10, Inc. v. Amazon.com, Inc., 508 F.3d at 1165; Kelly v. Arriba Soft Corp., 336 F.3d 811, 819 (9th Cir. 2003).] For example, a language model can be used to help learn a foreign language by chatting with users on diverse topics and offering corrective feedback.[Note 261: Cf. Stavros Athanassopoulos, The use of ChatGPT as a learning tool to improve foreign language writing in a multilingual and multicultural classroom, Advances in Mobil Learning Educational Research (2023), https://www.syncsci.com/journal/AMLER/article/view/AMLER.2023.02.009; see also OpenAI and the California State University System Bring AI to 500,000 Students and Faculty, OPENAI (Feb. 4, 2025), https://openai.com/index/openaiand-the-csu-system/; Linda Kane, Space Force Generative AI Challenge Empowers Guardians Through Education, Collaboration, U.S. SPACE FORCE (Dec. 10, 2024), https://www.spaceforce.mil/News/Article-Display/Article/3992437/space-force-generative-ai-challenge-empowers-guardians-through-education-collab/; Severin Rodler et al., Generative Artificial Intelligence in Surgery, 175 SURGERY 1496 (2024), https://www.sciencedirect.com/science/article/abs/pii/S0039606024001193?via%3Dihub.]

But transformativeness is a matter of degree, and how transformative or justified a use is will depend on the functionality of the model and how it is deployed. On one end of the spectrum, training a model is most transformative when the purpose is to deploy it for research,[Note 262: Cf. Google Books, 804 F.3d at 217 ("[T]he purpose of Google's copying of the original copyrighted books is to make available significant information about those books, permitting a searcher to identify those that contain a word or term of interest, as well as those that do not include reference to it. In addition, through the ngrams tool, Google allows readers to learn the frequency of usage of selected words in the aggregate corpus of published books in different historical periods. We have no doubt that the purpose of this copying is the sort of transformative purpose described in Campbell as strongly favoring satisfaction of the first factor.").] or in a closed system that constrains it to a non-substitutive task. For example, training a language model on a large collection of data, including social media posts, articles, and books, for deployment in systems used for content moderation does not have the same educational purpose as those papers and books.

On the other end of the spectrum is training a model to generate outputs that are substantially similar to copyrighted works in the dataset. For example, a foundation image model might be further trained on images from a popular animated series and deployed to generate images of characters from that series. Unlike cases where copying computer programs to access their functional elements was necessary to create new, interoperable works, using images or sound recordings to train a model that generates similar expressive outputs does not merely remove a technical barrier to productive competition. In such cases, unless the original work itself is being targeted for comment or parody, it is hard to see the use as transformative.[Note 263: The decision to train on expressive works when there are available alternatives may itself reflect a lack of transformative purpose. For example, an image model could be trained on mass image data collected through automated means (street-view cars, body cameras, security cameras), yet developers often choose aesthetic images such as stock photography. This suggests the purpose is not simply to generate images of the physical world, but to generate images that have expressive qualities like the originals.]

Many uses fall somewhere in between. The use of a model may share the purpose and character of the underlying copyrighted works without producing substantially similar content. Where a model is trained on specific types of works in order to produce content that shares the purpose of appealing to a particular audience, that use is, at best, modestly transformative. Training an audio model on sound recordings for deployment in a system to generate new sound recordings aims to occupy the same space in the market for music and satisfy the same consumer desire for entertainment and enjoyment. In contrast, such a model could be deployed for the more transformative purpose of removing unwanted distortion from sound recordings.

Because generative AI models may simultaneously serve transformative and nontransformative purposes,[Note 264: As described above, the strength of generative pre-trained language models is their ability to perform well on a variety of tasks when given natural language directions. See supra notes 39-41, 102-103.] restrictions on their outputs can shape the assessment of the purpose and character of the use. As described above, developers can apply training techniques or deployment guardrails so that the model rejects requests for excerpts of copyrighted works or even refuses to generate expressive works. Where such restrictions are effective, the system will be less capable of fulfilling the purpose of the original works, and their use in training may be more transformative.

...

4. Unlawful Access

...

In the Office's view, the knowing use of a dataset that consists of pirated or illegally accessed works should weigh against fair use without being determinative.[Note 292: See Harper & Row Publishers, Inc. v. Nation Enters., 471 U.S. 539, 562-63 (1985) (finding a user's knowing exploitation of a "purloined manuscript" to be relevant to the character of the use); Chi. Bd. of Educ. v. Substance, Inc., 354 F.3d 624, 628 (7th Cir. 2003) (explaining that the fact that the access was unauthorized "does not exclude the possibility of a fair use defense."); L.A. News Serv. v. KCAL-TV Channel 9, 108 F.3d 1119, 1122 (9th Cir. 1997) (finding relevant to the propriety of the user's conduct that, after being refused a license, defendant then "obtained a copy of the tape ... directly copied the original, superimposed its logo ... and used it for the same purpose for which it would have been used had it been paid for"); Atari Games Corp. v. Nintendo of Am. Inc., 975 F.2d 832, 843 (Fed. Cir. 1992) ("To invoke the fair use exception, an individual must possess an authorized copy of a literary work."); cf. Perfect 10, Inc. v. Amazon.com, Inc., 508 F.3d at 1164 n.8 ("[W]e conclude that Google's inclusion of thumbnail images derived from infringing websites in its Internet-wide search engine activities does not preclude Google from raising a fair use defense.").] Courts have expressed some uncertainty about whether good or bad faith generally is relevant to the fair use analysis.[Note 293: See Google LLC v. Oracle Am., Inc., 593 U.S. at 32-33 ("As for bad faith, our decision in Campbell expressed some skepticism about whether bad faith has any role in a fair use analysis. We find this skepticism justifiable, as '[c]opyright is not a privilege reserved for the well-behaved.'" (citations omitted)); Campbell v. Acuff-Rose Music, Inc., 510 U.S. 569, 585 n.18 (1994) ("[W)e reject [plaintiff's] argument that [defendant's] request for permission to use the original should be weighed against a finding of fair use."); see also Pierre N. Leval, Campbell As Fair Use Blueprint?, 90 WASH. L. REV. 597, 612-14 (2015); Simon Frankell & Matt Kellogg, Bad Faith and Fair Use, 60 J. COPYRIGHT SOC'Y USA 1 (2013), https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2165468; Pierre N. Leval, Toward A Fair Use Standard, 103 HARV. L. REV. 1105, 1126-28 (1990).] The cases in which they have done so, however, involved defendants who used copyrighted works despite the owners' denial of permission. Training on pirated or illegally accessed material goes a step further.[Note 294: In addition, some commenters suggested that, to the extent copyright owners "opt out" of having their material used to train AI, whether through terms of use, the robots.txt instructions, or other means, a defendant's decision to ignore such opt-outs might inform the fair use analysis. See, e.g., N/MA Initial Comments at 44; Pamela Samuelson et al. Initial Comments at 24 ("A defendant's ... disregard of robots.txt exclusions and similar mechanisms could each be framed in terms of an argument against fair use under the fourth factor.").] Copyright owners have a right to control access to their works, even if someone seeks to obtain them in order to make a fair use.[Note 295: Cf. 17 U.S.C. § 1201 (prohibiting circumvention of technological protection measures used by copyright owners to control access to their works); Samuelson, et al. Initial Comments at 24 ("One might argue that although copyright owners do not have a right to charge for fair uses as such, they do have a right to charge for access to their works. As such, it may be deemed harmful or unfair for commercial users to bypass the market for access to train their LLMs without a compelling reason.").] Gaining unlawful access therefore bears on the character of the use.

Ⅳ.フェアユース

(略)

A.要素1

(略)

2.変形性

(略)

上で議論した通り、ウォーホル事件最高裁判決は単に直近の複製行為ではなくその究極的な目標を見る事を求めている。[原注259:2023年5月18日のアンディ・ウォーホル財団対ゴールドスミス事件アメリカ最高裁判決;以下も参照、2014年6月10日の全米作家協会対ハイチ・トラスト事件第2巡回控訴裁判決(「デジタル化」及び「蓄積」のための本の複製行為を超えてその利用の究極的な目的である、全文サーチ、視覚障害者のためのアクセス性、保存を考慮);2000年2月10日のソニー・コンピュータ・エンタテイメント社対コネティックス社事件第9巡回控訴裁判決(リバースエンジニアリングが可能とした最終製品を考慮し、ソフトウェアをリバースエンジニアするための複製行為の目的を評価);2001年2月12日のA&Mレコード社対ナップスター社第9巡回控訴裁判決;2016年12月20日のフロ&エディー社対シリウスXMラジオ社事件第2巡回控訴裁判決(「[録音の内部データベースを作成する事]に対して適用されるフェアユース分析は…[公演をするという]その内部コピーの究極的な利用が許されるかどうかに密接に関係する。」)。上記Ⅳ.A.1節も参照。]したがって、学習データセットをまとめるために作品を複製する事が変形的であるかはそのデータセットが変形的な目的で利用されるかに懸かっている。

アメリカ著作権局の見解では、大規模で多様なデータセットによる生成AIの基本モデルの学習は変形的である事が多いであろう。そのプロセスは学習例の大量のコレクションを新しい状況の多様な幅に渡り広い範囲で生成できる統計モデルへと変換する。その学習データにおける個々の作品-例えば、様々な言語における大いなる眠りの複製-を、変形を認める事なく、電子メールの翻訳、文法の訂正又は20世紀文学に関する自然言語の質問に対する回答と比較する事は困難である。著作者性のある作品を作り出す目的は人間の享受と教育のためにそれを広める事にある。多くのAIモデルは、しかしながら、様々な機能を実行する事を目指しており、それらの内の幾つかは学習される著作物の目的とは区別され得るであろう。[原注260:2015年10月16日の全米作家協会対グーグル社(グーグルブックス)事件第2巡回控訴裁判決;ハイチ・トラスト事件第2巡回控訴裁判決;2007年5月16日のパーフェクト10社対アマゾン・ドットコム社事件第9巡回控訴裁判決;2003年7月7日のケリー対アリバ・ソフト社事件第9巡回控訴裁判決。]例えば、言語モデルは、様々なトピックについて利用者とチャットし、訂正フィードバックを提供する事により、外国語の学習を助ける事に使われ得る。[原注261:(訳注:参考文献は上の原文参照。)]

しかし、変形性は程度の問題であり、どれほど変形的であるか又は利用が正当化されるかは、モデルの機能性及びどの様にそれが展開されるかによるであろう。このスペクトルの一端において、その目的がそれを研究のために展開するか[原注262:グーグルブックス事件第2巡回控訴裁判決(「元の著作権の保護を受ける本を複製するグーグルの目的は、これらの本に関する有意な情報を入手可能とし、研究者に関心のある語又は用語を含むもの並びにそれに対する参照を含まないものを特定する事を可能とする事にある。さらに、ngramツールによって、グーグルは異なる時代に出版された本の集合コーパスにおける選択された語の利用の頻度を学ぶ事を読者に可能としている。この複製行為の目的はキャンベル事件最高裁判決において述べられた種類の変形目的であり、第1の要素を強く肯定的に満たすものである事に疑いの余地はない。」)]、非代替タスクのためにそれを含むクローズドシステムに展開する事にある場合、モデルの学習はほぼ変形的であろう。例えば、コンテンツモデレーションのために使われるシステムのために展開される、ソーシャルメディアの投稿、記事及び本を含む大規模コレクションによる言語モデルの学習はこれらの論文や本と同じ教育的な目的を持たない。

そのスペクトルの他端には、データセットにおける著作物に実質的に類似する出力を生成するためにモデルを学習させる事がある。例えば、基本画像モデルを、人気のアニメシリーズの画像でさらに学習させ、そのシリーズのキャラクターの画像を生成するために展開する事があり得るだろう。その機能的要素にアクセスするためのコンピュータプログラムの複製行為が、新しく相互運用可能な作品を作り出すために必要な場合と異なり、類似した表現的出力を生成するために画像又は録音を利用する事は、単に生産的競争の技術的障害を取り除く事ではない。この様な場合、元の作品それ自体が批評又はパロディのターゲットとなっていない限り、その利用を変形的と見るのは困難である。[原注263:代替物が入手可能である場合に表現的作品による学習する事を決定する事自体、変形目的の欠如を示すものであり得るだろう。例えば、画像モデルは自動手段によって収集された大量の画像データ(ストリートビュー車、ボディカメラ、セキュリティカメラ)で学習され得るが、開発者はストック写真の様な美的画像を選択する事が良くある。この事はその目的が現実世界の画像を生成する事にあるのではなく、オリジナルの様な表現的性質を持つ画像を生成する事にあるのを示唆する。]

多くの利用は何かしらその間にある。モデルの利用は、実質的に類似するコンテンツを作成しないが、基礎となる著作物の目的と性格を共有し得る。特定の視聴者の気を引く目的で共有されるコンテンツを生成するためにモデルが特定の型の作品により学習される場合、その利用は、せいぜい、多少変形的なものである。新しい録音を生成するためのシステムへの展開のために録音によりオーディオモデルを学習させる事は、音楽市場において同じ場を占め、娯楽と享受のための同じ消費者の望みを満たす事を目的としている。対照的に、その様なモデルは、録音から望ましくない歪みを取り除くというより変形的な目的のために展開され得るであろう。

生成AIモデルは同時に変形的及び非変形的目的に使われ得るものであるから[原注264:上で述べた通り、事前学習言語モデルの強さとは、自然言語の指示が与えられたときに多様な仕事を実行できるその能力である。前注39-41、102-103参照。]、その出力に対する制限はその利用の目的及び性格の評価を形作り得る。上で述べた通り、モデルが著作物の抜粋に対する要求を拒絶し、さらに表現的作品を生成する事を拒絶する様にも、開発者は学習技術や展開の安全策を展開できるのである。この様な制限が有効である場合、システムは元の作品の目的を満たす事がよりできなくなるであろうし、学習におけるその利用はより変形的なものであり得るであろう。

(略)

4.違法アクセス

(略)

アメリカ著作権局の見解では、海賊版又は違法にアクセスされた作品からなるデータセットのそうと知っての利用は、決定的なものではないが、フェアユースに否定的に働くものである。[原注292:1985年5月20日のハーパー&ロー出版社対ナショナル・エンタープライズ事件アメリカ最高裁判決(「盗まれた原稿」のそうと知っての利用はその利用の性格に関係すると認定);2003年12月31日のシカゴ教育委員会対サブスタンス社事件第9巡回控訴裁判決(アクセスが不正のものであったという事実は「フェアユースの抗弁の可能性を排除しない」と説明);1997年3月11日のロサンゼルス・ニュース・サービス対KCAL-TVチャンネル9事件第9巡回控訴裁判決(ライセンスを拒絶した後で、被告が「テープの複製を入手し・・・オリジナルを直接コピーし、そのロゴを入れ・・・支払って使われたであろうのと同じ目的でそれを使った」という利用者の行為の妥当性に関する認定);1982年9月10日のアタリゲームズ社対米ニンテンドー社事件連邦巡回控訴裁判決(「フェアユースの例外を持ち出すためには、個人は文芸作品の正規の複製を所有していなければならない。」);パーフェクト10社対アマゾン・ドットコム社事件第9巡回控訴裁判決(「私たちは、グーグルのインターネットに渡る検索エンジンの活動において侵害ウェブサイトに由来するサムネイルが含まれる事はグーグルがフェアユースの抗弁を提起するのを妨げない。」)。]裁判所は善意又は悪意が一般的にフェアユース分析に関係するかどうかについて多少のばらつきを示して来た[原注293:2021年4月5日のグーグル社対米オラクル社事件アメリカ最高裁判決(「悪意に関して、キャンベル事件における私たちの決定は悪意がフェアユース分析において何らかの役割を果たすかについて懐疑を示している。『著作権は良く振る舞う者に取り置かれる特権ではない』のであり、私たちはこの懐疑は正当化され得るものと考える。」);1994年3月7日のキャンベル対エイカフ=ローズ・ミュージック社事件アメリカ最高裁判決(「私たちはオリジナルを利用する許可の求めがフェアユースの認定に否定的に働くという[被告の]主張に同意しない。」);(訳注:その他参考文献については上の原文参照。)]。しかしながら、裁判所がそうして来た事件は、権利者による許可の拒絶にも関わらず著作物を利用した被告に関するものである。海賊版又は違法にアクセスされたマテリアルによる学習はさらに一歩先を行く[原注294:さらに、幾つかの意見は、著作権者のそのマテリアルがAIの学習のために使われる事に対する「オプトアウト」の程度、利用規約、robot.txtによる指示又は他の手段を通じて、被告がその様なオプトアウトを無視する決定をしているかどうかがフェアユース分析に情報を与え得るであろうと示唆している。例えば、N/MA初期意見、第44ページ;パメラ・サミュエルソン他初期意見、第24ページ(「被告の…robot.txtによる除外及び類似のメカニズムの無視はそれぞれ第4の要素においてフェアユースに否定的な主張となり得るであろう。」)参照。]。誰かが公正に利用するためにそれを入手しようとして来た場合であっても、著作権者はその作品に対するアクセスをコントロールする権利を有する[原注295:アメリカ著作権法第1201条(その作品へのアクセスをコントロールするために著作権者により利用される技術的保護手段の回避の禁止)参照;サミュエルソン他初期意見、第24ページ(「著作権者がフェアユース自体について課金する権利を持たないにせよ、その作品へのアクセスについて課金する権利を有すると主張し得るであろう。そうであるならば、強行的な理由なくその大規模言語モデルを学習させるために商業的利用者がアクセス市場を迂回するのは有害か不公正なものとみなされるべきであろう。」)。]。したがって、違法アクセスの入手はその利用の性格に影響する。

 ここで書かれている事も特におかしな事はなく、今までの様々なアメリカの主要な著作権判例、特に2023年のウォーホル事件アメリカ最高裁判決(ウォーホルによるプリンス作品への写真の利用はフェアユースに十分なほど変形的でないとしたケース、英語版Wikipedia参照)、2021年のグーグル対オラクル事件最高裁判決(JavaのAPI利用はフェアユースであると判断したケース、第440回参照、英語版Wikipediaも参照)、1994年のキャンベル事件最高裁判決(商業的パロディはフェアユースに該当すると判断したケース、英語版Wikipedia参照)などに照らし、AI学習への著作物の利用をどの様に考えるかをあり得るやり方で書いていると思うが、この報告書の分析は第1の要素の中でもウォーホル事件最高裁判決に依拠して変形性を若干強調し過ぎている様に私には見える。これはアメリカにおける最も最近の判例なのでやむを得ないかも知れないが、私自身はウォーホル事件におけるアメリカ最高裁の多数意見の判断は間違っていると思っているし、AI学習自体が新しい利用形態である事、フェアユースの判断においては常に新たな状況に応じて各要素を総合考慮すべきである事を忘れてはならないだろう。(アメリカのウォーホル事件についてはここで取り上げていなかったのだが、ウォーホル事件に対する私の考えとそこからAI学習のための著作物の利用についてどう考えるべきかという事はできればまたどこかで書きたいと思っている。)

 繰り返しになるが、このアメリカ著作権局のプレ公開版報告書第3部は、全体として、今までのアメリカの判例などに照らし、AI学習のための著作物の利用はフェアユースとなる場合もならない場合もあるだろう事を詳細に中立的にまとめた資料として精読に値するものである。ただ、上の変形性に関する部分など、検討の詰めが若干甘い様に見える所はプレ公開版として急ぎ公表した影響もあったのかも知れず、著作権局長の解任によって正式版の公表がもしかしたら遅れるか、公表されないかも知れないのはかなり残念である。

 知財本部の次回5月19日の構想委員会の議事(開催案内参照)を見ると、そろそろ今年の知財計画が決定されるのではないかと思えるので、次回おそらく知財計画の文章の確認をしてから、またAIと知的財産の関係に関する国際動向について書いて行きたいと思っている。

| | コメント (0)

«第511回:人間でない人工知能(AI)は特許法上の発明者たり得ない事を再確認する2025年1月30日の知財高裁判決