あなたの記事がAIに食べられた。
比喩ではない。事実である。OpenAIは、GPTを訓練するためにウェブ上の大部分のコンテンツをクローリングした。Google、Meta、Microsoft——皆が同じことをしている。あなたのGitHub repo、あなたのブログ、あなたのSNS投稿、すべてがどこかのデータセンターの訓練セットの中にある。
問題は:これは合法なのか?
答えはあなたがどこにいるかによる。
世界各国は「著作権保護」「技術革新」「商業包容」「TDM/AI免除」という4つの次元において、ウェブクローリングとAI訓練に対する法的姿勢が天と地ほど違う。レーダーチャートに描けば、手を開いている国もあれば、拳を固く握っている国もある。
日本は世界で最も急進的である。2018年に著作権法第30条の4を改正し、基本的にこう述べた:どのような目的であれ、著作権素材をクローリングして「情報解析」に使用することは可能である。AI研究?可能である。商業製品の訓練?これも可能である。日本は意図的に自国をAIフレンドリーな司法環境に作り上げようとし、アメリカの革新を見て、EUの規制を見て、最も寛容な側を選んだ。
シンガポールが後を追う。2021年に著作権法を改正し、商業用途の「計算データ分析」例外を明確に組み込み、アジア太平洋地域のAI革新の重要な拠点となった。
アメリカは別の道を歩んでいる——成文法の広範な免除に頼らず、司法判例に頼る。核心概念は「変形的フェアユース」と呼ばれる:あなたの使用方法が本質的に原始コンテンツの用途と意味を変えるなら、侵害にあたらない可能性がある。Googleは数百万冊の書籍をスキャンし、著作権者が法廷に持ち込んだが、裁判所は言った:これは変形的である、合法である。AI訓練も同じ論理に従う——あなたの記事は取られたが、あなたの記事を売っているのではなく、それを統計的重みに変え、新しいテキストを生成できるシステムにしたのである。
アメリカのポジション:最も寛容。革新優先。市場が語る。
EUは2019年に「デジタル単一市場著作権指令」を可決し、核心設計は大きく異なる:TDMは許可されるが、巨大な「ただし」がある——権利者はオプトアウトできる。Le MondeやDer Spiegelが「我々をクローリングするな」と言えば、クローラーは停止せねばならない。
このフレームワークの論理は:革新は重要だが、クリエイターの権利も重要なので、選択肢を与える。実際はどうか?大手出版社はオプトアウト機能を構築する能力があるが、小メディアや個人クリエイターは往々にして交渉権がない。結果として市場はより集中し、大勝者がより多く勝つ。
イギリスは現在「非商業研究」向けの限定的なTDM例外のみで、政策はまだ揺れている。全体的態度はEUより保守的である。
そして台湾である。
台湾には明確なTDM法的フレームワークがない。著作権法は存在するが、「どのような目的でデータをクローリングできるか」は明確に定義されていない。2024年のLawsnote案で、法律データベースプラットフォームがコンテンツクローリングのため厳格な判決を受けた。メッセージは明確である:クローリングにはリスクがあり、訴えられる可能性がある。
結果は萎縮効果である。AI革新を目指す台湾企業は自分たちの合法性が確信できない。コンテンツを保護したい台湾クリエイターは毎回自分で訴訟を起こさねばならない。これは「バランス」ではなく、指針なき空白である。
台湾の沈黙は降伏に等しい。なぜなら国際企業は彼らにとって最も有利な法律に従うからである——通常はアメリカ法である。あなたのコンテンツがアメリカ企業によってアメリカ法に基づいてクローリングされたのに、台湾法はあなたを保護もせず、励ましもしない。
私自身がこの状況にある。私がpaulkuo.twで書くすべての記事が、何らかのモデルの訓練に使われる可能性がある。私はこのことを知っている。私には阻止できない。もし私がEUに住んでいたら、Googlebotにクローリングを停止するよう要求できるだろう。もし私が日本に住んでいたら、少なくともゲームのルールが何かは知っているだろう。しかし私は台湾にいて、法律は私にツールを与えず、曖昧な脅威しか与えてくれない。
これは個人的問題ではない。これは体系的な不平等である。
いわゆるTDM——テキスト・データマイニング——は、プログラムを使用して大量のデジタルデータを自動分析する技術で、目的は非構造化テキストからパターンと知識を識別することである。これは大型言語モデルと生成AIの訓練の基礎技術である。AI免除は、AI訓練プロセスで一つひとつ著作権許可を得る必要のない法的例外である。各国の差異はここにある:この例外の範囲がどれほど広いか、クリエイターにオプトアウトの権利があるか。
前進の道は3つしかない。第一に、台湾はEUを学び、クリエイターがオプトアウトできるフレームワークを構築できる——だがこれは立法意志を要する。第二に、台湾は日本を学び、全面開放できる——だがこれはクリエイターを犠牲にする。第三に、現状の空白を維持する——そして空白の代価は、常に最も交渉権のない人が負担する。
今の問題はAIがあなたのコンテンツを使えるかどうかではない。当然使える。問題はあなたに何らかの発言権があるかどうかである。
アメリカでは、市場と裁判所が語る。EUでは、規制が語る。日本では、国家政策が語る。
台湾では、沈黙が語る。そして沈黙の代価を、すべてのクリエイターが支払う。
もうこのことが沈黙でなくなる時が来たのかもしれない。
💬 コメント
読み込み中...