生成AIの裏で大規模なプライバシー侵害　設計段階から違法性 : アムネスティ日本 AMNESTY

2026年5月29日: [国際事務局発表ニュース]; 国・地域：; トピック：企業の社会的責任

アムネスティは5月28日に発表した新たな報告書の中で、企業が生成AI（人工知能）製品を開発するために違法なウェブスクレイピングを通じて膨大な量のオンラインデータを収集しており、これが大規模なプライバシー侵害を引き起こしていると指摘した。そして生成AIは設計段階から違法だと結論付けた。

ウェブスクレイピングとは、ウェブサイトから画像やソーシャルメディアの投稿といった個人データを含む情報を自動的に収集するプロセスのことで、AIモデルの学習にも使われている。世界中の企業は、効率性と高度さをうたって生成AI製品を提供しているが、その実態は、違法なウェブスクレイピングを通じて大規模なプライバシー侵害を助長しているのだ。

同報告書は、生成AIの構築と学習に用いられている大規模なウェブスクレイピングおよび処理における深刻なリスクを明らかにしている。こうしたリスクには、設計段階からのプライバシー権の侵害をはじめ、環境や歴史的に不当な扱いを受けてきた社会集団への悪影響などがある。

生成AIシステムを構築するために一方的にデータを収集・利用する仕組みは、テクノロジー企業固有の設計上の選択や不当な労働を強いるサプライチェーンに支えられており、人権の大規模侵害を招きかねない技術開発の枠組みを可能にしてしまった。

アムネスティは、オープンAIのGPT-3やグーグルのGemini、メタのLlama、DeepSeek、Midjourney、Stable Diffusionなど、一般に公開されている最も人気の高い、単体で機能する生成AIツールを支える学習モデルについて調査を行った。

こうした生成AIは、オンライン上の数十億件に及ぶ公開投稿や画像から情報を収集することに依拠しているが、その多くは、そこに写っている人や作成者本人の明示的な同意なしに行われている。これはプライバシー侵害であるだけでなく、収集データが増大するにつれ、生成される憎悪や差別的な内容の存在も増え、特に人種やジェンダーに関する否定的な固定観念や偏見が増幅される。

人種、ジェンダー、文化をめぐる偏見は、生成AIシステムに共通して見られる特徴だ。これは、主にウェブから収集された学習データの産物であり、歴史的に不当な扱いを受けてきた社会集団に害をなす現実世界の偏った価値観に強く影響されるからだ。さらに、生成AIシステムは、予測に基づく提案を通じて利用者の思考に影響を与え、個人の信念を形づくる力を持つことから、思想の自由を脅かすおそれもある。特に、膨大な学習データに依拠する大規模モデルほど、この傾向が強い。

こうした選択は避けられないものではない。同意なく大規模に収集された個人データなどの学習データに依拠して生成AIシステムを構築する企業の設計選択に対し、私たちは強く問いただすべきだ。

このような設計のあり方は、人権を無視して事業を行うAI企業の中でも極めて深刻な慣行の一つであり、早急に対処しなければならない。当局が直ちに是正措置を講じれば、技術開発の軌道を変えることは可能だ。

多大な環境コスト

生成AI企業における開発の規模とスピードが加速するにつれ、インフラ要件とそれに伴う環境コストも増大している。

大規模モデルほど高い処理能力が必要なため、よりエネルギー消費量の多いチップや大規模なデータセンターが必要となり、その結果、運用にはより多くのエネルギーと水が必要となる。さらに、データセンターの建設や処理のために必要な土地や資源の確保において、歴史的に不当な扱いを受けてきた社会集団が搾取される。

グーグルが2024年に発表した自社のサステナビリティ報告書によると、同社の温室効果ガス排出量は2019年以降、データセンターおよびサプライチェーンからの排出に起因して、48％増という驚くべき増加を見せた。同様に、マイクロソフトの排出量も2020年から2024年の間に29％増加しており、これはAI支援プロセスを実行するデータセンターが要因だ。

生成AIの開発・運用における集中的な資源の消費は、チリのセリジョスから、メキシコのケレタロ、アメリカ合衆国のアリゾナに至るまで、各地で激しい反発を引き起こしている。すでに干ばつや電力不足に深刻な影響を受けているこうした地域では、住民がデータセンターの誘致・建設に抗議している。

アムネスティは調査の一環として、グーグル、オープンAI、メタ、Stability AI、Midjourney、DeepSeekに対し書簡を送付し、自社のモデルが違法なウェブスクレイピングに依拠していることなど、数多くの人権上の懸念を指摘した調査結果について回答する機会を設けた。

また、差別のリスクについてインテルとヴイエムウェアに、生成AIツールと関連インフラに伴う環境への悪影響についてグーグル、マイクロソフト、アマゾンに書簡を送付した。報告書の公表時点で、回答があったのは、マイクロソフト、アマゾン、インテル、オープンAI、メタのみである。各社の回答の概要は報告書に含まれている。

アムネスティは、違法なウェブスクレイピングを用いて構築された単体の生成AIツールを禁止するよう各国政府に求めている。企業は、AIに学習させることを目的とした個人データの違法で同意のないウェブスクレイピングを直ちに中止しなければならず、各国政府は、設計や事業上の選択に関連する人権侵害への加担について、企業の責任を追及しなければならない。

背景情報

本報告書は、生成AI製品の基盤となる「データパイプライン」（データ収集から処理までの一連の仕組み）について、人権の観点から分析を行っている。これには、AIが機能する上で不可欠なデータの収集、分析、処理の各段階が含まれる。具体的には、生成AIモデルの学習データに関連して下された設計上の選択をめぐる条件と影響を詳細に検証。特にデータ収集の方法や出所、データ処理、システムの規模調整、そして最終的なデータ生成について焦点を当てている。

アムネスティは、単体のAIツールを、AIチャットボット、画像・動画・音声・テキスト生成ツールなど、生成AI機能のみを目的として開発、展開、販売される製品と定義している。これには、生成AIがより大規模な製品群における一機能として組み込まれている製品（例えば生成AI機能を追加搭載できる文書作成ソフトなど）は含まれない。

アムネスティ国際ニュース
2026年5月28日

英語のニュースを読む

Global: Enormous data pipelines powering major generative AI systems are rooted in mass invasions of privacy by design