OpenAIは「より安全で透明性の高いAIエコシステムのためのコンテンツプロベナンスの推進」と題する投稿を公開しました。これは、業界全体が長年注目してきたあることを発表したものです。OpenAIはC2PA運営委員会に参加し、生成画像にGoogleのSynthIDウォーターマークを追加し始め、画像がOpenAI製かどうかを判別する公開ツールをプレビューし、研究者アクセスプログラムを通じてDALL-E 3の画像検出分類器へのアクセスを公開しました。この単一の投稿は、有用な指標となります。「この画像は本物か?」という疑問は、もはやファクトチェッカーだけの特別な懸念ではありません。今や、ジャーナリスト、採用担当者、出会い系アプリの利用者、保険査定人、そして一般の人々が日常的に行う標準的な確認事項となっています。
要約
画像がAI生成されたものかどうかを確認するには、信頼性の段階を下ってチェックします。まずC2PAコンテンツ認証情報(暗号学的来歴メタデータ)を検査し、次にGoogle SynthIDのような不可視の透かしをスキャンし、その後機械学習検出ツールに通し、肉眼で視覚的な特徴を探し、最後に画像検索を試します。どの単一の方法も決定的ではありません。来歴メタデータは存在すれば最も強力なシグナルですが、容易に除去されるため、複数の方法を組み合わせて証拠を評価する必要があります。
最も速く実用的なワークフロー:
- 元のファイルを入手する。スクリーンショットや再保存されたコピーは、最も有用な証拠を破壊します。可能な限り、元のファイルを要求してください。
- C2PAコンテンツ認証情報を確認する。ファイルをコンテンツ認証情報検証ツールにアップロードし、来歴マニフェストが存在する場合は読み取ります。
- 不可視の透かしをスキャンする。画像をGoogleのSynthID検出ツールに通し、GoogleまたはOpenAIの透かしがあるかどうかを確認します。
- ML検出ツールを実行する。来歴や透かしが見つからない場合、分類器ベースの検出ツールまたはAPIを使用して確率スコアを取得します。
- 画像を肉眼で検査する。手、テキスト、ジュエリー、歯、反射、照明などに注目しますが、これらの特徴はトップティアのモデルでは通用しないことを認識しておいてください。
- 画像検索を行う。オンラインで画像の履歴をたどり、いつどこで最初に現れたかを確認します。
- 証拠を評価する。結果は判決ではなく、確信度として扱います。
なぜこれが難しいのか、なぜ複数の方法を組み合わせる必要があるのか
2年前なら、ほとんどのAI画像は一瞬で見破ることができました。手には6本の指があり、背景のテキストは意味不明な記号でした。眼鏡は顔に溶け込んでいました。しかし、主要なモデルにおいては、その時代は終わりました。現在の画像生成ツールは、通常の検査に合格し、専門家の検査にも耐える写真を生成します。広く引用されている統計がそのギャップを示しています。高品質な合成メディアに関する研究では、人間がディープフェイク動画を正しく識別できたのは約4分の1の時間に過ぎませんでした。もはやあなたの目は信頼できる検出器ではありません。
そこで、この分野では2つのより良いアイデアへと移行しました。1つ目は来歴(プロベナンス)です。事後に偽造を検出しようとするのではなく、作成時に署名された来歴記録をファイルに付与するものです。2つ目は透かし(ウォーターマーク)です。対応するデコーダーが後で読み取れるように、統計的信号をピクセル内に隠すものです。どちらもプロアクティブな方法です。どちらも生成側の協力に依存します。そして、どちらも証拠を剥奪しようと決意した者によって打ち破られる可能性があります。

これが、単一のツールではなく、複数の方法を組み合わせる必要がある核心的な理由です。来歴は最も強力なシグナルですが、オプトインであり脆弱です。透かしは耐久性がありますが、モデルに固有です。分類器はあらゆる画像に機能しますが、確率的であり誤検知を生成します。視覚検査は普遍的ですが、優れたモデルには信頼できません。それぞれ方法が、他の方法の弱点を補います。それらを順番に実行し、明確な答えが得られたら停止してください。もし何も得られなかった場合、その不確かさ自体が発見です。
方法1:C2PAコンテンツ認証情報の確認(最も信頼性が高い)
C2PAは、「コンテンツ来歴と信頼性のための連合(Coalition for Content Provenance and Authenticity)」の略です。これは、Adobe、Microsoft、Google、OpenAI、BBC、主要なカメラメーカーが支援するオープンな技術標準であり、改ざん防止機能付きの暗号署名されたメタデータブロックをメディアファイルに付与します。そのブロックはマニフェストと呼ばれます。ユーザー向けのブランド名はコンテンツ認証情報です。
C2PAをサポートするツールが画像を作成または編集する際、何が起こったか(どのソフトウェアがいつファイルを作成したか、AIが関与したか)を記述したマニフェストを書き込みます。マニフェストは暗号署名されています。後で誰かが再署名なしに画像を改変した場合、検証は失敗します。OpenAIは2024年以来DALL-E 3画像にC2PAコンテンツ認証情報を付与しており、2026年5月の発表で、OpenAIがC2PA準拠のジェネレーターになったことを確認しました。これは、他のプラットフォームがその来歴データを読み取り、保存し、伝達できることを意味します。
確認方法
技術的な知識は必要ありません。無料のブラウザ内検証ツールを使用してください。
- 元の画像ファイルを入手してください。これは他のどの方法よりも重要です。
- コンテンツ認証情報インスペクターを開きます。公式のものは contentcredentials.org にあります。他にも無料のC2PAビューアが存在します。
- ファイルをアップロードまたはドラッグします。処理はブラウザ内で実行され、ファイルがサーバーに送信されることはありません。
- 結果を読み取ります。以下の3つのいずれかの結果が表示されます。来歴の詳細が記載された有効なマニフェスト、コンテンツ認証データがまったくない、または無効か改ざんされたマニフェスト。
有効なマニフェストは、その画像が特定のAIツールによって生成されたこと、または特定のカメラから来て指定されたソフトウェアで編集されたことを示すことができます。これは、画像チェックにおいて真実に最も近いものです。
大きな注意点
C2PAは、認証情報が存在し、かつ完全な場合にのみ役立ちます。以下はそれを破壊する要因です。
- スクリーンショット。画像をスクリーンショットすると、マニフェストのない新しいファイルが作成されます。
- 再エンコード。多くの「名前を付けて保存」操作や形式変換はメタデータを削除します。
- ソーシャルプラットフォーム。いくつかのプラットフォームは、アップロード時にC2PAメタデータを削除したり、保存しなかったりします(ただし、これは徐々に改善されています)。
- 意図的な削除。画像の来歴を隠したい人は誰でも、数秒でマニフェストを削除できます。
もう1つ、明確に述べるべき微妙な制限があります。C2PAはマニフェストの完全性を検証するのであって、コンテンツの真実性を検証するわけではありません。設定された、または誤解を招く写真でも、署名後に誰も変更していなければ、完全に有効な署名を持つことができます。したがって、有効な認証情報は、画像の来歴と編集履歴の強力な証拠として扱い、画像が現実を写しているという証明としては扱わないでください。コンテンツ認証情報が見つからなくても、それが画像が偽物である、または本物であるという証拠ではありません。この方法では何も得られなかったという意味であり、次の方法に移るだけです。
方法2:SynthIDのような不可視の透かしを検出する
来歴メタデータがパッケージの外側に貼り付けられた領収書であるとするなら、不可視の透かしは生地そのものに織り込まれたパターンです。Google DeepMindによって開発されたSynthIDは、GoogleのGeminiおよびImagenモデルによって生成された画像のピクセルに、知覚できない信号を直接埋め込みます。この変更は人間には見えませんが、対応するデコーダーによって検出可能です。
メタデータに対する利点は、その耐久性です。透かしはピクセル内に存在するため、スクリーンショット、トリミング、圧縮、色調整、再保存など、C2PAメタデータを消去する多くの変換に耐えられます。Googleによると、SynthIDは画像、音声、動画、テキストを含む数十億件のAIコンテンツに適用されてきました。そして2026年5月の発表以来、OpenAIも自身の生成画像にSynthID透かしを追加しており、これにより単一の検出器が最大手のモデルプロバイダー2社からのコンテンツをカバーできることになります。
確認方法
Googleは公開のSynthID検出器ポータルを運営しています。画像をアップロードすると、透かしをスキャンし、透かしが存在するかどうかを報告し、多くの場合、それが存在する可能性が高い領域を強調表示します。この技術に関する背景情報は、Google DeepMindのSynthIDページで読むことができます。
注意点
透かし検出は強力ですが、範囲が限定的です。
- モデル固有である。SynthID検出は、画像がSynthID透かしモデルから来たものかどうかを教えてくれます。Midjourney、Stable Diffusion、または透かしを使用しないモデルからの画像は、単に「クリーン」と判定されます。「クリーン」は人間が作成したことを意味しません。
- カバレッジは部分的である。透かしはプロバイダーごとのオプトインです。オープンソースモデルは、まったく透かしなしで実行できます。
- 大幅な編集は依然として劣化させる可能性がある。SynthIDは一般的な変換に耐えるように構築されていますが、積極的な操作、再生成、または極端な圧縮は信号を弱める可能性があります。
SynthIDの陽性結果は、強力で偽造が難しい「はい、これはAIです」という証拠になります。陰性結果はそれ自体ではほとんど意味がありません。この非対称性を覚えておくことが重要です。
方法3:ML検出分類器またはAPIを使用する
画像にプロベナンスメタデータも検出可能な透かしもない場合(これは世の中のほとんどの画像に当てはまります)、検出分類器に頼ることになります。これらは、大量の実画像と合成画像でトレーニングされた機械学習モデルです。これらは、自然なセンサーノイズの欠如、周波数領域のアーティファクト、肉眼では見えないテクスチャパターンなど、AIジェネレーターが残す統計的特徴を学習します。画像をアップロードすると、「87%の確率でAI生成された可能性が高い」といった確率が得られます。
いくつかの商用および無料ツールがこの方法で機能し、多くは画像を生成したモデル名を特定しようとします。2026年の独立したベンチマークでは、主要な検出器が標準テストセットで約90%台の精度を達成していることがわかりましたが、実際の性能はソースモデル、圧縮、編集によって異なります。OpenAI独自のDALL-E 3検出分類器(2026年5月に研究者向けに公開)は、このカテゴリの特殊な例です。
開発者にとって、実用的なアプローチは、自分のアプリケーションから検出APIを呼び出すことです。プロバイダーを評価している場合、開発者向けの最高のAI画像検出APIに関する弊社のまとめでは、精度、価格、サポートされているモデルを比較しています。また、パイプラインを自分で管理したい場合は、独自のAI画像検出APIを構築する方法に関するこのウォークスルーで、分類器のトレーニングと提供について説明しています。いずれにしても、実際のテスト画像をエンドポイントに送信し、それらに依拠する前に応答を確認する必要があります。その要求と検証のループは、APIクライアントの日常業務です。Apidogでは、保存された環境でこれらの呼び出しをスクリプト化して再生できるため、開発環境と本番環境で検出チェックが同じように動作します。検出ロジックがAIエージェントに組み込まれている場合、Apidog AIエージェントデバッガーは、モデルが送信および受信したものを正確に追跡するのに役立ちます。
注意点
分類器は最も広範囲に適用可能な方法ですが、最も不確実です。
- 誤検知は存在する。検出器は、特に大幅に編集された写真、スクリーンショット、低照度で撮影された写真、または滑らかでテクスチャの少ない表面を持つ画像を、誤ってAIとして識別することがあります。これは、誤って告発されたアーティストや学生に実害をもたらしています。
- 新しいモデルに追いつかない。新しいジェネレーターがリリースされる前にトレーニングされた分類器は、そのモデルの特性を学習していません。新しいモデルに対する検出精度は、多くの場合、宣伝されている数字よりもはるかに低くなります。
- 敵対的編集によって打ち破られる。軽微なノイズ、再圧縮、またはフィルターによって、画像が分類器の決定境界を越えてしまうことがあります。
- スコアは確率であり、判決ではない。「AI生成の可能性73%」は、モデルが不確実であることを意味します。中間の範囲のものはすべて決定的ではないと見なしてください。
これらの失敗モードについては、AI画像検出が失敗する理由に関する専用の記事で詳しく説明しています。要するに、詐欺や不正行為で誰かを告発するような重要な決定を、単一の分類器スコアだけで下してはいけません。
方法4:手動による視覚検査(注意して使用する)
これは誰もが最初に手にする方法ですが、最後の方に使うべきです。古いモデルや弱いモデル、あるいは結果を厳選しなかった人々の出力では、視覚的な特徴はまだ機能します。以下は注目すべき点です。
- 手と指。いまだに古典的な弱点です。指の数を数え、余分な関節、癒合した指、不自然な曲がり方をしている手がないか確認してください。
- テキスト。背景の看板、本の背表紙、ポスター、衣類のロゴは、しばしば歪んでいて、かろうじて文字とわかるような形で表示されます。
- 歯とジュエリー。歯が多すぎたり、大きさが不揃いだったり、イヤリングが左右で異なったり、ネックレスのチェーンが肌に溶け込んだり、太さが変わったりしています。
- 関節とアクセサリー。時計のストラップ、眼鏡のテンプル、ベルトのバックルなどが不自然に接続されていたり、体の後ろに消えていたりします。
- 反射と影。鏡、サングラス、水がシーンを正しく反射していない。影が不規則な方向に落ちている。
- 照明と物理。互いに矛盾する複数の光源。完璧に照らされた被写体に対して、ありえないほどぼやけた背景。
- 背景。繰り返されるテクスチャ、互いに溶け合うオブジェクト、不可能な幾何学構造の建築物。
- 出力解像度。多くのモデルは、限られた固定された寸法で画像を生成します。既知のジェネレーターのデフォルトと解像度が完全に一致する写真は、あくまでも「可能性のあるヒント」であり、決して「証明」ではありません。
- 肌とテクスチャ。エアブラシをかけたような、プラスチックのような均一性。本当の肌には毛穴、非対称性、微細な不完全さがあります。
正直な注意点
これを2回読んでください:現在のトップティアモデルでは、手動検査は失敗します。2026年を代表する生成ツールは、ほとんどの場合、正確な手、読みやすいテキスト、一貫した照明を生成します。意図的にフェイクを提示する人は、悪い出力を捨てて完璧なものだけを残すでしょう。したがって、視覚検査には2つの正しい使い方があります。第一に、明確なエラーを見つけた場合、AI生成を素早く確認できます。明らかな6本指の手は強力な「はい」のサインです。第二に、直感を養います。しかし、目に見える特徴がないことは、ほとんど何も教えてくれません。完璧な画像とは、優れた生成ツールや優れたカメラが作り出すものです。「何もおかしいところがない」から「だから本物だ」と決めつけないでください。
方法5:画像検索
画像検索は、AIの指紋のためにピクセルを分析するわけではありません。それは履歴を分析します。画像を検索エンジンに提出し、他にどこでオンラインに表示されているかを確認します。そのコンテキストは、AIの質問に間接的に、そして時には決定的に答えることができます。
Google画像検索、TinEye、または類似のサービスを使用してください。探すべきものは以下の通りです。
- 明確な出所。画像がストックライブラリ、名の知れた写真家のポートフォリオ、または数年前のニュースレポートに遡る場合、それは現在のAIの波より前の本物の写真である可能性が高いです。
- AIの出所。AIアートコミュニティ、「Midjourneyで作成」ギャラリー、またはプロンプト共有サイトに遡る場合、それが答えです。
- 不審なプロフィール。何十もの無関係なプロフィールに写真が現れる、またはどこにも現れない「人物」は、古典的な合成アイデンティティのシグナルです。多くの偽のLinkedInや出会い系プロフィールは、検索の痕跡を残さないため、AI顔を使用します。
- コンテキストの不一致。速報として提示された画像が、実際には数年前に、あるいは別の国で登場していた場合、それがAIであるかどうかにかかわらず、誤って表現されています。
画像検索は、相互チェックとして最も役立ちます。以前に一度も投稿されたことのない、新しく生成された画像を見つけることはできません。なぜなら、何も見つけるものがないからです。しかし、一度流通した画像であれば、ピクセルベースの方法では得られない証拠の層を追加します。
比較:5つの方法の概要
単独で機能する方法はありません。この表はトレードオフをまとめたもので、あなたの状況に合った適切な出発点を選ぶのに役立ちます。
| 方法 | 信頼性 | 検出対象 | 見逃し対象 | 労力 / コスト |
|---|---|---|---|---|
| C2PAコンテンツ認証情報 | 存在する時、最高 | 出所、編集履歴、AI関与、署名され検証可能 | スクリーンショット、再エンコード、またはメタデータが剥奪されたもの | 低; 無料ブラウザツール |
| 不可視の透かし (SynthID) | 存在する時、高 | 透かしモデルからのAI画像 (Google、そして現在OpenAI) | 透かしなしモデル、オープンソース生成ツール、大幅に劣化したファイル | 低; 無料ポータル |
| ML検出分類器 / API | 中程度; 確率的 | あらゆる画像の統計的AI指紋、メタデータ不要 | 新しいモデル、敵対的編集; 誤検知を生成 | 低〜中; 無料ツールまたは有料API |
| 手動視覚検査 | トップモデルでは低 | 弱い出力または厳選されていない出力における明白なエラー | 現在の主要モデルからのもの、または厳選されたフェイク | 低; 無料、ただし訓練された目が必要 |
| 画像検索 | 中程度; 間接的 | 画像の履歴、元のソース、再利用または誤表示された画像 | 以前に投稿されたことのない新しく生成された画像 | 低; 無料 |
パターン:方法1と2は、機能した場合にほぼ確実な情報を提供しますが、しばしば何も返しません。方法3から5は常に何らかの情報を提供しますが、確実性はありません。効果的な実践としては、まず方法1と2を実行して迅速な判断が得られるかを確認し、次に3、4、5を組み合わせて加重評価を行うことです。
複数の方法を組み合わせて結論を出す方法
シンプルな意思決定フローとしてまとめます。
- 元のファイルは手元にありますか?もしあれば、C2PAコンテンツ認証情報を確認してください。有効なAIマニフェストはほぼ決定的な「はい」です。AIの主張がない有効なカメラマニフェストは、本物の写真である強力な証拠です。認証情報がない場合は続行します。
- SynthIDをスキャンする。陽性反応は強力な「はい」です。陰性結果の場合は続行します。何も除外するものではありません。
- 分類器を実行する。非常に高いスコア(約90%以上)と他のコンテキストが一緒であれば、確実な「はい」です。非常に低いスコアは本物に近い傾向です。中程度のスコアは決定的ではないため、軽く扱います。
- 視覚的に検査する。明確な解剖学的またはテキストのエラーがあれば、確実な「はい」です。目に見えるエラーがなくても何も変わりません。
- 画像検索を行う。出所を確認し、誤って表現された画像を特定するために使用します。
- 二者択一ではなく、確信度を書き留める。「SynthIDの陽性反応と分類器スコア94%に基づき、AI生成であるとの確信度が高い」という記述は、弁護可能なものです。「それはフェイクだ」ではありません。
問題を避けるための考え方:あなたは証拠を集めているのであり、スイッチを切り替えているのではありません。シグナルが一致する場合、あなたは確信を持つことができます。それらが矛盾する場合や、すべてが空の場合、正しい出力は「未確定」であり、推測するのではなくそのように述べるべきです。
結論
2026年において、画像がAI生成されたものかどうかを確認することは、単一のテストを実行するのではなく、証拠を評価するプロセスです。主な要点:
- 信頼性の高い順に手順を進める:C2PAコンテンツ認証情報、次にSynthIDのような不可視の透かし、次にML分類器、次に視覚検査、最後に画像検索。
- 来歴と透かしは、機能した場合にほぼ確実性を提供するものの、メタデータが除去されたり、透かしがモデル固有であるため、しばしば何も返しません。
- 分類器は常にスコアを返しますが、確実性はありません。誤検知は一般的であるため、単一の数値だけで誰かを非難してはいけません。
- 現在のトップモデルでは手動検査は失敗します。明白なエラーを確認するために使用し、画像を本物と断定するために使用してはいけません。
- OpenAIの2026年5月の発表は重要です。なぜなら、SynthIDとC2PA準拠の追加により、2つの主要なプロバイダー間での来歴の耐久性が向上し、これが業界全体の進む方向だからです。
- 常に確信度を報告し、証拠が空であるか矛盾する場合は「未確定」と述べてください。
製品に検出機能を組み込む開発者であれば、次の自然なステップは、検出APIを接続し、実際の入力で正しく動作することを確認することです。Apidogをダウンロードして、保存されたリクエストと環境を使用して、その統合を1つのワークスペースで設計、デバッグ、テストし、画像チェックエンドポイントがどこでも同じように動作するようにしてください。
