AI技術の急速な発達の裏で、AIモデルの学習にウェブ上のコンテンツが収集されています。
コンテンツの制作者にとって、自分が書いた記事や作った画像が勝手にAIの学習データとして使われるのを好ましく感じない人も多いでしょう。
「自分のブログ記事や商品情報が、勝手にAIの学習に使われているかもしれない」
そんな心配をしているウェブサイト運営者の方は多いのではないでしょうか。
実際に、以下のような問題がおきています
・許可なくサイトデータがダウンロードされ勝手に使われる
・普通の訪問者よりもはるかに多い頻度でアクセスしてくるため、サーバーに負担がかかる
・エンドユーザーの疑問にAIが直接答えてくれるので、サイトを見に来る人が減る
・サイトに設置した広告が見られなくなる(広告での収入が激減)
Cloudflareでは、追加費用なしでそんなAIクローラーをブロックしてコンテンツを守る機能があります。
普通のボットとAIクローラーの違い
ところで、AIのことをAIクローラーと呼ばれたりしますが、ボットとAIクローラーは何が違うのでしょうか?
分類としては、いずれも人間ではないコンピュータを示しています。
ウェブ上にはいろんな「ボット」がありますが、みんな同じことをしているわけではありません。
検索エンジン(クローラー)
わかりやすい例として、たとえば、Googlebot、Bingbotなどの検索エンジンもボットの一種です。
これらは、検索結果に表示するためにサイトの情報を集める、無害なボット(許可された)です。
AI(LLM)
一方、 ChatGPTのGPTBot、ClaudeBotなどはAIクローラーと呼ばれます。
これらは、大規模言語モデル(ChatGPTやClaudeなど)の学習データとしてコンテンツを集めています
集めたデータは主にAIの学習や応答に使われます。
AIクローラーは、冒頭に挙げたような問題を引き起こしています。
CloudflareならAIクローラーだけをブロックできる
CloudflareのAIブロック機能は、SEOに大切な検索エンジンボットはそのままにして、AI学習目的のボットだけをブロックできます。
これで、検索結果に表示される効果は保ちながら、AIに情報収集されるのを防げます。
CloudflareのAIブロック機能をオンにすると、これらのAIクローラーが自動的にブロックされます。
ブロックされるAIクローラー一覧
ボット名 | 運営会社 | 何に使われる? |
---|---|---|
GPTBot | OpenAI | ChatGPTの学習用 |
ClaudeBot | Anthropic | Claudeの学習用 |
Amazonbot | Amazon | AmazonのAIサービス用 |
Applebot | Apple | AppleのAI機能用 |
Bytespider | ByteDance | TikTokの親会社のAI用 |
Google-CloudVertexBot | Google CloudのAI用(普通のGooglebotとは別物) | |
GoogleOther | その他GoogleのAI用 | |
Meta-ExternalAgent | Meta | MetaのAI学習用 |
PetalBot | Huawei | HuaweiのAI用 |
TikTokSpider | ByteDance | TikTok関連のAI用 |
DuckAssistBot | DuckDuckGo | DuckDuckGoのAI機能用 |
CCBot | Common Crawl | 大規模なウェブデータ収集用 |
このリストは定期的に更新されて、新しいAIクローラーも追加されます。
CloudflareのAIブロック機能の設定はとても簡単
Cloudflareの管理画面にログインし、右側にある「AIクローラーを制御する」という項目の
「AIトレーニング ボットをブロックする」をオンにするのみです。

たったワンクリックで、上に書いたAIクローラーがすべて自動でブロックされます。
「このAIだけは許可したい」という細かい調整も可能
さきほどの設定は、AI監査(AI Crawl Control)という画面で確認・調整(許可orブロック)ができます。
先ほどの「AIトレーニング ボットをブロックする」をONにすることでいくつかのボットがブロックになっている状態です。

設定するとAIからはどう見える?
実際にAIブロック機能をオンにすると、AIクローラーがサイトにアクセスしようとした時はこうなります。

Cloudflareが何故ボットを遮断できるか?
Cloudflareは世界中でCDN・WAFとして使用されているため、世界のトラフィックのトレンドを熟知しています。
このノウハウによって、ボットを正確に判断しコントロールすることができます。
AIボットに対価をの請求する「Pay Per Crawl」
さらに、新機能として「Pay Per Crawl」のプライベートベータ版が登場しました。
これは単純にブロックするだけでなく、AIクローラーのアクセスに対して実際に課金できる機能です。
現在はベータ版ですが、将来的にはコンテンツとAIが共存する今後のスタンダードになるかもしれません。
Cloudflareの導入・各種機能のサポートはドーモまでご相談ください。
Web表示スピード改善・セキュリティ対策のCloudflare
導入のご相談だけでなく、運用フェーズでのサポートも承ります。
DDoS攻撃や悪質なBot(ボット)からのアクセスを防ぎたい方、WAF機能やプランの詳細を知りたい方、
国内エンジニアによる安心の運用サポートをご希望の方も、ぜひお気軽にお問い合わせください。