LLMO対策の多くはコンテンツ施策に焦点が当たりますが、技術基盤(テクニカルSEO)が整っていなければコンテンツの効果は半減します。AIクローラーがサイトに正しくアクセスし、効率的に情報を取得できる環境を整えることがLLMO対策の土台です。
本記事では、LLMO対策の観点から重要なテクニカルSEO施策を解説します。クロール制御、インデックス最適化、サイト速度、構造化データの検証まで、技術担当者が実行すべき施策を網羅します。
AIクローラーの種類と特徴
| クローラー名 | 運営元 | 目的 | robots.txtのUser-agent |
|---|---|---|---|
| GPTBot | OpenAI | 学習データ収集 | GPTBot |
| ChatGPT-User | OpenAI | ブラウジング(リアルタイム) | ChatGPT-User |
| OAI-SearchBot | OpenAI | SearchGPT用の検索 | OAI-SearchBot |
| Google-Extended | Gemini学習データ収集 | Google-Extended | |
| Googlebot | 検索インデックス(AI Overviewsも含む) | Googlebot | |
| PerplexityBot | Perplexity | リアルタイム検索 | PerplexityBot |
| anthropic-ai | Anthropic | Claude学習データ収集 | anthropic-ai |
| ClaudeBot | Anthropic | Claudeブラウジング | ClaudeBot |
クロール制御の最適化
robots.txtの設定
全てのAIクローラーを許可する基本設定です。
# Search engines
User-agent: Googlebot
Allow: /
User-agent: Bingbot
Allow: /
# AI crawlers
User-agent: GPTBot
Allow: /
User-agent: ChatGPT-User
Allow: /
User-agent: OAI-SearchBot
Allow: /
User-agent: Google-Extended
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: anthropic-ai
Allow: /
User-agent: ClaudeBot
Allow: /
# Sitemap
Sitemap: https://example.com/sitemap.xml
特定のディレクトリ(管理画面、会員限定コンテンツ等)をブロックする場合は、Disallow で明示的に指定します。
llms.txtの設置
llms.txtは、AIクローラーに対してサイトの概要と主要コンテンツを伝えるためのファイルです。サイトのルートディレクトリに設置します。
# llms.txt
# サイト名: 〇〇株式会社
# 概要: 〇〇領域の専門メディア
## 主要コンテンツ
- /llmo-basics/what-is-llmo/ : LLMOとは?定義と対策方法の網羅解説
- /llmo-tactics/llmo-taisaku-methods/ : LLMO対策の具体的な方法
- /tools/llmo-diagnosis/ : LLMO対策スコア診断ツール
## サイト情報
- 運営: 〇〇株式会社
- 設立: 20XX年
- 専門領域: 〇〇
インデックス最適化
XMLサイトマップの最適化
AIクローラーもXMLサイトマップを参照してクロール対象を決定します。以下のポイントを確認しましょう。
- 全ての重要ページがサイトマップに含まれている
- lastmod(最終更新日)が正確に設定されている
- noindexのページがサイトマップに含まれていない
- Google Search ConsoleとBing Webmaster Toolsの両方に送信済み
canonical タグの適切な設定
重複コンテンツがある場合、canonicalタグで正規URLを指定します。AIクローラーもcanonicalを参照するため、正しく設定されていないと引用元URLが意図しないページになる可能性があります。
Bing Webmaster Toolsの活用
ChatGPT、SearchGPT、PerplexityはBing検索をバックエンドとして使用しています。Bing Webmaster Toolsでインデックス状況を確認し、クロールエラーがないかチェックしましょう。Google Search Consoleからのインポートで簡単に設定できます。
サイト速度とパフォーマンス
AIクローラーとページ速度
AIクローラーは大量のページを短時間で巡回するため、サーバーの応答速度が重要です。応答が遅いとクロールが途中で打ち切られ、コンテンツが取得されない可能性があります。
目標値:
- サーバー応答時間(TTFB): 200ms以下
- ページ読み込み時間: 3秒以下
- Core Web Vitals: すべて「良好」
レート制限の確認
CDNやWAF(Web Application Firewall)がAIクローラーのアクセスをレート制限していないか確認します。特にCloudflareを使用している場合、ボット検知機能がAIクローラーをブロックすることがあります。
構造化データの検証と保守
定期的な検証
構造化データは実装後も定期的に検証する必要があります。テーマの更新やプラグインの変更で構造化データが壊れるケースがあるためです。
検証ツール:
- Googleリッチリザルトテスト(個別ページの検証)
- Schema.orgバリデーター(JSON-LDの構文チェック)
- Google Search Console「拡張」セクション(サイト全体のエラー確認)
dateModifiedの自動更新
Article構造化データのdateModifiedが記事更新時に自動更新される仕組みを構築します。WordPressの場合、the_modified_date()関数で取得した日付をJSON-LDに出力するのが確実です。
テクニカルSEO for LLMO チェックリスト
| カテゴリ | チェック項目 | 確認方法 |
|---|---|---|
| クロール | AIクローラーがrobots.txtで許可されている | robots.txt確認 |
| クロール | llms.txtが設置されている | /llms.txt にアクセス |
| クロール | サーバーログにAIクローラーのアクセスがある | アクセスログ確認 |
| インデックス | XMLサイトマップが最新 | GSC / Bing WT確認 |
| インデックス | Bing Webmaster Toolsに登録済み | Bing WT確認 |
| インデックス | canonicalタグが正しく設定されている | ページソース確認 |
| 速度 | TTFB 200ms以下 | PageSpeed Insights |
| 速度 | CDN/WAFがAIクローラーをブロックしていない | サーバーログ確認 |
| 構造化 | FAQPage構造化データにエラーがない | リッチリザルトテスト |
| 構造化 | dateModifiedが自動更新される | JSON-LD出力確認 |
まとめ:技術基盤がLLMO対策の効果を最大化する
テクニカルSEOはLLMO対策の「縁の下の力持ち」です。AIクローラーが正しくサイトにアクセスし、効率的に情報を取得できる環境を整えることで、コンテンツ施策の効果が最大化されます。
まずはrobots.txtの確認、llms.txtの設置、Bing Webmaster Toolsの登録から始め、構造化データの検証と速度改善を段階的に進めましょう。
LLMO対策の全体像はLLMOとは?定義・仕組み・対策方法を網羅解説で、構造化データの実装は構造化データとLLMOの関係で解説しています。自社の対策状況はLLMO対策スコア診断ツールで無料診断できます。
テクニカルSEO for LLMOに関するよくある質問
Qrobots.txtでAIクローラーを許可するリスクはありますか?
コンテンツの無断利用リスクはありますが、ブロックするデメリットの方が大きいです。AIクローラーをブロックするとAI検索結果に一切表示されなくなり、競合に引用枠を奪われます。現時点では許可して引用のメリットを享受することを推奨します。
Qllms.txtは必須ですか?
必須ではありませんが、設置を推奨します。llms.txtはAIクローラーに対してサイトの構造と重要コンテンツを効率的に伝える手段です。設置コストは低い(テキストファイル1つ)一方、AIの情報取得効率を高める効果が期待できます。
QCDNを使っているとAIクローラーがブロックされますか?
設定によります。CloudflareなどのCDN/WAFは、ボット検知機能でAIクローラーのアクセスをブロックまたはチャレンジ(CAPTCHA表示)することがあります。CDNの設定でAIクローラーのUser-agentをホワイトリストに追加するか、ボット管理設定を確認してください。

