AIの活用が急速に進む中、「AIにとって最適なWebサイト設計とは何か」という課題に直面する機会が増えています。
先日公開したinsight記事の続編として、判明した追加の知見をもとに本稿をまとめました。
Webクローリングなど少し突っ込んだ内容を検証しつつ複数のAIによる同一サイトの評価実験を行ったところ以下の結果が出たので公開してみたいと思います。
結果として、ChatGPTはページ構造や記載された情報をある程度読み取れていましたが、Claudeは一部の情報しか取得できず、サイト全体の内容を把握できていないようでした。
この大きな差は一体何が原因なのでしょうか。
調査を進めると、各AIが使用する検索エンジンの違い、技術的制約、そしてサイト構造への対応能力に大きな差があることが明らかになりました。特に興味深いのは、サイトマップを適切に配置し、主要検索エンジンに登録していても、一部のAIでは基本的な情報すら発見できないという事実でした。
現在、ビジネスの現場では「ChatGPTで調べました」「AIが評価しました」という言葉をよく耳にします。しかし、どのAIを使うかによって得られる情報や評価が大きく変わるとすれば、これは深刻な問題です。正確な情報収集と適切な判断のためには、各AIの特性を理解し、使い分けることが不可欠となってきています。
AI(LLM:Large Language Model)による情報収集や調査が当たり前になりつつある今、「AIが自社サイトをどのように認識しているか」は重要な課題です。本記事では、主要LLM(ChatGPT、Claude、Gemini、Perplexity)による実際の情報発見・評価プロセスを検証し、その違いと対策を紹介します。
対象LLM
・ChatGPT(OpenAI/GPT-4o)
・Claude(Anthropic/Sonnet 4)
・Gemini(Google)
・Perplexity(Perplexity AI)
・補足検証:GenSpark
当サイトのドメインに対して、各LLMに同一のプロンプトを用いて情報取得を試みた。
内容に関する調査を促す形式のプロンプトを提示し、応答内容の構造や情報の取得傾向を観察した。
主な観点は以下の通り:
情報発見範囲:どの程度の記述内容やページ構造にアクセスできたか
情報の整合性:応答に含まれる内容と、実際のページ記述との一致度
応答の一貫性:同一条件下での出力内容に一貫性があるかどうか
検索挙動の深度:内部ページや階層構造への到達状況
ChatGPT
サイト全体にわたり情報の取得範囲が広く、構成上の複数ページから記述内容を取り込んでいる様子が確認された。構造把握および文脈の反映にも一定の対応が見られた。
Claude
情報の取得範囲が限定的で、主要な記述内容の多くにアクセスできていなかった。初回応答ではサイト固有の情報に基づく内容がほとんど含まれておらず、構造認識の深さに課題が見られた。
Gemini
一部のサイトや記述は取得されていたが、全体としてはページ横断的な情報統合や文脈の把握には至っていない印象だった。情報構造への反応はやや控えめ。
Perplexity
取得情報にばらつきがあり、外部ソースと混同された応答が確認される場面もあった。複数ソース統合型であることから、情報の整合性や出典の安定性にやや課題が残った。
GenSpark
外部リソース(例:公式サイトやサイト外部データ)に対するアクセス傾向が強く、サイト内部の情報と外部情報を組み合わせた取得挙動が確認された。
検索エンジンの違い ChatGPTはBing、GeminiはGoogle、ClaudeはBrave Search、Perplexityは複数統合型をそれぞれ使用。インデックス範囲や反映速度、リアルタイム性に大きな差が存在する。
技術的制約 一部のLLMでは検索結果に表示されたURLのみクロール可能という制約や、サブディレクトリやリダイレクト先への到達の制限、特定ファイル形式のアクセス制限などが確認された。
インデックス反映速度 検索エンジンによっては新規ファイルのインデックス化に時間がかかるケースがあり、サイトマップ登録や構造化データも即時反映されない場合が見られた。
マルチLLM対応の基本戦略
重要情報を複数パス・複数ページに配置し、構造化データを積極的に活用する。サイトマップやトップページに必須情報を明記し、各LLMがアクセスしやすい設計を心がける。
検索制約への対応
ルート直下への重要情報の配置、サブディレクトリやリダイレクトの多用回避、シンプルで分かりやすいサイト構造の採用などが有効。技術的制約を考慮した設計が重要。
各検索エンジンへの最適化
Google Search ConsoleやBing Webmaster Tools等への適切な登録、サイトマップや構造化データの充実、明快なナビゲーション設計により、各検索エンジンでの発見可能性を向上させる。
情報の多重配置
重要な情報は、複数のページで異なる形式で提供し、LLMの検索特性に応じた情報アクセスを可能にする。
今回の検証により、LLMごとに情報の拾い方や見えている範囲には明確な違いがあることが分かりました。どのAIも「すべての情報を正確に取得できる」わけではなく、それぞれ得意・不得意があります。
調べごとをする際には、ひとつのAIだけに頼るのではなく、複数のAIを使って見比べることで、より確かな理解につながる可能性があります。
また、情報を発信する側にとっても「AIにとっても分かりやすい構成」を意識することで、伝えたい内容がより正確に拾われやすくなることが期待されます。
ただし、どれだけ工夫を凝らしても、最終的に大切なのは「読む人にとって役に立つ情報」であることに変わりはありません。AIにも人にも伝わりやすい内容を心がけることが、今後ますます重要になっていくでしょう。
本検証は2025年7月時点の特定サイトでの事例であり、すべてのサイトで同様の結果になるとは限りません。各LLMの性能は継続的に改善されているため、現在の状況とは異なる可能性があります。また、サイトの構造や内容、業界特性によっても結果は大きく変わることが予想されます。
本記事の内容を参考にする際は、定期的な再検証と、複数の評価軸による総合的な判断を行うことを推奨します。
また、本記事の執筆には複数のLLMを利用しています。