カスタムパス案
/column/what-is-robots-txt
robots.txtとは何か(robots.txt)
検索エンジンのクロール制御を行う設定ファイル
更新日:2026年5月10日
■ 概要
robots.txt(ロボッツ・テキスト)とは、
検索エンジンのクローラー(Crawler)に対して、
👉 「どこをクロールして良いか」
を指示するための設定ファイルです。
Webサイトのルート直下に配置されます。
例:
https://example.com/robots.txt
■ robots.txtの役割
検索エンジンは、Webサイトを自動巡回しています。
この巡回を行うプログラムが、
Googlebot
Bingbot
などのクローラーです。
robots.txtは、そのクローラーに対して:
クロール許可
クロール拒否
sitemap.xmlの場所
などを伝えます。
■ 基本構文
最もシンプルなrobots.txtは以下です。
User-agent: *
Allow: /
意味:
記述
意味
User-agent: *
全クローラー対象
Allow: /
全ページ許可
■ よく使う設定
特定ディレクトリを除外
User-agent: *
Disallow: /admin/
意味:
👉 /admin/ 以下をクロール禁止
sitemap.xmlを指定
User-agent: *
Allow: /
Sitemap: https://example.com/sitemap.xml
これは実務でかなり重要です。
■ sitemap.xmlとの関係
robots.txtには、
👉 sitemap.xmlの場所
を記載できます。
これにより検索エンジンが:
新規ページ
更新ページ
を把握しやすくなります。
SEO運用では基本セットです。
■ 実務で重要な理由
robots.txtは、
「検索エンジンに何を見せるか」
を制御する重要な設定です。
例えば:
管理画面
テストページ
重複ページ
一時ファイル
などをクロール対象外にできます。
■ よくある誤解
「robots.txtで非公開にできる」
これは誤解です。
robots.txtは:
👉 「見ないでください」
というお願いに近い仕組みです。
アクセス制御ではありません。
URLを直接知っていればアクセスできる場合があります。
機密情報保護には:
Basic認証
Cloudflare Access
ログイン認証
IP制限
などが必要です。
■ robots.txtの配置場所
必ずドメイン直下に置きます。
正しい例:
https://example.com/robots.txt
誤り:
https://example.com/files/robots.txt
検索エンジンは基本的にルート直下しか見ません。
■ robots.txtでHTMLを書いてはいけない
robots.txtは「テキストファイル」です。
そのため:
<meta>
<script>
<style>
などを書くとエラーになります。
実際によくあるのが、
👉 robots.txt に index.html が返ってしまう
構成ミスです。
Cloudflare PagesやSPA(Single Page Application)構成では特に発生しやすいです。
■ Time合同会社での考え方
Time合同会社では、
Google Sites単体では制御しづらい:
robots.txt
sitemap.xml
canonical
リダイレクト
などを、
Cloudflare Pages
独自ドメイン
Edge制御
と組み合わせて運用するケースがあります。
特にSEO運用では、
👉 「検索エンジンからどう見えているか」
の視点が重要になります。
■ robots metaとの違い
よく混同されますが、
<meta name="robots" content="index,follow">
これはHTML内に書く設定です。
一方、
robots.txt はサイト全体のクロール制御です。
役割が異なります。
■ まとめ
robots.txtは、
検索エンジンのクローラー制御を行うための設定ファイルです。
SEO実務では、
sitemap.xml
canonical
インデックス制御
と並んで重要な基礎要素になります。
特に現在は、
「ホームページを作ること」
よりも、
👉 「検索エンジンに正しく認識される構造を作ること」
が重要になっています。