くりすたる・の〜と

とりあえずメモとかしてみた。

『重複コンテンツ』を簡単に見つけたい、のです。

2018.06.16

重複コンテンツがあると、検索エンジンが迷ってしまうので、あまりよくないのです。この重複コンテンツを簡単に見つけたい、というお話なのです。

重複コンテンツはあまりよくないのです。

『重複コンテンツ』とは、文字通り、同じような内容のページが複数できてしまうこと、なのです。これは、プレイ日記なんか書いていると、生まれやすくなるのです。

たとえば、マイクラ(ゲーム)の場合、洞窟探検を繰り返すと、同じようなプレイ内容になりがちなのです。これをそのままプレイ日記にすると、似たコンテンツが生まれる可能性が高くなるのです。

しっかり設計されたHOW TO系のページ(マイクラであれば、攻略情報など)を作っている場合は起こりにくいですが、日記チックなブログを作っている場合は、いずれ起こる可能性のある問題、なのです。

重複コンテンツは、検索エンジンから見ると、あまりよくはないもの、らしいです。とはいえ、どれが重複コンテンツになっているか、なんていうのは、(記事をたくさん書くにつれて)分かりづらくなってくるのです。

このページで扱う『重複コンテンツ』は、自分のページ内での『重複』のお話、なのです。他のページとの『重複』問題は、このページでは扱わないのです。

重複コンテンツはGoogleさんの検索結果で教えてくれますが...。

分かりづらい『重複コンテンツ』ですが、実は、これはGoogleさんが、ちゃんと教えてくれるのです。

検索結果を表示すると、こんな文章が出てくることがあるのです。

最も的確な検索結果を表示するために、上の xxx 件と似たページは除外されています。
検索結果をすべて表示するには、ここから再検索してください。
(Google検索結果より引用)

これで、出てこないページが『重複コンテンツ』になっている可能性があるのです...。

しかし、これだと、重複コンテンツの数は分かっても、具体的にどのページが重複しているかはわからないのです。それを調べるには、やはりGoogleさんが提供しているツールを使う必要があるのです。

Search Consoleを使えば、『重複』具合と理由がわかるのです。

重複コンテンツを探す為に使うのは、これまたWeb管理ではド定番である、『Search Console』なのです。このツールは、自分のページがどのキーワードでどの順位に掲載され、どれくらいアクセスがあるのかを調べるツールですが、実は重複コンテンツ対策にも使えるのです。

重複コンテンツを探す手順

  1. Search Consoleにログインする。(登録する)
  2. 『新しいSearch Consoleを試す』をクリックする。
  3. 左側メニューから、『ステータス』→『インデックスガバレッジ』を選択する。
  4. 右側の情報(グラフ上)の『除外』の項目を選択する。
  5. グラフの下に、除外された理由と件数が表示される。
  6. 理由のテキストをクリックすると、相当URLが表示される。

これで、検索から除外された理由を知ることができるのです。この中に、「ページが重複しています」というのがあるので、ここを調べれば重複コンテンツがわかるのです。

『新しいSearch Console』はベータ版なので、将来仕様変更される可能性があります。

自分の場合は、301リダイレクトが原因でした。

自分のページを調べてみたところ、重複(除外)理由の大半は、『301 Redirect』が原因でした。このページは、URLをけっこう変更しており、その度に、『301 Redirect』で転送しているので、リダイレクト周りはけっこうぐちゃぐちゃになっているのです。

URLを2度変えているページでは、こういった、『2段リダイレクト』になっている箇所が、たぶんあるのです。

2段リダイレクトでも、最終的にたどり着けるので問題ないはずなのですが、本来は、

にしないといけないはずのです...。でも、これ、探すのが大変なのでやってないのです..。いずれ、いずれやります...。たぶん。



くりすたる・の〜と