同一コンテンツに対しパラメータ付URLの重複ページが複数できてしまう

先日、WordPressで作成したサイトについて、Googleのインデックス状況を確認したところ、正式なURLの他に同じ内容にもかかわらず、なぜか下記のようなパラメータ付URLのページが複数インデックスされていることに気づきました。

http://www.example.com/example/?page_id=33

正式なURLはhttp://www.example.com/example/です。

これを見て、まっさきに思い起こすのが、Wordpressでのパーマリンク設定です。

WordPressにおいて、投稿記事のURLはデフォルト状態ですと上記のような「?page_id=○○」といったようなURLになります。

しかし、今回取り上げているサイトでは、パーマリンク設定で「カスタム構造」を選択し、投稿記事ごとに独自のURLを設定していますので、そのサイト内においては「?page_id=○○」のようなURLは1ページも存在していません。

http://www.example.com/example/とhttp://www.example.com/example/?page_id=33という同じ内容のページ2つがGoogleに認識されており、このままでは重複コンテンツとみなされてしまいます。

WordPressで作成したサイトのように動的なサイトでは、このようなパラメータ付のページを自動生成されてしまうようなのですが、同一コンテンツに対して複数のURLが生成されてしまうのは問題です。

調べてみましたら、どうやらWordpressの「リビジョン機能」に原因がありそうだということがわかりました。

リビジョン機能とは、投稿記事を書く際に、一定間隔おきに下書きに自動保存され、その記事の保存履歴が記録されるという機能です。

リビジョン機能につきましては、「投稿の編集」画面の右上、「表示オプション」タブから確認することができます。

リビジョン機能の表示

「表示オプション」タブをクリックすると、以下のように「リビジョン」にチェックを入れます。

リビジョン表示タブ

すると、記事の編集ボックスの下に、以下のような履歴が表示され確認することができます。

リビジョンの履歴

この履歴をクリックし、「復元」をクリックすることによって、その時点で保存されていた内容を復元できるというもので、万が一の際にはそれはそれで役に立つ機能です。

しかし、どうやらこの履歴ごとにページIDが割り振られてしまい、これが上述のように「?page_id=○○」というようなパラメータ付のURLが複数生成されてしまうということの原因だと推測しました。

と言いますのも、今回の重複ページの問題が発生する前に、かなりのページにおいて、編集を頻繁に繰り返していたという経緯があったからです。

この推測を元に、以下対処を行いました。

1、リビジョン機能を無効にし過去のリビジョンを消去する
2、Googlウエブマスターツールの「URLパラメータ」による調整