突然ですが、重複コンテンツって知っていますか?
重複コンテンツっていうのはGoogleさんによると次のように定義されているみたいです。
一般に、重複するコンテンツとは、ドメイン内または複数ドメインにまたがって存在する、他のコンテンツと完全に同じであるか非常によく似たコンテンツのブロックを指します。
なるほどな。
つまり、コピペや語尾をちょろっと変えたようなコンテンツは内容が被ってるからGoogleはそれを重複コンテンツと見なしますよってことか。
じゃあそれだけ気をつけてれば一件落着やん。
っと思ったあなた。
僕も最初は同じように思いコピペや語尾をちょろっと変えるのではなくてちゃんと自分の言葉で記事を書いたりしながらサイトを運営していました。
でもサイトを運営していくなかでいくつか疑問点が出てきました。
あなたは次のような場合すぐにどうすればいいか答えることができますか?
・ロングテールキーワードを狙った時に他のコンテンツとどうしても内容が被ってしまう。
・パラメーターを付けたURLは重複コンテンツとみなされるのか?
・PCサイト用とスマホサイトようにページを分けている時は重複コンテンツと見なされるのか?
・他のサイトに自分が作ったコンテンツをコピペされてしまった時。
僕は上の疑問点をみた時に、むむ・・・っと思いどうすればいいのかすぐに答えることができませんでした笑
今日の記事はそんな僕と同じように思ったあなたに向けて記事を書いています。
というわけで今回は重複コンテンツについて、デメリット、対処方法などについて紹介していきます。
重複コンテンツについて
もう一度重複コンテンツとは何かについて説明します。
重複コンテンツはWeb上に存在する全く同じか内容がほぼおなじコンテンツのことです。
でも重複コンテンツにはどんな物があるの?
って思いません?
僕は思います(^-^;)笑
なので次は重複コンテンツの例を紹介します!
重複コンテンツの例1
同じサイト内で狙っているキーワードは違うが、コンテンツが被っているコンテンツ。
これは1番はじめの方に出てきた
・ロングテールキーワードを狙った時に他のコンテンツとどうしても内容が被ってしまう。
っという項目ですね。
色々事例などを見たり、周りの人に聞いたりしてみましたが、やはり1つのキーワードには1つのオリジナルの内容のコンテンツを作っていくのがベストなようです。
実際SEOでかなり有名なバズ部の方たちもこの問題に関して次のように言っています。
もし、一つの記事内に複数のキーワードを使っていたり、複数のページを同じキーワードで対策したりすると、Googleから重複コンテンツと見られる可能性が高くなる。
もちろん100%アウトになるというわけではありませんが、万が一サイトがGoogleさんから削除された時のリスクを考えると最初のサイト設計の段階から各コンテンツページの内容が被らないようにするのは大切というわけですね。
重複コンテンツの例2
同じURLだけど、パラメーターが付与されているURLのページ。
そもそもパラメーターってなんやねんて感じですよね笑
パラメーターというのは次のようなもののことです。
http://test.com?id=22&sort=past
Amazonとかのサイトでこんな感じのURLとか見たことありませんか?
パラメーターとは上のURLの中で”?id=22&sort=past”の部分のことです。
このパラメーターなどはWebサービスなどでもよく見かけるのですが、意味はidが22番の商品で古い商品順で商品を表示するという意味に成ります。
ちょっとおかしいと思った人もいるかもしれませんが、そこは説明するためだと思ってスルーしてください笑
つまり、同じURLだけど、パラメーターが付与されているURLのページっていうのはURLが同じでパラメーター部分だけが違うページのことです。
Googleからしたら
http://test.com?id=22&sort=past
http://test.com?id=23&sort=new
http://test.com?sort=past
も全部パラメーターの部分だけ違うけどURL一緒やん、ってことはこれ重複コンテンツなんじゃないのか?
っと思ってしまうわけです。
重複コンテンツの例3
PCサイト用とスマホサイトようにページを分けている時。
具体的にはURLが下のようになっていて、別々のサイトのように思えるけれど内容が同じなので重複コンテンツとみなされてしまいます。
PC版:http://test.com
スマホ版:http://test.com/mobile
これもGoogleから重複コンテンツとみなされてしまいます。
重複コンテンツの例4
URLの統一をしていない。
http://test.com
http://www.test.com
https://test.com
上の3つのURLはどれも重複するコンテンツとみなされます。
理由は簡単でどのURLでもアクセスできてしまうからです。
なのでどのURLを使うかちゃんと統一するようにしましょう。
重複コンテンツがあるとどんなデメリットがあるの?
重複コンテンツのデメリットは2つあります。
1.Googleのクローラーのリソースを無駄にしてしまう。
2.検索エンジンから削除されて検索されても出てこなくなる。
それぞれ1つずつ見ていきます。
1.Googleのクローラーのリソースを無駄にしてしまう。
まずはGoogleのクローラーについて説明します。
Googleはクローラーと呼ばれるものを使ってどのページを検索結果の上位に表示するか決めています。
クローラーはGoogleの調査官のような存在です。
このクローラーは日々各サイトを訪れてサイトの状態をチェックしています。
でももし調査に訪れたサイトのコンテンツ3回連続で同じ内容だったらクローラーはどう思うと思いますか?
実際どう思うか僕の想像上ではありますが、実演してみましょう!
クローラー:おっしゃ今日もサイト調査するで!!
クローラー:ん?なんやこのサイト3つのコンテンツ調査したけど全部同じやないか!!
クローラー:Googleの理念知らんのか!
クローラー:3つとも同じ内容やったらユーザーのためにならないやないか!!
クローラー:しゃあないけど、このサイトはあんまりよくないサイトってことで調査の回数を減らすしかないな。
というふうに重複するコンテンツがあると何回も同じページを辿ることになるので、クローラーさんの労力が増えてしまうというわけです。
すると、必然的にそのサイトのページのランクが下がって検索のランキングに影響してしまいます。
なのでなるべく重複コンテンツは減らすのが得策というわけになります。
少し古いですが、実際Googleのマット・カッツ氏も過去のインタビューで以下のように話しをしています。
Imagine we crawl three pages from a site, and then we discover that the two other pages were duplicates of the third page. We’ll drop two out of the three pages and keep only one, and that’s why it looks like it has less good content. So we might tend to not crawl quite as much from that site.
書いてある内容は上のクローラーさんの例と同じような内容です。
2.検索エンジンから削除されて検索されても出てこなくなる。
あまりに重複コンテンツが多くて、そのサイト自体が何かしらの不正を行って検索結果の上位に表示されていると判断された場合はGoogleから順位を落とされたり、最悪の場合検索結果から削除されたりします。
なので取り扱うコンテンツに関してはどこかのサイトのコピペではなく、独自のコンテンツを貫くのが一番の安全策であると言えます。
重複コンテンツを解消するためにはどうすればいいの?
じゃあどうすれば重複コンテンツを防げるのか?
重複コンテンツ問題を解消する手立てはいくつかあります。
ここではそれらの方法を紹介していきます!
301リダイレクトを使う。
これは.htaccessファイルに重複コンテンツにアクセスしてきたら、自動的にオリジナルのページに飛ばすように処理をいれることです。
例えば次のような時に使われたりします。
1.http://www.test.comにアクセス。
2.htaacessファイルでどのURLに振り分けるかチェック。
3.htaacessファイル内でhttp://test.comにURLを統一するように記述されている。
4.htaacessファイル側でhttp://www.test.comでアクセスしてきたユーザーをhttp://test.comのURLのページに飛ばす。
現状ではこの301リダイレクトがベストな方法とされています。
でも使用しているサーバーによってはこの301リダイレクトが使用できないなどの問題がでてきます。
その場合は次の方法を試すのがベストです。
canonicalコードをヘッダータグの中に入れる。
これは301リダイレクトにとってかわる別の方法です。
canonicalコードは実際したのようなコードになります。
1 |
<link rel="canonical" href="オリジナルのURL" /> |
例えばhttp://www.test.comを正規のURLとして統一している場合は次のようにヘッダータグに入れることでGoogleのクロームさんが来た時に正規のURLを伝えてそちらの方をクロールするように誘導できます。
1 |
<link rel="canonical" href="http://www.test.com" /> |
これで例えばスマホページとPCページ両方わけている場合はスマホページに次のように記述することで重複コンテンツ問題に対処することが出来ます。
スマホ用ページ
1 |
<link rel="canonical" href="http://www.test.com" /> |
canonicalタグでどっちがこのコンテンツの親かをGoogleに伝える。
PCページでは下のようにタグを設置。
1 2 3 4 5 6 7 8 9 10 11 |
<link rel="alternate" media="only screen and (max-width: 640px)" href="http://www.test.com/mobile/"> </p> <p>alternateタグでスマホ対応のページがあることをGoogleに伝える。</p> <h3>内部で使用しているリンクの一貫性を保つ。</h3> <p>内部で使用しているリンクとは例えばCSS,JS,画像ファイルの読み込み先を統一するということです。</p> <p>例えばhttp://test.comを正規のURLとして決めているなら、CSS,JS,画像ファイルも次のようにして統一するべきということです。</p> <p><pre><link rel="stylesheet" href="http://test.com/style.css" type="text/css" /> |
1 |
<img src="http://test.com/img.png" alt="テスト画像" /> |
1 |
<img src="http://test.com/img.png" alt="テスト画像" /> |
1 |
<script type='text/javascript' src='http://test.com/test.js"'></script> |
GoogleサーチコンソールでどのURLを使うかを決める。
Googleサーチコンソールを使えばどのURLを正規のURLとして使うかをGoogleに伝えることができます。
またサーチコンソールを使うことでパラメーターが付いたページをクロールするかどうかなども決めることが出来ます。
他のサイトに自分が作ったコンテンツをコピペされてしまった時の対処方法
最後に自分の作ったコンテンツがそのまま丸ごとコピーされた時の対処方法をご紹介します。
それはGoogleさんに通報する方法です。
実際下のページにアクセスして、どのURLのサイトが自分のコンテンツを丸パクリしているかを指定してGoogleさんに連絡することで検索結果などから削除してもらえるように申請することができます。
ただし100%確証がある時だけにしましょう。
それか一度問い合わせフォームなどから記事を削除するようお願いするなどするのも有効方法の1つです。
さて、今回は重複コンテンツに関することやデメリットや対策方法などをご紹介しました。
今回の記事で下の質問に答えれるようになったのではないでしょうか?
・ロングテールキーワードを狙った時に他のコンテンツとどうしても内容が被ってしまう。
重複コンテンツとみなされる可能性は十分にある。
ロングテールを狙う時は1つのキーワードに1つの内容にするようにしよう。
・パラメーターを付けたURLは重複コンテンツとみなされるのか?
重複コンテンツとみなされる可能性は十分にある。
Googleに申請することでどのパラメーターの時はクロールするかなどを指定しよう。
・PCサイト用とスマホサイトようにページを分けている時は重複コンテンツと見なされるのか?
重複コンテンツとみなされる可能性は十分にある。
Canonicalタグとalternateタグを使って、PC用とスマホ用と区別するようにしよう。
・他のサイトに自分が作ったコンテンツをコピペされてしまった時。
Googleに申請。(ただし100%確証がある時だけ。)
メールで問い合わせも有効な手段。