PAGETOP

多言語化する前に知っておきたいの7つのルール

2017年8月17日

多言語化する前に知っておきたいの7つのルール

Webサイトのターゲットが国内だけでなく海外にもいる場合、サイトの多言語化をすることはとても大事です。ただし、最初に何の設定もせずに多言語化をしてしまうと、ページがスパム扱いされたりうまくクロールされなかったり、といったトラブルが起きることがあります。
そこで、多言語化する前に知っておきたいいくつかのルールをご紹介します。

1.言語が明確に分かるようにしておく

ヘッダーやサイドバー、メニューなどの言語は統一することで言語が認識しやすくなります。「About 私たちについて」など、原文と訳文を一緒に表示しているサイトもよく見かけますが、Googleでは全ての要素の言語を統一することを推奨しています。

2.検索結果も多言語化しておく

せっかくコンテンツが多言語化されていても、検索結果が元の言語のままではクリックされません。そこで、検索結果を多言語対応させる設定をします。
通常タグ内に記述する「lang」属性は無視されます。これらの言語情報は、ホームページ制作ソフトなどで自動生成されるため、信頼できる情報と認識されていないためです。
そこで、「hreflang」属性を用いて、多言語化サイトの構造をGoogleに認識させます。

〜内に次のように記述します。


<link rel="alternate" hreflang="ja" href="https://example.com/ja/" />

3.別々のURLにする

各言語のコンテンツには、別々のURLを使用します。これは、Googlebotがサイトの全ての言語バージョンをクロールできるようにするためです。
また、ユーザーのアクセシビリティを考慮すると、次のようなURL構造にしておくことをおすすめします。どの言語のコンテンツにいるかが分かりやすくなります。

例)
日本語ページ http://example.com/ja/sample.html
英語ページ http://example.com/en/sample.html

4.リダイレクトしない

ユーザーのブラウザ情報に基づいて、Cookieを使用して自動的にページを切り替えることは避けましょう。Googleのウェブマスター向け公式ブログでも、SEOの観点から非推奨になっています。
ユーザーや検索エンジンが、サイトの全ての言語バージョンにアクセスできる状態にしておくのがベストです。

5.ページ間で相互リンクする

同じコンテンツで言語が違うページは、ヘッダー部分など、ユーザーに分かりやすい位置で相互リンクしておきます。クロールされやすくなるだけでなく、ユーザーが間違った言語ページにアクセスしてしまった場合でも簡単に戻れて便利です。

6.文字コードはUTF8で統一する

Google は、HTTP ヘッダー、HTML ページ ヘッダー、コンテンツから文字コードを認識します。コンテンツとヘッダー間で情報が矛盾しないように、文字コードはUTF8で統一しておくことをおすすめします。

7.自動翻訳ページのクロール対策

Google は、HTTP ヘッダー、HTML ページ ヘッダー、コンテンツから文字コードを認識します。コンテンツとヘッダー間で情報が矛盾しないように、文字コードはUTF8で統一しておくことをおすすめします。
自動翻訳したページは、インデックスされないようにしておくほうが無難です。自動翻訳された文章は正しい文法でなかったり、ユーザーが読んで意味の通じない文章になっていることが多々あります。そのため、クローラーにインデックスされるとスパムとみなされる恐れがあります。

7.インデックスさせないようにする方法


<head>〜<head>内に、次のタグを埋め込んでおきます。
<meta name="robots" content="noindex" />

・もしインデックスされてしまったら?


<head>〜<head>内に、次のタグを埋め込んでおきます。
<meta name="robots" content="noindex" />

Googleにインデックスを削除するようにリクエストを送ることができます。
「古いコンテンツの削除(https://www.google.com/webmasters/tools/removals?hl=ja&pli=1)」

適切な方法で多言語化することで、国内外からのアクセスを集めることができます。Webサイトを多言語化する際は、上記の基本的なガイドラインをあらかじめふまえておきましょう。