HOME > 検索エンジン最適化(SEO)対策 > 文字コード(キャラクターセット)の書き方
検索エンジン最適化(SEO)対策 文字コード(キャラクターセット)の書き方
通常、日本語の文字セットを指定する場合、ヘッダ部<head>〜</head>の間に以下に示すようなmetaタグを設定します。
<meta http-equiv="content-type" content="text/html;charset=文字セット">
ところが、最近のブラウザーは自動認識が発達したため、文字セットを記述しなくても、ホームページを表示してくれるようになり、古い形式の文字セットを利用していたり、時には文字セット自体を設定していないホームページすらあります。
ホームページを公開するならば、HTMLファイルの符号化方式(character encordings)である文字セットを明確にし、読み込む側にキッチリと伝えることが重要であります。
1.文字コードセットの設定は初めに
文字コードセットは、符号化方式を明確にする項目であるため、HTMLファイル内で日本語が現れる前に設定する必要があります。特にヘッダー部には「タイトル」や「キーワード」など日本語を利用する可能性の高い項目がありますので、文字コードセットの設定は、ヘッダ部<head>〜</head>でも初めの方に設定することをお奨めします。
<head>
<title>SEO(検索エンジン最適化)対策:文字コード(キャラクターセット)の書き方-ジーエープロ</title>
<meta name="keywords" content="ホームページ制,作Webビジネス, ログ解析">
<meta name="description" content="インターネットやパソコンを活用したビジネスの
トータルサービス。ホームページ制作・レンタルサーバー・ドメイン登録・Web解析・
パソコンの設定までフルサポート">
<meta http-equiv="content-type" content="text/html;charset=Shift_JIS">
</head> |
× |
<head>
<meta http-equiv="content-type" content="text/html;charset=Shift_JIS">
<title>SEO(検索エンジン最適化)対策:文字コード(キャラクターセット)の書き方-ジーエープロ</title>
<meta name="keywords" content="ホームページ制作Webビジネス, ログ解析">
<meta name="description" content="インターネットやパソコンを活用したビジネスの
トータルサービス。ホームページ制作・レンタルサーバー・ドメイン登録・Web解析・
パソコンの設定までフルサポート">
</head> |
○ |
2.日本語の文字コードセットは「Shift_JIS」「EUC-JP」で
代表的な日本語の文字コードセットには、「Shift_JIS」を始めとする文字コードセットがあります。
よく日本語の文字コードセット「Shift_JIS」を「x-sjis」や「EUC-JP」「x-euc-jp」と設定する場合があいりますが、これはNetscapeの独自拡張で、Netscape 2.xなどの古いブラウザに理解させるための、設定になります。検索エンジン対策やSEOの基本である正しいHTMLを記述するといった観点からすると「Shift_JIS」や「EUC-JP」と記述することをお奨めします。
ただし、古いブラウザーは「Shift_JIS」と云う文字コード名を解釈できません。どうしても古いブラウザーにも対応したいと云った場合は「x-sjis」としても構いませんが、コンテンツ自体をJISコードかEUCコードで記述し、文字コードセットを「iso-2022-jp」か「EUC-JP」にする事をお奨めします。
文字コード名 |
文字セット |
|
日本語(x-sjis) |
x-sjis |
× |
日本語(x-euc-jp) |
x-euc-jp |
× |
日本語(EUC-JP) |
EUC-JP |
◎ |
日本語(ISO-2022-JP) |
ISO-2022-JP |
◎ |
日本語(Shift_JIS) |
Shift_JIS |
○ |
文字コード名 |
文字セット |
特長 |
欧文(ISO-8859-1) |
iso-8859-1 |
アメリカ合衆国やヨーロッパで
使われている文字セット |
欧文(Windows 1252) |
windows-1252 |
|
Unicode(UTF-8) |
UTF-8 |
Unicode(UTF-8)の日本語文字セット |
Unicode(UTF-16) |
UTF-16 |
Unicode(UTF-16)の日本語文字セット |
日本語(x-sjis) |
x-sjis |
SJISコードの日本語文字セット |
日本語(EUC-JP) |
EUC-JP |
EUCコードの日本語文字セット |
日本語(ISO-2022-JP) |
ISO-2022-JP |
半角カタカナを除くJISコードの
日本語文字セット |
日本語(Windows 932) |
windows-932 |
|
日本語(Shift_JIS) |
Shift_JIS |
SJISコードの日本語文字セット |
日本語(x-euc-jp) |
x-euc-jp |
EUCコードの日本語文字セット |
キリル文字(ISO-8859-5) |
ISO-8859-5 |
|
キリル文字(Windows 1251) |
windows-1251 |
|
ギリシア語(ISO-8859-7) |
ISO-8859-7 |
|
ギリシア語(Windows 1253) |
windows-1253 |
|
中央ヨーロッパ(ISO-8859-2) |
ISO-8859-2 |
|
中央ヨーロッパ(Windows 1250) |
windows-1250 |
|
バルト文字(ISO-8859-4) |
ISO-8859-4 |
|
バルト文字(Windows 1257) |
windows-1257 |
|
中国語(繁体)(Big5) |
Big5 |
|
中国語(繁体)(Windows 950) |
windows-950 |
|
日本語の文字コードセットに的を絞って解説しますと、よく利用されている文字コードセットには以下のようなものがあります。
文字コード名 |
文字セット |
日本語(x-sjis) |
x-sjis |
日本語(x-euc-jp) |
x-euc-jp |
日本語(EUC-JP) |
EUC-JP |
日本語(ISO-2022-JP) |
ISO-2022-JP |
日本語(Shift_JIS) |
Shift_JIS |
よく「x-sjis」や「x-euc-jp」という日本語文字コードセットを設定している方を見かけます。IANAに登録されている正式な文字コードセットは「Shift_JIS」や「EUC-JP」「ISO-2022-JP」などですが、NetscapeNavigater2.0が全盛の時代は、「ISO-2022-JP」が登録されていただけで、「Shift_JIS」や「EUC-JP」の日本語文字コードセットがIANAに登録されていませんでした。
そこで、当時のNetscapeNavigaterは日本語表示を行なうために、「ISO-2022-JP」の拡張セットとして「x-sjis」「x-euc-jp」をNetscapeNavigaterの独自拡張として認識するようにしました。これが、普及し本来規定されている「Shift_JIS」や「EUC-JP」の存在が小さくなっています。
また、現在のブラウザーの文字コードセットの自動認識が発達したため、どちらの文字コードセットを利用していても、問題なく表示されるため「Shift_JIS」や「EUC-JP」への移行が進まないようです。
これからは、「UTF-8」「UTF-16」が普及してくるかもしれません。「UTF-8」「UTF-16」はUnicodeといい、全ての言語の文字を1つのコード体系でサポートしようという試みであり、Windows NT系のネーティブコードでもあります。
HOME > 検索エンジン最適化(SEO)対策 > 文字コード(キャラクターセット)の書き方
|