ホームページ制作 Webシステム開発会社 ジーエープロ LastUpdate:2006.12.27
会社概要
お問合わせ
ジーエープロのロゴ
Webコンサル || ジーエープロ || ホームページ制作 || アクセス解析 || レンタルサーバ
WebコンサルTOP サーチファインダーの実行 サービス概要 基本的な対策
検索エンジン最適化(SEO)対策 タイトル 文字コードセット フレームの扱い altテキスト 本文 キーワード

HOME > 検索エンジン最適化(SEO)対策 > 文字コード(キャラクターセット)の書き方

検索エンジン最適化(SEO)対策 文字コード(キャラクターセット)の書き方

通常、日本語の文字セットを指定する場合、ヘッダ部<head>〜</head>の間に以下に示すようなmetaタグを設定します。

<meta http-equiv="content-type" content="text/html;charset=文字セット">

ところが、最近のブラウザーは自動認識が発達したため、文字セットを記述しなくても、ホームページを表示してくれるようになり、古い形式の文字セットを利用していたり、時には文字セット自体を設定していないホームページすらあります。

ホームページを公開するならば、HTMLファイルの符号化方式(character encordings)である文字セットを明確にし、読み込む側にキッチリと伝えることが重要であります。

1.文字コードセットの設定は初めに

文字コードセットは、符号化方式を明確にする項目であるため、HTMLファイル内で日本語が現れる前に設定する必要があります。特にヘッダー部には「タイトル」や「キーワード」など日本語を利用する可能性の高い項目がありますので、文字コードセットの設定は、ヘッダ部<head>〜</head>でも初めの方に設定することをお奨めします。

<head>
<title>SEO(検索エンジン最適化)対策:文字コード(キャラクターセット)の書き方-ジーエープロ</title>
<meta name="keywords" content="ホームページ制,作Webビジネス, ログ解析">
<meta name="description" content="インターネットやパソコンを活用したビジネスの
トータルサービス。ホームページ制作・レンタルサーバー・ドメイン登録・Web解析・
パソコンの設定までフルサポート">
<meta http-equiv="content-type" content="text/html;charset=Shift_JIS">
</head>
×
<head>
<meta http-equiv="content-type" content="text/html;charset=Shift_JIS">
<title>SEO(検索エンジン最適化)対策:文字コード(キャラクターセット)の書き方-ジーエープロ</title>
<meta name="keywords" content="ホームページ制作Webビジネス, ログ解析">
<meta name="description" content="インターネットやパソコンを活用したビジネスの
トータルサービス。ホームページ制作・レンタルサーバー・ドメイン登録・Web解析・
パソコンの設定までフルサポート">
</head>

2.日本語の文字コードセットは「Shift_JIS」「EUC-JP」で

代表的な日本語の文字コードセットには、「Shift_JIS」を始めとする文字コードセットがあります。

よく日本語の文字コードセット「Shift_JIS」を「x-sjis」や「EUC-JP」「x-euc-jp」と設定する場合があいりますが、これはNetscapeの独自拡張で、Netscape 2.xなどの古いブラウザに理解させるための、設定になります。検索エンジン対策やSEOの基本である正しいHTMLを記述するといった観点からすると「Shift_JIS」や「EUC-JP」と記述することをお奨めします。

ただし、古いブラウザーは「Shift_JIS」と云う文字コード名を解釈できません。どうしても古いブラウザーにも対応したいと云った場合は「x-sjis」としても構いませんが、コンテンツ自体をJISコードかEUCコードで記述し、文字コードセットを「iso-2022-jp」か「EUC-JP」にする事をお奨めします。

文字コード名 文字セット
日本語(x-sjis) x-sjis ×
日本語(x-euc-jp) x-euc-jp ×
日本語(EUC-JP) EUC-JP
日本語(ISO-2022-JP) ISO-2022-JP
日本語(Shift_JIS) Shift_JIS

代表的な文字コードセット

文字コード名 文字セット 特長
欧文(ISO-8859-1) iso-8859-1 アメリカ合衆国やヨーロッパで
使われている文字セット
欧文(Windows 1252) windows-1252
Unicode(UTF-8) UTF-8 Unicode(UTF-8)の日本語文字セット
Unicode(UTF-16) UTF-16 Unicode(UTF-16)の日本語文字セット
日本語(x-sjis) x-sjis SJISコードの日本語文字セット
日本語(EUC-JP) EUC-JP EUCコードの日本語文字セット
日本語(ISO-2022-JP) ISO-2022-JP 半角カタカナを除くJISコードの
日本語文字セット
日本語(Windows 932) windows-932
日本語(Shift_JIS) Shift_JIS SJISコードの日本語文字セット
日本語(x-euc-jp) x-euc-jp EUCコードの日本語文字セット
キリル文字(ISO-8859-5) ISO-8859-5
キリル文字(Windows 1251) windows-1251
ギリシア語(ISO-8859-7) ISO-8859-7
ギリシア語(Windows 1253) windows-1253
中央ヨーロッパ(ISO-8859-2) ISO-8859-2
中央ヨーロッパ(Windows 1250) windows-1250
バルト文字(ISO-8859-4) ISO-8859-4
バルト文字(Windows 1257) windows-1257
中国語(繁体)(Big5) Big5
中国語(繁体)(Windows 950) windows-950

日本語の文字コードセットに的を絞って解説しますと、よく利用されている文字コードセットには以下のようなものがあります。

文字コード名 文字セット
日本語(x-sjis) x-sjis
日本語(x-euc-jp) x-euc-jp
日本語(EUC-JP) EUC-JP
日本語(ISO-2022-JP) ISO-2022-JP
日本語(Shift_JIS) Shift_JIS

よく「x-sjis」や「x-euc-jp」という日本語文字コードセットを設定している方を見かけます。IANAに登録されている正式な文字コードセットは「Shift_JIS」や「EUC-JP」「ISO-2022-JP」などですが、NetscapeNavigater2.0が全盛の時代は、「ISO-2022-JP」が登録されていただけで、「Shift_JIS」や「EUC-JP」の日本語文字コードセットがIANAに登録されていませんでした。

そこで、当時のNetscapeNavigaterは日本語表示を行なうために、「ISO-2022-JP」の拡張セットとして「x-sjis」「x-euc-jp」をNetscapeNavigaterの独自拡張として認識するようにしました。これが、普及し本来規定されている「Shift_JIS」や「EUC-JP」の存在が小さくなっています。

また、現在のブラウザーの文字コードセットの自動認識が発達したため、どちらの文字コードセットを利用していても、問題なく表示されるため「Shift_JIS」や「EUC-JP」への移行が進まないようです。

これからは、「UTF-8」「UTF-16」が普及してくるかもしれません。「UTF-8」「UTF-16」はUnicodeといい、全ての言語の文字を1つのコード体系でサポートしようという試みであり、Windows NT系のネーティブコードでもあります。

HOME > 検索エンジン最適化(SEO)対策 > 文字コード(キャラクターセット)の書き方

当サイトへのリンクは自由です。ただし、著作権はジーエープロにあります。
Copyright(C) 2001-2006 GA-Pro All Rights Reserved.
ホームページ制作 Webシステム開発 ジーエープロ