これからの文字コードはUTF-8

スポンサーリンク

よくWEBサイトを見ていて、こんな経験はありませんか?
突然、文字化けした記号がページの中にずらり!
あれれ、という感じで、そのサイトから逃げる!
これは、文字コードがそのページで指定されていない場合に起きる現象。
そんなときは、あわてず、さわがず、ブラウザの上部メニューから、
FireFOXであれば、「表示」>「文字エンコード」>「自動判別」を選ぶと、
だいたいは解消されると思います。

文字コードそのものは、SHIFT-JISとかEUC-JPとか、メジャーですが、
これは説明すると、ややこしいのでWIKIPEDIAの「文字コード」をご覧ください。

それでも簡単に説明すると、まず大きな方眼紙をイメージしてください。
その升目にすべて文字が入っていて、Aの1番地とかBの5番地とか、
住所を示すことで、それに対応する文字を表現するのですね。
その方眼紙にいくつかの規格があるわけです。英語圏の人に、
日本語やハングル語はあまり必要ないわけですから。

で、インターネットでは、さまざまな文字コードが共存してきたのですが、
これからは、UTF-8という文字コードが主流になりつつあります。

なぜか? これはSEO対策との関連があります。

例えば「赤ちゃんポスト」という名前でググッて(Googleで検索)みると、
各ページの検索結果のいちばん下にURLが表示されます。

1)ja.wikipedia.org/wiki/赤ちゃんポスト – 56k – 2007年5月14日
2)www.yomiuri.co.jp/iryou/news/kyousei_news/20061129ik02.htm – 27k 3)www.dotcolumn.net/modules/wordpress/index.php?p=434 – 46k –
4)kumanichi.com/iryou/yurikago.html – 46k –
5)d.hatena.ne.jp/keyword/
%C0%D6%A4%C1%A4%E3%A4%F3%A5%DD%A5%B9%A5%C8 – 21k –

注目は、1番目と5番目。このアドレスには2つとも日本語が使われています。
URLに、日本語がちゃんと表示されているのがUTF-8によるページ。
文字がわけわからんようになっているのが、EUC-JPによるページ。
つまり、ブログなんかで、カテゴリとかタグを日本語で入れていると、
それが今回のように「赤ちゃんポスト」としてヒットするわけです。

UTF-8でWEBサイトをつくっておけば、
ページ内だけではなく、URL名も検索対象になります。
これからのSEO対策には効果を発揮する規格です。

ちょっと、今回は難しかったかな。

コメント

タイトルとURLをコピーしました