6月5日(金)1コマ目

今日、やったこと

  • [確認テスト]ビットシフト
  • 文字コード

今日のホワイトボード

前前回から続いている文字コードのつづき。

[符号化方式]EUC-JP

UNIX系OS(Linuxも)で使われている(いた)文字符号化方式。

図 [符号化方式]EUC-JP


[符号化方式]ISO-2022-JP

通称、JISコード。

電子メールで使われている。

図 [符号化方式]ISO-2022-JP(上図の上)


[符号化方式]UTF-8

今、一番使われている符号化方式(と思う)。

文字集合はUNICODE。地球上のすべての文字を表現。

図 [符号化方式]ISO-2022-JP(上図の下)


なぜ文字化けする?

今はほぼ見ることはなくなったが、20年ほど前はホームページを見ると、文字化けすることがあった。

理由は 送信側と受信側で異なる符号化方式を使っている から。


まとめ

以下は理解してください。

○文字集合

符号化対象の文字のあつまり

○文字符号化方式

文字を数字に変換するルール、方法

○ASCII

文字集合+文字符号化方式 

1文字1バイト(7ビット)

数字、記号、アルファベットのみ

○Shift_JIS

文字符号化方式

1文字1バイト(ASCII)、2バイトの可変長。

WindowsOSで使われている

○EUC-JP

文字符号化方式

1文字1バイト(ASCII)、2バイトの可変長。

UNIX系OSで使われている

○UNICODE
文字集合。地球上のすべての文字を収納(したい)
○UTF-8
文字集合はUNICODE -> 地球上のすべての文字を表現(したい)
1文字1バイト~4バイトの可変長

次回は

文字コードの練習問題。
そのあとは誤差。

このブログの人気の投稿

5月29日(金)1コマ目

5月11日(月)1コマ目