6月5日(金)1コマ目
今日、やったこと
- [確認テスト]ビットシフト
- 文字コード
今日のホワイトボード
前前回から続いている文字コードのつづき。
[符号化方式]EUC-JP
UNIX系OS(Linuxも)で使われている(いた)文字符号化方式。
![]() |
| 図 [符号化方式]EUC-JP |
[符号化方式]ISO-2022-JP
通称、JISコード。
電子メールで使われている。
![]() |
| 図 [符号化方式]ISO-2022-JP(上図の上) |
[符号化方式]UTF-8
今、一番使われている符号化方式(と思う)。
文字集合はUNICODE。地球上のすべての文字を表現。
![]() |
| 図 [符号化方式]ISO-2022-JP(上図の下) |
なぜ文字化けする?
今はほぼ見ることはなくなったが、20年ほど前はホームページを見ると、文字化けすることがあった。
理由は 送信側と受信側で異なる符号化方式を使っている から。
まとめ
以下は理解してください。
○文字集合
符号化対象の文字のあつまり
○文字符号化方式
文字を数字に変換するルール、方法
○ASCII
文字集合+文字符号化方式
1文字1バイト(7ビット)
数字、記号、アルファベットのみ
○Shift_JIS
文字符号化方式
1文字1バイト(ASCII)、2バイトの可変長。
WindowsOSで使われている
○EUC-JP
文字符号化方式
1文字1バイト(ASCII)、2バイトの可変長。
UNIX系OSで使われている
○UNICODE
文字集合。地球上のすべての文字を収納(したい)
○UTF-8
文字集合はUNICODE -> 地球上のすべての文字を表現(したい)
1文字1バイト~4バイトの可変長
次回は
文字コードの練習問題。
そのあとは誤差。

