generated at
文字コード



初期の文字コード
7bit
100文字弱
ASCIIJIS X 0208の組み合わせ
国際文字コード
世界中の文字を扱えるようにしようとした
JIS




過去の資産との互換性を考えないといけない
文字コードの規格と、その実装がどれぐらい整合しているか
実装に依っては規格と微妙に異なってたりするのねmrsekut

文字コードが複雑になる理由
過去の遺産の積み重ね
文字そのもののが複雑
e.g. 漢字多すぎ
e.g. アラビア文字で同じ文字が文脈によって形を変える

文字コードが乱立する経緯、歴史、動機を知りたい
各アプリケーションがどういう理由でその文字コードを選択するのか
e.g. このCSVをExcelで開くと文字化けする!といったときに、なぜExcelはその文字コードのみをサポートしようとしたのか
古いやつが能力不足なのはわかるが、モダンなやつどうしでもメリデメがあるのか
なぜ標準化、統一化されないのか
しようと頑張っているのはそらそうだが、なぜ実際そうなっていないのか


julia
わかりやすい