6NC:データサイエンス研修(NCCHD) トップ へ戻る
日本語のための文字コードとUnicodeのUTF-8《講師:岡村浩司》
Unicodeの普及により、最近は文字化けをあまり見かけなくなりました。かつてはJISコード、日本語EUC、シフトJISなどの日本語コードが存在していましたが、現在ではUnicodeの中でも、多くの日本語文字が3バイトで表されるUTF-8と呼ばれる文字符号化形式の利用が一般的です。その他、UTF-16やUTF-32などもあり、それらとの違いや、バイト順マークBOMなどについても解説します。この動画はNCCHD第149回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
Unicodeの普及により、最近は文字化けをあまり見かけなくなりました。かつてはJISコード、日本語EUC、シフトJISなどの日本語コードが存在していましたが、現在ではUnicodeの中でも、多くの日本語文字が3バイトで表されるUTF-8と呼ばれる文字符号化形式の利用が一般的です。その他、UTF-16やUTF-32などもあり、それらとの違いや、バイト順マークBOMなどについても解説します。この動画はNCCHD第149回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
受講者コメント