NC・JIHS:データサイエンス研修(NCCHD) back to top

日本語のための文字コードとUnicodeのUTF-8《講師:岡村浩司》

Unicodeの普及により、最近は文字化けをあまり見かけなくなりました。かつてはJISコード、日本語EUC、シフトJISなどの日本語コードが存在していましたが、現在ではUnicodeの中でも、多くの日本語文字が3バイトで表されるUTF-8と呼ばれる文字符号化形式の利用が一般的です。その他、UTF-16やUTF-32などもあり、それらとの違いや、バイト順マークBOMなどについても解説します。この動画はNCCHD第149回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
Unicodeの普及により、最近は文字化けをあまり見かけなくなりました。かつてはJISコード、日本語EUC、シフトJISなどの日本語コードが存在していましたが、現在ではUnicodeの中でも、多くの日本語文字が3バイトで表されるUTF-8と呼ばれる文字符号化形式の利用が一般的です。その他、UTF-16やUTF-32などもあり、それらとの違いや、バイト順マークBOMなどについても解説します。この動画はNCCHD第149回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。

User evaluation Evaluated by 29 people

    Usefulness

    4.00

    Very useful 1
    Useful 2
    Neither 3
    Not very useful 4
    Not useful 5

    Difficulty

    3.62

    Very Easy 1
    Easy 2
    Moderate 3
    Difficult 4
    Very difficult 5

User comments