ASA X3.4-196 US-ASCII / ANSI X3.4-1986 JIS X 0201-1976 ≒ 半角文字(ASCII+半角カナ) JIS X 0202 ≒ ISO/IEC 2022 JIS X 0208-1978 - 漢字集合 JIS X 0208-1983 - 漢字集合 JIS X 0208-1990 - 漢字集合 JIS X 0212-1990 - 漢字集合 JIS X 0208-1997 - 漢字集合 JIS X 0211 - 制御文字 JIS X 0221 ≒ ISO/IEC 10646 ISO/IEC 646-1991 - 半角文字 ISO/IEC 646 IRV ≒ US-ASCII ISO 8859 ISO/IEC 6429-1992 ISO/IEC 2022 RFC 1468 = ISO-2022-JP ISO-2022-JP ISO-2022-KR ISO-2022-CN EUC-JP Shift_JIS
「AB漢字」という漢字をそれぞれの文字コードで表した場合のコードを下記に示します。
| 文字コード | BOM | A | B | 漢字IN | 漢 | 字 | 漢字OUT |
|---|---|---|---|---|---|---|---|
| JIS(ASCII) | 41 | 42 | 1B 24 42 | 34 41 | 3B 7A | 1B 28 4A | |
| JIS(Roman) | 41 | 42 | 1B 24 42 | 34 41 | 3B 7A | 1B 28 42 | |
| 旧JIS | 41 | 42 | 1B 24 40 | 34 41 | 3B 7A | 1B 28 42 | |
| EUC-JP | 41 | 42 | B4 C1 | BB FA | |||
| Shift_JIS | 41 | 42 | 8A BF | 8E 9A | |||
| UTF-16LE | 41 00 | 42 00 | 22 6F | 57 5B | |||
| UTF-16BE | 00 41 | 00 42 | 6F 22 | 5B 57 | |||
| UTF-16(LE) | FF FE | 41 00 | 42 00 | 22 6F | 57 5B | ||
| UTF-16(BE) | FE FF | 00 41 | 00 42 | 6F 22 | 5B 57 | ||
| UTF-8N | 41 | 42 | E6 BC A2 | E5 AD 97 | |||
| UTF-8 | EF BB BF | 41 | 42 | E6 BC A2 | E5 AD 97 | ||
| UTF-7 | 41 | 42 | 2B | 62 79 4A | 62 56 77 | 2D |
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | |
| 0 | NUL | DC0 | SP | 0 | @ | P | ||
| 1 | SOM | DC1 | ! | 1 | A | Q | ||
| 2 | EOA | DC2 | " | 2 | B | R | ||
| 3 | EOM | DC3 | # | 3 | C | S | ||
| 4 | EOT | DC4 | $ | 4 | D | T | ||
| 5 | WRU | ERR | % | 5 | E | U | ||
| 6 | RU | SYN | & | 6 | F | V | ||
| 7 | BEL | LEM | ' | 7 | G | W | ||
| 8 | FE0 | S0 | ( | 8 | H | X | ||
| 9 | HT | S1 | ) | 9 | I | Y | ||
| A | LF | S2 | * | : | J | Z | ||
| B | VT | S3 | + | ; | K | [ | ||
| C | FF | S4 | , | < | L | \ | ACK | |
| D | CR | S5 | - | = | M | ] | ||
| E | SO | S6 | . | > | N | ↑ | ESC | |
| F | SI | S7 | / | ? | O | ← | DEL |
|
【6bitコード】
|
【7bitコード】
|
|
|
| 規格 | 説明 |
|---|---|
| ISO-8859-1 | Latin-1 西欧諸語 |
| ISO-8859-2 | Latin-2 東欧諸語 |
| ISO-8859-3 | Latin-3 南欧諸語、エスペラント語など |
| ISO-8859-4 | Latin-4 北欧諸語 |
| ISO-8859-5 | Cyrillic ロシア語(キリル文字) |
| ISO-8859-6 | Arabic アラビア語 |
| ISO-8859-7 | Greek ギリシャ語 |
| ISO-8859-8 | Hebrew ヘブライ語 |
| ISO-8859-9 | Latin-5 トルコ語 |
| ISO-8859-10 | Latin-6 北欧語 |
| ISO-8859-11 | タイ |
| ISO-8859-12 | 予約 |
| ISO-8859-13 | Latin-7 Baltic Rim |
| ISO-8859-14 | Latin-8 Celtic |
| ISO-8859-15 | Latin-9 Latin-1の改定 |
| ISO-8859-16 | Latin-10 Latin-2の改定 |
ISOが制御文字について定義した規格です。
ISO/IEC 6429:1992をベースに、制御文字集合 C0領域(#00〜#1f)、C1領域(#80〜#9f)など様々な制御コードの詳細が定義されています。
JISによる漢字コードとは別に、下記などの漢字表が定義されています。
| 制定年 | 名称 | 字数 |
|---|---|---|
| 1946年 | 当用漢字 | 1,850字 |
| 1948年 | 当用漢字音訓表 | |
| 1948年 | 当用漢字別表 | 881字 |
| 1949年 | 当用漢字字体表 | |
| 1951年 | 人名用漢字別表 | 92字(2004年には983字) |
| 1981年 | 常用漢字表 | 1,945字 |
| 規格 | 非漢字 | 第一 水準 |
第二 水準 | 第三 水準 |
第四 水準 |
補助 漢字 |
合計 |
|---|---|---|---|---|---|---|---|
| JIS X 0208-1978 | 453 | 2,965 | 3,384 | 6,802 | |||
| JIS X 0208-1983 | 524 | 2,965 | 3,388 | 6,877 | |||
| JIS X 0208-1990 | 524 | 2,965 | 3,390 | 6,879 | |||
| JIS X 0208-1997 | 524 | 2,965 | 3,390 | 6,879 | |||
| JIS X 0212-1990 | 6,067 | 6,067 | |||||
| JIS X 0213-2000 | 1,183 | 2,965 | 3,390 | 1,249 | 2,436 | 11,223 | |
| JIS X 0213-2004 | 1,183 | 2,965 | 3,390 | 1,259 | 2,436 | 11,233 |
最初に制定されたJIS漢字コード表です。制定時は「JIS C 6226-1978」と呼ばれていましたが、1987年に「JIS X 0208-1978」に改名されました。「旧JIS」、「78JIS」などとも呼ばれます。文字を区(1〜94)と点(1〜94)で表します。たとえば「あ」は4区2点となります。下記の6,802字が定義されています。
| 区 | 説明 | 文字数 | 備考 |
|---|---|---|---|
| 1〜2区 | 記号 | 108字 | 後に39字追加 |
| 3区 | 英数字 | 62字 | |
| 4区 | ひらがな | 83字 | |
| 5区 | カタカナ | 86字 | |
| 6区 | ギリシア文字 | 48字 | |
| 7区 | キリル文字 | 66字 | |
| 8区 | 罫線記号 | 後に32字追加 | |
| 16〜47区 | 第一水準 | 2,965字 | |
| 48〜84区 | 第二水準 | 3,384字 | 後に6字追加 |
| 合計 | 6,802字 | 現在は6,879字 |
当初は「JIS C 6226-1983」と呼ばれていましたが、1987年に「JIS X 0208-2983」と改名されました。「新JIS」、「83JIS」とも呼ばれています。他社が新JISに移行する中、NECのPC-9801のみが旧JISを使い続けたため、混乱の生じた時代がありました。JIS X 0208-1978 に対し、下記の変更が行われています。
「堯 槇 遙 瑤」の文字を簡易文字に字形変更し、元の4字を第二水準(84区)に移動しました。
第一水準:尭 槙 遥 瑶(字形変更) 第二水準:堯 槇 遙 瑤(移動)
1〜2区記号39字、8区罫線32字を追加しました。
∈∋⊆⊇⊂⊃∪∩∧∨¬⇒⇔∀∃∠⊥⌒∂∇≡≒≪≫√∽∝∵∫∬ʼn ♯♭♪†‡¶◯ ─│┌┐┘└├┬┤┴┼━┃┏┓┛┗┣┳┫┻╋┠┯┨┷┿┝┰┥┸╂
第一水準と第二水準の間で22組(44字)を入れ替えました。
鯵鰺・鴬鶯・蛎蠣・撹攪・竃竈・潅灌・諌諫・頚頸・砿礦・蕊蘂・靭靱 賎賤・壷壺・砺礪・梼檮・涛濤・迩邇・蝿蠅・桧檜・侭儘・薮藪・篭籠
「森鴎外」の「鴎」など、294字の字形を変更しました。
拐喝嫌溝遮逝栓濯棚塚扉頻泡癒尭慧昂冴渚梢翠琢那槙遥遼瑶皓翔迪 唖逢芦飴溢鰯迂欝厩噂餌焔襖鴎迦晦葛鞄噛澗翰翫徽祇侠卿僅躯喰櫛 屑祁繋倦捲鹸諺巷麹鵠甑采榊柵薩鯖錆珊屡杓灼繍酋曙薯藷哨廠蒋醤 鞘蝕逗摺蝉撰煎煽詮噌遡掻痩遜騨腿黛啄蛸巽辿鱈樽箪註瀦凋捗槌鎚 掴辻鄭擢溺填顛堵屠菟賭塘祷涜瀞噸遁頓謎灘楢禰嚢牌這秤剥箸溌醗 挽樋柊稗逼媛謬廟瀕蔽瞥娩庖蓬頬鱒迄麺儲餅籾鑓愈猷耀莱漣煉蓮榔 蝋鯵鴬蛎撹竃潅頚砿靭賎壷砺梼蕊涛迩蝿桧侭薮篭諌鰺鶯蠣攪竈灌頸 礦靱賤壺礪檮蘂濤邇蠅檜儘藪籠諫冉唹唳嘲堋媾屏捩搆攅斃枦湮珎甄 甍甕硼稱箙粐粮綛綮綟舮芍苒茣荵蔗蛛螂蟒褊覯諞譁跚踉輓遘霤靠鮗 鯲麪淫恢概稽荊捌鴇兔冕冤嚥寃悗枴梛梍爨龝釁頤鬮龜
JIS X 0208-1983 に対し、第二水準に2字を追加した他、225文字を字形変更しました。
凜 熙
「JIS補助漢字」とも呼ばれます。出版業界などの依頼を受けて新たに 6,067字(漢字 5,801字、非漢字 266字)を追加定義していますが、JIS X 0213 の登場により 0212 は意味を失い、現在ではほとんど使用されていません。16〜77区に文字を割り当てています。
JIS X 0208-1990 の改訂版です。文字数や字形に変更はありません。「椦」や「妛」などの文字選定根拠不明文字(幽霊文字)の明確化、および、Shift_JIS や ISO-2022-JP エンコーディングが附属書として明文化されました。EUC-JPは採用されませんでしたが、類似の規格(EUC-JPから半角カナとJIS X 0212を除いたもの)が「国際基準版・漢字用8ビット符号」として取り入れられています。
「JIS2000」や「新拡張JISコード」とも呼ばれます。JIS X 0208-1997の定義を1面とし、これに非漢字659字、第三水準漢字1,249字を追加、新たな第2面に第四水準漢字2,436字を追加しています。JIS X 0208で4区2点と定義された「あ」は、JIS X 0213では1面4区2点となります。2面は、JIS X 0212 との重複を避け、1〜15区、77〜94区を使用しています。2001年に正誤表が公開されています。
「JIS2004」とも呼ばれます。JIS X 0213-2000 に対して、168字の字形変更、第三水準漢字に「倶叱嘘屏痩剥呑妍并繋」に似た字形の10字を追加しています。
JIS 0208/0212/0213で定義された文字をコンピュータで扱う差異の取り決めを「符号化方式(エンコーディングルール)」と呼びます。Unicodeが登場する以前は下記が使用されていました。
| 俗称 | 正式名 | 説明 | |
|---|---|---|---|
| シフトJIS | Shift_JIS | JIS X 0208/0212/0213 文字コードを、1バイト目が #80〜#ff の領域にシフトさせてエンコードする方式です。 | |
| EUC | EUC-JP | JIS X 0208/0212/0213 文字コードを、1バイト目も 2バイト目も #80〜#ff の領域にシフトさせてエンコードする方式です。 | |
| JISコード | ISO-2022-JP | JIS X 0208/0212/0213 文字コードを、ESC $ B などのエスケープ文字を用いてエンコードする方式です。 |
各国で定義した文字を総合的に扱えるように、ISO/IEC 2022 という規格が策定されています。#00〜#FF までの文字領域を、CL(32文字)、GL(94文字)、CR(32文字)、GR(96文字)の4つの領域に分け、G0〜G3の4つの中間バッファを想定します。エスケープシーケンスによって各国の文字コードを中間バッファに「指示」し、これを中間バッファから文字境域に「呼び出す」ことにより、各国言語を扱います。

例えば、ISO-2022-JPで「AあいうA」という文字列は、「A(#41) 漢字開始(#1B #24 #42) あ(#24 #22) い(#24 #24) う(#24 26) ローマ字開始(#1B #28 #42) A(#41)」と表されます。漢字開始(#1B #24 #42=ESC $ B)は「多バイト94文字集合JIS X 0208をG0に指示する」ことを意味します。ローマ字開始(#1B #28 #42=ESC ( B)は「1バイト94文字集合US-ASCIIをG0に指示する」ことを意味します。ISO-2022-JPでは、予めG0はGLに呼び出されているため、GLの領域を、漢字(JIS X 0208)とローマ字(US-ASCII)で切り替えながら使用することが可能になります。
| 領域 | 説明 |
|---|---|
| CL領域 | #00〜#1f。32字。Control Left。 |
| GL領域 | #21〜#7e。94字。Graphic Left。 |
| CR領域 | #80〜#9f。32字。Control Right。 |
| GR領域 | #a0〜#ff。96字。Graphic Right。 |
| 領域 | 説明 |
|---|---|
| G0 | 94文字分の中間バッファ。#20(SP)と #7f(DEL)の 2文字分少ない。 |
| G1 | 96文字分の中間バッファ。 |
| G2 | 96文字分の中間バッファ。 |
| G3 | 96文字分の中間バッファ。 |
| シフト方法 | シーケンス | 呼び名 | 説明 |
|---|---|---|---|
| ロッキングシフト | #0f | SI(Shift In) | G0をGLに呼び出す。 |
| #0e | SO(Shift Out) | G1をGLに呼び出す。 | |
| ESC n | LS2(Locking Shift 2) | G2をGLに呼び出す。 | |
| ESC o | LS3(Locking Shift 3) | G3をGLに呼び出す。 | |
| 無し | 無し | G0はGRに呼び出せない。 | |
| ESC " | LS1R(Locking Shift 1 Right) | G1をGRに呼び出す。 | |
| ESC } | LS2R(Locking Shift 2 Right) | G2をGRに呼び出す。 | |
| ESC | | LS3R(Locking Shift 3 Right) | G3をGRに呼び出す。 | |
| シングルシフト | ESC N | SS2(Single Shift 2) | G2をGLに1文字呼び出す。 |
| ESC O | SS3(Single Shift 2) | G3をGLに1文字呼び出す。 | |
| #8e | SS2(Single Shift 2) | G2をGRに1文字呼び出す。 | |
| #8f | SS3(Single Shift 3) | G3をGRに1文字呼び出す。 |
| 文字集合 | シーケンス | 説明 |
|---|---|---|
| 1バイト 94文字集合 | ESC ( F | 1バイト94文字集合F を G0 に指示する。 |
| ESC ) F | 1バイト94文字集合F を G1 に指示する。 | |
| ESC * F | 1バイト94文字集合F を G2 に指示する。 | |
| ESC + F | 1バイト94文字集合F を G3 に指示する。 | |
| 1バイト 96文字集合 | 無し | 1バイト96文字集合F は G0 には指示できない。 |
| ESC - F | 1バイト96文字集合F を G1 に指示する。 | |
| ESC . F | 1バイト96文字集合F を G2 に指示する。 | |
| ESC / F | 1バイト96文字集合F を G3 に指示する。 | |
| 多バイト 94文字集合 | ESC $ ( F ESC $ F | 多バイト94文字集合F を G0 に指示する。 |
| ESC $ ) F | 多バイト94文字集合F を G1 に指示する。 | |
| ESC $ * F | 多バイト94文字集合F を G2 に指示する。 | |
| ESC $ + F | 多バイト94文字集合F を G3 に指示する。 | |
| 多バイト 96文字集合 | 無し | 多バイト96文字集合F は G0 には指示できない。 |
| ESC $ - F | 多バイト96文字集合F を G1 に指示する。 | |
| ESC $ . F | 多バイト96文字集合F を G2 に指示する。 | |
| ESC $ / F | 多バイト96文字集合F を G3 に指示する。 |
| 文字集合 | F | 説明 |
|---|---|---|
| 1バイト 94文字集合 | A | UK-ASCII |
| B | US-ASCII | |
| J | JIS X 0201-1976-Roman | |
| H | JIS X 0201-1976-Roman(本当はスウェーデン文字) | |
| I | JIS X 0201-1976-Katakana | |
| 1バイト 96文字集合 | A | ISO 8859-1 |
| B | ISO 8859-2 | |
| C | ISO 8859-3 | |
| D | ISO 8859-4 | |
| L | ISO 8859-5 | |
| G | ISO 8859-6 | |
| F | ISO 8859-7 | |
| H | ISO 8859-8 | |
| M | ISO 8859-9 | |
| X | ISO 8859-10 | |
| 多バイト 94文字集合 | @ | JIS X 0208-1978(旧JIS) |
| A | GB 2312-80(中国語簡体字) | |
| B | JIS X 0208-1983/1990/1997(新JIS) | |
| C | KS C 5601-1987(ハングル) | |
| D | JIS X 0212-1990(JIS補助漢字) | |
| O | JIS X 0213-2000-1面 | |
| P | JIS X 0213-2000-2面 |
ISO/IEC 2022 を参考にして、日本では下記などのエンコーディングルールが使用されています。
| 規格 | 説明 |
|---|---|
| ISO-2022-JP | RFC1468。下記のシーケンスを使用する。
ESC ( B - ASCII
ESC ( J - JIS X 0201-1976 ("Roman" set)
ESC $ @ - JIS X 0208-1978
ESC $ B - JIS X 0208-1983 |
| ISO-2022-JP-1 | RFC2237。ISO-2022-JPに下記のシーケンスを追加。
ESC $ ( D - JIS X 0212-1990 |
| ISO-2022-JP-2 | RFC1554。下記のシーケンスを使用可能。
ESC ( B - ASCII
ESC ( J - JIS X 0201-Roman
ESC $ @ - JIS X 0208-1978
ESC $ B - JIS X 0208-1983
ESC $ A - GB2312-1980
ESC $ ( C - KSC5601-1987
ESC $ ( D - JIS X 0212-1990
ESC . A - ISO8859-1
ESC . F - ISO8859-7(Greek) |
| ISO-2022-JP-3 (ISO-2022-JP-3-strict) | 下記のシーケンスを使用。
ESC ( B - ASCII
ESC $ B - JIS X 0208-1983
ESC $ ( O - JIS X 0213-2000 1面
ESC $ ( P - JIS X 0213-2000 2面
ESC ( J と ESC $ @ は廃止。互換性のためにESC $ Bの使用も許すが、森鴎外の「鴎」などJIS X 0208とJIS X 0213で互換性の無い文字についてはJIS X 0213のシーケンスを用なくてはならない。 |
| ISO-2022-JP-3-compatible | JIS X 0208とJIS X 0213で互換性の無い文字についてもJIS X 0208のシーケンスを用いることを許すもの。 |
| ISO-2022-JP-3-plane1 | ISO-2022-JP-3から2面(ESC $ ( P)を除いたもの。 |
| ISO-2022-JP-2004 | ISO-2022-JP-4にJIS X 0213-2004を加えたもの。
ESC ( B - ASCII
ESC $ B - JIS X 0208-1983
ESC $ ( O - JIS X 0213-2000 1面
ESC $ ( P - JIS X 0213-2004 2面
ESC $ ( Q - JIS X 0213-2004 1面
JIS X 0213-2004と互換性の無い文字に関しては、JIS X 0213-2004のシーケンスを使用しなくてはならない。 |
| ISO-2022-JP-2004-plane1 | ISO-2022-JP-2004から2面(ESC $ ( P)を除いたもの。 |
| CP50220 | Microsoft Windowsの規約。ISO-2022-JPをベースに、半角カタカナ、拡張文字(NEC特殊文字、NEC選定IBM拡張文字、ユーザ定義文字)を追加したもの。半角カタカナは全角文字に変換される。
ESC ( B - ASCII
ESC ( J - JIS X 0201-Roman
ESC ( I - JIS X 0201-Katakana
ESC $ @ - JIS X 0208-1978
ESC $ B - JIS X 0208:1997+拡張文字
半角カナの「アイウ」は、ESC$B(#1B #24 #42) ア(#25 #22) イ(#25 #24) ウ(#25 #26) ESC(B(#1B #28 #42)となる。
|
| CP50221 | CP50220をベースに、半角カタカナをISO-2022のロッキングシフトで扱えるようにしたもの。半角カナの「アイウ」は、ESC(I(#1B #28 #49) ア(#31) イ(#32) ウ(#33) ESC(B(#1B #28 #42)となる。 |
| CP50222 | CP50220をベースに、半角カタカナをISO-2022のシングルシフトで扱えるようにしたもの。半角カナの「アイウ」は、ESC(J(#1B #28 #4A) SO(#0E) ア(#31) イ(#32) ウ(#33) ESC(B(#1B #28 #42)となる。 |
| 規格 | ASCII | JIS X 0201-1976-Roman | JIS X 0208-1978 | JIS X 0208-1983 | JIS X 0212-1990 | JIS X 0213-2000 1面 | JIS X 0213-2000 2面 | JIS X 0213-2004 1面 | その他 |
|---|---|---|---|---|---|---|---|---|---|
| シーケンス | ESC ( B | ESC ( J | ESC $ @ | ESC $ B | ESC $ ( D | ESC $ ( O | ESC $ ( P | ESC $ ( Q | |
| ISO-2002-JP | ○ | ○ | ○ | ○ | − | − | − | − | − |
| ISO-2002-JP-1 | ○ | ○ | ○ | ○ | ○ | − | − | − | − |
| ISO-2002-JP-2 | ○ | ○ | ○ | ○ | ○ | − | − | − | |
| ISO-2002-JP-3 | ○ | − | − | △ | − | ○ | ○ | − | − |
| ISO-2002-JP-3-compatible | ○ | − | − | ○ | − | ○ | ○ | − | − |
| ISO-2002-JP-3-plane1 | ○ | − | − | ○ | − | ○ | − | − | − |
| ISO-2002-JP-2004 | ○ | − | − | △ | − | △ | ○ | ○ | − |
| ISO-2002-JP-2004-plane1 | ○ | − | − | △ | − | △ | − | ○ | − |
| CP50220 | ○ | ○ | ○ | ○ | − | − | − | − | NEC特殊文字 NEC選定IBM拡張文字 ユーザ定義文字 半角カナ[ESC(I] |
| CP50221 | ○ | ○ | ○ | ○ | − | − | − | − | NEC特殊文字 NEC選定IBM拡張文字 ユーザ定義文字 半角カナ[ロッキングシフト] |
| CP50222 | ○ | ○ | ○ | ○ | − | − | − | − | NEC特殊文字 NEC選定IBM拡張文字 ユーザ定義文字 半角カナ[シングルシフト] |
UNIX でよく用いられる文字コードです。ローマ字(ASCII)はそのまま、通常の漢字は最上位ビットをたて、半角カナは SS2(#8e)、第三・第四水準は SS3(#8f)を用います。
| ビット | 説明 |
|---|---|
| 0xxxxxxx | JIS X 0201 ローマ字。 |
| 1xxxxxxx 1xxxxxxx | JIS X 0213 1面(第一水準、第ニ水準、第三水準)。区、点にそれぞれ #a0 を加えます。例えば「あ(4区2点)」はEUC では #a4 #a2 になります。 |
| 10001110 1xxxxxxx | JIS X 0201 半角カタカナ。#8e は SS2(シングルシフト2)と呼ばれています。例えば半角カタカナの「アイウ」#b1 #b2 #b3 は、#8e #b1 #8e #b2 #8e #b3 となります。 |
| 10001111 1xxxxxxx 1xxxxxxx | JIS X 0212(補助漢字)や、JIS X 0213 2面(第四水準)。#8f は SS3(シングルシフト3)と呼ばれます。 |
---------------------------------------------------------
1バイト目 2バイト目
---------------------------------------------------------
0x81-0x9F 0x40-0x7E,0x80-0xFC JIS X 0213 1面
0xE0-0xEF 0x40-0x7E,0x80-0xFC JIS X 0213 1面
0xF0-0xFC 0x40-0x7E,0x80-0xFC JIS X 0213 2面
---------------------------------------------------------
| 規格 | 説明 |
|---|---|
| US-ASCII | ASCII。 |
| ISO-2022-JP | JISコード。JIS X 0208。RFC1468。 |
| ISO-2022-JP-2 | JISコード。JIS X 0221。RFC1554。 |
| Shift_JIS | シフトJIS。JIS X 0201-1997、JIS X 0208-1997 をベースにシフトJIS 変換したもの。 |
| Windows-31J | Shift_JISに、NEC特殊文字(13区)、NEC選定IBM特殊文字(89〜92区)、IBM拡張文字(115〜119区)を加えたもの。 |
| EUC-JP | EUC。(1) #00-#7f 領域の US-ASCII、(2) #80-#ff 領域にシフトした JIS X 0208-1990 文字集合、(3) SS2プレフィックスを用いた半角カタカナ、(4) SS3プレフィックスを用いた JIS X 0212-1990 文字集合。 |
| ISO-8859-1 | Latin-1。西欧諸語。 |
| ISO-8859-2 | Latin-2。東欧諸語。 |
| ISO-8859-3 | Latin-3。エスペラント語など。 |
| ISO-8859-4 | Latin-4。北欧諸語。 |
| ISO-8859-5 | Cyrillic。ロシア語(キリル文字)。 |
| ISO-8859-6 | Arabic。アラビア語。 |
| ISO-8859-7 | Greek。ギリシャ語。 |
| ISO-8859-8 | Hebrew。ヘブライ語。 |
| ISO-8859-9 | Latin-5。トルコ語。 |
| ISO-8859-10 | Latin-6。北欧語。 |
| ISO-8859-13 | Latin-7。 |
| ISO-8859-14 | Latin-8。 |
| ISO-8859-15 | Latin-9。 |
| KOI8-R | ロシア語。RFC1489。 |
| ISO-2022-KR | 韓国語。 |
| EUC-KR | 韓国語。KS X 1001。 |
| GB2312 | 簡字体中国語。 |
| Big5 | 繁字体中国語。主に台湾で使用。 |
| 規格 | 説明 |
|---|---|
| JIS X 0201 | 半角文字を定義 |
| JIS X 0202 | ISO-2022の日本語版 |
| JIS X 0208 | 漢字 |
| JIS X 0212 | 漢字 |
| JIS X 0213 | 漢字 |
| JIS X 0211 | 制御コード |
| JIS X 0221 | ISO 10646(≒Unicode)の日本語版 |
| ISO/IEC 646 | 半角文字 |
| ISO/IEC 10646 | ≒Unicode |
WindowsでUnicodeの文字列を、任意のコードページに変換するにはWideCharToMultiByte()を用いる。シフトJISに変換するにはCP932を用いるが正式なShift_JISとは若干異なる。JISコードに変換するにはCP50220、CP50221、CP50222を用いるが、正式なISO-2022-JPとは若干異なる。EUCに変換するにはCP20932を用いるが、正式なEUC-JPとは若干ことなる。
932 ANSI/OEM - Japanese, Shift-JIS 1200 Unicode UCS-2 Little-Endian (BMP of ISO 10646) 1201 Unicode UCS-2 Big-Endian 20932 JIS X 0208-1990 & 0121-1990 50220 ISO 2022 Japanese with no halfwidth Katakana 50221 ISO 2022 Japanese with halfwidth Katakana 50222 ISO 2022 Japanese JIS X 0201-1989 50930 Japanese (Katakana) Extended 50939 Japanese (Latin) Extended and Japanese 51932 EUC - Japanese 65000 Unicode UTF-7 65001 Unicode UTF-8
| 規格 | 説明 |
|---|---|
| CJK | 中国(C)、日本(J)、韓国(K)で使用される漢字の総称。 |
| KS C 5601-1992 | 韓国で一般に用いられる 8224字(ハングル 2350字、漢字 4888字、ASCIIや記号 986字)。 |
| KS C 5657-1991 | 韓国の補助漢字。2858字。 |
| GB 1988-1989 | 中国語ASCII。 |
| GB 2312-1980 | 中国語基本集。7445字(一級3755字、二級3008字)。 |
| GB 12345-1990 | 中国語補助集。7583字。 |
| GB 7589-1987 | 中国語第ニ補助集。7237字。 |
| GB 7590-1987 | 中国語第四補助集。7039字。 |
| BIG5 | 台湾の文字集合。13523字。 |
| CNS 11643-1992 | 台湾の文字集合。約55000字。 |