iconv コマンド
目次
概要
iconv - ファイルの文字コードを変換するコマンドライン
iconv [OPTION...] [FILE...]
対象バージョン
- RHEL 10 : iconv (GNU libc) 2.39
- Ubuntu 24.04 : iconv (Ubuntu GLIBC 2.39-0ubuntu8.4) 2.39
説明
ファイルの文字コードを変換します。下記の例では、Shift_JIS(JIS X 0213対応) のファイルを UTF-8 に変換しています。
$ iconv -f Shift_JISX0213 -t UTF-8 sjis.txt > utf8.txt
指定可能な文字コードの一覧は -l
オプションで確認できます。-f
や -t
に指定する際、大文字・小文字は無視されます。
$ iconv -l : CP904, CP905, CP912, CP915, CP916, CP918, CP920, CP921, CP922, CP930, CP932, : ISIRI3342, ISO-2022-CN-EXT, ISO-2022-CN, ISO-2022-JP-2, ISO-2022-JP-3, ISO-2022-JP, ISO-2022-KR, ISO-8859-1, ISO-8859-2, ISO-8859-3, ISO-8859-4, : SEN_850200_B, SEN_850200_C, SHIFT-JIS, SHIFTJISX0213, SHIFT_JIS, : US-ASCII, US, UTF-7-IMAP, UTF-7, UTF-8, UTF-16, UTF-16BE, UTF-16LE, UTF-32, :
主な文字コードは下記のとおり。Unicode系であれば UTF-8、シフトJIS系であれば Shift_JISX0213、JISコード系であれば連携するアプリによって ISO-2022-JP か ISO-2022-JP-3 がよさそうです。
- Unicode系
- UTF-8 : Unicode系で最も広く使用。ASCIIは1文字、日本語などは概ね3バイトなどで表現。サロゲートペア領域対応。
- UTF-16 : 1文字を2バイトまたは4バイトで表現。サロゲートペア領域対応。
- シフトJIS系
- SHIFT_JIS : 第三・第四水準未対応。○付数字未対応。波ダッシュ問題無し。
- SHIFT_JISX0213 : 第三・第四水準対応。○付数字対応。波ダッシュ問題無し。
- CP932 : Microsoft版シフトJIS。第三・第四水準未対応。〇付数字対応。波ダッシュ問題有り。
- WINDOWS-31J : Microsoft版シフトJIS。第三・第四水準未対応。〇付数字対応。波ダッシュ問題有り。
- JISコード系
- ISO-2022-JP : いわゆるJISコード。メールなどで使用されている。第三・第四水準未対応。
- ISO-2022-JP-3 : 上記の拡張版。第三・第四水準対応。アプリが対応していないことも。
- EUC系
- EUC-JP : 昔のUNIX系で使用されていた文字コード。
オプション
文字コード
- -f, --from-code=NAME
- 変更前の文字コードを指定します。
- -t, --to-code=NAME
- 変更後の文字コードを指定します。
- -l, --list
- 指定可能な文字コードリストを表示します。
出力指定
- -c
- 文字コードとして適切ではない文字を出力から除外します。
- -o, --output=FILE
- 出力先ファイルを指定します。省略すると標準出力に出力します。
- -s, --silent
- 警告メッセージを抑制します。
- --verbose
- 進捗状況を表示します。
ヘルプ表示
- -?, --help
- ヘルプを表示します。
- --usage
- 使用方法を表示します。
- -V, --version
- バージョン情報を表示します。
関連項目
Copyright (C) 2025 杜甫々
初版:2025年8月3日 最終更新:2025年8月3日
https://www.tohoho-web.com/linux/cmd/iconv.html