文字コードの変換はいつも大変です。自分の場合は、よくメールの文章を取り込むようなシステムの開発で遭遇するのですが、ヘッダとボディの文字コードが合ってない等々(エンコーディングの指定情報が欠落していたり、コードの指定が間違っていることがある為)で...
そんな時に、調査用としてよくnkf コマンドを利用します。
メールで文字化けがあったときに考えられることとしては、「送信する側で設定した文字コード」と「受信する側で設定している文字コード」が異なっていると、または送信側で意図した文字を受信側で正しく表示することができずに、文字化けを起こしてしまうことなどが考えられます。
nkf コマンドを使うと簡単に文字コードの確認ができるため重宝してます。
nkf とは
nkf は文字コードを変換するコマンドです。
Network kanji Filter の略のようです。
ja.wikipedia.org
オプション
自分がよく使う文字コードのオプションをまとめてみました。
オプション | 説明 |
---|---|
-g | 文字コードの判別 |
-w | utf-8 変換 |
-e | euc-jp 変換 |
-s | shift-jis 変換 |
使い方
文字コード判別
-g オプションにファイル名を渡してあげると文字コードを判別してくれます。
$ nkf -g {FILE}
ファイルの上書き(utf-8変換)
--overwrite オプションを指定すると、変換結果でファイルを置き換えることができます。
$ nkf --overwrite -w {FILE}