CSV移行の文字化けって、地味に見えて後から効いてくるタイプのトラブルです。
氏名の「髙」「﨑」、住所の記号、フリガナの半角カナ…
崩れたまま取り込むと、あとで検索も照合もやりにくくなります。
よくある症状はこんな感じ。
- 氏名や住所が「??」「□」「�」みたいな記号になる
- カナが全角と半角で混ざって見た目が崩れる
- 一部だけ文字化けして、気づきにくい(特に「髙」「﨑」「𠮷」など)
- CSVを開いた瞬間に崩れて、どっちが正しいか分からなくなる
結論:文字化けの原因はだいたい「文字コード」と「Excel」の合わせ技
CSVはただのテキストなので、文字コードがズレると文字が崩れます。
さらに厄介なのが、CSVをExcelで開いた瞬間に、Excel側が勝手に解釈して崩すことがある点です。
まず覚えておくと安心な一言
「CSVはExcelで“普通に開かない”」
これだけで、事故がかなり減ります。
まずここを確認:文字化けの代表パターン4つ
| パターン |
起きる症状 |
主な原因 |
最初に見る所 |
| UTF-8とShift-JISのズレ |
日本語が「??」「�」になる |
取り込み側とCSVの文字コードが不一致 |
取り込み設定/出力設定 |
| Excelで開いた瞬間に崩れる |
見た目が崩れて保存し直すと悪化 |
Excelが自動判定で変換 |
Excelの開き方(インポート) |
| 機種依存文字(外字)が崩れる |
「髙」「﨑」「𠮷」などが別文字に |
フォント・文字体系の差/システム側の対応差 |
置換ルール/許容文字 |
| カナや記号だけ崩れる |
半角カナや記号が混ざる |
正規化がされていない |
入力元データ/変換ルール |
ポイント
「取り込む前のCSVの時点で崩れている」のか、
「Excelで開いたせいで崩れた」のか、ここを切り分けるのが最短ルートです。
最短の切り分け:Excelを介さずに“素のCSV”を確認する
まず、CSVをExcelでダブルクリックして開くのは一旦ストップ。
代わりに、次のどちらかで見ます。
- メモ帳(テキストエディタ)で開く(Windowsならメモ帳、できれば軽いテキストエディタ)
- システムの取り込みプレビューがあるなら、プレビューで確認する
ここで日本語が普通に見えるなら、「Excelで開いた時に崩れてる」可能性が高いです。
ここで既に崩れているなら、「文字コードや出力設定」の問題の可能性が高いです。
Excelの罠:ダブルクリックで開くと自動判定が走る
Excelは便利なんだけど、CSVに関しては「親切すぎて困る」ことがあります。
自動で文字コードや区切りを推測して、勝手に変換してしまうことがあるんです。
Excelで見るなら、この発想
「開く」じゃなくて「取り込む」。
文字コードを選べる手順で読み込むと、崩れにくくなります。
崩れる前に整える:文字コードの基本(難しく見えるけど、要は2択)
実務では、だいたいこの2択です。
- UTF-8:最近のWebサービス寄り(推奨されることが多い)
- Shift-JIS:昔からのWindows・一部の業務ソフト寄り
人事労務システム側が「UTF-8でアップロードしてください」「Shift-JISで出力してください」みたいに指定している場合があります。
まずは、その指定に合わせるのが基本です。
「髙」「﨑」問題:機種依存文字は“置換ルール”が必要になることがある
氏名で一番やっかいなのが、いわゆる異体字(「髙」「﨑」「𠮷」など)。
システムによっては受け付けない・別文字に変わる、が起きます。
| 起きること |
困る場面 |
対処の考え方 |
| 別の文字に置き換わる |
本人確認、書類、検索で不一致 |
会社として許容する置換ルールを決める |
| 取り込みでエラーになる |
全体が止まる |
対象者だけ先に置換して取り込む |
| 見た目は同じだが内部が違う |
CSV照合でズレる |
正規化(統一)して扱う |
現実的な落とし所
「正しい表記を100%守る」より、社内で同じ表記で揃う方が運用が安定します。
置換する場合は、対象者への説明(表記ルール)もセットで決めると揉めにくいです。
確認の順番(これで迷いにくい)
- Step1:Excelを介さずにCSVを確認
テキストで見て、そもそも崩れているか切り分け。
- Step2:取り込み側の指定文字コードを確認
UTF-8指定なのにShift-JISで作ると崩れやすいです。
- Step3:小さくテスト(10人分だけ)
いきなり全件ではなく、氏名・住所が混ざる10人程度で試すと安全です。
- Step4:異体字がある人を含めて試す
「髙」「﨑」など、クセのある文字を含めると早めに引っかかります。
- Step5:問題が出たら“置換ルール”を決める
個別対応を続けると毎回同じ所で時間が溶けるので、社内ルール化が効きます。
質問と回答
Q1. 文字化けが起きるのは取り込み側の問題?
両方ありえます。まずはExcelを介さずにCSVを確認して、元から崩れているかを切り分けるのが早いです。
Q2. Excelで編集したい時はどうする?
ダブルクリックで開いて保存し直すのが危険です。Excelの「取り込み」手順で文字コードを指定して読み込む方が崩れにくいです。
Q3. 異体字はどうするのが正解?
会社としての運用ルールを決めるのが現実的です。置換する場合は、検索・照合が揃う利点もあります。
Q4. 住所だけ崩れます
記号や数字の混ざり、区切り文字の影響もあります。まずは文字コードとExcelの自動変換を疑うのが近道です。
Q5. システム選びの時点で見ておくべき?
見ておく価値は高いです。CSV移行の仕様、サンプルCSV、文字コード指定、異体字の扱いが明確だと導入がスムーズです。
まとめ:文字化けは「切り分け」と「小さくテスト」で勝てる
- Excelで“普通に開かない”(まずテキストで確認)
- 文字コード(UTF-8/Shift-JIS)の指定に合わせる
- 10人分で小さくテストしてから全件へ
- 異体字は置換ルールを社内で決めると安定する
人事・労務管理システムおすすめランキングを見る
次の記事:CSV取り込みが通らない時(項目ズレの確認順)へ