CSV移行で文字化けする原因|名前・住所が崩れる前に見る設定

CSV移行で文字化けする原因|名前・住所が崩れる前に見る設定

人事労務システムのCSV移行で起きる文字化け(氏名・住所・カナ)の原因を、UTF-8/Shift-JIS/Excelの罠まで含めて整理。崩れる前に確認する順番、直し方、テストのやり方を実務目線で解説します。

CSV移行で文字化けする原因|名前・住所が崩れる前に見る設定

CSV移行の文字化けって、地味に見えて後から効いてくるタイプのトラブルです。
氏名の「髙」「﨑」、住所の記号、フリガナの半角カナ…
崩れたまま取り込むと、あとで検索も照合もやりにくくなります。

よくある症状はこんな感じ。

  • 氏名や住所が「??」「□」「�」みたいな記号になる
  • カナが全角と半角で混ざって見た目が崩れる
  • 一部だけ文字化けして、気づきにくい(特に「髙」「﨑」「𠮷」など)
  • CSVを開いた瞬間に崩れて、どっちが正しいか分からなくなる

結論:文字化けの原因はだいたい「文字コード」と「Excel」の合わせ技

CSVはただのテキストなので、文字コードがズレると文字が崩れます。
さらに厄介なのが、CSVをExcelで開いた瞬間に、Excel側が勝手に解釈して崩すことがある点です。

まず覚えておくと安心な一言
「CSVはExcelで“普通に開かない”」
これだけで、事故がかなり減ります。

まずここを確認:文字化けの代表パターン4つ

パターン 起きる症状 主な原因 最初に見る所
UTF-8とShift-JISのズレ 日本語が「??」「�」になる 取り込み側とCSVの文字コードが不一致 取り込み設定/出力設定
Excelで開いた瞬間に崩れる 見た目が崩れて保存し直すと悪化 Excelが自動判定で変換 Excelの開き方(インポート)
機種依存文字(外字)が崩れる 「髙」「﨑」「𠮷」などが別文字に フォント・文字体系の差/システム側の対応差 置換ルール/許容文字
カナや記号だけ崩れる 半角カナや記号が混ざる 正規化がされていない 入力元データ/変換ルール
ポイント
「取り込む前のCSVの時点で崩れている」のか、
「Excelで開いたせいで崩れた」のか、ここを切り分けるのが最短ルートです。

最短の切り分け:Excelを介さずに“素のCSV”を確認する

まず、CSVをExcelでダブルクリックして開くのは一旦ストップ。
代わりに、次のどちらかで見ます。

  • メモ帳(テキストエディタ)で開く(Windowsならメモ帳、できれば軽いテキストエディタ)
  • システムの取り込みプレビューがあるなら、プレビューで確認する

ここで日本語が普通に見えるなら、「Excelで開いた時に崩れてる」可能性が高いです。
ここで既に崩れているなら、「文字コードや出力設定」の問題の可能性が高いです。

Excelの罠:ダブルクリックで開くと自動判定が走る

Excelは便利なんだけど、CSVに関しては「親切すぎて困る」ことがあります。
自動で文字コードや区切りを推測して、勝手に変換してしまうことがあるんです。

Excelで見るなら、この発想
「開く」じゃなくて「取り込む」
文字コードを選べる手順で読み込むと、崩れにくくなります。

崩れる前に整える:文字コードの基本(難しく見えるけど、要は2択)

実務では、だいたいこの2択です。

  • UTF-8:最近のWebサービス寄り(推奨されることが多い)
  • Shift-JIS:昔からのWindows・一部の業務ソフト寄り

人事労務システム側が「UTF-8でアップロードしてください」「Shift-JISで出力してください」みたいに指定している場合があります。
まずは、その指定に合わせるのが基本です。

「髙」「﨑」問題:機種依存文字は“置換ルール”が必要になることがある

氏名で一番やっかいなのが、いわゆる異体字(「髙」「﨑」「𠮷」など)。
システムによっては受け付けない・別文字に変わる、が起きます。

起きること 困る場面 対処の考え方
別の文字に置き換わる 本人確認、書類、検索で不一致 会社として許容する置換ルールを決める
取り込みでエラーになる 全体が止まる 対象者だけ先に置換して取り込む
見た目は同じだが内部が違う CSV照合でズレる 正規化(統一)して扱う
現実的な落とし所
「正しい表記を100%守る」より、社内で同じ表記で揃う方が運用が安定します。
置換する場合は、対象者への説明(表記ルール)もセットで決めると揉めにくいです。

確認の順番(これで迷いにくい)

  1. Step1:Excelを介さずにCSVを確認
    テキストで見て、そもそも崩れているか切り分け。
  2. Step2:取り込み側の指定文字コードを確認
    UTF-8指定なのにShift-JISで作ると崩れやすいです。
  3. Step3:小さくテスト(10人分だけ)
    いきなり全件ではなく、氏名・住所が混ざる10人程度で試すと安全です。
  4. Step4:異体字がある人を含めて試す
    「髙」「﨑」など、クセのある文字を含めると早めに引っかかります。
  5. Step5:問題が出たら“置換ルール”を決める
    個別対応を続けると毎回同じ所で時間が溶けるので、社内ルール化が効きます。

質問と回答

Q1. 文字化けが起きるのは取り込み側の問題?

両方ありえます。まずはExcelを介さずにCSVを確認して、元から崩れているかを切り分けるのが早いです。

Q2. Excelで編集したい時はどうする?

ダブルクリックで開いて保存し直すのが危険です。Excelの「取り込み」手順で文字コードを指定して読み込む方が崩れにくいです。

Q3. 異体字はどうするのが正解?

会社としての運用ルールを決めるのが現実的です。置換する場合は、検索・照合が揃う利点もあります。

Q4. 住所だけ崩れます

記号や数字の混ざり、区切り文字の影響もあります。まずは文字コードとExcelの自動変換を疑うのが近道です。

Q5. システム選びの時点で見ておくべき?

見ておく価値は高いです。CSV移行の仕様、サンプルCSV、文字コード指定、異体字の扱いが明確だと導入がスムーズです。

まとめ:文字化けは「切り分け」と「小さくテスト」で勝てる

  • Excelで“普通に開かない”(まずテキストで確認)
  • 文字コード(UTF-8/Shift-JIS)の指定に合わせる
  • 10人分で小さくテストしてから全件へ
  • 異体字は置換ルールを社内で決めると安定する

人事・労務管理システムおすすめランキングを見る
次の記事:CSV取り込みが通らない時(項目ズレの確認順)へ