データの文字化け

クラウドからダウンロードしたCSVが文字化けする理由と、Windowsパソコンでの対処法

クラウドサービスからデータをダウンロードして、Excelやメモ帳で開こうとしたら、文字がぐちゃぐちゃになっていた。

このような経験はありませんか。

たとえば、顧客一覧、売上一覧、予約データ、勤怠データ、会員名簿、商品データなどをクラウドサービスからCSV形式でダウンロードし、それをExcelで開いたときに、日本語が読めない文字に変わってしまうことがあります。

クラウドから取得したCSVをExcelやメモ帳で開くと、文字コードの違いにより文字化けすることがあります。

これは、パソコンが壊れているわけでも、データが壊れているわけでもありません。多くの場合、「文字コード」という、文字を保存するときの形式の違いが原因です。

文字コードという言葉は少し難しく聞こえるかもしれません。

簡単に言うと、パソコンやソフトが文字を保存したり表示したりするときの「文字の読み方のルール」のようなものです。同じ日本語でも、ファイルを作った側と開く側でこのルールが合っていないと、文字化けが起きます。

1.昨今の「文字化け問題」

近年、多くの業務がクラウドサービス上で行われるようになりました。

会計ソフト、販売管理、予約管理、勤怠管理、顧客管理、ネットショップ、フォーム受付、各種補助金や行政手続きなど、さまざまなサービスがWebブラウザ上で使えるようになっています。

その結果、クラウドサービスからCSVファイルをダウンロードし、Excelで開いて確認・加工する、という作業が増えています。

ところが、ここで問題になるのが「文字化け」です。

クラウドサービス側では、世界中で使いやすい文字の形式が使われていることが多くあります。代表的なものが「UTF-8」という形式です。

一方で、日本のWindowsパソコンや古い業務ソフトでは、昔から日本語Windowsでよく使われてきた形式が前提になっている場合があります。

そのため、クラウドサービスからダウンロードしたCSVを、何も考えずにExcelで開いたり、古い業務ソフトに取り込んだりすると、日本語を正しく読み取れず、文字化けしてしまうことがあります。

たとえば、次のような現象です。

  • 日本語の氏名や住所が読めない文字になる
  • 会社名や商品名がぐちゃぐちゃに表示される
  • 「髙」「﨑」などの文字が変になる
  • 文字の一部だけが「?」になる
  • Excelで開くと文字化けするけど、別のソフトでは正しく見える
  • クラウド上では正常なのに、ダウンロードしたファイルだけがおかしい

ここで大事なのは、「文字化けしたからといって、すぐにデータが壊れたと考えないこと」です。

多くの場合、ファイルそのものは壊れていません。

開く側のソフトが、文字の読み取り方を間違えているだけです。

つまり、正しい方法で開き直せば、元の日本語がきちんと表示されることが多いのです。

2.どう対処すればよいか?

この記事をお読みの多くの方はWindowsのパソコンをお使いになっていることと思います。

文字化けが起きたとき、まず覚えておきたいことがあります。

それは、CSVファイルをいきなりダブルクリックで開かない、ということです。

CSVファイルをダブルクリックすると、多くのWindowsパソコンではExcelが起動します。

一見便利なのですが、この方法ではExcelが文字の形式を自動判断するため、うまく判定できないと文字化けします

特にクラウドサービスからダウンロードしたCSVでは、ダブルクリックで開くのではなく、Excelの中から読み込む方法をおすすめします。

対処法1:Excelの「データ」からCSVを読み込む

もっともおすすめの方法は、Excelの「データ」メニューからCSVファイルを読み込む方法です。

手順は次のとおりです。

  1. Excelを起動します。
  2. 空白のブックを開きます。
  3. 画面上部の「データ」をクリックします。
  4. 「テキストまたはCSVから」を選びます。
  5. ダウンロードしたCSVファイルを選びます。
  6. 表示されたプレビュー画面で、日本語が正しく表示されているか確認します。
  7. 文字化けしている場合は、「元のファイル」や「文字コード」の項目を変更します。
  8. 日本語が正しく表示されたら、「読み込み」をクリックします。

この方法であれば、Excelに「このファイルはこの形式で読んでください」と指定できるため、文字化けを避けやすくなります。

対処法2:クラウドサービス側で文字コードを選べる場合は確認する

クラウドサービスによっては、CSVをダウンロードするときに、文字コードを選べる場合があります。

たとえば、次のような選択肢が表示されることがあります。

  • UTF-8
  • Shift-JIS
  • Excel用
  • Windows用
  • 日本語Excel用

このような選択肢がある場合、Excelで開く目的であれば、「Excel用」「Windows用」「Shift-JIS」などを選ぶと、文字化けしにくいことがあります。

ただし、別のクラウドサービスへ取り込む場合は、UTF-8を選んだ方がよい場合もあります。

つまり、どれが常に正解というよりも、「何に使うファイルか」によって選ぶ必要があります。

目安としては、次のように考えると分かりやすいです。

Excelで見る・加工するためのCSVであれば、Excel用またはShift-JIS。

別のクラウドサービスに取り込むためのCSVであれば、UTF-8。

このように覚えておくとよいでしょう。

対処法3:Windowsのメモ帳でUTF-8のファイルを開く

CSVファイルやテキストファイルを、Windowsのメモ帳で開いて確認することもあります。

最近のWindowsのメモ帳は、以前よりもUTF-8への対応が進んでいます。

そのため、現在のWindows 10やWindows 11であれば、UTF-8のテキストファイルをメモ帳で開いたときに、正しく表示されることも多くなっています。

ただし、次のような場合には、まだ文字化けが起きることがあります。

  • 古いWindowsパソコンを使っている
  • 古い業務ソフトから出力されたテキストを開いている
  • 文字コードが特殊な形式になっている
  • ファイルの保存形式がメモ帳でうまく判定できない
  • CSVをExcelで開いたときだけ文字化けする

メモ帳でUTF-8などのファイルを開く場合は、まず次の手順を試してください。

  1. ファイルを右クリックします。
  2. 「プログラムから開く」を選びます。
  3. 「メモ帳」を選びます。
  4. 日本語が正しく表示されるか確認します。

これで正しく表示されれば、ひとまず内容の確認はできます。

ただし、注意が必要です。メモ帳で正しく表示されたからといって、そのまま上書き保存してよいとは限りません。上書き保存すると、ファイルの保存形式が変わってしまう場合があります。

特に、他のシステムに取り込むためのCSVや、クラウドサービスからダウンロードした原本ファイルは、安易に上書き保存しない方が安全です。

対処法4:メモ帳で保存し直す場合は「名前をつけて保存」を使う

メモ帳で開いたファイルを、UTF-8形式で保存し直したい場合は、「上書き保存」ではなく「名前を付けて保存」を使います。

手順は次のとおりです。

  1. メモ帳でファイルを開きます。
  2. 日本語が正しく表示されていることを確認します。
  3. 「ファイル」をクリックします。
  4. 「名前を付けて保存」を選びます。
  5. 保存先を選びます。
  6. ファイル名を付けます。
  7. 画面下部にある「文字コード」または「エンコード」の欄を確認します。
  8. 必要に応じて「UTF-8」を選びます。
  9. 「保存」をクリックします。

ここで大切なのは、元のファイルとは別名で保存することです。

たとえば、元のファイル名が、

顧客一覧.csv

だった場合、

顧客一覧_UTF8.csv

のように、別名で保存しておくと安心です。

こうしておけば、万が一うまくいかなかった場合でも、元のファイルに戻ることができます。

業務データでは、「元ファイルを残す」ことがとても大切です。

対処法5:メモ帳で文字化けする場合は、別のテキストエディタを使う

メモ帳で開いても文字化けする場合は、無理にメモ帳だけで解決しようとしない方がよいです。

その場合は、文字コードを選んで開けるテキストエディタを使うと、解決しやすくなります。

テキストエディタとは、文字だけのファイルを開いたり編集したりするためのソフトです。

Windowsのメモ帳もテキストエディタの一種ですが、文字コードの確認や変換をしやすい、もう少し便利なソフトもあります。

たとえば、次のようなソフトがあります。

  • TeraPad
  • Sakura Editor
  • Notepad++

この中でも、一般的な事務作業で使うのであれば、TeraPadは比較的シンプルで扱いやすいテキストエディタです。

見た目もメモ帳に近く、余計な機能が前面に出すぎていないため、専門的なIT知識がない方でも使いやすい部類に入ります。

TeraPadでは、ファイルを開いたときの文字コードを確認したり、別の文字コードで保存し直したりできます。

そのため、メモ帳で文字化けしてしまうファイルでも、TeraPadで開き直すと正しく表示できる場合があります。

ただし、TeraPadなどのテキストエディタを使う場合でも、元ファイルを直接上書きしないことが大切です。

まずは元ファイルのコピーを作り、そのコピーを開いて確認するようにしましょう。

普段の業務では、次の順番で考えると分かりやすいです。

まず、Excelで使うCSVなら、Excelの「データ」から読み込む。

次に、内容確認だけなら、メモ帳で開いてみる。

メモ帳でうまく表示できない場合は、TeraPadなどのテキストエディタで開いてみる。

それでもうまくいかない場合は、詳しい人に確認する。

この順番で考えると、混乱しにくくなります。

対処法6:文字化けしたファイルをそのまま保存しない

文字化けが起きたときに、一番避けたいのは、文字化けした状態のまま保存してしまうことです。

たとえば、Excelで文字化けしたCSVを開き、そのまま上書き保存してしまうと、元の正しい文字に戻せなくなる場合があります。

また、文字化けした日本語を見ながら手作業で修正するのもおすすめできません。

時間がかかるうえに、間違いが入りやすくなります。

文字化けしたときは、まず保存せずに閉じる。

そして、正しい開き方でもう一度開き直す。

この手順を守ることが大切です。

3.特に注意が必要なクラウドサービスやソフトウェア

文字化けが起きやすいのは、主に「クラウドサービスからCSVをダウンロードする場面」です。特に次のようなサービスでは注意が必要です。

会計・販売管理・請求管理サービス

会計ソフト、請求書発行サービス、販売管理サービスなどでは、取引先、品目、売上、仕訳、入金データなどをCSVで出力することがあります。

これらのデータには、会社名、氏名、住所、商品名など、日本語が多く含まれます。

文字化けすると内容の確認ができないだけでなく、誤ったデータを加工してしまう危険もあります。

ネットショップ・予約管理・顧客管理サービス

ネットショップ、予約管理、顧客管理、メール配信、問い合わせフォームなどのサービスでも、顧客情報をCSVで出力することがあります。

この場合、氏名や住所に旧字体や特殊な文字が含まれることがあります。

たとえば、名字や地名に使われる難しい漢字が正しく表示されないことがあります。

顧客情報を扱う場合は、文字化けしたまま修正や加工を進めないよう注意が必要です。

勤怠管理・給与関連サービス

勤怠管理や給与関連のクラウドサービスでも、従業員一覧、勤務実績、シフト、給与計算用データなどをCSVで出力することがあります。

このようなデータは、後で給与計算や会計処理に使われることもあります。

文字化けだけでなく、CSVをExcelで開いたときに、数字の先頭の「0」が消える、日付が勝手に変わる、といった別の問題も起こることがあります。

たとえば、社員番号や顧客番号が「00123」だったのに、Excelで開いたら「123」になってしまうことがあります。

これもCSVを扱うときによくあるトラブルです。

文字化けとあわせて注意したいポイントです。

Excel

文字化けが起きたとき、多くの方は「Excelがおかしい」と感じるかもしれません。

しかし、Excel自体が悪いというよりも、CSVファイルをどの形式で読むかをExcelがうまく判断できないことが原因です。

そのため、CSVファイルはダブルクリックではなく、Excelの「データ」から取り込む方法を基本にするのがおすすめです。

特に、クラウドサービスからダウンロードしたCSVは、まず「データ」から読み込む、と社内ルールにしておくと安心です。

メモ帳

メモ帳は手軽に使えるため、CSVやテキストファイルを確認するためによく使われます。

最近のメモ帳はUTF-8にも対応していますが、それでもすべての文字化けを自動的に解決してくれるわけではありません。

また、メモ帳で開いて上書き保存すると、ファイルの形式が変わることがあります。

そのため、業務用のCSVファイルをメモ帳で編集して上書き保存するのは、あまりおすすめできません。

確認だけならよいのですが、編集・保存する場合は、元ファイルのコピーを取ってから行うようにしましょう。

Terapadなどのテキストエディタ

メモ帳よりも少し便利なソフトとして、TeraPadなどのテキストエディタがあります。

TeraPadは、文字だけのファイルを開いたり編集したりするためのソフトで、CSVやテキストファイルの中身を確認したいときに役立ちます。

特に、メモ帳で開くと文字化けするファイルを、別の文字コードで開き直したい場合に便利です。

ただし、TeraPadを使えば何でも自動的に直る、というわけではありません。

あくまで、文字コードを確認したり、別の形式で保存し直したりしやすくなるソフトだと考えるとよいでしょう。

また、TeraPadで編集する場合も、元ファイルを直接上書きしないことが大切です。

業務で使うCSVは、まずコピーを取ってから開くようにしましょう。

古い業務ソフト

長年使っている販売管理ソフト、給与ソフト、在庫管理ソフトなどでは、昔ながらの日本語Windows向けの形式を前提にしている場合があります。

一方、新しいクラウドサービスは、世界標準の形式を前提にしていることが多くあります。

そのため、古い業務ソフトと新しいクラウドサービスの間でCSVをやり取りすると、文字化けが起きやすくなります。

たとえば、次のような場面です。

クラウドから出したCSVを古い業務ソフトに取り込む。

古い業務ソフトから出したCSVをクラウドに取り込む。

このような場面では、特に注意が必要です。

作業(現場)でのおすすめルール

ここまで色々書くと、難しそうな話に思えるかもしれませんが(実際難しい話なのですが(^_^;))、難しい仕組みをすべて理解する必要はありません。まずは、次のルールを決めておくだけでも十分効果があります。

1つ目は、CSVファイルはすぐにダブルクリックしないことです。

Excelで開く場合は、「データ」から取り込むようにします。

2つ目は、文字化けしたファイルをそのまま保存しないことです。

文字化けした状態で上書き保存すると、元に戻せなくなる場合があります。

3つ目は、クラウドサービスからCSVを出すときに、「Excel用」「Windows用」「Shift-JIS」などの選択肢がないか確認することです。

4つ目は、メモ帳で開く場合も、元ファイルを直接上書きしないことです。

保存し直す場合は、「名前を付けて保存」を使い、必要に応じて「UTF-8」などを選びます。

5つ目は、メモ帳で文字化けする場合は、TeraPadなどのテキストエディタで開いてみることです。

ただし、その場合も元ファイルを直接編集せず、コピーを作ってから試します。

6つ目は、他のシステムに取り込むCSVは、編集前に必ずコピーを取ることです。

7つ目は、うまくいかない場合に、すぐ手作業で直そうとしないことです。

文字化けした日本語を見ながら一つひとつ修正するのは、時間がかかるうえに間違いも起きやすくなります。

まずは正しい方法で開き直すことを試してください。

ポイント(社内で共有したい簡単な合言葉♪)

  • CSVはダブルクリックしない。
  • Excelで開くときは、「データ」から読み込む。
  • メモ帳で保存するときは、元ファイルを上書きしない。
  • メモ帳で読めなければ、TeraPadなどで開いてみる。
  • 文字化けしたら、保存せずに閉じる。

この5つだけでも、現場でのトラブルはかなり減らせます。


文字化けは、パソコンに詳しくない方にとっては、とても不安なトラブルです。

しかし、多くの場合、データそのものが壊れているわけではありません。

ファイルを開くときの読み取り方が合っていないだけです。

特にクラウドサービスからダウンロードしたCSVファイルは、Excelでダブルクリックして開くのではなく、Excelの「データ」から取り込む方法を覚えておくと安心です。

また、Windowsのメモ帳でUTF-8のファイルを開くことはできますが、保存するときには注意が必要です。

メモ帳で開いて内容を確認するだけならよいのですが、保存し直す場合は「名前を付けて保存」を使い、必要に応じて文字コードを選び、元ファイルとは別名で保存するようにしましょう。

メモ帳でうまく表示できない場合は、TeraPadなどのテキストエディタを使う方法もあります。

ただし、その場合も元ファイルを直接上書きせず、まずコピーを取ってから試すことが大切です。

中小・小規模企業の現場では、専任のIT担当者がいないことも多く、こうした小さなトラブルが業務の大きな負担になることがあります。

だからこそ、難しい専門知識を覚えるよりも、まずは次の基本を覚えておくことが大切です。

CSVはダブルクリックせず、Excelのデータから読み込む。

メモ帳で保存するときは、元ファイルを上書きしない。

メモ帳で読めなければ、TeraPadなどで開いてみる。

この基本を社内で共有しておくだけでも、文字化けによる混乱をかなり減らすことができます。