GoogleドキュメントでOCR | 岸本ビジネスサポート株式会社

「紙にプリントアウトされた書類の文章を再度Wordとか文書作成ソフトで入力し直す」・・・小さな会社やお店では、たまに見かける光景ですが、これ、冷静に考えると手間ばかりかかる上になんとなくナンセンスな感じがします。

そこで登場するのがGoogleドキュメントのOCR機能。文書を撮影した写真やPDFファイルから自動で文字起こしをしてくれるというスグレモノな機能です。まずはとにかく、手順とその精度をご紹介いたします。

写真を文書に変換する

図のようなA4用紙にワープロ文章のように書いた印刷物をスマホで写真に撮ります。

Googleドライブをブラウザで開き、写真データをアップロードします。
ブラウザをGoogleChrome使っておくと図のようにブラウザ上へドラッグするだけで済むのでラクです。

アップロードした写真ファイルを右クリックし、Googleドキュメントで開く操作をします。

暫くの間図のように処理中の画面が続くと思います（長い場合は1分くらい続く）

Googleドキュメントで開く処理とOCR処理が終わると、まず1ページめに写真が表示されます。（これは普通に画像として表示されます）

2ページめには、1ページめに表示した写真のOCR（文字認識）結果が表示されます。
こちらは文字データなので、誤認識などがあれば後で修正・編集することも出来ます。

上記の例のように、元々ワープロ打ちなどをされている書類を写真で撮って取り込んだ場合の認識率は、かなり満足度の高いものでした。上記の例で言うと、認識間違いしていたのは「^^;」のような顔文字と、ちょっとした句読点などです。

ちなみに、よく見ると1行目に「当日まで」とか途中の行に「(1顕家」とかありますが、これは、この書類の文字を誤認識したのではなく、写真に写り込んだ書類の後ろにある緑色のシートに表記されていた文字まで認識しちゃっている結果によるもの・・・こんな細かい文字まで認識してる(@_@)！！むしろスゴすぎる！

ちなみに、試しにと思って手書き文字を写真にとって同じ作業してみました。

結果は図のような感じ。

さすがに手書きの文字は認識率低すぎて使い物になりません（もう少しきちんとしたキレイな字であれば大丈夫かもしれませんが^^;）

ワープロ打ちの書類限定とはいえ、写真にとってアップして変換するだけで文字認識してくれるとなると、業務上で利用できるシーンはかなり多そうです。今まで「スキャナで取り込んで、データ化して・・・」なんてやっていた書類も、スマホで撮ってアップするだけで簡単に文書データ化出来ますから、ね。参考までに

Androidスマートフォン・Googleフォトの自動バックアップ機能・Googleドライブのそれぞれを利用して組み合わせれば、いちいちパソコンに写真データを移し替えなくてもブラウザ上だけで処理できてしまうので、マジメに最強かもしれません。

今回ご紹介した例は「文章だけ」のものでしたが、例えば「料理レシピ」とか「ノウハウ解説書」などのように写真や図が文章と一緒に掲載されているようなものでも、かなりの精度で文字の部分だけを認識して処理してくれました。

また、何十ページ・何百ページもある本を見開きにして写真を撮るとどうしても真正面からきちんと撮れない事が多いですが、そんな「歪んでる写真」とか「たわんでいる書類の写真」でも、相当な正確さで文字認識してくれました。

これは、本当に強い味方になるかもしれません、ね^^