夢見る税理士の独立開業繁盛記

神戸市東灘区で開業している駆け出し税理士の、試行錯誤日記

事務所ホームページはこちらです→神戸市東灘区御影の会計事務所 小林敬幸税理士事務所

エクセルのOCR(画像からのデータ取得)は、データ取込に使えるか?

前回の日記で
ScanSnap単体で「日付_金額_店名」でOCRをかけると、手書きの領収書以外は結構いい精度で取り込めるんですよね」
と書いたのですが、しばらく前にその話を知り合いの税理士さんにしたところ
「90%合っていても10%間違ってたら、その間違い探すのに手間がかかるから使えないわ」
みたいなことを言われたことがありました。
確かに金額微妙に間違えたまま取り込んでしまって、あとで間違い探しで訂正ということになったら、手入力の方が早かったというオチにもなりかねないですよね・・・。

他に何かいい方法がないかなあと考えていたのですが、ふとエクセルでも画像にOCRかけてテキストデータに変換できる機能があったことを思い出したので、取引データへの変換に使えるか試してみました。


エクセルはメニューの以下のアイコンを選択すると、画像データからOCRで、画像上の文字をテキストデータに変換することができます。

ただ日本語の変換は正直微妙で、取引先名とかそのままレシートの取り込みには使うことはできないかなあという感じです。
その取引先名、10月からインボイス番号がレシートに記載されるようになっているので、「T+番号」のインボイス番号さえ拾うことができれば国税庁APIに投げて返ってきた業者名を取得すればいいんだから、もしかしたら使いものになるかも・・・。


ということで、試しに手元のレシートをスキャンして、エクセルで取り込んでみました。


  • 郵便局のレシート


  • 本屋さんのレシート


  • コンビニのレシート



  • パン屋さん(印刷がかすれると厳しい・・・)


  • スーパー


  • 百均ショップ


取り込んでみると、必要な情報である「インボイス番号」と「日付」と「金額」は、ほぼ完璧に取り込めている感じ。
金額から取引金額を選択させるのはちょっと面倒そうだけど、以前作った次の「電子取引データ保存シート」と同じ仕組みを使えば、意外と簡単にデータ抽出できるかも。

www.youtube.com



上手く実務に使えそうな方法を考えてみたいと思います。



神戸市東灘区御影の会計事務所 小林敬幸税理士事務所です