話題のGoogleドキュメントで画像から文字を抽出するやり方

まずGoogleドライブに画像をアップロードします．

次に画像を右クリックして，アプリで開くからGoogleドキュメントを指定します．

f:id:okamurauchino:20180202122947p:plain

すると少し後に文字起こしされます．

f:id:okamurauchino:20180202123111p:plain

そしてこれが文字の大きさなどをそろえてあげたものです．

参考記事　街かど屋のおすすめメニュー - ミグストラノート

f:id:okamurauchino:20180202123152p:plain

だいたいうまく文字に起こされていますね．OCR優秀．「，と．」があまり拾えてませんね．とろたまがとるたまになっています．

手書きの議事録とかのときは単純なOCRに加えて，文章作成ソフトの文章校正 (画像の赤波線部分など) を組み合わせるのが今後のトレンドになるのかもしれません．

Googleドライブの公式のヘルプからの情報です．

PDF や写真のファイルをテキストに変換する - パソコン - Google ドライブヘルプ

ファイルを準備する次のヒントを参考にするとファイルを最適な状態で準備できます。

形式: .JPEG、.PNG、GIF、PDF（複数ページのドキュメント）の各ファイル。ファイルサイズ: ファイルは 2 MB 以下にします。解像度: テキストの高さは 10 ピクセル以上にします。向き: ドキュメントは正しい向きにします。画像の向きが間違っている場合は、回転させてから Google ドライブにアップロードします。言語: Google ドライブではドキュメントの言語は検出されません。フォントと文字セット: 最適な結果を得るには、Arial や Times New Roman のような一般的なフォントを使用します。画質: 明るさが均一でコントラストがはっきりしたシャープな画像が最適です。画像ファイルを変換するパソコンで drive.google.com を開きます。目的のファイルを右クリックします。 [アプリで開く] 次へ [Google ドキュメント] をクリックします。画像ファイルは Google ドキュメントに変換されますが、形式によっては移行できないこともあります。太字、斜体、フォントサイズ、フォントタイプ、改行は通常保持されます。リスト、表、列、脚注、巻末の注などは、検出されない可能性があります。

GoogleドキュメントのOCR機能の活用方法と聞くと，直大さんがエロゲキャラのなりきりTwitter botを作るために，ゲームの画像をスクリーンショットとして取得して，文字起こしをするのに使っていたのを思い出します．

f:id:okamurauchino:20180202124213p:plain