tips64 デジカメdeOCR!(ここまで来たデジカメの実力)
   

 ずいぶん昔の話しになるが、Windows95全盛期に流行った「日本語OCR」ソフト。
 現行の良し悪しで認識率は飛躍的に上がるものの、当時のレベルでは「罫線を含む文書」や「新聞記事」など、お世辞にも「使える代物」と言えるものではなかった。
 OCRソフトのレベルもさることながら、入力用となるイメージスキャナーも現在のように(安価かつ)高性能なものはなかった時代である。
 今回は、ハイレベルなイメージスキャナーに、あえてデジカメで挑もうという破天荒な企画であるが、デジカメの活きた使い方の紹介になれば幸いである。

 
題して「デジカメdeOCR!」


<そもそもの発端>
 文章を編集する者にとって(前述ののように)「日本語OCR」ソフトは画期的なもの。
 しかしながら、高価なソフトを入手し、試行錯誤を繰り返すたびに「裏切られ」、いつしかその存在も忘れていたのであった。
 ところが、PDFファイル(Excelタイプの表形式)からのデジタルファイル化に迫られ、ついつい購入した「読んdeココ」。
 目的を達成した後に「脳裏をよぎったものは・・・」

 
(PDFのようにファイルからOCR化が可能となるのなら)わざわざイメージスキャナーを使わずとも、デジカメで代用できるのでは? ...へ(__へ)☆\(^^;)


<ものは試しに…>
 手始めは、Microsoft Wordで作成・印刷された文書。
 早速、コンパクトデジカメを使って撮影し、パソコンに転送してOCRソフトを起動。撮影したファイル(JEPG形式)を読み込むと、なにやらメッセージが・・・。
 撮影した画像は、72dpiであるために解像度が低い(推奨は400dpi)ので(うまく変換できないかもしれない)と注意を促しているのである。
 もちろんソフト側で、自動で解像度を(推奨値に)変換してくれるのであるが、できれば事前に画像編集ソフトなどを利用して変換しておくことをお勧めする。
 結果は、(原稿自体が鮮明で単純なものであったこともあり)1文字誤変換以外は、パーフェクトであった。


<OCR、その前に・・・>
 レベルの高い画像ほど認識率が向上することは前述のとおり。
 デジカメの気軽さゆえに、「手ぶれ」や「ぼけ」には、ことのほか注意を払う必要があるのはいうまでもない。
 さしずめ、最近のデジカメのトレンドとなっている「手ぶれ補正」は、このうえない味方となろう。
 イメージスキャナーの代用をするわけであるから、撮影された画像の良し悪しこそ「生命線」となるのである。


<試行錯誤の中から・・・>
 OCRのプロセスに移る前に、試行錯誤の中から編み出したテクニック?をご紹介する。
 ・(前述のように、これまでいくつかのOCRソフトを使用してきた経験から)「カラー画像」よりは「モノクロ画像」
 ・(通常デジカメ画像は72dpiで記録されることも多いことから)解像度は400dpi以上に変換
 ・出来れば「濃く」なく「薄く」ない画像を・・・ など上げればキリがない。

 しかし、今回の試みは、デスクワークに多少時間を割いたとしても、短時間に手軽に、たくさん撮影し、デジタル化することにある。
 ムシが良すぎるかもしれないが、「使えるか、使えないか」を判断するには、これくらいのノルマは必要であろうと考えたのである。

 
現に、所有する2つのOCRソフトは、不合格にて、即刻ゴミ箱行きの破目になったことはいうまでもない  ...へ(__へ)☆\(^^;)


<撮影編>
 ・原稿は出来るだけ平面に保つ(カールしていると原稿が傾く恐れがある)
 ・紙面と並行に、かつ傾かないように(画像の傾きは、画像編集編集用ソフトで修正できるが、できれば歪のないように)
 ・「手ぶれ」「ピンボケ」は論外(明るいところを選ぶか、「手ぶれ」「ピンボケ」に最新の注意を払って)
 ・マクロモードは有効な手段(それでも手ぶれには注意)
 ・手ぶれ補正が搭載されているデジカメなら、必ずONで!


<画像編集編>
 画像編集については、さまざまなソフトがあるため、画一的な機能で表現するのにはかなり無理がある。
 ここでは、カラーで撮影されたJEPGファイルを、PhotoShopにて編集することを例に、説明していくこととする。

 ・ファイルメニューから、目的の画像を読み込む
 ・(余分なものが写っていると思われるので) OCR用原稿となる部分だけを範囲選択し、切り取り(又はコピー)にて、ファイルメニューから「新規」を選び、OKボタンを押した後、画像を貼り付ける
 ・(画像など)OCRに不必要なものは、範囲を選択して、編集メニューから「カット」を選んで削除しておく
 ・(選択範囲メニューから、「選択を解除」を選び、何も選択されていないことを確認して)イメージメニューから「イメージ」「モード」に進み「グレースケール」に変換する
 ・イメージメニューから、「色調補正」「レベル補正」に進み、表示された山形(白黒分布)の下の、出力レベルの「△」マークを、左右の端から、山が始まる位置に両側とも移動させ、適正露出の画像に変換する

(変換前) (調整済み、あとはOKボタンを押すだけ)

 ・イメージメニューから「画像解像度」を選び、(画像の再サンプルにチェックが入っていないことを確認して)解像度を(この場合72dpiから)400pixel/inchに変換する
 (解像度は変更されるが、実質のファイル容量は変わらない)


 ・ファイルメニューから、「別名で保存」を選び、JEPGオプションから画質を最高(低圧縮率)にして保存する


 これでひととおりの編集作業は終了となる。


<いざ!OCR>
 ・OCRソフト(今回の場合は)「読んde!!ココ」を起動
 ・ファイルメニューから、「画像ファイルを開く」を選んで目的の画像を読み込む
 ・ファイルが読み込まれると同時に、「背景除去」が自動で行われる
 ・認識メニューから、「自動領域抽出」を選ぶと、OCR変換される文字列が赤枠で表示される
 ・(変換しようとする文字列が全て赤枠で囲まれていることを確認して)認識メニューから、認識実行を選ぶ
 ・認識結果窓が開き、OCR変換の結果が表示される
 ・あとは、Wordなり、一太郎なりのアイコンを押せば、それぞれのソフトに変換された結果が転送される

<新聞記事OCRの例>
(元画像) (自動領域抽出後) (認識結果)


<おわりに>
 デジタルカメラの活きた使い方の一例として、日本語OCRに挑戦したが、OCRといえばイメージスキャナーという概念を根底から覆す結果となったことはいうまでもない。
 それだけ、OCRソフトが進化した証であり、デジタルカメラがイメージスキャナーに取って代わるレベルにあることの裏返しである。
 特に新聞からのOCRでは、イメージスキャナーを使用したとしても(紙面が白色でなく裏写りするなど)かなり過酷な条件にもかかわらずに・・・である。
 今回の結果を、どのように評価されるかは、諸兄に委ねることとするが、筆者自身このOCRソフトは、なくてはならない必須のアイテムとなってしまったことを付記しておきたい。

 「デジカメdeOCR!」
 やみつきになりそうである。