読者です 読者をやめる 読者になる 読者になる

新知見あうとぷっと

IT企業に勤めるへなちょこ30代会社員。仕事をいい感じにするため、勉強のため、ちょっといいな・役立つなと思った情報をまとめるブログ。

画像ファイルやPDF内の文字をテキストに変換するOCRソリューション

画像ファイル、またはPDF内にある文字を認識して、WordやExcelに変換できるOCRソリューションを探していたところ、いくつか見つけたのでメモ。

 

1、Google Drive

GoogleDrive上にアップしたファイルを選択し、「アプリで開く」→「Google Document」とすると、画像がテキストとなって表示される。

 

2、OCROnline

Free Online OCR - convert scanned PDF and images to Word, JPEG to Word

ファイル選択→言語選択→OutPut形式(Word、Excel、txt)と行うと、画像内の文字がテキスト化されて指定した形式で出力できる。

 

3、Renee PDF Aide

フリーソフトで、下記のURLからDLする必要がある。

変換元はPDFに限定されるが、変換先は非常に多岐にわたる(Word、ExcelPowerPoint、txt、イメージファイルなど)

例えば申込書などのPDFをExcel形式にて変換すると、罫線こそ引いてくれないものの、元の帳票レイアウトに近い形でテキストを配置してくれるので、非常に便利。

www.reneelab.jp