20年前のOCRソフトでひどい目にあったので避けていたかもしれない。
ところが、現在はすごくよくなっている。
スキャンした40ページの書類を WORD データにする作業をすることになった。
他の仕事もしながらだけど、3日間でデータにできたよ。
1)原稿
・事務用のコピー機で一括でスキャンして、PDFとして取り出した原稿。
・ページごとで、傾いていたり、ひしゃげて(シアー)いる。
2)今まで
・PDFを Photoshop で画像にして、傾きなどを補正
・イラストレータに配置して、なぞるようにテキストを打ち込む
3)簡単な方法があった
OCR
https://www.adobe.com/jp/acrobat/how-to/ocr-software-convert-pdf-to-text.html
PDF → WORD
https://www.adobe.com/jp/acrobat/how-to/pdf-to-word-doc-converter.html
スキャンしたデータから編集操作でテキスト化したPDFから Word にすると、見た目はそれなりでも、かなり複雑で編集しにくい Word データに仕上がってしまう。
テキストをコピペして、イラストレーターで成形して、PDF保存。
このPDFを Acrobat で開いて、 Word に変換。
4)チェック
OCRについては、40ページ中、2,3個の誤字
論旨(×) 諭旨(〇) など
簡単に、早くできて助かった。