目次
開発環境の準備(Anaconda編)
開発環境の準備(Visual Studio Code編)
OCR環境の構築
PDFを画像へ変換
画像をPDFへ変換
PDFの文字認識
PDFの保護解除
透かし
PDFのサイズ変更
画像の部分文字認識
透視投影
画像加工と文字認識
画像のつなぎ合わせとPDF化
文字列の検索(grep)
PyMuPDFの利用
PyPDF2の利用
著者等紹介
北山洋幸[キタヤマヒロユキ]
鹿児島県南九州市知覧町出身、富士通株式会社、日本ヒューレット・パッカード株式会社(旧横河ヒューレット・パッカード株式会社)、米国Hewlett‐Packard社(Santa Clara,CA USAなど)、株式会社YHPシステム技術研究所を経て有限会社スペースソフトを設立、現在は変業を減らし、ゆっくり開発や執筆活動中。書籍、月刊誌、辞典、コラム・連載など執筆多数(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
yajimayajiuma
6
4章のサンプルプログラムに「020…」と名付けられている等、章とpyファイル名が一致していないのがやや不親切。同じ章内だと似たファイル名が多いので結構分かりにくい。あと、入力値が全てコマンドライン引数なのも面倒で、特にVSCodeはAnaconda程説明されていないので、慣れるまで本筋と違う箇所で時間がかかった。 しかし、ピンポイントな題材を扱っているため内容は面白い。透視投影や範囲選択、二値化等を行ってのOCR、複数PDFでのgrep、複数画像の結合とPDF化等、興味深いサンプルが多かった。2024/10/24