Pythonで文書処理―資料のPDF化、文字認識、検索、その他さまざまな作業をプログラミングで解決

個数:

Pythonで文書処理―資料のPDF化、文字認識、検索、その他さまざまな作業をプログラミングで解決

  • ウェブストアに1冊在庫がございます。(2025年06月16日 14時33分現在)
    通常、ご注文翌日~2日後に出荷されます。
  • 出荷予定日とご注意事項
    ※上記を必ずご確認ください

    【ご注意事項】 ※必ずお読みください
    ◆在庫数は刻々と変動しており、ご注文手続き中に減ることもございます。
    ◆在庫数以上の数量をご注文の場合には、超過した分はお取り寄せとなり日数がかかります。入手できないこともございます。
    ◆事情により出荷が遅れる場合がございます。
    ◆お届け日のご指定は承っておりません。
    ◆「帯」はお付けできない場合がございます。
    ◆画像の表紙や帯等は実物とは異なる場合があります。
    ◆特に表記のない限り特典はありません。
    ◆別冊解答などの付属品はお付けできない場合がございます。
  • ●3Dセキュア導入とクレジットカードによるお支払いについて
    ●店舗受取サービス(送料無料)もご利用いただけます。
    ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら
  • サイズ B5変判/ページ数 301p/高さ 24cm
  • 商品コード 9784877834975
  • NDC分類 007.64
  • Cコード C3004

目次

開発環境の準備(Anaconda編)
開発環境の準備(Visual Studio Code編)
OCR環境の構築
PDFを画像へ変換
画像をPDFへ変換
PDFの文字認識
PDFの保護解除
透かし
PDFのサイズ変更
画像の部分文字認識
透視投影
画像加工と文字認識
画像のつなぎ合わせとPDF化
文字列の検索(grep)
PyMuPDFの利用
PyPDF2の利用

著者等紹介

北山洋幸[キタヤマヒロユキ]
鹿児島県南九州市知覧町出身、富士通株式会社、日本ヒューレット・パッカード株式会社(旧横河ヒューレット・パッカード株式会社)、米国Hewlett‐Packard社(Santa Clara,CA USAなど)、株式会社YHPシステム技術研究所を経て有限会社スペースソフトを設立、現在は変業を減らし、ゆっくり開発や執筆活動中。書籍、月刊誌、辞典、コラム・連載など執筆多数(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

yajimayajiuma

6
4章のサンプルプログラムに「020…」と名付けられている等、章とpyファイル名が一致していないのがやや不親切。同じ章内だと似たファイル名が多いので結構分かりにくい。あと、入力値が全てコマンドライン引数なのも面倒で、特にVSCodeはAnaconda程説明されていないので、慣れるまで本筋と違う箇所で時間がかかった。 しかし、ピンポイントな題材を扱っているため内容は面白い。透視投影や範囲選択、二値化等を行ってのOCR、複数PDFでのgrep、複数画像の結合とPDF化等、興味深いサンプルが多かった。2024/10/24

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/18763312
  • ご注意事項

    ご注意
    リンク先のウェブサイトは、株式会社ブックウォーカーの提供する「読書メーター」のページで、紀伊國屋書店のウェブサイトではなく、紀伊國屋書店の管理下にはないものです。
    この告知で掲載しているウェブサイトのアドレスについては、当ページ作成時点のものです。ウェブサイトのアドレスについては廃止や変更されることがあります。
    最新のアドレスについては、お客様ご自身でご確認ください。
    リンク先のウェブサイトについては、「株式会社ブックウォーカー」にご確認ください。

最近チェックした商品