内容説明
さらなる自動化、並列クローリング、Python 3.x全面対応、Scrapy 1.6対応etc.本当に欲しい情報を効率的に手に入れる。改訂!第2版。
目次
第1部 スクレイパーを作る(最初のWebスクレイパー;高度なHTMLパース;Webクローラを書く;Webクローリングのモデル ほか)
第2部 高度なスクレイピング(文書を読む;汚れたデータをクリーニング;自然言語の読み書き;フォームとログインでクローリング ほか)
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
ぶう
13
オライリーのスクレイピング本。日本で出版されているスクレイピング本では一番上級者向けだろう。実際にスクレイピングをしていると、アクセスをブロックされる事がよくある。本書にはそれらの対処法など、他書にはあまり書かれていない実践的な内容まで載っている。一通りPythonでのスクレイピングを覚え、更に詳しいところを学習したい場合などに本書が最適であろう。ただ一点残念なのが翻訳があまりよくないところ。読んでいて所々「?」になる箇所がいくつかある。まぁ翻訳本にはよくあることなので、そこまで気にするほどではないが…2022/12/26
ゆきのしん
1
スクレイピングの手法をざっと勉強できる。ただ、すでに公式で非推奨になっているライブラリなどを使用している部分があり、結局実装する部分はググって解決した。概要を理解するのに使うのが良いと思う。2020/11/12
DM
1
主にお試し用のサイトやWikipediaを使ってスクレイピングに関する一通りのことを学べる。 所々訳が意味不明だったりするが、気にならない程度。2019/09/02
-
- 和書
- 探偵倶楽部 角川文庫