内容説明
インターネットにたくさんあるデータ。利用したいと思ってみても、いちいち手でコピペしてたのでは効率的ではありません。そこで使われるのがクローリングという自動巡回と、スクレイピングというデータ抜き出しの手法です。本書は、ExcelとVBAを駆使し、簡単かつ実用的にデータ収集を行う方法を解説していきます。
目次
第1章 クローリングとスクレイピングに必要な基礎知識
第2章 Excel VBAでInternet Explorerを制御する
第3章 Excel VBAでHTMLタグを制御する
第4章 さまざまなファイルを解析する
第5章 クローリング/スクレイピングの運用について
6章 プログラムが文章を理解するために
7章 robots.txtを考慮したクローリングサンプル
Appendix
著者等紹介
五十嵐貴之[イカラシタカユキ]
1975年2月生まれ。新潟県長岡市(旧越路町)出身。東京情報大学経営情報学部情報学科卒業。Vectorから20万回以上ダウンロードされている「かんたん画像サイズ変更」などのフリーソフトの開発者。2019年5月より、東京情報大学校友会信越ブロック支部長に就任予定(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
月雪 花那
2
参考になりました。2019/10/25
松井淳史
0
スクレイピング 図書館_依頼2020/02/02
まぶたのあるいきもの
0
類書の『Excel VBAでIEを思いのままに操作できるプログラミング術』と比較したら、『思いのまま』の方が古いとは言えより実践的だと思う。こちらはどちらかと言えば網羅的だけど、実際に使おうしたら、やはり色々と調べることになる。極めようという風に謳っている割にはかゆいところに手が届かないのではないでしょうか?HTTPリクエストなども載ってないですしね。2019/02/17