内容説明
「プログラミングは難しそう」「仕事が忙しくて勉強時間があまりない」本書では実践的なサンプルで最小限のコツを押さえられます!プログラミングは難しいものではありません。あらかじめ用意されたプログラムの部品を活用して、少ないコードでたくさんの自動化を実現できます!
目次
第1章 データ収集をハックする(プログラムを使って自動でデータを集める;自動で集められるデータとは ほか)
第2章 Webからデータを集める準備(データ収集に役立つPython;Pythonが使える環境を準備する ほか)
第3章 データ自動収集のしくみを押さえる(Webページ・Web APIのしくみを理解する;データのフォーマットや種類を理解する ほか)
第4章 Pythonでデータを自動で集める(売れ筋ランキング情報を収集しよう;人気商品の画像情報を集めよう ほか)
第5章 集めたデータを活用しやすい形にする(データ活用までに必要な準備;保存したデータを取り出す ほか)
著者等紹介
清水義孝[シミズヨシタカ]
大手製造業でデータサイエンティストとして、ビックデータの分析に携わっている。その経験を活かして、データ収集・分析、BIツールに関する社内講座を担当。オンライン動画講座サイト「Udemy」で動画講座「Pythonによるビジネスに役立つWebスクレイピング」などを制作・販売中。4000名以上の受講生を持つ(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
朝ですよね
3
スクレイピング以前の、Python言語やHTMLタグ自体の初心者向け解説が多めに載っている。2024/09/24
まつ
1
スクレイピング収集結果の操作が整理できた。 ・データ抽出方法は3つある -要素指定(find,find_all) -階層移動による要素指定 -CSSセレクタ指定(select) ・階層移動で2番目以降の要素に行く場合は.next_sibling。HTMLは要素間は空行のため連続2回使う必要あり ・selectでのcss要素の指定方法。 class指定:先頭にドットをつける。 id指定:先頭にシャープをつける。 上記以外(hrefなど):soup.select(要素[href="〇〇"]の形式。2023/02/11
gnu
0
初心者向け2025/05/28