本記事では、Pythonのスクレイピングについて学べるおすすめの参考書を紹介しています。
気になった参考書があれば、購入する前にAmazonの無料試し読みで内容を確認することをおすすめします。
表紙がイラストをたくさん使っているから、内容も初心者向けだろうと思い購入してみたら、図解での説明が少なく文字で埋め尽くされている参考書だった。。なんてこともありますので。
Amazon Kindle Unlimited
Amazon Kindle Unlimitedに登録すると、月額980円で読み放題だからオススメだよ!
初回30日間は無料だから、まだ登録したことのない人はぜひ試してみてね!
変数名/関数名にもう悩まない!
- 美しいコードが書けるが自然と書けるようになる
- 他の開発者が理解しやすいコードになる
Python2年生 スクレイピングのしくみ 体験してわかる!会話でまなべる!
出版社 | 翔泳社 |
著者 | 森 巧尚 |
発売日 | 2019/10/4 |
ページ数 | 192ページ |
- Pythonでデータをダウンロード
- HTMLを解析しよう
- 表データを読み書きしよう
- オープンデータを分析してみよう
- Web APIでデータを収集しよう
この本はフルカラーで実際に実用的なデータ収集やデータの読み込み、保存まで小学生でもわかるほど分かりやすく子供向けではなく大人が読んでも楽しく分かりやすく書かれています。この本がKindle Unlimitedで読めたのもありがたかったです。プログラミングの基礎概念を長々説明されるより、とにかく書いてみる、解説も書かれているので消化不良になることもないです。この本で作る楽しみを知ってからステップアップするのが上達の近道だと思います。
引用元:Amazon
逐一行間が補充されている。
beautifulsoupという名前の背景や、findメソッドのアトリビュートでを指定する際、idはそのまま使えるのにclassだけアンダースコアをつけなければいけない理由はなぜかについてなど、初心者が気にかけてしまう些末事についてまで丁寧に言及している。
引用元:Amazon
初心者にとっては最適の書籍ではないかと思う。
スクレイピング・ハッキング・ラボ Pythonで自動化する未来型生活
出版社 | インプレスR&D |
著者 | 齊藤 貴義 |
発売日 | 2020/9/4 |
ページ数 | 415ページ |
- スクレイピングの基礎
- Pythonの導入
- Pythonの環境構築
- Python3の基礎
- Beautiful Soupでスクレイピングする
- スクレイピングのテクニックと考慮すべき点
- PythonからSeleniumでブラウザーを操作する
- Scrapyを使って、はてな匿名ダイアリーをクローリングする
- MeCabとWord2Vecによる自然言語解析
- Pandasによる解析とMatplotlibによる可視化
- スクレイピング結果を自動通知する
- スマートフォンでスクレイピング
- Raspberry Piにポータブル・スクレイピング・ハッキング・ラボを構築する
仕事上、スクレイピングが必要になり入手しました。まず伊沢剛氏の「めんどうな作業が秒速で終わる! Excel×Python自動化の超基本」でエントリー。次にステップアップとして本書を使いました。初心者の小生にとってはとても分かり易かったと思います。
引用元:Amazon
スクレイピングって何?というくらいの初心者でしたが、はてなブックマークの人気エントリの取得や画像をスクレイピングしてダウンロードする方法などがイチから解説されていました。見本のコードが見やすく、手を動かしながら動作確認ができて、Pythonの勉強にもなりました。ブラウザ操作でツイート画面を入力したりと、Pythonの自動化は工夫次第で様々なことができるのだとその一端が示されています。他にはどんなことができるのか夢が広がりました。手軽にスクレイピングの楽しさを体験してみたい人におすすめです。
引用元:Amazon
Pythonクローリング&スクレイピング[増補改訂版]
出版社 | 技術評論社 |
著者 | 加藤 耕太 |
発売日 | 2019/8/10 |
ページ数 | 440ページ |
- クローリング・スクレイピングとは何か
- Pythonではじめるクローリング・スクレイピング
- ライブラリによる高度なクローリング・スクレイピング
- 実用のためのメソッド
- クローリング・スクレイピングの実践とデータの活用
- フレームワーク Scrapy
- クローラーの継続的な運用・管理
- Vagrantによる開発環境の構築
今までググりながら適当にやっていたスクレイピングを体系的に学べてよかった。今後に活きると思う。
引用元:Amazon
難しいというレビューがありますが、確かに説明がシンプル過ぎるところがあるので完全に初心者だと戸惑うかもしれません。(個人的にはググれば何とかなるレベルと思います)
少し前の本ですが、今でもめちゃくちゃいい本です、ガチでスクレーピングしたければすぐにポチるべし。
引用元:Amazon
食べログ、Amazon、Youtube、Yahoo News、Note、ハテナブックマーク、Twitter APIなど実用的な例が紹介されており、かなり役立ちます。
おまけにAWSやVagrantの記述に、データベースの例もあり、広範囲に知識がある人にはかなり有益です。全力で読んで実践することをおすすめします。
ちょっと前のものなので、ホームページの構造も変化して、動かないサンプルも多いですが、自分でChromeの開発者ツールで分析して、コードを修正、動かすことでより、更に実践的なスキルがつきます。
この本をマスターしたら、本に紹介しているライブラリのオリジナルページを参照することで更にハイレベルのスクレーピングができるようになります。例えばScraperなど。
スラスラ読める Pythonふりがなプログラミング スクレイピング入門
出版社 | インプレス |
著者 | リブロワークス |
発売日 | 2021/12/1 |
- スクレイピング最初の一歩
- スクレイピングをやってみよう
- スクレイピングの応用テクニック
- 集めたデータを整理・加工しよう
- Web APIでデータを集めよう
とても見やすいです。
引用元:Amazon
丁寧な解説で初学者に向いてます。
Webにある情報を的確に収集して利用するのに便利だと思います。
ただ、サイト側もロボットによる収集を拒否しているケースもあることから、やり過ぎには注意が必要です。
取りあえずそれらしいデータを集めたい、ようなときに
引用元:Amazon
便利です。
Pythonをそもそもインストールできる環境かどうかというのは
ありますが、どこから集めてきたかでPythonでスクレイピングしました
というとできそうな気配を一応出せます。
増補改訂Pythonによるスクレイピング&機械学習 開発テクニック
出版社 | ソシム |
著者 | クジラ飛行机 |
発売日 | 2018/12/15 |
ページ数 | 430ページ |
- クローリング、スクレイピングそして機械学習
- クローリングとスクレイピング
- 高度なスクレイピング
- データソースと書式・整形
- 機械学習
- 深層学習に挑戦しよう
- テキスト解析とチャットボットの作成
- 深層学習を実践してみよう
Pythonを理解するのにもってこいの一冊である。
ディープラーニングと機械学習が身近に感じられる。
時間があればじっくり取り組んでみたいと思う。
引用元:Amazon