PythonによるWebスクレイピング入門第三弾です!
今回の内容は前回の動画に似ていますが、扱うライブラリが異なります!
今回はWebページ内のテキストデータをBeautiful Soupで抽出する方法についてお伝えします!今回も簡単な内容であり、みなさんの業務を効率化するためのヒントが散りばめられています!是非お楽しみください!
◎講義で使用するページ
https://scraping-for-beginner.herokuapp.com/udemy
■ 本講座のベースになっているUdemy講座
PythonによるWebスクレイピング〜入門編〜
https://www.udemy.com/course/python-scraping-beginner/?referralCode=80FF17EE8C49654A816E
■ PythonによるWebスクレイピング入門
Pythonを用いた業務効率化、自動化の中でも代表的なWebスクレイピングについてお伝えしていきます。ブラウザ操作の自動化からテキストや画像データの自動抽出等を行う方法についてわかりやすくお伝えします。
【PythonによるWebスクレイピング入門】vol.01:ログインなどのブラウザ操作を自動化しよう(Selenium)
【PythonによるWebスクレイピング入門】vol.02:Webページ内のテキストデータを自動で抽出(Selenium)
■ 他シリーズ人気動画
習得したい言語第1位!!Pythonとは? | 中学生でもわかるPython入門シリーズ
クラス | 中学生でもわかるPython入門シリーズ
PythonでぐるなびAPIを扱おう | Python活用シリーズ
■ Twitter
Tweets by 03Imanyu
■ Udemy
https://www.udemy.com/user/jin-xi-hang-ping-2/
#Webスクレイピング #Python #BeautifulSoup
コメント
分かり易い説明ありがとうございます。Windows10の環境で以下のエラーメッセージが出ました。
subscribers = soup.find_all(‘p’.attrs == {‘class’:’subscribers’})[0]
AttributeError: ‘str’ object has no attribute ‘attrs’
@実行時に文字化けした人
res.text→res.context でうまくいきました!
prettify関数って変数名がsoupの時以外は使えないのでしょうか?
soup.prettifyはうまくいったのですが、その次以降に出てくるスクリプトが読みづらいです…
soup.fina_allとかを変数で置いて.prettifyとやっても、
AttributeError: ResultSet object has no attribute ‘prettify’. You’re probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()?
としか出ません…