みなさんお待ちかねのPythonによるWebスクレイピング入門第一弾です!
Pythonを学び始めた方の多くが、今回お伝えする「Webスクレイピング」に興味を持っているのではないでしょうか?
今回お伝えするSeleniumを用いることで、習得コストを抑え、業務自動化を簡単に実現することができます。本動画では、ログインを中心としたブラウザ操作の自動化についてお伝えします!
◎ChromeDriver – WebDriver for Chrome
https://chromedriver.chromium.org/
◎講義で使用するページ
https://scraping-for-beginner.herokuapp.com/login_page
■ 本講座のベースになっているUdemy講座
PythonによるWebスクレイピング〜入門編〜
https://www.udemy.com/course/python-scraping-beginner/?referralCode=80FF17EE8C49654A816E
■ PythonによるWebスクレイピング入門
Pythonを用いた業務効率化、自動化の中でも代表的なWebスクレイピングについてお伝えしていきます。ブラウザ操作の自動化からテキストや画像データの自動抽出等を行う方法についてわかりやすくお伝えします。
■ 他シリーズ人気動画
習得したい言語第1位!!Pythonとは? | 中学生でもわかるPython入門シリーズ
クラス | 中学生でもわかるPython入門シリーズ
PythonでぐるなびAPIを扱おう | Python活用シリーズ
■ Twitter
Tweets by 03Imanyu
■ Udemy
https://www.udemy.com/user/jin-xi-hang-ping-2/
#Webスクレイピング #Python #Selenium
コメント
早速、私が頻繁にログインしているサイトで、試してみたのですが、、ID, パスワードの入力は、すんなりできたのですが、ログインボタンのクリックが、出来ずに、暫く悩むこととなりました。。
と言うのも、、そのサイトのログインボタンを、検証してみたところ、IDが無く、以下のようなコードだったのです。。
input type=”image” src=”/img/login/login_button.png” alt=”ログイン”
そこで、find_element_by_src=’image’、や、find_element_by_alt=‘ログイン’ 等々で、試しましたが、全くダメで、諦めかけていたやさきに、ふと閃いたのですが、普段、パスワード入力後に、ENTERキーを押せば、ログインできることを思い出し、
パスワード入力時に、PASSWORDのみを入れるのでなく、、PASSWORD+バックスラッシュnを、入力するようにしたら、ログインボタンのクリック無しで、、ログインできました❤
先生、、一つ、発見しちゃいました❤
とは言え、、こんなのは、先生からすれば、、発見でも何でもなく、、大したことではありませんよね。。(笑)
しかし、先生の動画を見て、その通りのことをやってみるだけでなく、色々と自分なりにアレンジしてやってみる、、ということも、非常に大事なことだということが、今回のことで、良く分かりました❤
はじめて見させていただいてます。 macで「!brew install chromedriver」を長時間待ってインストールした結果、
以下のようなエラー?が出たのですが、これは正常にインストールできてないということでしょうか?
=> Tapping homebrew/cask
git clone https://github.com/Homebrew/homebrew-cask /usr/local/Homebrew/Library/Taps/homebrew/homebrew-cask –origin=origin
Cloning into ‘/usr/local/Homebrew/Library/Taps/homebrew/homebrew-cask’…
remote: Enumerating objects: 549659, done.
error: 3609 bytes of body are still expected10 MiB | 44.00 KiB/s
fetch-pack: unexpected disconnect while reading sideband packet
fatal: early EOF
fatal: index-pack failed
Error: Failure while executing; `git clone https://github.com/Homebrew/homebrew-cask /usr/local/Homebrew/Library/Taps/homebrew/homebrew-cask –origin=origin` exited with 128.
何が原因かまた悩みます;
windowsでheadlessモードで使用したい場合はwebdriver.Chrme()の記載はどうすればよいのでしょうか?