【PythonによるWebスクレイピング入門】vol.01:ログインなどのブラウザ操作を自動化しよう(Selenium)

オススメ

みなさんお待ちかねのPythonによるWebスクレイピング入門第一弾です!
Pythonを学び始めた方の多くが、今回お伝えする「Webスクレイピング」に興味を持っているのではないでしょうか?

今回お伝えするSeleniumを用いることで、習得コストを抑え、業務自動化を簡単に実現することができます。本動画では、ログインを中心としたブラウザ操作の自動化についてお伝えします!

◎ChromeDriver – WebDriver for Chrome
https://chromedriver.chromium.org/

◎講義で使用するページ
https://scraping-for-beginner.herokuapp.com/login_page

■ 本講座のベースになっているUdemy講座
PythonによるWebスクレイピング〜入門編〜
https://www.udemy.com/course/python-scraping-beginner/?referralCode=80FF17EE8C49654A816E

■ PythonによるWebスクレイピング入門
Pythonを用いた業務効率化、自動化の中でも代表的なWebスクレイピングについてお伝えしていきます。ブラウザ操作の自動化からテキストや画像データの自動抽出等を行う方法についてわかりやすくお伝えします。

■ 他シリーズ人気動画
習得したい言語第1位!!Pythonとは? | 中学生でもわかるPython入門シリーズ

01. 習得したい言語第1位!!Pythonとは? | 中学生でもわかるPython入門シリーズ

クラス | 中学生でもわかるPython入門シリーズ

15. クラス | 中学生でもわかるPython入門シリーズ

PythonでぐるなびAPIを扱おう | Python活用シリーズ

PythonでぐるなびAPIを扱おう | Python活用シリーズ

■ Twitter

■ Udemy
https://www.udemy.com/user/jin-xi-hang-ping-2/

#Webスクレイピング #Python #Selenium

コメント

  1. サラリーマン 優次郎 より:

    早速、私が頻繁にログインしているサイトで、試してみたのですが、、ID, パスワードの入力は、すんなりできたのですが、ログインボタンのクリックが、出来ずに、暫く悩むこととなりました。。
    と言うのも、、そのサイトのログインボタンを、検証してみたところ、IDが無く、以下のようなコードだったのです。。

    input type=”image” src=”/img/login/login_button.png” alt=”ログイン”

    そこで、find_element_by_src=’image’、や、find_element_by_alt=‘ログイン’ 等々で、試しましたが、全くダメで、諦めかけていたやさきに、ふと閃いたのですが、普段、パスワード入力後に、ENTERキーを押せば、ログインできることを思い出し、
    パスワード入力時に、PASSWORDのみを入れるのでなく、、PASSWORD+バックスラッシュnを、入力するようにしたら、ログインボタンのクリック無しで、、ログインできました❤
    先生、、一つ、発見しちゃいました❤
    とは言え、、こんなのは、先生からすれば、、発見でも何でもなく、、大したことではありませんよね。。(笑)

    しかし、先生の動画を見て、その通りのことをやってみるだけでなく、色々と自分なりにアレンジしてやってみる、、ということも、非常に大事なことだということが、今回のことで、良く分かりました❤

  2. nrnnkcj より:

    はじめて見させていただいてます。 macで「!brew install chromedriver」を長時間待ってインストールした結果、
    以下のようなエラー?が出たのですが、これは正常にインストールできてないということでしょうか?
    => Tapping homebrew/cask
    git clone https://github.com/Homebrew/homebrew-cask /usr/local/Homebrew/Library/Taps/homebrew/homebrew-cask –origin=origin
    Cloning into ‘/usr/local/Homebrew/Library/Taps/homebrew/homebrew-cask’…
    remote: Enumerating objects: 549659, done.
    error: 3609 bytes of body are still expected10 MiB | 44.00 KiB/s
    fetch-pack: unexpected disconnect while reading sideband packet
    fatal: early EOF
    fatal: index-pack failed
    Error: Failure while executing; `git clone https://github.com/Homebrew/homebrew-cask /usr/local/Homebrew/Library/Taps/homebrew/homebrew-cask –origin=origin` exited with 128.

    何が原因かまた悩みます;

  3. keita nakatuka より:

    windowsでheadlessモードで使用したい場合はwebdriver.Chrme()の記載はどうすればよいのでしょうか?

タイトルとURLをコピーしました