【Python × スクレイピング入門⑬】自動で画像保存の準備!画像URLを取得しよう!
※現在、質問・相談コメントの返信は対応しておりません。ご承知おきくださいませ🙇🏻♂️
▼ソースコード
https://github.com/hayatasuuu/ScrapingBeginner
スクレイピング講座の第13回目になります!
Pythonは、基本的に副業で稼ぐには不向きです。
でもスクレイピングは唯一、副業で稼ぐことが可能なスキルなので、一緒に頑張っていきましょう(`・ω・´)!
≪この動画で学べる内容≫
①SeleniumでHTMLタグを指定する方法が分かる
②Seleniumを使ってブ必要な情報を取得する方法が分かる
③必要な要素を取得してCSVに保存するまでの流れが分かる
▼スクレイピング入門〜再生リスト〜
■□■□■□■□■□■□■□■□■□■□
▼Pythonの学習が済んでいない方はこちら!
Python入門【2020年版】:https://www.youtube.com/playlist?list=PL4Y-mUWLK2t2rISQza73yNiz6_8HTaQiY
▼Anacondaのインストール方法(Windows)
テキスト:https://tech-diary.net/anaconda-install-windows/
■□■□■□■□■□■□■□■□■□■□
▽Twitter
Tweets by hayatasuuu
▽Blog
https://tech-diary.net/
▽stand.fm(ラジオ)
https://stand.fm/channels/5f812ac1f04555115d597948
▼経歴
現在:フリーランスエンジニア(Python, GCP)
過去:大手SIerで機械学習系エンジニア&プログラミングスクール講師→大手金融機関(連結3万人以上)でデータサイエンティスト(Python, AWS)→スタートアップでWebエンジニア(Golang, ReactJS)→現在に至る
コメント
いつもお世話になっております。
スクレイピング入門2周目を見ております。
一度目よりもさらに理解が進み、そうだったのかとつながる部分が増えたように思います。
1つ質問がございます。
seleniumやBeautifulSoupで特定の要素を取得する際のclass等の指定の仕方についてです。
今回のようにタグの親子要素が何階層にもなっている場合は、どの階層から指定していくなどの決まりはあるのでしょうか?
例えば今回であれば、
elements=driver.find_elements_by_class_name(“sw-Thumbnail”)
と書いているいる部分を
その下の階層に含まれるFigureタグのクラス名を使って
elements=driver.find_elements_by_class_name(“sw-Thumbnail__image”)
と書いてはダメでしょうか?
タグやクラスの指定の仕方にまだ慣れておらず、HTMLの知識も乏しいため苦戦中です。
アドバイスいただければ幸いです。
よろしくお願いいたします。
素晴らしい動画でめちゃくちゃ参考にさせて頂いています!
質問なのですが、画像URLではなく画像自体をcsvに表示させることは可能なのでしょうか?
今回の動画も最高でした。web上のものがlocal上の表にまとまる瞬間は、美しさすら感じますね。
【質問です】環境構築がうまくいかない際は、anacondaでやっているので問題はないのですが。。。
pandasやmatplotlibのインストールができません。ちなみに、M1MacBookでPython3.9.1です。
いろいろ調べてみるとPython3.8にダウングレードするとうまくいくそうなのですが、すべてをVSCodeでする必要はあるのでしょうか?私は今のところ、必要に応じてanacondaを使っており、Python3.9に対応するのを待つ(上記の理由が正しいのであれば)つもりなのですが、今後それによる問題はありますでしょうか?