【Python×データサイエンス入門⑦】機械学習の必修科目!学習データとテストデータに分割しよう!
※現在、質問・相談コメントの返信は対応しておりません。ご承知おきくださいませ🙇🏻♂️
データサイエンス入門の第7回目になります!
バブル期の熱は冷めましたが、今でもデータサイエンティストを欲しがっている企業はたくさんあります。
DX時代に備えて、今からデータサイエンスを勉強しておきましょう!
≪この動画で学べる内容≫
①学習データとテストデータの分割方法が分かる
②特徴量と正解の分割方法が分かる
③isnull()を活用したデータフレームの絞り込みが分かる
▼この動画シリーズで使っているコード・データ
▽ソースコードのダウンロード(Github)
https://github.com/hayatasuuu/DataScienceBeginner
▽データのダウンロード(Kaggle)
https://www.kaggle.com/
■□■□■□■□■□■□■□■□■□■□
▼Pythonの学習が済んでいない方はこちら!
▼スクレイピングを学んでみるならこちら!
▼Anacondaのインストール方法(Windows)
テキスト:https://tech-diary.net/anaconda-install-windows/
■□■□■□■□■□■□■□■□■□■□
▽Twitter
Tweets by hayatasuuu
▽Blog
https://tech-diary.net/
▽stand.fm(ラジオ)
https://stand.fm/channels/5f812ac1f04555115d597948
▼経歴
現在:フリーランスエンジニア(Python, GCP)
過去:大手SIerで機械学習系エンジニア&プログラミングスクール講師→大手金融機関(連結3万人以上)でデータサイエンティスト(Python, AWS)→スタートアップでWebエンジニア(Golang, ReactJS)→現在に至る
コメント
X が大文字の理由は、y のベクトルに対して、行列っていう意味なんですね。
ずっとなんで大文字なんだろうかと思っていたのでスッキリしました。
いつも分かりやすい動画ありがとうございます。