実践的なデータを使って円グラフを作る方法について説明をしました。ビジネスでの活用シーンをイメージしながらレッスンを聞いていただければと思います。もしわからない点などありましたら、前回のレッスン( https://youtu.be/10kD86Cq_yE )に戻って解説を聞いていただければよいと思います。
▼目次
00:00 ハイライト
00:21 はじめに
01:18 ライブラリのインポート
01:51 データの読み込み
02:28 データの整形
03:51 円グラフの作成
04:35 グラフの凡例
06:16 グラフに割合(%)を表示
06:40 グラフのスタート位置と時計回りの設定
07:16 グラフタイトルの表示
07:31 グラフの色の指定方法
08:26 円グラフの一部の要素の切り出し
08:58 グラフに影を追加
09:10 グラフの保存
09:29 ドーナツ型円グラフの作成
10:34 二重ドーナツ型円グラフの作成
12:43 おわりに
▼おすすめ動画
Matplotlib & Seaborn 入門講座
Python超入門コース
Pandas入門コース
仕事の自動化の再生リスト
プログラミング初心者がPythonを完全無料で学習する方法
株のデータ分析
たった1分でPythonのプログラミングを始める|GoogleColaboratoryの使い方
▼文字書き起こし
こんにちは。キノコードです。
Matplotlib & Seaborn入門講座の7回目です。
前回のレッスンでは、円グラフの作成方法について解説しました。
この動画では、前回の動画で説明した内容をもとに、実践的なデータを使って円グラフを作成、また前回のレッスンでは説明しなかった二重ドーナツの作成方法などをしていきたいと思います。
実践的なデータを通して仕事などへのイメージを沸かしていただければと思います。
なお、キノコードでは、YouTubeのメンバーシップを募集しています。
キノコードを応援してくださる方は、メンバーになるをクリックをお願いします。
メンバーシップをはじめた理由などの動画もありますので、そちらもご視聴ください。
概要欄にURLを貼っておきます。
それではレッスンスタートです。
“`python
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
“`
それでは、ライブラリをインポートする記述をします。
pandasをpdという名前でインポートします。
pandasを使うことで、csvやExcelファイルなどのデータを簡単に読み込み、効率的にデータ加工をすることができます。
さらに、matplotlibの中のpyplotをpltという名前でインポートします。
最後のこの記述は、notebook内にグラフを表示させるための記述です。
実行します。
インポートが完了しました。
“`python
df = pd.read_csv(‘/content/drive/MyDrive/08_ partner/05_原稿/ayaさん/01.Matplotlib & Seaborn入門コース/matplotlib#07(Pie実践)/data.csv’)
“`
続いて、pandasのread_csvメソッドを使ってcsvファイルを読み込む記述をします。
こちらのcsvファイルは、キノコードのwebサイトからダウンロードできます。
丸括弧の中に読み込むファイル名を記述し、実行します。
read_csvメソッドの詳しい使い方については、pandas入門講座で説明をしています。
詳しく知りたい方は、そちらもご覧ください。
“`python
df.head()
“`
それでは、dfの中身を確認してみましょう。
headメソッドで上位5件を表示させてみます。
実行します。
データが格納されているようです。
“`python
df_sum = df[[‘商品分類’,’売上金額’]].groupby(‘商品分類’).sum()
df_sum
“`
続いて、グラフを作成しやすいように、データを加工しましょう。
pandasのgroupbyメソッドを使って、商品分類ごとの売上金額の合計を算出します。
groupbyの詳しい使い方については、pandas入門講座でも解説をしています。
そちらもご覧ください。
dfアンダースコアsumという変数に、商品分類ごとの売上金額の合計を格納します。
二重括弧の中に、商品分類と売上金額、groupbyの丸括弧の中には商品分類と記述します。
最後に、合計を意味するsumを書いて丸括弧です。
実行します。
支店ごとのデータフレームを作成できました。
“`python
df_sum = df_sum.sort_values(by=’売上金額’, ascending=False)
df_sum
“`
作成したデータフレームを、降順に並べ替えてみましょう。
大きいものから小さいものへの並び替えを降順と言います。
pandasの、sort_valuesメソッドを使って並び替えていきます。
sort_valuesについてもpandas入門講座で詳しく解説をしています。
是非そちらもご覧ください。
byという引数に、並び替えをする売上金額の列を渡します。
ascendingイコールFalseとすることで降順になります。
Trueにすると昇順です。
実行します。
並べ替えができているようです。
▼書き起こしブログ
準備中
▼自己紹介
現在:データ分析やDX推進を支援する会社の社長
前職:リクルート
▼SNS
Twitter : https://twitter.com/kino_code/likes
Facebook : https://www.facebook.com/%E3%82%AD%E3%83%8E%E3%82%B3%E3%83%BC%E3%83%89-105693727500005/
Website : https://kino-code.com/
#Python #グラフ #Python可視化 #Matplotlib #Seaborn
コメント
応用の動画も見たいです
ボトムスのところにシャツなどが書かれており、2重ドーナツの内側と外側が連動していない気がします。トップスやボトムスの降順設定を解除したら上手くいきました。