今回からデータの視覚化を行い、それを分析してみようと思います。
Pythonの視覚化の定番はmatplotlib。
matplotlibを使って視覚化を行ってみます。
まずは2020/01/16から2020/05/24までの、日本全国の日付毎の累計感染者数を棒グラフで表示してみます。
from matplotlib import pyplot as plt
%matplotlib inline
x = c19j1_df["Date"]
y = c19j1_df["Confirmed"]
plt.figure(figsize=(40 ,15), dpi=50)
plt.bar(x,y)
plt.tick_params(labelsize=30)
plt.tight_layout()
plt.show()
上記コードを入力して表示したグラフが以下となります。
X軸の日付がうまく表示できませんでした。
2020/01/16から2020/05/24までが表示されているのですが、重なってしまっていて判別できません。
調整を試みましたが、結局のところ今の私ではこれが限界でした。
次に都道府県別の累計感染者数をグラフで表示してみます。
x = c19j1_df["Location"]
y = c19j1_df["Confirmed"]
plt.figure(figsize=(40 ,15), dpi=50)
plt.bar(x,y)
plt.tick_params(labelsize=30)
plt.tight_layout()
plt.show()
上記コードを入力して表示したグラフが以下となります。
こちらも先と同じくX軸の都道府県が重なってしまい判別できません。
元データと比べると何となくどの棒が何を示すのかは分かりますが、それではそもそもグラフを描く意味がありません。
残念ながら、これが今の私の限界のようです。
しかし、視覚化に関してはBIソフトを先に使ってその便利さを痛感しており、matplotlibを使ったそれは事実上棚上げになっていました。
この結果は当然の事だと思います。
これを機に学習を深めるべきですが、matplotlibの勉強は今後の課題として、ここはCIVID-19の分析を優先し前に進むことにしようと思います。
よっと今後の視覚化はBIソフトを使って行おうと思います。
BIソフトに関しては以前、Microsoft POWER BIを使ったことがあります。
しかし、今回は新しい勉強を兼ねてGoogle データポータルで視覚に挑戦してみようと思います。
Microsoft POWER BIとの違いを含めて、楽しんでGoogle データポータルを学びたいと思います。