【PythonでCIVID-19分析】日本版(1) Part11: データの視覚化・分析 1-1

投稿者: | 2020年6月5日

今回からデータの視覚化を行い、それを分析してみようと思います。

Pythonの視覚化の定番はmatplotlib。

matplotlibを使って視覚化を行ってみます。

まずは2020/01/16から2020/05/24までの、日本全国の日付毎の累計感染者数を棒グラフで表示してみます。

from matplotlib import pyplot as plt 
%matplotlib inline

x = c19j1_df["Date"]
y = c19j1_df["Confirmed"]

plt.figure(figsize=(40 ,15), dpi=50)
plt.bar(x,y)
plt.tick_params(labelsize=30)
plt.tight_layout()
plt.show()

上記コードを入力して表示したグラフが以下となります。

X軸の日付がうまく表示できませんでした。

2020/01/16から2020/05/24までが表示されているのですが、重なってしまっていて判別できません。

調整を試みましたが、結局のところ今の私ではこれが限界でした。

次に都道府県別の累計感染者数をグラフで表示してみます。

x = c19j1_df["Location"]
y = c19j1_df["Confirmed"]

plt.figure(figsize=(40 ,15), dpi=50)
plt.bar(x,y)
plt.tick_params(labelsize=30)
plt.tight_layout()
plt.show()

上記コードを入力して表示したグラフが以下となります。

こちらも先と同じくX軸の都道府県が重なってしまい判別できません。

元データと比べると何となくどの棒が何を示すのかは分かりますが、それではそもそもグラフを描く意味がありません。

残念ながら、これが今の私の限界のようです。

しかし、視覚化に関してはBIソフトを先に使ってその便利さを痛感しており、matplotlibを使ったそれは事実上棚上げになっていました。

この結果は当然の事だと思います。

これを機に学習を深めるべきですが、matplotlibの勉強は今後の課題として、ここはCIVID-19の分析を優先し前に進むことにしようと思います。

よっと今後の視覚化はBIソフトを使って行おうと思います。

BIソフトに関しては以前、Microsoft POWER BIを使ったことがあります。

しかし、今回は新しい勉強を兼ねてGoogle データポータルで視覚に挑戦してみようと思います。

Microsoft POWER BIとの違いを含めて、楽しんでGoogle データポータルを学びたいと思います。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です