前回、累積累計数字のプログラムc19j2_df_ver1.01を日別の累計数字になるようにプログラムの追加を行いました。
感染者数・死亡者数・回復者数・PCR検査数の各日付別のデータセットが作成されたので、今回は内容の検証を行います。
まずは、プログラムc19j2_df_ver1.01のデータ内容を確認しておきます。
次に、日別に変換したデータをそれぞれ合計して、最新の数字(今回は2020/7/12)と同じかを確認しておきます。
2020/7/12の数字は以下の通りとなります。
Confirmed:21459
Recovered:17887
Deaths:981
PCR_TEST:466738
以下コードで合計を行い、上記と一致していれば問題ないということになります。
print(Confirmed_ed_df.sum())
print(Recovered_ed_df.sum())
print(Deaths_ed_df.sum())
print(PCR_TEST_ed_df.sum())
表示された内容を確認すると、一致することが分かりました。
このデータを結合して日別のデータセットを作成します。
c19j2_day_df3 = pd.concat([c19j2_day_df2, Confirmed_ed_df , Recovered_ed_df , Deaths_ed_df, PCR_TEST_ed_df ], axis=1)
c19j2_day_df3.head()
c19j2_day_df3.tail()
Confirmed
20200712:391
20200711:328
20200710:407
〜
20200207:0
20200206:0
20200205:16
Recovered
20200712:100
20200711:154
20200710:197
〜
20200207:5
20200206:0
20200205:4
Deaths
20200712:0
20200711:0
20200710:0
〜
20200207:0
20200206:0
20200205:0
PCR_TEST
20200712:1838
20200711:5362
20200710:9867
〜
20200207:23
20200206:19
20200205:132
となり、元データである累積累計数字の当日−前日の数字と一致しています。
後はこのデータで視覚化が行えれば完成です。
次回はその検証を行いたいと思います。