【PythonでCIVID-19分析】データの準備編 2

投稿者: | 2020年5月25日

前回に引き続きデータの準備編になります。

前回、SIGNATEで開催されているコンペティションCOVID-19チャレンジで提供されているsignate_covid-19_datasetをお借りすることにしましたが、さらにWEBを調べてみると、もうひとつ別のデータを発見しました。

東洋経済オンライン編集部の荻原和樹氏がGitHubで公開しているデータがそれで、これは同氏が東洋経済オンラインでビジュアル化し公開されている元データとなります。

csvデータが公開されていて、中身を見ると非常に分かりやすい。

これなら私でもなんとかなりそうです。

MITライセンスとします。研究、調査、報道など、商用・非商用を問わずご自由にお使いください。


と、上記ライセンスとなっているので使わせていただこうと思います。

SIGNATEのsignate_covid-19_datasetで私ができそうなことは全国・都道府県の罹患者数の分析くらいでした。

しかし、こちらのデータを使うと罹患者数・死亡者数・回復者数に加え、PCR検査人数なども分析できそうです。

もっとも私のレベルで欲張ってもできることはしれているので、・死亡者数・回復者数の三項目に絞って分析を試みたいと思っています。

実はこちらのデータを発見する以前、自力でデータを入手しようとスクレイピングを学習。

四苦八苦しながらいくつかのWEBサイトから何とかデータの取得に成功しました。

東洋経済オンラインの新型コロナウイルス国内感染の状況もその内のひとつです。

しかし、ページレイアウトの更新が頻繁で、コードの修正が追いつかずに断念したという残念な経緯があります。

結局、取得できたのは数日分ていどでしたが、一度そのデータを使って分析に挑戦したことがあります。

その経験が活かせればと思っています。


コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です