Kaggle「Titanic – Machine Learning from Disaster」に挑戦:Part2(評価:0.75119)

投稿者: | 2021年6月17日

Kaggleの「Titanic – Machine Learning from Disaster」に挑戦中です。

初挑戦の評価は0.73684。

順位は42456位でした。

挑戦二回目となる今回は特徴量を増減しての挑戦となります。

前回の特徴量は’Pclass’,’Sex’,’Age’,’Fare’,’Embarked’の5つ。

今回は’Pclass’,’Fare’,’Embarked’,’person’,’Alone’,’honorific’の6つの特徴量を採用しました。

‘Sex’,’Age’を削除し、新たに作成した特徴量’person’,’Alone’,’honorific’を追加しました。

‘person’は’Sex’のmale・femaleに加えてchildを加えた特徴量。

‘Alone’は単身かそれとも家族連れかの特徴量。

‘honorific’はnameの中に含まれるMrやMissといった敬称を抽出した特徴量です。

結果的に1つ特徴量が増えて、どれだけ評価が変化するのか楽しみ。

そんなKaggle「Titanic – Machine Learning from Disaster」の挑戦二回目の結果は以下のとおり。

使用した予測アルゴリズムは前回同様決定木。

評価は0.75119。

順位は42153位。

評価は0.01435、順位は303位のUPとなりました。

しかし、目標としている評価0.80以上には0.04881もの開きがあります。

道のりはまだまだ遠そうです。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です