Kaggleの「Titanic – Machine Learning from Disaster」に挑戦中です。
初挑戦の評価は0.73684。
順位は42456位でした。
挑戦二回目となる今回は特徴量を増減しての挑戦となります。
前回の特徴量は’Pclass’,’Sex’,’Age’,’Fare’,’Embarked’の5つ。
今回は’Pclass’,’Fare’,’Embarked’,’person’,’Alone’,’honorific’の6つの特徴量を採用しました。
‘Sex’,’Age’を削除し、新たに作成した特徴量’person’,’Alone’,’honorific’を追加しました。
‘person’は’Sex’のmale・femaleに加えてchildを加えた特徴量。
‘Alone’は単身かそれとも家族連れかの特徴量。
‘honorific’はnameの中に含まれるMrやMissといった敬称を抽出した特徴量です。
結果的に1つ特徴量が増えて、どれだけ評価が変化するのか楽しみ。
そんなKaggle「Titanic – Machine Learning from Disaster」の挑戦二回目の結果は以下のとおり。
使用した予測アルゴリズムは前回同様決定木。
評価は0.75119。
順位は42153位。
評価は0.01435、順位は303位のUPとなりました。
しかし、目標としている評価0.80以上には0.04881もの開きがあります。
道のりはまだまだ遠そうです。