給与推定

給与推定により人事の赤池くんの窮地を救おう

賞金: 100,000 参加チーム数: 281 終了まで: 8日

Feature Engineeringについて(年収幅ラベルの追加)

目的変数であるsalaryを年収幅でラベル化し、分類問題として解いた後に予測したラベルをテストデータに加えて学習させたのですが、予測値が全てinfになってしまいます。 このアイデアは何か問題があるのでしょうか? Notebookはgithubにあります。

https://github.com/Maekura/ML_Competiton/blob/master/ProbSpace/Salary_Prediction/lgbm_salary_labeling.ipynb

※年収幅ラベルとは
0~200万の人は0
200〜400万の人は1
400万〜600万の人は2
といった具合のラベルです。

D4995639 eb59 46a8 b543 6aadbfe784b5
wakame

Githubのipynbファイルがそのまま開かなかったので、新しくGoogleColab環境に内容をコピペして動かしましたが問題なく動作しました。 https://colab.research.google.com/drive/1uG9jEks84di7HYI_Os7-5oPhaStxgPM5

2de43b46 2743 45ff b4bd 4bd8174c716d
RyoMaekura

確認して頂きありがとうございます。 再計算し直したところ、上手くいきました。

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。