給与推定

給与推定により人事の赤池くんの窮地を救おう

賞金: 100,000 参加チーム数: 281 終了まで: 8日

[Score: 25.07]給与推定コンペBaseline

ベースラインが出来たので公開しました。 https://colab.research.google.com/drive/1eYI-yBha7QrvZ6XkfAZDeR7yvrp6pr3N

ベースラインを作成する上で気をつけた点として2点あります。

  1. 目的変数の分布

    こちらのEDAで図示されています通り、salaryは分布が歪んでいるため正規分布に近づけるようにlog1pで対数変換をかけています。注意点として学習時は変換をかけたままの値でも問題ないですが、結果提出時はexpm1で変換をかけて元の値に戻さないとのスコア計算がおかしくなります。

    ProbSpace - [Salary Prediction] Simple EDA Notebook

  2. 目的関数の最適化

    lightgbmの学習時のパラメータを見てほしいのですがmaeを使っていません、代わりにfair lossを使っています。なぜ使うのかについては下記スライドのP17を見てください。

    Signate - 飯田産業 土地の販売価格の推定 - 入賞モデル 1位スライド

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。