対戦ゲームデータ分析甲子園

目指せ"Another" バトル優勝!

賞金: 100,000 参加ユーザー数: 489 終了まで: 27日

【運営担当者様】A1-levelの一部抜けについて

変数を確認しているときに気がついたので、何らかの背景があるか確認させてください。

添付したプロットは横軸にlevel、縦に出現頻度としたヒストグラムです。
プロットの通り、A1-levelのみ472から541の間と、586以上のlevelが一切出現しておらず、他のlevelの分布と異なっていました。

これは恣意的にデータを間引いた結果でしょうか?またはデータの収集の過程でこのようになる状態だったのでしょうか。
ご確認、ご回答の程どうぞよろしくお願い致します。

0f0b7a50-b00e-47ae-8b07-0f3ed6904430.png

Aws4 request&x amz signedheaders=host&x amz signature=9c29119ec0fb73aed20372c45bde668771547b282fa58e166250a719689198e5
sylk

https://prob.space/competitions/game_winner/discussions/takaito-Posta0ec91cc7dc4e956bac1

上のリンクで最新のコメントでA1の人は投稿者だからレベル+武器とかでプレイヤーが特定されるかもしれないとのことでした

Aws4 request&x amz signedheaders=host&x amz signature=d470becd9ac52c434ecc6984e76401d3f4383e99fb72a6ff1dacd1df7dde22cb
ProbSpace_official

ご質問ありがとうございます。
回答としましては、こちらで意図的にデータを間引いているということはございません。
400レベルを超える投稿ユーザー数が少ないことで、分布に偏りが生じているのかなと思われます。
ご確認のほど、よろしくお願いいたします。

Aws4 request&x amz signedheaders=host&x amz signature=35ebadf8433fd2a0835ca4ef6517d9ca7d91a1df1e2a73f98bbac6e7395f9796
masato

なるほど、ということは大まかにはデータ収集のプロセス起因が想定されうるということですね。

sylkさん 有用なコメントへのメンションありがとうございます!

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。