終了済み: 対戦ゲームデータ分析甲子園

目指せ"Another" バトル優勝!

賞金: 100,000 参加ユーザー数: 567 6ヶ月前に終了

【運営担当者様】A1-levelの一部抜けについて

変数を確認しているときに気がついたので、何らかの背景があるか確認させてください。

添付したプロットは横軸にlevel、縦に出現頻度としたヒストグラムです。
プロットの通り、A1-levelのみ472から541の間と、586以上のlevelが一切出現しておらず、他のlevelの分布と異なっていました。

これは恣意的にデータを間引いた結果でしょうか?またはデータの収集の過程でこのようになる状態だったのでしょうか。
ご確認、ご回答の程どうぞよろしくお願い致します。

0f0b7a50-b00e-47ae-8b07-0f3ed6904430.png

Aws4 request&x amz signedheaders=host&x amz signature=ce3da4a96b2b9fd1eda5eee410e2721e0c928f6c8699b320360165c44f06d45c
sylk

https://prob.space/competitions/game_winner/discussions/takaito-Posta0ec91cc7dc4e956bac1

上のリンクで最新のコメントでA1の人は投稿者だからレベル+武器とかでプレイヤーが特定されるかもしれないとのことでした

Aws4 request&x amz signedheaders=host&x amz signature=6148d4f7a950595cc2533b9a6e8e5c45902bd3ddf83250fcb78f2ff799f283be
ProbSpace_official

ご質問ありがとうございます。
回答としましては、こちらで意図的にデータを間引いているということはございません。
400レベルを超える投稿ユーザー数が少ないことで、分布に偏りが生じているのかなと思われます。
ご確認のほど、よろしくお願いいたします。

Aws4 request&x amz signedheaders=host&x amz signature=4a653db2bec86b9e221df399e497657bb2b0ea5958700b8a450f4ae90f2a0c5b
masato

なるほど、ということは大まかにはデータ収集のプロセス起因が想定されうるということですね。

sylkさん 有用なコメントへのメンションありがとうございます!

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。