欧州サッカーの移籍金は予測可能か?強く影響するのは年齢だけじゃない
移籍金と年齢は相関関係になる
では、ランダムフォレストによって移籍金額の予測に強く影響している変数が、図のようになりました。年齢や平均ゴール数を筆頭に納得のいく変数がならんでいることがわかります。実際は若いほうが移籍金が高額になるようです。
しかし、将来のポテンシャルと言っても、単純に若いほうがいいという訳ではなさそうです。年齢と移籍金額の関係性を見る経験と将来性のバランスが求められていると考えられ、22歳の移籍金額の平均値は、14.7 million Eurosと全体平均のおよそ2倍となっています。
データサイエンスの最大の魅力とは
最終的に予測の質としてはまだ発展途上でありますが、これは移籍金額が今回用いたサッカーのパフォーマンスだけで決まるものではないということから当然のものであり、精度向上のためには、さらなるデータを集めて検討していくことが必要となります。
一方で、ゼロからオープンデータの収集およびその範囲内で今回の結論にたどり着くことというのは、専門家でなくとも誰でも数字によって裏付けられた知見を用いて目的達成に近づくことができる、ということを意味しています。
もっというと、勘や経験では138個もの要素に対して全て正確な扱いは不可能であるため、思いもしなかった重要な仮説の発見にもつながります。これがデータサイエンスの最大の魅力です。
今回の事例では、機械学習のひとつである「ランダムフォレスト」の紹介をしましたが、そもそも「機械学習」や「AI」は「なんとなくは理解しているけど……」という方は多いのではないでしょうか。「人間の仕事がAIに全部取って替えられる」くらいの勢いで、期待が煽られていたこの技術も、実は万能ではなく、できること、できないことについて事例を交え、シンプルにお伝えしていきたいと思います。