競馬を予想するための材料として競馬理論によって導き出された数値を使う人もいます。
競馬理論には色々な種類がありますが、多くの人が積極的に活用している数値の1つにデータマイニングというものがあります。
実際に、競馬の情報商材でもデータマイニングを軸とした手法が販売されていますし、データマイニングの研究をしている競馬ファンもいたりします。
しかし、ただデータマイニングの指数だけを見てもどの馬が勝つか、どの馬券を買えば的中するかを判断することは難しく、指数をそのまま鵜呑みにしても不的中になるのがオチでしょう。
そこで、馬券を的中させるためのデータマイニングの活用法についてお話ししていきます。
「マイニング指数なんか見ても稼げないよ!」と思っている人も、もしかすると単純に使い方が間違っている・・・なんてこともあり得ますので、ぜひここで、正しい使い方を覚えてもらえればと思います。
[adsense]
データマイニングとは
データマイニングとは、データの集合の中から知識(ルールとか法則のことを指します)を見つけることを指すマーケティング用語です。
そのため、データマイニングは決して競馬の専門用語ではなく、競馬のデータに反映させただけに過ぎません。
このデータマイニングはJRA-VANが独自に算出している数字であり、JRA-VANに登録すれば閲覧することができます。
そしてこのデータマイニングの数字に関して、JRA-VANは次のように記しています。
競馬は、競走馬と人間(騎手、調教師等)が、その能力をフルに使って速さを競うレースです。速く走る素質を持った馬が、優秀な調教師によってその素質にさらに磨きをかけられ、レース当日に上手な騎手が馬の能力をフルに引き出そうとすることによって、レースの勝敗は決まります。
レース当日の馬の速さに関係していると思われるデータを事前に入手し、それらをうまく組み合わせることにより、ある程度の予測が可能な現象である、といえます。データから結果が予測可能である、という意味では、天気予報や企業の倒産予測などと同じと言えるでしょう。
引用:JRA-VAN
つまり、馬の速さに関係するデータをあらかじめ入手し、それを独自に組み合わせることによって、各レースの順位を予測しているがデータマイニングなのです。
そして、このデータマイニングの情報は定期的に更新され、レース出走の1時間前に確定されます。
また競馬で用いられるデータマイニングは「走破タイム型」と「対戦型」の2種類があります。
走破タイム型とは
走破タイム型データマイニングとは、過去のレース成績データから算出した各競走馬の走破速度に、競走馬の情報や騎手、調教師、出走するレースの情報を加味することによって、その馬が出走した場合の速度順位を予測したものです。
例えば芝1800mのレースに出走する馬が16頭いたとすると、1頭で走った場合の順位を予測するのがそうはタイム型のデータマイニングということです。
対戦型とは
対戦型データマイニングとは、過去のレースにおいて対戦実績のある競走馬の勝ち負けをデータの軸とし、そこに騎手、調教師、出走するレースの情報を加味して、次のレースで対戦する競走馬の勝ち負けを予測するものです。
分かりやすくいうと、走破タイム型が1頭で走る“タイムアタック”の予測順位に対して、対戦型は出走する馬全頭で走る“レース形式”での予測順位ということになります。
データマイニングが“使えない”と言われる理由
データマイニングは、レース当日の馬の速さに関係しているデータを収集・組み合わせて数値化されたものであり、それを参考にすることでどの馬が来るかを予想することができます。
ところが「データマイニングは使えない」と主張する人も少なくありません。
実は、ほんの数年前まではデータマイニングをはじめとしたほとんどのスピード指数は、競馬で稼ぐのに有効な手段として重宝されてきました。
馬の強さが数値として知ることができたわけですから、その数値を信じて馬券を組み立てれば当然馬の強さの優劣を把握することができるため、容易に的中する馬券を予想することが出来たからです。
ではなぜデータマイニングを使っても稼げなくなったのか?
その理由は大きく分けて2つあります。
理由1:全てのデータがオッズに反映されたから
少し前までは、競走馬に関するデータは一部の人しか収集・閲覧することができなかったため、データマイニングの数値を頼りに馬券を買ってもそれなりに利益を出すことができました。
しかし、誰でもデータマイニングがチェックできるようになった現在はどうでしょうか?
例えばデータマイニングをチェックできる人が100人しかできないとすると、その数値を元に馬券を買う人は100人しかいないわけです。
そうするとマイニング1位の馬に賭ける馬はどれだけ多くても100人ですから、オッズにそこまで影響を及ぼすことはありません。
しかし、データマイニングをチェックできる人が100万人になったら?
マイニング指数を参考に馬券を買う人が1万倍に増えたわけですから、少なからずオッズに影響を与えるのは容易に想像がつきます。
つまり、データマイニングを使って競馬を予想する人が増えすぎてしまったため、馬券がマイニング指数上位の馬に集中し、満足のいく払戻金を受け取れなくなってしまったのです。
分かりやすく言うと、馬券を買うリスクはそのままでリターンだけが下がったため、マイニング指数を鵜呑みして馬券を買うリスクが高まってしまったのです。
2:マイニング指数を算出するロジックが変更される
どんな指数でも、数値を出すのに必ずロジックが用いられ、このロジックを元に数値を当てはめていくことで各競走馬の強さを数字に置き換えることができます。
ところが、このデータマイニングに関してはこのロジックが変更されることがあります。
もちろんガラリと変わるのではなく、より精度を高めるための微調整かと思いますが、実はこれがデータマイニングを使った分析を難しくしている原因につながるのです。
例えば今までAというロジックで馬の強さが算出されていたのに、ある日を境にA+というロジックに変更がかかると、馬の強さが微妙ながら変更されることになります。
この変更によって馬の強さの優劣まで変更される可能性は十分あります。
事実、2010年~2015年のタイム型マイニング1~3位の単勝の回収率は以下のようになっています。
マイニング1位 78%
マイニング2位 80%
マイニング3位 84%※上記データは、過去19,925レースを一切フィルタリングせずに分析したものです。
参考:ブエナの競馬予想ブログ
以上のデータから、マイニング1位~3位の馬を単勝で買い続けても稼ぐことができないということが分かります。
データマイニングを使った馬券予想のコツ
以上の点を総括すると、データマイニングは馬の強さを数値化したものではあるものの、その数値を鵜呑みにして馬券を買っても稼ぐことはできない・・・というものでした。
「じゃあマイニングはむししてもいいのか?」という人もいるかと思いますが、それは極端な結論だと言わざるを得ません。
なぜなら、データマイニングをうまく活用すればきちんと競馬で稼ぐことができるからです。
先ほど挙げた「マイニングを使っても稼げない理由」というのは、マイニング指数を鵜呑みにして馬券を買った時の話であり、それ以外の要素を組み合わせて予想することで、きちんと競馬で利益が残る馬券の買い方をすることができるのです。
例えば、全レースを対象にするのではなく“芝”のレースだけに照準を絞ってみたり。
期待値から見た場合、芝コースのレースで8番人気マイニング指数が1~3位の馬は比較的お勧めです。(ただし、下位人気の馬ですから的中率が低いのを織り込み済みで勝負する必要があります。)
また、芝の重賞コースにだけ照準を絞ると、マイニング指数7位の馬が好走する・・・というデータもあります。
マイニング1位の成績 | マイニング7位の成績 | |
勝率 | 13・7% | 18・4% |
連対率 | 23・5% | 22・4% |
複勝率 | 33・3% | 28・6% |
単勝回収率 | 33% | 142% |
※上記数値は2013年のものです。
参考:Info Review
以上の数値を参考に組合せを吟味することで、競馬で稼ぐことができます。
もちろんこれ以外にも、様々なデータや数値を組み合わせることによって、馬券に絡む可能性がある馬を絞り込むことが可能。
つまり、データマイニングの使い方は1つではない・・・ということです。
データマイニングは競馬予想の“材料”である
競馬で勝てない人の中には、1つの数値やデータに依存して馬券を予想する人がいて、その中にデータマイニングに依存している人もいることでしょう。
しかし、データマイニングに依存して馬券を買っても的中はする者のお金を稼ぐことはできません。
それは、データマイニングが悪いのではなく、マイニング指数を使う人に問題があるからです。
マイニング指数に限った話ではなく、競馬で稼ぐためにはあらゆるデータや数値を参考に、自らが取捨選択をして判断することが重要です。
そのための材料としてデータマイニングがあり、そういう点から考えた時、マイニング指数は非常に参考になる指数だと思います。
マイニング指数をどう見たら的中するか・・・を考えるよりも、自分の予想にマイニング指数をどう活用できるか?を考えることが競馬で稼ぐための近道です。
試行錯誤しながら、自分なりのマイニング指数の使い方を身につけてもらえればと思います。
[adsense]