自作のスピード指数を用いた予想方法①

スポンサーリンク

さて、競馬予想ブログを始めるからには、その予想方法を先にお伝えしなければ始まらないですね。

私は、統計学におけるデータ分析の手法である重回帰分析を用い、ある条件における走破タイムを予測して、それより速いか遅いかを偏差値化したものを独自指数として競馬予想に取り入れています。


そこまでやるかやらないかは別としても、走破タイムを指数化するアプローチとしてはごくオーソドックスなものではないでしょうか。

このブログを作っていてもそうですが、そもそもプログラムってなにそれおいしいの?
レベルの私が、30半ばで統計学の参考書片手に初歩の初歩をかじって一から作り上げた指数のため、とても完璧とは呼べませんが。。

指数の問題点としては、

  • 芝の重不良馬場が、サンプルが少ないので上級条件になるほど指数が抜けて高くなりがち。
  • 大逃げの馬が垂れたレースの指数が狂いがち。
  • 新潟芝1000直は風の影響が大きすぎて不正確。(ライオンボスが勝った去年のアイビスサマーダッシュの指数を出してみて、1000直は指数を出さないことにしました。。)

とまぁ、正確を期すなら問題ありありですが、指数通りに買うのではなく、大枠でとらえて優秀か優秀じゃないか、という考え方をしているのでそんなに気にはしていません。そもそも競馬予想で参考になれば、程度なので。

サンプル数については、12月31日を一区切りとして、翌1月1日から向こう6年分までを限度に、出走馬のデータをサンプルとして使用しています。
今日でいえば、2015年1月1日から2020年6月16日現在までのデータ数(新潟1000直と障害戦を除く)を用いており、常時20万~25万件程度のサンプル数を基にしている、ということになります。

エクセルのCSVファイルのデータを用いて解析しているので。。 
これ以上サンプル数を増やすとパソコンがフリーズしてしまいます。。
(でも素人が自作したプログラムは我が子の様にかわいいもんです)

具体的に指数をどの様に予想で使っているかは、改めて記事にします。


コメント

PVアクセスランキング にほんブログ村
タイトルとURLをコピーしました