買わないオトコの買い物ブログ

『それでも欲しいもの』を求めて・・・ファッションやアウトドアを中心に日常のアレコレを紹介をするブログ


【Python】競馬データ収集スクリプトを書いてみた【機械学習】


f:id:null11blg:20191105201542j:plain

 

機械学習をやってみようと急に思い立った私は、まず選んだのが「競馬」というテーマでした。

 

秋から冬にかけて毎週のようにGIという大きなレースが開催される今こそやってみようというわけです。

 

ファーストステップとなる今回は、Pythonを使って競馬のデータを収集するスクリプトを実装したいと思います。

 

 

実装にあたって

今回、データ収集を行うスクリプトを組むにあたって参考にさせていただいたのはこちらのサイトのスクリプトです。今回の実装の詳しい部分はほぼすべてこちらに載っています。

qiita.com

 

こちらのスクリプトは、すでにそのほとんどが完成されているのですが、今回はさらに改良を行っていきたいと思います。

 

私はあくまで改良を加えただけですので、いいねは作者さんのサイトのほうに行なってください。

 

改良を行なった項目

今回、改良を行なった項目については以下の通りです。

  • 馬番と枠番を取得できるようになった
  • コースデータを芝・ダ・障と距離に分割して取得できるようになった
  • レースタイムを取得できるようになった
  • 3Fのタイムを取得できるようになった
  • 着差を取得できるようになった
  • 頭数取得ができないケースを回避できるようになった

 

ざっくりまとめると、これまでの機能に加えて、新たなデータを取得をできるようにしたという形です。

 

ソースコード

ほぼオリジナルをベースに作成しています。

続きをメガネをかけたキリンのブログで読む