データ収集

学習する(改良6:Permutation Feature Importance 実装を高速化・安定化)

Permutation Feature Importance 実装を高速化・安定化しました 🚀前回まで使っていた Permutation Feature Importance (PFI) のコードを、より高速で安定して動作するように全面的に...
バグ修正

学習する(改良5:高速化 groupby.apply,rolling,astype(“category”))

データの前処理の高速化を行いました。いまのボトルネックは主に「groupby.apply(lambda … rolling …)」と「同じ列の何度もソート/astype/fillna」の往復です。副作用なく速くできる“差し替えポイント”を順...
バグ修正

学習する(改良4:枠の位置バイアスを素直に学習させ、順位情報を削らず、レース全体の確率モデル(Plackett–Luce)で“勝ち切る力”を直接最適化する。

もっと、頭を良くさせたいと思い、以下の改良を加えてみました!枠番を復活 & レース内正規化特徴(A)順位の切り詰めをやめる(フルランク学習)Plackett–Luce 損失(B)の追加1) 枠番を復活 & レース内正規化特徴(A)置き換える...
レース予想方法

2025/9/7中山2Rを予想してみました。。。

完成したコードで、実際に結果が分かっているレースを予測してみました。実際の結果は、、、、1位:11キアラメンテ、2位:7ノーブルライナー、3位:9スタンピー。まだまだのようです笑笑笑。
レース予想方法

レース予想(2:学習時と同じ前処理を推論に適用する ― preprocess_like_training 関数をつくる)

まず、最初にコードから。。。。@torch.no_grad()def preprocess_like_training( X, stats: dict, *, inplace: bool = False, out_dtype_torch: ...
レース予想方法

レース予想(1:概説)

直近3走×時系列モデルで“今”を評価する今回は、レースIDを指定して出走各馬の直近傾向を数値化し、スタッキング構成の時系列モデルでスコアリング → Excelに一括転記するところまでを自動化しました。記事では処理の全体像と、学習時との違い、...
学習

学習する(改良3:「どの情報をどう使うか」をモデル自身に学習させる仕組みを追加)

今回のコード改良では、CLS+学習窓+MoE、つまり従来のLSTM+SetTransformer構成に対して、「どの情報をどう使うか」をモデル自身に学習させる仕組みを追加しました。これにより、人間があらかじめ決め打ちした窓幅や重み付けに依存...
競馬予想アルゴリズム

学習する(17:改良2 距離・斤量)

🐎 距離・斤量の“相対化”を多視点化(3・5・7走)これまでは「距離=1800m」「斤量=55kg」といった絶対値をそのまま扱っていました。しかし競馬の世界では “普段より長い距離” や “いつもより斤量が重い” ことこそが成績に直結します...
学習

学習する(16:改良1 相対化・履歴・血統)

🏇 モデルが“文脈”を読むようになった話 — 相対化・履歴・血統の三本柱これまでのモデルは「距離=1800m」「斤量=55kg」といった絶対値の並びを見ていました。でも、予想の現場で大事なのは「この馬にとって今回は長いの?重いの?」「同条件...
評価

評価する(3:PFI結果)

今回はPFIの結果です。これらの結果から何が見えるのか?そして、何が課題なのかを突き詰めておきたいと思っています。まず、以下が結果でした。📊 Baseline NDCG@3: 0.9201🚀 Numeric PFI: 24 features...