学習

データ収集

学習する(改良6:Permutation Feature Importance 実装を高速化・安定化)

Permutation Feature Importance 実装を高速化・安定化しました 🚀前回まで使っていた Permutation Feature Importance (PFI) のコードを、より高速で安定して動作するように全面的に...
バグ修正

学習する(改良5:高速化 groupby.apply,rolling,astype(“category”))

データの前処理の高速化を行いました。いまのボトルネックは主に「groupby.apply(lambda … rolling …)」と「同じ列の何度もソート/astype/fillna」の往復です。副作用なく速くできる“差し替えポイント”を順...
バグ修正

学習する(改良4:枠の位置バイアスを素直に学習させ、順位情報を削らず、レース全体の確率モデル(Plackett–Luce)で“勝ち切る力”を直接最適化する。

もっと、頭を良くさせたいと思い、以下の改良を加えてみました!枠番を復活 & レース内正規化特徴(A)順位の切り詰めをやめる(フルランク学習)Plackett–Luce 損失(B)の追加1) 枠番を復活 & レース内正規化特徴(A)置き換える...
学習

学習する(改良3:「どの情報をどう使うか」をモデル自身に学習させる仕組みを追加)

今回のコード改良では、CLS+学習窓+MoE、つまり従来のLSTM+SetTransformer構成に対して、「どの情報をどう使うか」をモデル自身に学習させる仕組みを追加しました。これにより、人間があらかじめ決め打ちした窓幅や重み付けに依存...
学習

学習する(16:改良1 相対化・履歴・血統)

🏇 モデルが“文脈”を読むようになった話 — 相対化・履歴・血統の三本柱これまでのモデルは「距離=1800m」「斤量=55kg」といった絶対値の並びを見ていました。でも、予想の現場で大事なのは「この馬にとって今回は長いの?重いの?」「同条件...
学習

学習する(14:学習コマンド)

キャパの異なる2つの自己注意モデルを“学習的に”スタックして、レース予測を実戦仕様で学習・保存・再利用する起動スクリプト今回は、レース予測モデルの学習/推論パイプラインの起点です。このコードは、2種類のハイブリッドモデル(LSTM+埋め込み...
学習

学習と評価で利用(15:評価ユーティリティセット)

特徴の正規化・不均衡対策・早期停止・ラベル整形・評価集計を一括で支える、実運用向けの検証ユーティリティ群今回は、学習・評価フェーズで使う補助ユーティリティのセットです。履歴特徴の正規化、クラス重みの算出、早期終了(過学習抑制)、ラベルの正規...
学習

学習する(12:学習ループ、EarlyStopping、AMPなど)

学習プロセス:レースを単位に、順位・勝者・上位価値を同時最適化しつつ、過学習を監視して学習率も自動調整する “実戦仕様” のランキング学習ループ今回は、関数 train_racewise_regression_modelの作成です。この関数...
学習

学習する(3:相対差などの特徴量作成)

「直前までの情報だけ」で実績と傾向を要約し、レース内の相対差で正規化した、リークに強い特徴量セットを構築このコードは、 の安定ソートを土台に、騎手・馬・コンビ(馬×騎手)の直前までの実績指標や過去平均をベクトル化して作成し、さらに同レース内...
学習

学習する(11:ヘイズワイズ、トップ1、nDCG@K)

ペア・トップ1・上位Kの3軸から、レース内ランキングを統計的に鍛える損失パックレース内のスコア(preds)と着順ラベル(targets)に対して、ランキング学習の3種類の損失を実装しています。目的は、ペアワイズで正しい並びを学習(勝ち負け...