学習 学習する(8:標準化) 時系列特徴量の標準化(平均0・分散1)を行い、シーケンス入力用に整形して保存する前処理print("✅ スケーリング(高速版)")TAIL = 3 Xtr_main = X_trainXtr_tail = X_trainXtr_num = ... 2025.08.31 学習
学習 学習する(9:TSLM、Transformer、モデル作成) 馬の履歴(時系列)と同一レース内の相互関係(集合)を同時に学習できる、埋め込み付きハイブリッド予測モデルclass SetTransformer(nn.Module): def __init__(self, input_dim, hidde... 2025.08.31 学習
学習 学習する(7:Embedding) 埋め込み(Embedding)入力を作る前処理学習用のシーケンス特徴から 埋め込み(Embedding)入力を作る前処理が必要ですので、以下の通り作成しました。print("✅ Embedding")def build_category_m... 2025.08.31 学習
学習 学習する(6:リーク防止分割) 学習データを 時系列順にレース単位で分割このコードは、レース単位+時系列順でデータを「訓練/検証/テスト」に分割する処理です。データリークを防ぐ設計がポイントなので、その観点も含めて解説します。print("✅ データ分割(リーク撲滅: レ... 2025.08.31 学習
学習 学習する(5:スライディングウインドウ) 馬ごとの時系列シーケンス化(スライディングウィンドウ)+特徴量拡張の前処理パイプライン「馬ごとの時系列シーケンス化(スライディングウィンドウ)+特徴量拡張の前処理パイプライン」 です。もう少し噛み砕くと:並び替え → 馬IDごとの時系列整列... 2025.08.31 学習
学習 学習する(4:エンコード) ラベルエンコードラベルエンコードとは?ラベルエンコード(Label Encoding)とは、文字やカテゴリ情報を整数のIDに変換する方法です。機械学習モデルやニューラルネットワークでは、文字列やカテゴリのままでは計算できないため、一意のカテ... 2025.08.31 学習
学習 学習する(2:血統) 血統データのマージ 血統データを取得して、マージします。次にこれらの血統データから得意な特性をまとめていきます。# -------------------------------------------------------------#... 2025.08.31 学習
学習 学習する(1:GPU/CPU自動切替) 競馬予想で当てるためのAI競馬のため、まずは過去データを学習するプログラムを作成したいと考えます。先ずは、初期設定や、データ読み込み、そして前処理について説明します。「GPU/CPU自動切替でどこでも動く学習環境」device = torc... 2025.08.31 学習
データ収集 競馬データベースの選定 競馬予想には、競馬データが必要です。当たり前ですね(笑)。そこで、どこからデータを入手すべきか悩みましたが、条件は無料、信頼性が高い、取得できること、の観点から、まとめてみました。クリーン(安心)JRA-VAN, NAR, SPAT4 など... 2025.08.31 データ収集
データ収集 データベース作成 データベースを選定したら、次に自分自身の使いやすいデータベースを作成したいと思います。私の場合、・horse_db.csv (レース)・ payouts.csv(払戻) ・bloodline_id_data.csv(血統) の 3種類の C... 2025.08.31 データ収集