学習 学習する(7:Embedding) 埋め込み(Embedding)入力を作る前処理学習用のシーケンス特徴から 埋め込み(Embedding)入力を作る前処理が必要ですので、以下の通り作成しました。print("✅ Embedding")def build_category_m... 2025.08.31 学習
学習 学習する(6:リーク防止分割) 学習データを 時系列順にレース単位で分割このコードは、レース単位+時系列順でデータを「訓練/検証/テスト」に分割する処理です。データリークを防ぐ設計がポイントなので、その観点も含めて解説します。print("✅ データ分割(リーク撲滅: レ... 2025.08.31 学習
学習 学習する(5:スライディングウインドウ) 馬ごとの時系列シーケンス化(スライディングウィンドウ)+特徴量拡張の前処理パイプライン「馬ごとの時系列シーケンス化(スライディングウィンドウ)+特徴量拡張の前処理パイプライン」 です。もう少し噛み砕くと:並び替え → 馬IDごとの時系列整列... 2025.08.31 学習
学習 学習する(4:エンコード) ラベルエンコードラベルエンコードとは?ラベルエンコード(Label Encoding)とは、文字やカテゴリ情報を整数のIDに変換する方法です。機械学習モデルやニューラルネットワークでは、文字列やカテゴリのままでは計算できないため、一意のカテ... 2025.08.31 学習
学習 学習する(2:血統) 血統データのマージ 血統データを取得して、マージします。次にこれらの血統データから得意な特性をまとめていきます。# -------------------------------------------------------------#... 2025.08.31 学習
学習 学習する(1:GPU/CPU自動切替) 競馬予想で当てるためのAI競馬のため、まずは過去データを学習するプログラムを作成したいと考えます。先ずは、初期設定や、データ読み込み、そして前処理について説明します。「GPU/CPU自動切替でどこでも動く学習環境」device = torc... 2025.08.31 学習
データ収集 競馬データベースの選定 競馬予想には、競馬データが必要です。当たり前ですね(笑)。そこで、どこからデータを入手すべきか悩みましたが、条件は無料、信頼性が高い、取得できること、の観点から、まとめてみました。クリーン(安心)JRA-VAN, NAR, SPAT4 など... 2025.08.31 データ収集
データ収集 データベース作成 データベースを選定したら、次に自分自身の使いやすいデータベースを作成したいと思います。私の場合、・horse_db.csv (レース)・ payouts.csv(払戻) ・bloodline_id_data.csv(血統) の 3種類の C... 2025.08.31 データ収集
プログラミング環境 開発環境 最初にPython開発するためのPCをはじめとした私の開発環境を公開します。PCの仕様私のPC仕様は以下の通りです。機種名:MSI Prestage 14 A12UCCPU:12th Gen Intel(R) Core(TM) i7-128... 2025.08.31 プログラミング環境