Shige

学習

学習する(7:Embedding)

埋め込み(Embedding)入力を作る前処理学習用のシーケンス特徴から 埋め込み(Embedding)入力を作る前処理が必要ですので、以下の通り作成しました。print("✅ Embedding")def build_category_m...
学習

学習する(6:リーク防止分割)

学習データを 時系列順にレース単位で分割このコードは、レース単位+時系列順でデータを「訓練/検証/テスト」に分割する処理です。データリークを防ぐ設計がポイントなので、その観点も含めて解説します。print("✅ データ分割(リーク撲滅: レ...
学習

学習する(5:スライディングウインドウ)

馬ごとの時系列シーケンス化(スライディングウィンドウ)+特徴量拡張の前処理パイプライン「馬ごとの時系列シーケンス化(スライディングウィンドウ)+特徴量拡張の前処理パイプライン」 です。もう少し噛み砕くと:並び替え → 馬IDごとの時系列整列...
学習

学習する(4:エンコード)

ラベルエンコードラベルエンコードとは?ラベルエンコード(Label Encoding)とは、文字やカテゴリ情報を整数のIDに変換する方法です。機械学習モデルやニューラルネットワークでは、文字列やカテゴリのままでは計算できないため、一意のカテ...
学習

学習する(2:血統)

血統データのマージ 血統データを取得して、マージします。次にこれらの血統データから得意な特性をまとめていきます。# -------------------------------------------------------------#...
学習

学習する(1:GPU/CPU自動切替)

競馬予想で当てるためのAI競馬のため、まずは過去データを学習するプログラムを作成したいと考えます。先ずは、初期設定や、データ読み込み、そして前処理について説明します。「GPU/CPU自動切替でどこでも動く学習環境」device = torc...
データ収集

競馬データベースの選定

競馬予想には、競馬データが必要です。当たり前ですね(笑)。そこで、どこからデータを入手すべきか悩みましたが、条件は無料、信頼性が高い、取得できること、の観点から、まとめてみました。クリーン(安心)JRA-VAN, NAR, SPAT4 など...
データ収集

データベース作成

データベースを選定したら、次に自分自身の使いやすいデータベースを作成したいと思います。私の場合、・horse_db.csv (レース)・ payouts.csv(払戻) ・bloodline_id_data.csv(血統) の 3種類の C...
プログラミング環境

開発環境

最初にPython開発するためのPCをはじめとした私の開発環境を公開します。PCの仕様私のPC仕様は以下の通りです。機種名:MSI Prestage 14 A12UCCPU:12th Gen Intel(R) Core(TM) i7-128...
プログラミング環境

学習のためのコードは?

超概要、具体的な学習理論やプログラミング仕様を説明します。