NPBデータストアについて

サイトの目的

NPBデータストアは、日本プロ野球(NPB)のシーズンデータを誰でも無料で閲覧・比較できるように設計された 総合データベースです。打率や防御率といった伝統的な成績だけでなく、wOBA・FIP・SwStr%・CSW% などの セイバーメトリクス指標、球種別データ、配球チャート、観客動員数まで、ファン・指導者・記者・データ分析者の幅広いニーズに応える情報を集約することを目指しています。

データ収集と処理プロセス

  1. データソース: 公開されている試合結果・選手情報・1球ごとのプレイデータを複数の公的・準公的ソースから収集しています。
  2. 正規化: 選手名・チーム名表記の揺れ(旧名・略称・全角半角)を辞書ベースで統一し、年度横断検索を可能にしています。
  3. 集計: pandas を用いた DataFrame 処理で、シーズン成績・対戦相手別成績・球場別成績・球種別指標などを算出しています。
  4. セイバーメトリクス計算: wOBA / wRC+ / FIP / xFIP / WHIP+ / ISO / BABIP / Whiff% / CSW% などを内製ロジックで算出しています。計算式は用語集で公開しています。
  5. キャッシュと配信: Google Cloud (App Engine) 上で稼働し、TTL キャッシュと Cache-Control ヘッダーにより高速配信を実現しています。

更新頻度

  • 試合結果・選手成績: 試合終了後、概ね数時間以内に反映
  • 順位表・ランキング: 数十分単位で再集計
  • 注目選手(Hot Players): 直近14日間の成績を 30 分間隔で更新
  • 球種別データ・配球チャート: 試合データ取り込み時に同時更新

編集方針・品質管理

  • 客観性: 数値データは公的に確認可能な情報のみを使用し、特定球団・特定選手に偏らない中立的な記述を心がけます。
  • 透明性: 各セイバーメトリクス指標の計算式は用語集に明記し、ブラックボックス化を避けます。
  • 誤りの修正: 数値の誤りや表記ゆれを発見された場合はお問い合わせフォームからご連絡ください。確認のうえ速やかに修正します。
  • 免責: データは可能な限り正確を期していますが、公式記録との差異が生じる可能性があります。詳細は免責事項をご参照ください。

運営

NPBデータストアは、プロ野球データの民主化を目的に個人プロジェクトとして開発・運営されています。 広告収益(Google AdSense)はサーバー運営費用に充当しています。

お問い合わせ プライバシーポリシー 用語集