NPBデータストアについて
サイトの目的
NPBデータストアは、日本プロ野球(NPB)のシーズンデータを誰でも無料で閲覧・比較できるように設計された 総合データベースです。打率や防御率といった伝統的な成績だけでなく、wOBA・FIP・SwStr%・CSW% などの セイバーメトリクス指標、球種別データ、配球チャート、観客動員数まで、ファン・指導者・記者・データ分析者の幅広いニーズに応える情報を集約することを目指しています。
データ収集と処理プロセス
- データソース: 公開されている試合結果・選手情報・1球ごとのプレイデータを複数の公的・準公的ソースから収集しています。
- 正規化: 選手名・チーム名表記の揺れ(旧名・略称・全角半角)を辞書ベースで統一し、年度横断検索を可能にしています。
- 集計: pandas を用いた DataFrame 処理で、シーズン成績・対戦相手別成績・球場別成績・球種別指標などを算出しています。
- セイバーメトリクス計算: wOBA / wRC+ / FIP / xFIP / WHIP+ / ISO / BABIP / Whiff% / CSW% などを内製ロジックで算出しています。計算式は用語集で公開しています。
- キャッシュと配信: Google Cloud (App Engine) 上で稼働し、TTL キャッシュと Cache-Control ヘッダーにより高速配信を実現しています。
更新頻度
- 試合結果・選手成績: 試合終了後、概ね数時間以内に反映
- 順位表・ランキング: 数十分単位で再集計
- 注目選手(Hot Players): 直近14日間の成績を 30 分間隔で更新
- 球種別データ・配球チャート: 試合データ取り込み時に同時更新
編集方針・品質管理
- 客観性: 数値データは公的に確認可能な情報のみを使用し、特定球団・特定選手に偏らない中立的な記述を心がけます。
- 透明性: 各セイバーメトリクス指標の計算式は用語集に明記し、ブラックボックス化を避けます。
- 誤りの修正: 数値の誤りや表記ゆれを発見された場合はお問い合わせフォームからご連絡ください。確認のうえ速やかに修正します。
- 免責: データは可能な限り正確を期していますが、公式記録との差異が生じる可能性があります。詳細は免責事項をご参照ください。
運営
NPBデータストアは、プロ野球データの民主化を目的に個人プロジェクトとして開発・運営されています。 広告収益(Google AdSense)はサーバー運営費用に充当しています。