Бейсбол и DWar

На самом деле вопрос из двух частей.

По какой формуле рассчитывается DWar?

Кроме того, как я понимаю; кажется, что он полагается на некоторые статистические данные, которые исторически контролировались значительно менее строго, чем, скажем, хоум-раны или хиты. Если это так, то экспоненциально ли падает точность статистики после определенного количества лет назад - существует ли известная граница, после которой цифры перестают быть достоверными? Или мое утверждение неверно?

DWar, как оборонительная война?
Не уверен, что на это можно будет ответить... лаконично. Можете ли вы указать, о каком источнике dWAR вы спрашиваете? (WAR и ее варианты не являются единой статистикой: Fangraphs, Basball-Reference.com и т. д. используют разные формулы.)
Я и не знала, что вариантов так много. Спасибо за это.

Ответы (2)

Основная формула ВОЙНЫ выглядит следующим образом:

WAR = (Batting Runs + Base Running Runs + Fielding Runs + Positional Adjustment + League Adjustment +Replacement Runs) / (Runs Per Win)

В разных источниках будут разные способы расчета этих значений.

Справочник по бейсболу (источник ESPN) использует:

bWAR:
    RS (Runs Scored) = Runs per Win + (mwRAA (a modified weighted runs above average) + Base Running Runs + Park Factor + Position Adjustment + Replacement Level) 
    RA (Runs Allowed) = Runs per Win - DRS (Defensive Runs Saved) 
    Win - Loss% (W-L%)= (RS^x)/(RS^x + RA^x)
        where RS = (league Runs/Game /2) + Player Offensive Runs
        RA = (league Runs/Game /2) - Player Defensive Runs Saved
        x = (Runs Per Game involving Player)^.285
    Runs Per Game involving Player = 53.6 * (League Runs Per Out + (Player Runs Batting + Player Runs Double Plays + Player Runs Base Running + Player Positional Adjustment - Player Fielding Runs)/(6 * Player Innings). 
    Wins Above Average (WAA) = (W-L% - .500) * Player Games Played
    Wins Run Scoring Environment (WRSE) = Player Total Runs / ((2 * (league Runs/Game)^.715) - (2 * (Runs per Game involving Player)^.715))
    Wins Above Replacement bWAR = WAA + Wins Run Scoring Environment 

Фанграфы используют:

fWAR = (wRAA + UZR (Ultimate Zone Rating) + wSB (weighted Stolen Base runs) + UBR (Ultimate Base Running) + Positional Adjustment + League Adjustment + Replacement Level)/ Runs Per Win

Количество пробежек на победу можно посмотреть здесь

Чтобы ответить на ваш первый вопрос. Экстраполяция DWAR из fWAR:

fDWAR = UZR / Runs Per Win 

Подробный анализ того, как рассчитать UZR, смотрите здесь .

Как вы, вероятно, видите, экстраполировать DWAR из bWAR немного сложнее.

W-L% = ((League Runs/Game / 2)^(Runs/Game involving Player))/((League Runs/Game / 2)^(Runs/Game involving Player) + ((League Runs/Game / 2)- Player Defensive Runs)^(Runs/Game involving Player))
DWAA = (W-L% - .5) * Games Played
DWRSE = Player Defensive Runs / ((2 * (league Runs/Game)^.715) - (2 * (Runs per Game involving Player)^.715))
DWAR = DWAA + DWRSE

Более подробный анализ того, как рассчитать DRS, см. здесь .

Чтобы ответить на ваш второй вопрос . Статистика, используемая для современных побед в обороне, относится примерно к 2002 году (ссылка на бейсбол использует их, начиная с 2003 года), прежде чем в этом году вместо UZR или DRS используется TZR. TZR — это система, разработанная Шоном Смитом, краткое описание которой можно найти здесь ., который распределяет удары отбивающих по позициям игроков в зависимости от типа и местоположения отбитого мяча. Они были в определенной степени реконструированы из исторических игр по игровым источникам, но данные становятся значительно более производными, если доступны только тип отбитого мяча и расположение аутов. Поэтому, если вы хотите сохранить все равными, менее справедливо сравнивать DWAR для игроков до 2003 года с текущей статистикой, чем дальше вы будете возвращаться, тем ближе вы подойдете к точке, в которой вся статистика основана на данных игры за игрой. разного качества. Справедливости ради следует отметить, что в начале 20-го века очки в коробках были гораздо более качественными, чем в 40-х годах и позже из-за большего потребления бейсбола по радио и более подробных письменных обзоров.

Я бы не сказал, что есть точка, в которой наблюдается экспоненциальный спад, особенно потому, что блестящие люди, которые работали над этим анализом, прошли кропотливые шаги, чтобы вернуться в прошлое и попытаться исправить свои методы, когда становятся очевидными вопиющие ошибки.

Кстати, данные о пойманных на краже могут быть переменными в зависимости от источника данных, особенно для baserunner. Смотрите этот пост.

По какой формуле рассчитывается DWar?

Цитирую из Википедии :

Четко установленной формулы ВОЙНЫ нет.


экспоненциально падает точность статистики после определенного количества лет назад

Я не вижу причин, по которым точность падала бы в геометрической прогрессии. Это фраза с очень специфическим математическим значением, и я не вижу здесь механизма, который привел бы к экспоненциальному изменению точности.


есть ли известная граница, где цифры перестают быть достоверными?

Даже если бы он существовал, это зависело бы от того, какую именно формулу (D)WAR вы используете.

Это комментарий, а не ответ.
Вопрос "какая формула для расчета DWAR?". Ответ: «Такой формулы нет». Сделанный.
Таких формул много. Вопрос неясен, как указано, но ничто из приведенного выше не дает полезного ответа на вопрос.