忘 그리고... 望

sceptre.egloos.com



Baseball RC와 WAR 2017/01/19 11:24 by Ozzie

작년 6월 쯤에 친구의 "혹시 WAR하고 RC류는 어느정도로 연관되는 거임? 개념은 알겠는데 계산식은 봐도 모르겠더라고 ㅋㅋ"라는 질문에 다른 게시판에 끄적여 놓은 글. 
just archiving...

------------
RC와 WAR

저 둘 사이의 관계는, WAR가 타석에서의 기여분 계산할 때, 팀 득점 기여도를 산출한 뒤 그걸 승수로 환산하기 때문에 두 스탯의 컨셉만 보면 관련 있어 보이는데 실제 수식적인 연관관계는 없다. (물론 잘하는 놈이 둘다 좋겠지)
RC보다는 wRC가 WAR와 직접적으로 관계가 있는데, 그 이유는 wRC와 WAR는 타자의 경우 wOBA로 부터 구하기 때문이다. 즉 저 두 값은 wOBA를 구하고 그것을 다시 가공을 해서 뽑아낸 값들이다. 

RC와 wRC가 이름이 비슷해서 RC를 가공하면 wRC가 나올것 같은데, 이게 부모가 다른 놈들이다. RC는 빌 제임스 아저씨 발명품, wRC는 톰 탱고 아저씨 발명품. 
각각에 대해 좀 더 살펴보자.

우선 RC.
빌 제임스는 간단하게, "출루횟수*진루횟수/기회"를 그 타자의 팀 득점 기여분이라고 생각하고 시작했다. 그래서 출루율 * TB(total base)로 러프하게 계산해도 된다. 
아님 OBP * SLG * AB (두 비율 스탯 모두 분모가 AB라 AB로 두번 나눠서 한번 곱해줌). 이 관계식에 OPS가 선수 실력 또는 연봉과 상관관계를 가질 수 있는 힌트가 숨어있다. 실제 의미가 있는 것은 OBP와 SLG의 합이 아니라 곱이지만. 대체로 합이 크면 곱이 크니깐.
OPS가 보기는 쉽고 구하기도 쉽고, 먼가 있을거 같은데 사실 까보면 의미/실체가 없는 숫자인데, 이거 크면 잘 하는 선수인 이유가 저 관계식이다. 따라서 합이 큰 선수가 잘 하는 선수다라는 건 맞는데 맞은 이유가 곱이 의미가 있어서 곱이 큰 선수가 잘 하는 선수이기 때문이다. (아, 국어 어렵네. 중언부언.) 
이런 간단한 아이디어에서 출발했지만 좀 더 정확하게 구하고자 하는 욕심에 계산은 점점 더 복잡해져 간다. 
계산식 복잡해지는 과정은 위키 참조: https://en.wikipedia.org/wiki/Runs_created#Formula
시작은 wOBA보다 훨씬 간단한 컨셉에서 간단한 식으로 시작했는데, 결국 이리저리 보정하다 보니 그냥 wOBA 처럼 모두 다 통계처리해서 가중치 구하나 이거 구하나라고 할 만큼 이런 저런 상수들이 붙어서 식이 더러워졌다 ㅋㅋ 
RC가 누적 스탯이라 비율화 시킨 것이 RC/27. 한 타자가 혼자 27아웃 (=1경기) 당하는 동안 만들어낸 점수랄까... 

wRC는, weighted RC라해서 RC의 파생품일 것 같은데 실은 wOBA의 파생품.
탱고가 제임스의 컨셉이 그럴 듯해보였는지 본인이 고안한 wOBA로 부터 구한다. wOBA가 타석에서의 각 이벤트에 대한 득점 기대확률을 가중해서 평균내고 출루율 스케일에 맞게 스케일 factor를 곱해준 값이기 때문에, 스케일 팩터를 털어내면 이게 타석당 실제 득점 기대값이기 때문에, 대충 타석수 곱해주면 rough하게 계산 끝. 보정을 좀 해주긴 하지만, 대충 컨셉상. 

타석에서의 WAR에 대한 기여분은 단순히 wRAA (weighted Runs Above Average)를 구한뒤, 1승에 필요한 득점수 R/W (runs/wins)로 나눠서 구하게 되는데, R/W 구하려면 피타고리안 승률 공식이니 뭐니 들어가야 되고 타고투저니 투고타저니 해서 그때 그때 다른데 이건 http://www.fangraphs.com/guts.aspx?type=cn 여기에 매해 정리되어 있다. 보통 대충 구할 때 10을 쓴다. 사실 링크는 wOBA 구하는데 필요한 상황별 가중치를 통계처리해서 구한 결과 테이블인데 그거 제일 끝에 R/W 있음. (즉, 이건 WAR 구하는데 쓰이는 테이블임 ㅋ)

wRAA는 wOBA에서 리그 평균 wOBA 빼고 타석수 곱한다. (물론 스케일 팩터 털어내고) 즉, wRC를 리그 평균이 0이 되도록 조정한 값이랄까? 

하튼 결론은 
대충 타석 WAR 기여분 = wRAA/10
대충 wRAA + 리그 평균 wRC = wRC니깐 
wRC와 타석에서 WAR 값의 상관 관계는 정리 될 듯. 

RC는 wRC랑 이름만 비슷한... 김민호랑 이민호 관계 쯤 된다고 하자. 

쓰고 보니, 뭐 엄청 복잡하게 읽는 사람 헷갈리게 써 지네; 마지막 4~5줄이 전부인데 ㅋㅋ 

p.s. RC와 OPS는 어제 OOO형 댓글에 달았던 장타율에 대한 왜곡에서도 차이가 발생. OPS는 합이라 2루타면 1출루+2진루로 3진루처럼 보이지만, RC는 1출루x2진루로 2진루. 뭐 홈런타자가 타격왕보다 연봉을 더 잘 받는 특성상 장타율 왜곡이 있는 OPS가 연봉과 상관관계가 더 높을 수있다. 근데 팀 승리에 더 도움이 되는지는... (뭐, 티켓/유니폼 판매, 팀 인기 등의 부가적인 요인을 생각하면... )





덧글

댓글 입력 영역



쥔장 한 마디..

希望本是无所謂有,
无所謂无的。

這正如地上的路,
其實地上本沒有路,
走的人多了,
也便成了路。

- 魯迅