영화 ‘머니 볼’은 실제 MLB의 성공 신화를 쓴 빌리 빈 단장의 이야기를 영화화한 것으로 많은 화제를 불러일으킨 작품이다. 오클랜드 에슬래틱스 팀의 단장을 맡으며 최하위였던 팀은 5번이나 포스트시즌에 진출시키며 기적의 역전 드라마를 만들어 낸 장본인이다. 선수들의 데이터가 중요시 않았던 시절 그는 오로지 경기 데이터 분석 자료만을 바탕으로 선수들의 재능을 평가하고, 적은 비용으로 높은 효과를 거둘 수 있는 선수들을 트레이드하면서 MLB 140년 역사상 최초로 20연승이라는 대기록을 세우기도 했다.
서울 코엑스 메가박스에서 열린 영화 `머니볼` 홍보차 레드카펫에 참석한 할리우드 스타 브래드 피트(William Bradley Pitt).
이런 활약으로 2007년 미국 경제전문지 ‘포브스’가 선정한 미국 경제에 가장 큰 영향력을 미치는 파워 엘리트 30인에 선정되는 등 세계적 유명 인사로 거듭났다. ‘머니 볼’의 의미는 바로 경기 데이터를 철저하게 분석해 오직 데이터를 기반으로 적재적소에 선수들을 배치해 승률을 높이는 게임 이론을 의미한다. 현대 프로스포츠에서도 승률은 곧 돈을 이끌어 내는 원천이기 때문에 과학적인 근거를 기반으로 한 경기력 향상은 누구에게나 매력적인 방법이 될 수 밖에 없다.
많은 종목 중에 통계를 오래 전부터 이용하고, 중요시 한 종목은 바로 야구이다. 야구 통계학의 시초는 1860년대 헨리 채드윅은 박스 스코어를 개발했고, 1872년 선수들의 수비능력을 계량화 한 지표를 제시하였다. 이후 1944년에는 브루클린 다저스의 단장인 브랜치 리키가 야구팀 최초로 통계학자 앨런 로스를 고용하게 된다. 당시 로스는 통계학적 관점에서 출루율과 장타율이 타자를 평가하는 중요한 개념이라는 것을 인지하고, 현대 OPS(On base Plus Sluggling)의 이론적 배경을 제시하였다.
코리안 메이저리거 추신수(신시내티 레즈).
이러한 과정을 거쳐 1970년 빌 제임스는 SABR(The Society for American Baseball Research을 창시고, 야구를 통계학적 관점에서 분석하는 방법론인 세이버메트릭스(Sabermetrics)를 고안하게 된 것이다. 당시에는 많은 영향을 주지 못했지만, 해마다 펴낸 ‘야구연감’을 통해 80년대 이후부터 큰 주목을 받기 시작했다. 같은 타율을 기록하더라도 행운의 안타를 많이 친 선수의 타율과 홈런을 많이 친 선수의 타율은 엄연하게 다른 가치를 가지고 있다는 것이 세이버메트릭스가 지향하는 목표인 것이다.
야구에서는 공격과 수비로 나뉘어 측정하게 되는데, 측정할 수 있는 기본 데이터들을 기반으로 데이터와 데이터 간의 연관성을 예측하여 의미 있는 또 다른 수치를 가지고 평가를 하는 것이다. 위에서 언급한 OPS(On base Plus Sluggling)가 바로 대표적인 예라고 볼 수 있는데, 타자가 안타를 치고 나가는 것이 중요한 시대에서는 사구(ball four 또는 hit by pitch ball)가 저평가 되었던 시절이 있었는데, 현대 야구에서는 안타와 더불어 사구로 인한 출루율이 매우 중요한 평가 기준이 되고 있다. 또한 장타율 역시 득점이나 승리 공헌의 가능성이 높기 때문에 출루율과 장타율의 합인 OPS는 타자를 평가하는 주요 기준이 되었다.
서울 고척스카이돔에서 `2017 월드베이스볼클래식(WBC)`을 앞두고 대한민국 WBC 대표팀과 쿠바와 1차 평가전에서 박찬호 해설위원이 시구행사에서 멋진 폼으로 공을 던지고 있다.
실제 OPS와 팀 득점의 상관관계는 0.945(94.5%)에 달하는 것으로 알려져 있어 과학적으로도 근거가 충분하다. 그런데 이보다 상관관계가 더 있는 지표가 있는데 그것은 바로 단순 합의 평가가 아닌 출루율과 장타율을 곱하는 방식이다. 이러한 과정은 단순이 공식을 만들어 가는 과정이라기보다는 수많은 가설들을 통해 입증된 결과를 바탕으로 보다 가능성을 높이는 방식으로 접근하고자 하는 세이버메트릭션들의 노력이 담겨져 있는 것이다. 혹자는 야구가 더 이상 선수들의 플레이가 아닌 구구단표의 대입하는 방식이라면서 데이터 과학의 야구는 비난하는 사람들도 있다. 그러나 통계 결과는 어디까지나 확률을 의미하는 수치이다. 100%라는 수치는 있을 수가 없기 때문에 단 1%의 가능성이라도 스포츠에서는 변수가 많다. 아직 국내 프로스포츠 현장에서는 도입이 안 되고 있는 데이터 과학이 언젠가는 다양한 종목으로 확산되어 또 다른 재미를 주지 않을까 한다. (김진국 교수/navyjk@daum.net)