메인화면으로
[인터뷰] 야구 분석의 미래, 스탯캐스트는 어떻게 만들어지나?
  • 페이스북 공유하기
  • 트위터 공유하기
  • 카카오스토리 공유하기
  • 밴드 공유하기
  • 인쇄하기
  • 본문 글씨 크게
  • 본문 글씨 작게
정기후원

[인터뷰] 야구 분석의 미래, 스탯캐스트는 어떻게 만들어지나?

[베이스볼 Lab.] 트랙맨 베이스볼의 홍기훈을 만나다

최근 메이저리그 중계를 보다 보면 '스탯캐스트'(statcast)라고 불리는 새로운 기술을 종종 볼 수 있다. 좋은 수비가 나왔을 때 수비수의 반응속도, 주력, 공까지 얼마나 최단거리로 달렸는지 등을 화면에 나타낸다. 덕분에 팬들은 더 흥미롭게 야구를 볼 수 있게 됐고, 구단들은 그 정보를 이용해 더욱 정확하게 선수를 분석한 자료를 이용하게 됐다.

그러나 중계에서 소개되는 자료는 빙산의 일각일 뿐이다. 실제로는 훨씬 더 많은 데이터가 수집되고, 우리가 모르는 뒤에선 그 자료들을 적극적으로 활용하여 팀 운영에 반영하고 있다. 그 누가 '세밀함은 일본이 미국보다 앞선다'했던가. 메이저리그 팀들은 이미 커브볼의 회전수 같이 도저히 사람의 눈으로는 알아낼 수 없는 자료들까지도 적극적으로 이용하고 있다.

그런 자료들이 어디서 갑자기 하늘에서 뚝 떨어진 것은 아니다. <베이스볼 Lab.>이 뒤에서 묵묵히 그런 자료를 제공하는 일을 하는 한국인 직원 홍기훈 씨와 이메일로 자세한 이야기를 나눴다.

안녕하세요. 간단한 자기 소개 부탁드립니다.

안녕하세요. 홍기훈이라고 하고요. 트랙맨 베이스볼 애널리틱스/오퍼레이션(Analytics/Operation) 부문에서 일하고 있습니다.

트랙맨 베이스볼은 어떤 일을 하는 곳인가요?

트랙맨이라는 회사는 덴마크에 본사를 둔 레이더회사에요. 미국에 넘어와서는 골프에 이어서 야구로 영역을 넓혔고요. 레이더를 구장들에 설치해서 얻어낸 데이터를 분석하고 팀들에게 공급하는 일을 합니다.

레이더 회사와 야구라. 어떻게 보면 전혀 관련이 없어 보이는데요. 그 중에서도 애널리틱스/오퍼레이션은 어떤 부분을 맡아주시는 건가요?

레이더에서 들어온 데이터를 정리하고 그 데이터의 진짜 의미가 뭔지, 팀들이 어떻게 사용할 수 있는지 연구하는 일을 합니다.

그렇다면 메이저리그 경기장에 데이터를 수집하기 위한 레이더가 설치되어 있다는 건가요??

네 그렇습니다. 메이저리그 구장에는 레이더가 다 설치되어있고요. 90여 개의 마이너리그 구장과 다수의 대학구장에도 설치되어있습니다. 일본에도 설치되어있고요.

▲템파베이 레이스의 홈구장인 트로피카나 필드에 설치되어 있는 레이더 ⓒ홍기훈
그렇게 레이더를 통해 들어온 데이터를 정리하고 연구하신다고 하셨는데요. 처음 들어오는 데이터를 가공하는 과정은 어떤가요?

일단 레이더에서 들어오는 건 시그널로 들어오는데요, 덴마크에서 만든 프로그램이 그 시그널을 숫자들로 바꿔줍니다. 그 숫자들에 있는 노이즈를 제거하고 팀들이 원하는 형태로 만들어서 전달합니다.

데이터를 수집한다 하면 팬들이 가장 먼저 떠올릴만한 것은 누가 안타를 쳤고, 누가 볼넷을 내줬고 이런 것들일 텐데요. 사실 그런 데이터는 굳이 레이더를 사용하지 않아도 수집할 수 있는 부분입니다. 그렇다면 레이더로는 어떤 데이터를 수집하는 건가요?

일단 투구 쪽은 구속, 투수가 공을 어느 지점에서 놓는지, 마운드에서 얼마나 앞으로 나와서 공을 놓는지, 공이 투수의 손을 떠난 뒤 얼마나 움직이는지 등을 재고요. 트랙맨만이 잴 수 있는 항목으로는 공의 회전수가 있습니다. 그리고 타구 쪽으로는 공이 방망이에 맞아 나갈 때 속도, 각도, 궤적 등을 재고요. 비거리를 공식으로 추산하는 게 아니라 직접 재는 점도 특이하다고 할 수 있겠네요.

그럼 그런 데이터들을 어떻게 활용할 수 있나요?

각 구단의 분석팀에서는 다른 곳에서 구할 수 없는 공 회전수같은 데이터를 선수평가에 사용하는 것으로 알고 있습니다.

구단들이 실제 그 데이터를 이용해서 선수를 평가한다는 것이군요. 세이버메트릭스가 널리 퍼지게 된 것도 결국 ‘머니볼’로 대표되는 오클랜드의 성공 때문이었습니다. 레이더로 수집한 데이터를 사용해서 성공한 사례가 있나요?

<엠엘비닷컴>의 기사에도 실린 얘긴데요, 애스트로스 선발투수 콜린 맥휴의 경우를 들 수가 있겠네요. 맥휴는 콜로라도 록키스에서는 별다른 활약을 못 보여주고 있었는데요, 그가 던지는 커브볼의 스핀수를 마음에 들어한 애스트로스가 그를 웨이버로 영입해서 보다 많은 커브를 던지라고 주문했고요. 올 시즌 굉장히 좋은 모습을 보이고 있습니다.

▲콜린 맥휴의 브레이킹볼 구사율 변화. 맥휴는 2013년 12월 휴스턴으로 이적했다

콜린 맥휴가 다른 투수가 된 원인으로 패스트볼 계열 구종 구사를 줄이고, 커브 구사율을 높인 점을 꼽는 칼럼을 읽은 적이 있었는데 이게 다 데이터 분석 때문이었군요. 맥휴가 등판하는 경기를 보면 뿌듯하시거나 그러신가요?

맥휴를 분석한 건 제 입사 전 일이라 직접적인 관련은 없지만 엠엘비닷컴에 기사가 뜨고 난 뒤 사람들이 맥휴를 보며 트랙맨 이야기 종종 하는 건 좋더라고요

앞서 메이저리그 뿐 아니라 마이너리그나 대학구장, 일본 등에도 레이더가 설치되어 있어 데이터를 수집한다고 하셨는데요. 그렇다면 선수 육성이나, 드래프트와 관련해서도 이런 데이터를 이용하게 되겠군요?

네 그렇습니다. 대학뿐만 아니라 몇몇 고등학교 대회도 데이터를 수집하고 있고요. 영역을 점차 확대하려는 과정 중에 있는 걸로 알고 있습니다.

그렇다면 한국에도 설치 될 가능성이 있는 걸까요? 국내에서도 슬슬 팀 운영에 세이버메트릭스를 적극적으로 이용하는 구단들이 나타나는 추세인데요.

네 그렇습니다. 그렇지 않아도 지금 몇 명이 한국으로 출장 가 있는 걸로 알고 있습니다.(*좋은 결과가 있어 조만간 한국 야구 데이터도 들어올 것이라 한다. 필자)

좋은 소식이 들려왔으면 좋겠네요. 작년 포스트시즌이나 올해 초부터 메이저리그 중계방송을 보다 보면 본격적으로 <스탯캐스트>라 불리는 트래킹 시스템이 종종 보이던데요. 그것과도 관련이 있는 건가요?

네. 스탯캐스트는 MLB에서 미디어 사업 쪽을 맡고 있는 MLBAM(MLB 어드밴스드 미디어)의 새 프로젝트인데. 트랙맨과 캐런히고 두 회사가 합작해서 공 뿐만 아니라 필드 위의 모든 선수들을 추적하고 그 데이터를 중계방송에 보여주는 프로젝트입니다.

스탯캐스트 덕에 새로운 정보를 많이 접하고 있어서 야구 팬으로서 요즘 참 행복한데요. 얼마 전에 인상적인 자료를 본 적이 있습니다. 1루로 헤드퍼스트 슬라이딩을 하는 것이 확실한 손해라는 것도 스탯캐스트에서 자료를 보여주더라구요. 야구 좋아하시니 응원 팀이 있으실 텐데 응원팀 선수가 1루로 헤드퍼스트 슬라이딩을 하는 모습을 보면 어떠신가요?

▲헤드퍼스트 슬라이딩을 할 경우 오히려 1루에 더 늦게 도달하게 된다. MLBAM 자료화면.
글쎄요. 헤드퍼스트 슬라이딩하면 손해라는 건 선수들도 많이 알고 있을 겁니다. 그래도 뭐 스포츠를 하다 보면 머리보다 몸이 앞서는 경우가 생길 수 밖에 없으니까요. 이해는 합니다. 다만 투수한테 손을 밟힌다던가 하는 부상이 생길 수도 있으니 그런 건 좀 조심했으면 좋겠네요.

그러고 보니 응원 팀에 대한 이야기는 하지 않았네요. 메이저리그나 한국프로야구 구단에 응원하는 팀이 있는지, 어떤 계기로 응원하게 된 건지가 궁금합니다.

양키스 팬입니다. 1998년에 미국에 처음 왔는데요. 사촌 형이 양키스타디움에 데리고 간 이후로 쭉 양키스 응원하고 있습니다.

양키스가 돈만 펑펑 쓰는 구단이라는 이미지가 있는데 사실 이런 자료들을 이용하는데 있어서도 매우 선진적인 구단으로 알고 있는데요. 자신이 하는 일이 실제 응원하는 팀 구단 운영에 반영될 수 있다는 점에 대한 느낌은 어떠신가요?

맞습니다. 양키스는 수비할 때 시프트도 굉장히 많이 쓰고요. 분석 팀에도 굉장히 많은 인원을 채용하는 것으로 알고 있습니다. 제가 하는 일이 대단한 일은 아니지만 여러 팀들에게 직접 쓰일 수 있다는 건 굉장히 보람된 일이죠. 재밌습니다.

그런 보람되고 재미있는 일을 하게 된 계기는 있으신가요?

학부 때는 수학전공을 했는데요. 수학을 가지고 할 수 있는 일이 뭘까 이리저리 찾아보는데 딱히 끌리는걸 못 찾겠더라고요. 그러다가 팬그래프에서 BIS 채용공고 글을 보게 됐고, 그래서 작년에 BIS에서 일하기 시작하면서 이쪽 업계(?)에 발을 들이게 됐습니다.

팬그래프라. 웬만한 야구 덕후가 아니라면 들어가지 않는다는 바로 그 곳이군요. 야구 덕후시라면 잘 아시겠지만, Pitch F/X가 대중에게 공개되면서 ‘덕후’들이 수많은 아이디어를 내놓았고, 그걸 인정받아 구단에서 일하게 되거나, 칼럼니스트가 된 사람들도 많습니다. 대표적인 게 피치 프레이밍이구요. 그러나 MLBAM이 최근 맛배기로 보여주고 있는 자료들은 대중에게 완전히 공개되지 않고 있는데요. 여기에 대해 개인적으로 어떻게 생각하시나요?

개인적으로도 야구덕후이기에 앞서 숫자덕후라서요, 가지고 놀 장난감이 늘어나는 건 굉장히 반가운 일이죠. 다만 치열한 정보전에서 앞서나가려는 구단의 입장도 충분히 이해합니다.

안 그래도 현지에서는 이를 지적하는 여러 칼럼이 나와 있더라구요. 이를 두고 구단과 야구 팬들 사이의 데이터를 놓고 벌이는 전쟁이라고 표현하기도 하더군요. 다시 주제로 돌아와서. 이렇게 야구의 모든 플레이 하나하나가 다 숫자로 표현되는 것을 두고 야구가 더 재미없어진다라는 팬들도 존재합니다. 이런 분석이 더 적극적으로 활용될 미래의 야구는 정말로 더 재미없어질까요?

전혀요. 훨씬 재밌어질 거라고 생각합니다. 스마트폰이 이전의 전화기보다 더 복잡해졌다고 통화하는 게 더 재미없어졌다고 생각하시는 분은 없겠지요. 복잡한 수식을 더 직관적으로 와닿게 설명하는 게 저 같은 스탯쟁이들이 할 일이라고 생각하고요. 시간이 지나서 일견 복잡해 보이는 스탯들도 대중들이 익숙해지면 널리 쓰일 것이라고 생각합니다.

2000년도 초반에 세이버메트릭스가 널리 퍼지게 되면서 팬들이나 구단이 선수를 평가하고 보는 기록들이 크게 바뀌었습니다. 이제 레이더로 추적되는 데이터의 시대가 온다면, 또 다시 패러다임이 변화하게 될 까요?

레이더로 보다 다양한 데이터를 얻으려고 노력하는 건 크게 보면 2000년대 초반의 세이버메트릭스 열풍과도 궤를 같이 한다고 생각합니다. 다른 사람들이 못보고 지나치는 부분을 캐치하는 것, 선수를 보다 다양한 측면에서 이해하는 것, 고정관념을 깨야하는 것 등이 특히 그렇고요. 기술의 발전이 이런 사고와 결합되면 시너지 효과가 굉장할 것으로 생각됩니다.

최근 류현진, 추신수, 강정호 등이 메이저리그에 진출하게 되면서 더 많은 야구 선수들이 메이저리그의 꿈을 꾸게 됨과 동시에 메이저리그 구단이나 관련 직종에서 일하고 싶어하는 사람들도 늘었습니다. 메이저리그 관련 일을 하고 싶은 사람들에게 조언을 해 준다면?

저도 조언을 드릴만한 위치에 있지는 못합니다만, 그래도 구단관계자들과 얘기해보면서 느낀 점을 감히 얘기해보자면 뭔가 독특한, 자신만이 내세울 수 있는 무기를 갈고 닦는 게 중요한 것 같습니다. 요즘 한국선수들이 메이저리그에 하나 둘씩 모습을 나타내면서 한국시장에도 관심이 커지고 있는데요. 한국어를 잘하고 한국 선수들을 잘 아는 것도 분명 그런 무기 중의 하나가 될 수 있다고 생각하고요. 무엇보다도 야구를 열심히 보고 즐기는 것이 가장 중요하다고도 생각합니다. 야구 일을 하다 보면 야구를 정말 좋아하지 않고서는 버티기 힘들 수도 있다는 생각을 해봤습니다. 야구 열심히 보시고요, 경기를 보면서 남들이 생각 못하는 부분 하나 둘씩 생각해보시면, 멀지 않은 미래에 하고 싶으신 일들 하게 되실 수 있을 거라고 생각합니다. 더 자세히 물어보고 싶으신 분은 개인적으로 연락 주셔도 좋고요. 트위터 @geehoonbaseball로 연락 주세요.

이 기사의 구독료를 내고 싶습니다.

+1,000 원 추가
+10,000 원 추가
-1,000 원 추가
-10,000 원 추가
매번 결제가 번거롭다면 CMS 정기후원하기
10,000
결제하기
일부 인터넷 환경에서는 결제가 원활히 진행되지 않을 수 있습니다.
kb국민은행343601-04-082252 [예금주 프레시안협동조합(후원금)]으로 계좌이체도 가능합니다.
프레시안에 제보하기제보하기
프레시안에 CMS 정기후원하기정기후원하기

전체댓글 0

등록
  • 최신순