프로그래밍/AI로 통계공부

[AI와 로또를] #11 — 야구는 기억하고, 로또는 잊는다

Tiboong 2026. 6. 17. 10:01
728x90

지난주에 우리는 또 패턴 하나를 찾아냈다. "극단이 한 번 터지면 다음 주엔 번호판이 싹 갈리더라"는 것. 역대 그런 적이 셋 있었고, 셋 다 그랬다. 그래서 이번 주에도 우리는 그 셋을 근거로 30조합을 뽑았다. 근거랍시고.

그런데 이 글은 그 베팅이 맞았는지 틀렸는지에 관한 글이 아니다. 토요일 결과는 토요일에 나오고, 맞든 틀리든 그건 또 다음 이야기다. 오늘 하고 싶은 건 좀 다른 질문이다. 우리는 왜 매주 이 짓을 반복하는가. 그리고 왜, 그게 재밌는가.


어제의 나는, 오늘의 나를 얼마나 알까

질문 하나 던져보자. 어제 야식을 먹은 사람이 오늘도 야식을 먹을까?

 

대충 그럴 것 같다. 야식이라는 건 습관에 가까우니까. 어제의 내가 오늘의 나를 꽤 알려준다. 그런데 어제 기분이 좋았다고 오늘도 기분이 좋을까? 이건 좀 다르다. 어제 좋았다가 오늘 폭삭 가라앉기도 하고, 어제 바닥이었다가 오늘 멀쩡하기도 하다. 기분은 어제의 내가 오늘의 나를 별로 못 알려준다.

 

통계에는 이걸 재는 자가 있다. 자기상관(autocorrelation) 이라고 부른다. 말은 거창한데, 뜻은 단순하다. "과거의 값이 미래의 값을 얼마나 알려주느냐." 1에 가까우면 어제가 오늘을 잘 알려주는 거고(습관처럼), 0에 가까우면 어제가 오늘에 대해 입을 다무는 거다(기분처럼).

이 자를 들고, 우리가 11주째 붙들고 있는 로또 공한테 슬쩍 갖다 대보자. 그 전에, 잠깐 야구장에 들렀다 가자.

야구 안에서도 기억하는 놈과 잊는 놈이 갈린다

야구는 숫자의 운동이다. 그리고 그 숫자들이 다 같은 성격은 아니다.

 

투수의 삼진율(K%) 을 보자. 작년에 타자를 잘 돌려세우던 투수는 올해도 잘 돌려세운다. 자기상관이 0.868. 거의 0.9다. 삼진을 잡는 능력은 운이 아니라 실력이라, 한 해의 성적이 다음 해를 또렷하게 알려준다. 볼넷율, 홈런율, 순장타율(ISO) 도 0.7 언저리에서 비슷하게 군다. 작년의 그 선수가 올해의 그 선수를 상당히 알려주는 것이다. 야구가 "어제를 기억하는" 종목이라는 건 이런 뜻이다.

 

그런데 같은 야구 안에서도 기억이 흐릿해지는 지표가 있다. BABIP(인플레이 타구 안타율)이라는 게 있는데, 쉽게 말해 "맞혀서 페어 그라운드로 굴러간 공이 안타가 된 비율"이다. 이건 자기상관이 0.380까지 뚝 떨어진다. 왜? 운이 잔뜩 섞여 있어서다. 잘 맞은 타구가 야수 정면으로 가서 잡히기도 하고, 빗맞은 공이 절묘하게 떨어져 안타가 되기도 한다. 작년에 BABIP가 좋았다고 올해도 좋으리란 보장이, 삼진율만큼 단단하지 않은 것이다.

 

그러니까 야구라는 한 종목 안에도 스펙트럼이 있다. 한쪽 끝엔 "어제를 또렷이 기억하는" 삼진율이, 반대쪽 끝엔 "어제를 절반쯤 잊는" BABIP가 있다. 같은 야구인데도 이렇게 다르다.

그리고 이 그래프의 맨 오른쪽 끝, 절벽처럼 뚝 떨어진 자리.

그 절벽 너머에 로또가 있다

로또 번호의 자기상관은 0.005 다.

 

소수점 아래 셋째 자리에서야 겨우 0이 아닌 척하는 숫자. 사실상 0이다. BABIP가 0.380으로 "절반쯤 잊는다"면, 로또는 "통째로 잊는다." 지난주에 27번이 나왔다는 사실은, 이번 주 27번이 나올지 말지에 대해 아무것도 알려주지 않는다. 정말로 아무것도.

 

야구의 BABIP조차 0.38은 된다. 운이 많이 섞였다지만 그래도 실력의 그림자가 어렴풋이 남아 있다는 뜻이다. 그런데 로또는 그 그림자마저 없다. 야구에서 "가장 운에 휘둘리는 지표"보다도 70배 넘게 더 운에 휘둘린다. 아니, 휘둘린다는 말도 과하다. 그냥, 어제와 오늘 사이에 아무 끈이 없다.

 

11주를 끌고 오면서 우리가 매주 찾으려던 게 바로 이 끈이었다. "27번이 일곱 주째 안 나왔으니 이제 나올 때 됐다"거나, "28번이 네 주 연속 나왔으니 흐름이 있다"거나. 전부 어제가 오늘을 알려준다는 가정 위에 서 있던 베팅이었다. 그 가정의 크기를 숫자로 재면, 0.005다. 우리는 0.005짜리 끈을 11주 동안 붙들고 늘어졌던 셈이다.

 

같은 자를 두 세계에 동시에 들이대면, 그 차이가 그림 한 장으로 드러난다.

 

왼쪽 야구는 점들이 대각선을 따라 길쭉하게 줄을 선다. 작년 삼진율이 높았던 타자는 올해도 오른쪽 위에, 낮았던 타자는 왼쪽 아래에. 어제가 오늘의 자리를 거의 정해준다. 오른쪽 로또는? 점들이 사방으로 흩어진 구름이다. 직전 30회에 자주 나왔든 뜸했든, 다음 30회와는 아무 약속이 없다. 같은 자로 쟀는데 한쪽은 직선이 되고, 한쪽은 구름이 된다. 이게 풀리는 문제와 안 풀리는 문제의 맨얼굴이다.

정렬이 만든 유령

여기서 한 번 더 정직해질 자리가 있다.

 

지난 며칠, 나는 "공이 나온 순서" 데이터를 새로 구해서 뒤졌다. 우리가 늘 보던 정렬된 당첨번호 말고, 추첨기에서 공이 실제로 굴러나온 날것 그대로의 순서 말이다. 1228회를 예로 들면, 정렬해 적으면 24·29·30·31·35·44라 29-30-31이 손잡고 선 "삼총사"처럼 보인다. 그런데 공이 실제로 나온 순서는 30 → 29 → 44 → 31 → 35 → 24였다. 29와 30은 첫째 둘째로 붙어 나왔지만, 31은 저 멀리 넷째였다. 삼총사 같은 건 추첨기 안에 없었다. 내가 결과지를 오름차순으로 줄 세우면서 만들어낸 것이다.

 

900회가 넘는 데이터를 이 날것 순서로 다 뒤졌는데, 신호가 0이었다. 첫 공이 어느 번호든 고르게 나오고(편향 없음), 추첨기 세 대가 똑같은 손이고, 연속으로 나온 공끼리도 아무 상관이 없었다. 비복원 추첨이면 물리적으로 반드시 있어야 할 미세한 끈조차 노이즈에 묻혀 안 잡혔다. 진짜 있는 신호도 안 보이는 마당이었다.

 

이게 왜 중요하냐면 — 야구의 0.868과 로또의 0.005 사이의 진짜 차이가 여기 있기 때문이다. 야구의 삼진율은 데이터를 어떻게 정렬하든 끈이 살아 있다. 실재하는 신호니까. 반면 로또에서 우리가 "찾았다"고 흥분했던 패턴들은, 정렬을 풀어버리면 같이 사라진다. 실재하는 게 아니라 보는 방식이 만든 그림자였던 것이다.

그래서 왜 또 야구가 아니라 로또인가

야구는 풀리는 문제다. 어제가 오늘을 알려주니까, 파고들면 언젠가 답에 가까워진다. 삼진 잘 잡는 투수는 내년에도 잘 잡을 거라고, 꽤 자신 있게 말할 수 있다. 그런데 바로 그래서, 야구에는 끝이 있다. 데이터가 쌓이고 쌓이면 "이 선수는 이런 선수다"라는 답지가 만들어지고, 어느 순간 우리는 그 답지를 외워버린다.

 

로또는 다르다. 어제가 오늘에 대해 입을 꾹 다물기 때문에, 답지가 영원히 안 만들어진다. 1,228회를 쌓아도 1,229회는 백지에서 다시 시작이다. 지난주에 깨졌어도, 이번 주는 아무 빚 없이 새로 출발한다. 만년 꼴찌가 없는 리그. 어제의 패배를 오늘로 끌고 오지 않는, 무심하지만 공평한 게임.

 

생각해보면 이게 묘하게 다정하다. 만약 로또에 진짜 패턴이 있어서 누가 풀어버린다면, 그날로 게임은 끝이다. 답이 나와버리니까. 그런데 0.005는 그 일이 절대 안 일어난다는 보증서다. 풀리지 않기 때문에, 우리는 이걸 영원히 가지고 놀 수 있다. 매주 그럴듯한 가설을 세우고("극단이 터졌으니 다음 주엔 싹 갈리겠지"), 거기에 꿈이든 촉이든 양념을 치고, 토요일 저녁에 결과 앞에서 웃거나 운다. 맞으면 "거 봐, 내 촉이!", 틀리면 "역시 0.005야". 어느 쪽이든 다음 주 이야깃거리가 생긴다. 끝나지 않는 떡밥 공장인 셈이다.

 

그러니 11주 동안 우리 트랜스포머가 매주 자신만만하게 여섯 숫자를 내놓은 것도, 이제는 좀 다르게 보인다. 데이터를 더 줘도 두 번 돌려도 거의 같은 답을 뱉는 그 고집은, 모델이 "모른다는 걸 모르는" 우스운 장면이면서 — 동시에 우리가 매주 똑같이 하는 짓이기도 하다. 알면서도 또 베팅하고, 안 될 걸 알면서도 또 촉을 세운다. 모델만 멍청한 게 아니다. 우리도 똑같이, 기꺼이, 멍청하게 논다. 그 멍청함이 재밌어서.

그래서 어제가 오늘을 0.005밖에 못 알려준다는 그 자리에서, 우리는 이번 주에도 또 30조합을 뽑았다. 못 맞힐 걸 알면서. 토요일에 결과가 나오면 우리는 또 웃거나 울 거고, 그리고 다음 주에 또 뽑을 거다. 답이 영영 안 나오는 게임이라서, 우리는 영영 그만둘 이유가 없다. 무심한 게임의, 무심해서 다정한 구석이다.


다음 편 예고: 야구로도 왜 돈을 못 따는가 — 수수료라는 보이지 않는 세금 예고 둘: 벼락은 같은 사람을 일곱 번 때렸다 — 로이 설리번과 로또의 무심함 (확률 비교 편)

728x90