기대값 사고 (expected value)

어떤 선택이 가져올 여러 결과를, 각 결과의 값에 그 결과가 일어날 확률을 곱해 모두 더한 하나의 평균값으로 환산해 비교하는 사고법. 눈앞의 한 번이 아니라 같은 선택을 무한히 반복했을 때 평균적으로 손에 쥐게 될 몫을 따지는 것이 핵심이며, 확률론과 의사결정 이론의 가장 기초적인 토대다.

너, 동전 던지기 게임 하나를 제안받았다고 해보자. 판돈을 걸고 동전을 던진다. 앞면이 나오면 너는 백만 원을 따고, 뒷면이 나오면 백만 원을 잃는다. 할까 말까. 너는 본능적으로 머릿속에서 무언가를 계산한다. 딸 가능성 절반, 잃을 가능성 절반, 액수는 똑같다. 밑질 것도 남을 것도 없는 게임이구나. 그래서 너는 시큰둥해진다. 그런데 누가 조건을 살짝 바꾼다. 앞면이면 이백만 원을 따고 뒷면이면 백만 원만 잃는다고. 그 순간 네 마음이 기운다. '어, 이건 해볼 만한데.' 방금 너는 누가 가르쳐 준 적도 없는 셈법을 썼다. 일어날 법한 각각의 결과에, 그게 일어날 가능성의 무게를 매겨, 하나의 점수로 합친 것이다. 오늘 이야기는 이 너무도 당연한 셈을, 도박판의 다툼 하나를 풀다가 처음으로 종이 위에 박아 넣은 두 사람에 관한 거다.

때는 대략 17세기 중엽, 1654년 프랑스. 슈발리에 드 메레라는 이름의 한 도박꾼 귀족이 풀리지 않는 문제 하나를 안고 있었다. 그가 던진 물음은 이런 거였다. 두 사람이 판돈을 걸고 여러 판 승부를 겨루기로 했는데, 승부가 다 끝나기 전에 게임이 중간에 깨졌다. 그렇다면 판돈을 어떻게 나눠야 공정한가. 지금까지 이긴 횟수대로? 그건 불공평하다. 앞으로 남은 판에서 뒤집힐 가능성이 멀쩡히 살아 있으니까. 이 '점수 나누기 문제'를 메레는 당대 최고의 두뇌에게 들고 갔다. 블레즈 파스칼이다. 파스칼은 혼자 끙끙대다 멀리 툴루즈의 또 다른 천재, 피에르 드 페르마에게 편지를 띄웠다. 그렇게 두 사람이 주고받은 편지 속에서, 인류는 처음으로 '아직 일어나지 않은 미래를, 일어날 확률로 무게 잡아 지금의 값으로 환산한다'는 발상을 또렷이 손에 쥐었다. 판돈은 이미 딴 몫이 아니라, 남은 판들에서 각자가 평균적으로 따낼 '기대되는 몫'에 따라 갈라야 한다는 답이었다.

이 편지를 곁에서 지켜본 젊은 네덜란드 사람이 있었다. 크리스티안 하위헌스. 그는 파스칼과 페르마가 말로 더듬던 것을 1657년 작은 책 한 권에 가지런히 정리해 세상에 내놓았는데, 바로 그 책에서 '어떤 도박의 값어치'라는 개념이 인쇄된 글자로 처음 정의된다. 결과마다 액수에 확률을 곱해 더하라는 그 한 줄. 우리가 지금 기대값이라 부르는 바로 그것이다. 도박판의 시비를 가리려던 셈이, 확률론이라는 학문의 주춧돌로 올라앉은 순간이다.

그런데 이 깔끔한 셈법은 곧 자기 발에 걸려 넘어진다. 너에게 게임 하나를 다시 내밀어 보겠다. 동전을 앞면이 나올 때까지 계속 던진다. 첫 판에 앞면이 나오면 2원, 둘째 판에 처음 나오면 4원, 셋째 판이면 8원, 이렇게 한 판 늦어질 때마다 상금이 곱절로 뛴다. 자, 이 게임에 너는 참가비로 얼마까지 낼 수 있나. 기대값대로 계산해 보면 끔찍한 일이 벌어진다. 2원 딸 확률의 몫이 1원, 4원 딸 확률의 몫이 또 1원, 8원의 몫이 또 1원… 끝없이 1원씩 더해져 기대값이 무한대로 발산한다. 셈법대로라면 너는 전 재산을 털어서라도 이 게임에 들어가야 마땅하다. 그런데 현실의 너는 어떤가. 막상 누가 이 게임을 팔면 기껏해야 몇 천 원쯤 내고 말 거다. 셈은 무한을 가리키는데 사람은 코웃음을 친다. 이 역설은 그 게임이 처음 논의된 도시의 이름을 따 상트페테르부르크 역설이라 불린다.

이 모순을 끝까지 물고 늘어져 푼 사람이 다니엘 베르누이다. 1738년, 그는 무릎을 치게 하는 답을 내놓는다. 사람이 진짜로 재는 건 돈의 액수 그 자체가 아니라, 그 돈이 자기에게 주는 만족이라는 거였다. 가진 게 없는 자에게 백만 원은 인생을 바꾸지만, 이미 백억을 쥔 부자에게 똑같은 백만 원은 먼지에 가깝다. 즉 돈이 불어날수록 거기서 얻는 만족의 증가분은 점점 쪼그라든다. 그래서 무한히 커지는 상금도, 만족으로 환산하면 더는 무한이 아니라 얌전한 유한값으로 수렴한다. 베르누이는 '기대되는 금액'을 '기대되는 만족'으로 갈아 끼움으로써 역설을 녹였고, 이 발상에 기대효용이라는 이름이 붙었다. 날것의 기대값 사고가 한 단계 자라난 결정적 대목이다. 결과의 무게를 잴 때, 객관적 액수가 아니라 그 결과가 나에게 갖는 진짜 가치로 재라는 것.

이 도구를 가장 날카롭게 벼린 자리는 뜻밖에도 20세기 통신 연구소였다. 1956년, 벨 연구소의 존 켈리라는 물리학자가 도박과 베팅에서 판돈의 몇 할을 걸어야 장기적으로 재산이 가장 빨리 불어나는지를 기대값의 논리로 풀어 하나의 공식으로 못 박았다. 한 번의 대박이 아니라 같은 베팅을 평생 반복했을 때의 평균 성장을 최적화하는 그 공식은, 훗날 전설적인 투자자들과 도박사들이 자금을 어떻게 쪼개 걸지를 정하는 바이블이 된다. 눈앞의 한 판이 아니라 무한 반복의 평균을 본다는 기대값의 정신이, 카지노 테이블과 월스트리트의 운용 자금을 동시에 움직인 것이다.

기대값이 컴퓨터로 들어가는 마지막 길목에서, 너는 정말 눈여겨봐야 할 대목을 만난다. 오늘날 스스로 학습하며 행동을 고르는 인공지능 — 바둑을 두고 게임을 깨고 로봇 팔을 움직이는 그것들 — 의 심장에는 기대값 계산이 박혀 있다. 기계는 지금 둘 수 있는 모든 수를 놓고, 각 수가 데려올 미래들을 그 미래가 펼쳐질 확률로 무게 잡아 더한 '기대 보상'을 따지고, 그 값이 가장 큰 수를 고른다. 그런데 이게 가능하려면 생각의 윗단추부터 다시 끼워야 했다. 기계는 단 한 번의 결과에 일희일비해선 안 된다. 운 좋게 한 판 이겼다고 그 수를 최고로 떠받들거나, 한 번 졌다고 그 길을 영영 버리면 아무것도 배우지 못한다. '한 번의 사건'이 아니라 '무한히 반복했을 때의 평균 기대값'을 판단의 단위로 삼는 관점 — 그 상위 틀을 통째로 갈아 끼우고 나서야, 기계는 운과 실력을 분리해 진짜 학습을 시작할 수 있었다. 도박판의 점수 나누기에서 태어난 셈이, 기계가 세상을 대하는 가장 윗단의 태도가 된 셈이다.

그러니 너가 어떤 갈림길 앞에서 망설이게 되거든 — 이 사업에 들어갈까, 이 베팅을 받을까, 이 한 번에 모든 걸 걸까 — 눈앞에 펼쳐진 단 한 번의 결과에 홀리지 마라. 일어날 수 있는 결과들을 모두 펼쳐 놓고, 각각에 일어날 확률의 무게를 매겨, 그 길을 백 번 천 번 반복했을 때 평균적으로 내 손에 쥐어질 몫을 따져라. 그리고 그 무게를 잴 때 액수가 아니라 그게 너에게 갖는 진짜 가치로 재는 것까지 잊지 마라. 한 번의 운이 아니라 무한 반복의 평균을 보는 눈, 그게 도박판의 다툼 하나에서 시작된 생각의 전부다.