06. 확률·통계적 사고

분포 사고 (distribution)

어떤 양을 하나의 대푯값으로 뭉뚱그리지 않고, 값들이 어떻게 흩어져 있는지(퍼짐)와 양 끝의 드문 값들(꼬리)까지 통째로 살피는 사고법. 평균은 분포의 그림자일 뿐이며, 변동성과 극단값에 진짜 정보와 위험이 숨어 있다고 보는 것이 핵심이다.

너, 강을 하나 건너야 한다고 해보자. 누가 와서 그러더라. 걱정 마, 이 강 수심이 평균 1미터밖에 안 돼. 너는 키가 1미터 80이니 안심하고 첨벙 들어선다. 그런데 강 한가운데에 깊이 4미터짜리 웅덩이가 숨어 있었다면? 평균은 1미터가 맞다. 가장자리가 얕아서 평균을 끌어내렸을 뿐이다. 평균이라는 한 숫자는 너를 빠뜨려 죽이고도 끝까지 거짓말을 하지 않았다. 오늘 이야기는, 세상을 평균이라는 외눈으로 보던 사람들과, 그 외눈을 답답해하다가 결국 두 번째 눈을 뜬 한 사람에 관한 거다.

19세기 초 벨기에에 아돌프 케틀레라는 사람이 있었다. 원래 천문학자였다. 별의 위치를 잴 때 여러 번 관측하면 값이 조금씩 흩어지는데, 그 흩어짐이 가운데가 봉긋한 종 모양을 그린다는 건 천문학자들이 이미 알고 있었다. 케틀레가 한 엉뚱하고도 대담한 짓은, 그 별을 재던 자를 사람에게 들이댄 것이다. 그는 수천 명 병사의 가슴둘레와 키를 모았고, 그 수치들이 별의 오차처럼 똑같은 종 모양으로 퍼지는 걸 발견했다. 거기서 그는 '평균인'이라는 개념을 빚어냈다. 모든 사람을 평균 낸 가상의 표준 인간. 케틀레에게 이 평균인은 자연이 겨눈 과녁의 한복판이었고, 실제 사람들의 들쭉날쭉함은 그 과녁을 맞히려다 빗나간 오차에 불과했다. 말하자면 그는 흩어짐을 '신의 실수'로 본 셈이다. 평균이 진실이고, 퍼짐은 잡음이라는 세계관. 대략 1830년대의 일이고, 이 발상이 사회를 숫자로 다루는 모든 학문의 출발점이 되었다.

여기서 이야기가 한 세대 뒤에 뒤집힌다. 케틀레를 열렬히 흠모하던 영국 사람 프랜시스 골턴이 정반대 결론에 가닿은 것이다. 골턴은 같은 종 모양 곡선을 들여다보다가, 케틀레가 잡음이라 버린 바로 그 흩어짐이야말로 세상에서 가장 중요한 정보라고 확신하게 됐다. 키가 큰 사람과 작은 사람의 차이, 빠른 사람과 느린 사람의 차이 — 그 변이가 없으면 유전도, 변화도, 우열도 아무것도 논할 수 없다. 케틀레에게 퍼짐은 닦아내야 할 얼룩이었지만, 골턴에게 퍼짐은 연구의 본체였다. 그는 이 흩어짐을 눈으로 보여주려고 작은 기계까지 만들었다. 위에서 쇠구슬을 떨어뜨리면 못들 사이를 무작위로 튕기며 내려가 아래 칸칸에 쌓이는데, 수백 개를 쏟아붓고 나면 구슬더미가 저절로 그 종 모양을 그려냈다. 무질서한 개개의 튕김이 모이면 질서 있는 분포가 된다는 걸, 그는 나무와 쇠구슬로 증명해 보인 것이다.

골턴이 이 분포를 들여다보다 낚아챈 보석이 하나 더 있다. 그는 키 큰 아버지의 아들이 아버지만큼 크지 않고 평균 쪽으로 조금 되돌아온다는 걸 발견하고, 이걸 '평균으로의 회귀'라 불렀다. 분포 전체를 보지 않으면 절대 보이지 않는 현상이다. 한 사람만 보면 그냥 '아들이 좀 작네'지만, 수천 쌍을 분포로 깔아놓고서야 비로소 끄트머리 극단값들이 다음 세대에서 가운데로 빨려드는 그 보이지 않는 힘이 드러난다. 이렇게 평균만 보던 통계학에 '퍼짐을 본다'는 두 번째 눈을 달아준 사람이 골턴이었고, 그 눈이 곧 분포 사고의 시작이었다.

이 두 번째 눈이 사람 목숨을 건진 장면이 2차 대전에 있다. 미군은 폭격기가 자꾸 격추당하자 어디에 철판을 덧대야 할지 고민했다. 돌아온 비행기들을 살펴보니 총탄 자국이 날개와 동체에 잔뜩 박혀 있고, 엔진 부위는 멀쩡했다. 군의 상식은 당연히 '구멍 난 데를 보강하자'였다. 그때 통계학자 에이브러햄 발드가 정반대를 말했다. 보강해야 할 곳은 구멍이 '없는' 엔진이라고. 그의 논리는 분포 사고 그 자체였다. 우리가 보고 있는 건 살아 돌아온 비행기들, 즉 전체 분포에서 살아남은 한쪽 끄트머리뿐이다. 엔진에 총을 맞은 비행기는 아예 돌아오지 못해 우리 눈앞 표본에서 통째로 사라졌다. 그러니 돌아온 놈들의 엔진이 깨끗하다는 건 엔진이 안전해서가 아니라, 거기 맞은 놈은 다 죽었다는 증거다. 보이는 자국이 아니라 보이지 않게 잘려나간 꼬리를 읽어낸 것이다. 군은 그의 말을 따랐고, 무수한 조종사가 살았다.

분포의 꼬리가 단순한 변이가 아니라 세상을 통째로 뒤엎는 괴물일 수 있다고 가장 집요하게 외친 건 우리 시대 사람 나심 탈레브다. 그는 트레이더 출신인데, 사람들이 '평균적으로는 안전하다'를 믿다가 한 번의 극단적 폭락에 모든 걸 잃는 걸 숱하게 봤다. 키나 몸무게처럼 꼬리가 얌전한 세계가 있는가 하면, 주가나 전염병이나 부의 분포처럼 꼬리가 두꺼워서 단 한 번의 사건이 그동안의 평균을 무의미하게 만드는 세계가 따로 있다. 그는 후자를 '검은 백조'가 사는 땅이라 불렀다. 평균과 표준적인 변동만 보고 그 두꺼운 꼬리를 무시한 사람들이 어떻게 파국을 맞는지를, 그는 평생의 주제로 삼았다. 분포를 본다는 건 결국, 가운데의 평온이 아니라 끄트머리의 재앙을 미리 들여다보는 일이라는 걸 그가 우리에게 각인시켰다.

이 분포 사고가 컴퓨터로 들어오면서 생각의 윗단추 하나가 통째로 바뀌었다. 옛날 계산은 늘 하나의 답을 토해냈다. 평균 수익은 얼마, 예상 수명은 몇 년. 그런데 2차 대전 무렵 핵무기를 설계하던 사람들은 중성자가 물질 속에서 어디로 튈지 같은, 우연이 켜켜이 쌓인 문제 앞에서 공식이 손을 들어버리는 걸 겪는다. 거기서 스타니스와프 울람과 폰 노이만이 꺼낸 수가, 그 무작위 과정을 컴퓨터로 수천수만 번 흉내 내어 결과가 어떻게 흩어지는지 분포 자체를 그려보는 것이었다. 도박의 도시 이름을 따 몬테카를로라 불린 이 방법의 핵심은, 답을 하나로 구하길 포기하고 답의 분포를 통째로 뽑아낸 데 있다. 이걸 제대로 하려면 머릿속 틀부터 갈아야 했다. 변수를 '하나의 확정된 값'으로 붙들던 사고를, 변수를 '값들이 퍼져 있는 분포 덩어리'로 바꿔 쥐어야 했다. 오늘날 프로그램들이 점추정 하나가 아니라 분포를 통째로 들고 다니며 계산하는 것, 인공지능이 '정답'이 아니라 '가능한 답들의 확률 분포'를 내놓는 것 모두 이 전환 위에 서 있다. 하나의 답을 묻던 머리가, 답의 모양을 묻는 머리로 바뀐 사건이다.

그러니 너가 어떤 보고서에서 '평균 ○○'이라는 한 줄을 만나거든, 거기서 멈추지 말고 되물어라. 그래서 이게 얼마나 흩어져 있는가, 그리고 양 끝에 나를 빠뜨릴 웅덩이나 나를 살릴 기회가 숨어 있지는 않은가. 평균은 분포가 드리운 그림자 한 점일 뿐이다. 그림자만 밟지 말고, 그 그림자를 만든 몸통의 폭과 끄트머리까지 보는 눈 — 그게 한 숫자에 속아 강에 빠지지 않는 유일한 방법이다.