평균회귀 인식 (regression to the mean)

어떤 측정값이 우연의 요소를 품고 있을 때, 한 번 극단적으로 높거나 낮게 나온 값의 다음 측정치는 평균 쪽으로 되돌아오는 경향을 보인다는 통계적 사실. 실력이나 처치 같은 진짜 원인이 아니라 운의 출렁임이 극단을 만들었을 뿐이라면, 그 다음은 으레 평범해진다는 것을 미리 감안하는 인식법이다.

너, 이런 장면을 상상해 보자. 어느 비행학교 교관이 화가 잔뜩 나서 말한다. 칭찬은 다 헛소리라고. 자기 경험으로는, 묘기 비행을 기막히게 해낸 생도를 불러 칭찬해 주면 다음 비행에서는 꼭 더 못한다는 거다. 반대로 형편없이 굴린 생도에게 고래고래 호통을 치면 다음번엔 신통하게 나아진다는 거다. 그러니 칭찬은 사람을 망치고 질책이 사람을 키운다 — 교관은 수십 년 비행대 생활로 그걸 두 눈으로 봤다고 했다. 자, 너라면 이 베테랑에게 뭐라 답하겠나. 그의 관찰은 거짓이 아니다. 정말로 칭찬 뒤엔 추락하고 호통 뒤엔 솟았다. 그런데도 그의 결론은 통째로 틀렸다. 왜 그런지를 그 자리에서 깨달은 한 젊은 심리학자의 머릿속으로 들어가 보자.

때는 1960년대 중반, 이스라엘 공군의 비행교관들 앞에 선 사람은 갓 서른의 대니얼 카너먼이었다. 그가 가르치려던 건 단순했다. 잘한 행동에 상을 주면 그 행동이 늘고, 처벌은 별 효과가 없다는, 당시 심리학의 정설. 바로 그때 노련한 교관이 위의 반론을 들이댄 것이다. 카너먼은 순간 멈칫했다. 그리고 통계를 아는 사람의 눈으로 그 장면을 다시 봤다. 생도가 어느 날 환상적으로 비행했다는 건 무슨 뜻인가. 그날따라 그의 평소 실력에 운까지 유난히 잘 맞아떨어졌다는 뜻이다. 그렇게 끝까지 치솟은 날의 다음번은, 칭찬을 하든 안 하든 평소 실력 쪽으로 내려올 수밖에 없다. 반대로 끔찍하게 망친 날은 실력에 악운이 겹친 바닥이라, 호통을 치든 안 치든 다음번은 위로 올라온다. 교관은 자기 목소리가 생도를 움직였다고 믿었지만, 정작 생도를 위아래로 끌고 다닌 건 운의 출렁임이었다. 칭찬은 늘 꼭대기 직후에, 질책은 늘 바닥 직후에 나왔으니, 칭찬엔 추락이 질책엔 상승이 따라붙는 착시가 빚어진 거다. 카너먼은 훗날 이 순간을 두고 자기 평생에서 가장 짜릿했던 깨달음의 하나였다고 적었다. 극단은 제 발로 평범을 향해 되돌아온다는 것, 그리고 사람은 그 자연스러운 복귀를 자꾸 자기 행동의 공으로 가로챈다는 것.

이 현상에 이름을 붙인 사람은 그보다 한참 앞, 19세기 영국의 프랜시스 골턴이다. 다윈의 사촌이기도 했던 이 별난 박물학자는 처음엔 스위트피 완두콩을 길렀다. 씨앗 크기를 재 보니 묘한 일이 벌어졌다. 아주 큰 어미 씨에서 난 자식 씨는 어미보다 작아지는 쪽으로, 아주 작은 어미의 자식은 어미보다 커지는 쪽으로, 다들 가운데로 슬슬 모여드는 것이었다. 그는 사람의 키로도 같은 걸 확인했다. 큰 부모의 자식은 부모만큼 크진 않고, 작은 부모의 자식은 부모만큼 작진 않았다. 1885년 영국 학술협회 강연에서 그는 솔직히 고백한다. 한때는 이 현상이 도무지 이해되지 않아 눈이 멀어 있었노라고. 이듬해 그가 내놓은 논문 제목이 곧 이 사고법의 출생증명서다. '유전되는 키에서 평범으로의 회귀.' 처음에 그는 이걸 자연이 종을 평범하게 끌어내리는 어떤 힘처럼, 거의 생물학 법칙으로 오해했다. 진짜 정체가 드러난 건 그 뒤다. 이건 유전의 특별한 성질이 아니라, 두 측정이 완벽히 들어맞지 않는 한 어디서나 튀어나오는 순수한 통계의 그림자였다. 키든 시험 점수든 매출이든, 측정값에 운이 한 방울이라도 섞이면 극단 다음엔 복귀가 온다. 골턴이 '회귀(regression)'라 부른 이 말은, 오늘날 데이터로 관계를 추정하는 '회귀분석'이라는 통계학의 기둥 용어로 그대로 굳었다. 한 사람의 오해에서 시작된 단어가 한 분야의 주춧돌이 된 셈이다.

이 인식이 가장 날카롭게 쓰이는 자리는, 누군가 '우리가 손을 썼더니 좋아졌다'고 외치는 모든 현장이다. 성적이 바닥으로 떨어진 학교만 골라 특별 프로그램을 넣으면 이듬해 성적은 거의 틀림없이 오른다. 프로그램이 좋아서일까, 아니면 바닥은 원래 올라오게 돼 있어서일까. 증상이 가장 심할 때 찾아온 환자에게 약을 주면 대개 나아진다. 약효일까, 가장 아픈 날 다음은 원래 나은 날이어서일까. 그래서 의학이 끝내 의지하게 된 무기가 대조군이다. 처치를 안 받은 비슷한 집단도 똑같이 평균으로 돌아오는지를 나란히 재 봐야, 운의 복귀분을 걷어내고 진짜 효과만 추려낼 수 있다. 카너먼식으로 말하면, 평균회귀를 모르는 사람은 세상의 자연스러운 출렁임을 전부 자기 개입의 성과로 착각하며 산다.

여기엔 디지털 시대로 넘어온 꼬리도 달려 있다. 야구나 스포츠 데이터에서 신인이 첫 시즌 펄펄 날다 두 번째 해에 주춤하는 이른바 2년차 슬럼프, 잡지 표지를 장식한 직후 성적이 꺾이는 징크스 — 상당 부분이 운의 복귀일 뿐이라는 게 데이터로 드러났다. 그래서 오늘날 기계가 선수의 다음 시즌을 예측할 때는 화려한 한 시즌을 곧이곧대로 믿지 않고, 평균으로 일부러 끌어당겨 보정한다. 웹사이트에서 버튼 색 하나 바꾼 효과를 재는 A/B 테스트에서도, 처음 며칠 유난히 튄 숫자에 흥분해 결론 내렸다간 평균회귀에 보기 좋게 속는다. 데이터가 폭증한 시대일수록, 극단값 하나에 환호하기 전에 '이게 진짜 신호냐, 아니면 곧 평범으로 돌아올 운의 거품이냐'를 먼저 물어야 하는 까닭이다.

그러니 너가 무언가를 측정해 유난히 높거나 낮은 값을 손에 쥐었을 때, 그 다음 숫자를 두고 섣불리 공과 죄를 따지지 마라. 최악의 분기 다음에 손을 썼다면 회복의 절반은 네 덕이 아니라 평균의 귀향일 수 있고, 최고의 분기 다음의 둔화 역시 네 실책이 아니라 자연스러운 착지일 수 있다. 극단을 보거든 먼저 이렇게 물어라 — 여기 운이 얼마나 섞여 있나, 그렇다면 다음은 가운데로 돌아오게 돼 있지 않나. 그 한 번의 의심이, 칭찬을 미워하고 호통을 신봉하게 된 저 비행교관의 함정에서 너를 건진다.