외계인의 통계학

by d_ijk_stra

최근 친구에게 SF 소설집 ‘Stories of Your Life and Others’를 선물하고, 나도 Kindle 버전으로만 갖고 있는 것이 아쉬워서 내 책도 한 권 구입했다. 소설 내용을 별로 스포일링하지는 않을 터이지만 나처럼 조금도 소설의 내용을 미리 알지 않고 싶어하는 사람들은 정말 강력히 추천한다는 말만 들어 두고 여기에서 읽기를 그만 두는 것이 좋겠다.  여하간 이 소설집의 단편 중 하나인 ‘Story of Your Life’를 정말 감명 깊게 읽었는데, 이 소설은 갑자기 외계인들이 인간들과 화상 채팅;을 시작하면서 인간이 외계인들에 대해 알아가는 과정을 다루고 있다.

재미있는 것은 이 외계인들에게는 인과관계의 개념이 없거나 적어도 이를 중요하게 생각하지 않는다는 것이다. 즉 시간을 흐름으로 느끼는 것이 아니라, 현재를 사는 것과 동시에 미래에도 살고 있고 또 과거에도 살고 있는 것이다. 어떻게 생각하면 있을 법한 이야기이다. 우리 인간은 시간의 흐름을 느끼지만 공간이 흐른다고 느끼지는 않는다. 공간은 우리에게 있어 정적인 것으로 느껴진다. 이런 의미에서, 어떤 축에 시선을 고정하고 다른 축을 바라볼 것인가는 어쩌면 절대적인 것이 아니라 다양한 선택의 가능성이 있는 것이 아닐까? 라는 생각이 들었다. 일반 상대성 이론에 대한 지식이 있으면 좀 더 구체적으로 생각해 볼 수 있을 것 같은데 아쉽다.

여기서 내가 던지고 싶은 질문은 “이 외계인들에게도 통계학이 있을까? 있다면 그 통계학은 어떤 모습일까?” 라는 것이다. 통계학에서 던지는 가장 중요한 질문들 중 하나는, 데이터를 많이 수집할수록 원하는 진실에 얼마나 빨리 다가갈 수 있냐는 것이다. 이것은 빈도주의와 베이지언 통계학 모두에 공통적인 것이다. 그런데 과거와 현재, 미래에 동시 존재하며 관찰하는 외계인의 입장에서는 이러한 질문은 무의미할지도 모른다. 왜냐하면 그들의 입장에서는 데이터는 수집할수록 많아지는 것이 아니라 이미 모든 데이터를 동시에 관찰하고 있기 때문이다. 만약 시간이 무한하고 관찰하고자 하는 사건도 무한히 발생한다면 외계인들은 무한한 숫자의 데이터를 사용할 수 있을 것이다. (이것이야말로 빅 데이터다!) 이 경우에는 무한한 정확도로 원하는 양을 추정할 수 있을 것이기 때문에 빈도주의도 베이지언도 의미가 없을 것으로 생각된다.

다만 사건의 발생에 대한 불확실성은 여전히 존재하기 때문에 확률론은 여전히 의미가 있을 것이다. 우리가 어떤 물질에서 그 밀도를 느끼는 것처럼, 그들도 사건의 확률에 대해 시간 축 속에서의 밀도를 느끼지 않을까 한다. 또한 정규분포는 그들에게도 중요한 분포일 것이다. 확률론과 통계학의 가장 중요한 정리 중 하나인 중간 극한 정리(central limit theorem)에 따르면 정규분포를 따르지 않는 확률변수들이라 해도 이들을 많이 모아서 평균을 내면, 평균은 대체로 정규분포에 가깝다는 것이다. 외계인들은 무한히 많은 사건을 동시에 관측하므로 이들이 바라보는 사건은 정확히 정규분포를 따를 것이다. 다만 중간 극한 정리가 적용되기 위해서는 일부 가정이 필요하기 때문에 정규분포만이 이들에게 관심있는 분포는 아닐 것이다. 내가 알기로는 극한으로 존재할 수 있는 것은 무한히 쪼갤 수 있는 분포(infinitely divisible distribution)들 뿐인데, 외계인들에게는 여기 속하는 분포들이 아주 중요하고 또 자연스럽게 느낄 것 같다. 수학자 외계인이 아니더라도 본능적으로 이해하고 있지 않을까?

서두에 추측한 것처럼, 만약 외계인은 시간이 고정된 것이고 공간이 흐르는 것이라고 느낀다면 외계인들은 외계인들 나름대로의 통계학이 필요할 수도 있다. 인간이 ‘데이터를 더 많이 수집할 수록 어떤 효과가 있을까?’를 생각한다면, 외계인은 ‘데이터를 더 다양한 장소에서 수집할 수록 어떤 효과가 있을까?’라고 생각할지도 모른다. 그들에게는 공간이 멈추어 있지 않고 흘러가버리는 대상이기 때문에 사건의 정확한 위치를 추정할 수 없고, 많이 데이터를 수집할수록 공간적 불확실성을 줄여나갈 수 있겠지만 완전히 불확실성을 없애는 것은 불가능할 것이다.

(곁다리 1: 사실 인간 역시도 하이젠베르크의 불확정성 원리 때문에 사물의 위치에 대한 정확한 추정은 불가능하다. 그렇지만 일상 생활에서 불확정성 원리의 불편함을 느끼지는 못할 정도로 정확하게 추정하며 살아간다. 외계인들도 우리와 같은 우주에 살아가고 있기 때문에 마찬가지 제약이 있을 것이다. 즉 그들도 실제로 무한히 많은 시간을 동시에 체험할수는 없겠지만 일상 속에서는 거의 동시 존재하는 것과 마찬가지라고 느낄 것이다.)

베이지언 통계는 공간의 불확실성을 다루는 외계인들의 통계학에서도 의미가 있을 수 있겠다. Bayes Rule은 ‘사건 A가 일어났을 때 사건 B의 확률은 무엇인가?’를 계산하는데, 이 때 사건 A, B 사이에 선후관계를 가정하지는 않기 때문이다. 인간이 갖고 있는 확률론으로 접근 가능할 가능성이 높다. 빈도주의 통계학은 어떻게 될 지 잘 모르겠다. 빈도주의는 실험을 반복했을 때 얼마나 높은 빈도로 원하는 결과를 얻을 수 있는가를 생각하는데 외계인들은 이미 무한히 실험을 반복한 결과를 지켜볼 수 있으니… 대신 그들에게는 공간적 불확실성이 있으므로 나름의 ‘밀도주의 통계학’을 개발했을지도 모르겠다. 외계인들도 밀도주의 통계학자와 베이지언 통계학자 사이에 분쟁이 있을지 궁금하다.

써놓고 보니 이게 대체 무슨 소리여…

곁다리 2. Larry Wasserman이 항상 불평하듯 Bayes Rule을 쓴다고 해서 베이지언 통계라고 할 수는 없긴 한데, 대부분들 그렇게 생각하니까 그냥 베이지언 통계라고 얘기했다. 한 발 물러나서 얘기한다면 외계인들에게도 Bayes Rule은 유효할 수 있으며 이를 바탕으로 나름의 통계학을 정립할 수 있다는 얘기가 되겠다.

곁다리 3. 이 글을 쓰면서 느낀 것은 ‘시간의 흐름’이 통계학에 있어서 굉장히 중요한 요소라는 것이다. 그런데 역설적으로 통계학의 가장 대중적인 도구인 회귀분석에서는 사건의 상관관계만을 볼 뿐, 인과관계를 분석하지 않는다. 사실 우리는 어떤 사건이 먼저 일어났고, 어떤 사건이 나중에 일어났는지에 관심이 있는데 말이다. 회귀분석이 정말 대부분의 문제에 있어서 우리에게 필요한 도구인가? 우리에게 적합한 도구인가? 통계학의 대부분의 도구는 회귀분석에 그 뿌리를 두고 있는데, 우리는 잘못된 지점에서 뻗어나가고 있는 것이 아닐까?

곁다리 4. 외계인의 통계학에 대해 생각하다 보니 사실 아이디어가 너무 많아서 적당한 지점에서 자르는 것이 힘들었다. 책을 한 권 쓸 수도 있겠어…

Advertisements