bikestra의 유사통계학 교실

정체성

1. 영사관에 가서 딸의 출생 신고를 마치고 왔다. 출생신고서에는 본적(本籍) 뿐만 아니라 본관(本貫)까지 한자로(!) 적어야 했는데, 스스로의 본관을 생각할 기회는 최근 십수년간 매우 드물었으므로 한자로 적을 자신이 없어서 잠시 당황했다. 다행히 스마트폰과 구글이 있으니 침착하게 검색하며, 짐짓 지체있는 집안 자식이니 이 정도는 문제없다는 척 해당 항목을 채웠다. ‘포미닛’의 2013년 발표곡 <이름이 뭐예요>에서 이름과 전화번호에 이어 ‘본관이 뭐예요~’ 하고 물어보면 웃기겠다는 생각을 하며…

버스를 타고 집으로 돌아오는 길에 워싱턴 호수를 바라보다가, 문득 이제 영락없는 이민자가 되었다는 생각이 들었다. 직업도 집도 그리고 빚도 (먼산) 다 미국에 있고, 이중국적이긴 하지만 엄연한 미국인을 키우고 있으니 누가 봐도 전형적인 이민 1세인 것이다. 미국에서 살기 시작한지 8년이 되었으니 이제 와서 새삼 스스로가 이민자라는 사실을 의식하는 것이 웃기지만, 정체성이란 환경이 변하는 만큼 빨리 변하지는 못하는 것 같다. 내 정체성은 여전히 한국에서 스스로가 이민을 가리라고는 상상도 하지 못하고 있던 시절에 형성된 것이 거의 그대로 남아있는 모양인지, 미국에서 영어를 사용하며 회사를 다니고 있다는 스스로의 일상을 생각하면 왠지 나 자신의 모습이라고 받아들이기보단 ‘거 참 재밌고 신기한 사람이군!’ 하고 생각하게 된다.

2. 때로는 내가 한국인으로서의 정체성에 매여 있는 것이 아니라, ‘한국인으로서의 나’와 ‘미국 이민자로서의 나’라는 분리된 정체성이 존재하는 것이 아닌가 하는 생각이 들기도 한다. ‘윤효근’과 ‘Hyokun Yun’은 다른 언어를 사용하고, 다른 분야를 전공했으며, 둘의 인맥 사이에는 공통분모가 거의 없기 때문에, 어쩌면 ‘윤효근’과 ‘Hyokun Yun’이 별개의 사람이 되어 한국과 미국에서 독립적인 삶을 이어나간다 해도 썩 위화감이 없을만큼 두 정체성은 분리되어 있는 것 같다.

물론 가끔은 이 두 정체성이 동시에 발현되어야 하는 순간들이 있는데, 가장 전형적인 상황은 기계학습을 전공한 한국인을 만나는 것이다. 나는 기계학습을 미국에 와서야 공부하기 시작했으므로, 기계학습은 영어를 사용하는 Hyokun Yun으로서 공부해 왔다. 그런데 한국인이 내게 다가와서 한국어로 ‘제프 힌턴의 이 연구는 정말 대단하지 않아요?’라고 말을 건네면, 순간 기계학습에 대해 내가 갖고 있는 모든 개념들이 갑자기 좀 더 친근하고 개인적인 것으로 새롭게 비쳐지는 경험을 하게 된다. 이런 때는 내가 갖고 있는 언어로 뭐라고 설명하기 힘든, 상당히 이상한 기분이 든다.

이러한 정체성의 분리가 썩 스스로에게 도움이 되지는 않는 것 같다. 내가 한국에서 기계학습을 공부했다면, 그래서 기계학습의 개념들이 늘 이렇게 친근하고 개인적인 것으로 느껴졌다면, 좀 더 욕심을 갖고 열심히 연구하지 않았을까 하는 생각이 들곤 한다. Hyokun Yun으로서의 일들을 마치 ‘남의 일’인 것처럼 가볍게 생각하는 경향이 있는 것 아닌가, 싶은 것이다. 한국계 미국인으로 자라날 딸이 정체성의 혼란을 겪으면 어떻게 하나 걱정하곤 했는데, 일단은 나 자신의 문제가 먼저인 것 같다.

Advertisements

한국 사회와 리더쉽

문득, 한국 사회의 근본적인 문제는 리더쉽에 대한 이해가 전반적으로 부족하기 때문이 아닌가 하는 생각이 들었다. 회사에서 일을 빨리 하라고 다그치고 야근을 강요한다고 절대로 프로젝트가 빨리 끝나지 않는다. 학교에서 학생들을 밤늦게까지 자율학습으로 묶어두고 공부를 시키면 아이들 몸만 힘들지, 공부를 잘하게 되지 않는다. 마찬가지로, 추석 때 오랜만에 만난 조카에게 얼른 취직하고 결혼하라고 닦달을 하면 조카 기분만 나쁘지 달라지는 것은 없다. 그런데 우리는 아랫사람의 부족한 상황에 짜증을 내고 자신의 권위로 그 사람을 극단적인 상황으로 몰아넣어 문제를 해결하고자 하는 조급증을 너무 자주 보인다.

아랫사람의 존경심에서 우러나오는 진정한 권위는 한정된 자원이고, 잘못된 조언을 할 때마다 그만큼 권위는 사라지게 된다. 이렇게 잃기 쉬운 권위를 효과적으로 활용하기 위해서는, 필요한 때를 기다리는 인내심과, 근본적인 문제를 찾아내기 위한 아랫사람에게의 관심이 필요하다. 그런데 한국 사회에서 이런 리더는 찾기 힘들고, 학교에서도, 회사에서도, 추석때 오랜만에 만난 친지들 사이에서도 ‘너 좋으라고 하는 말이다’라는 변명 아래 호통만이 끊이지 않는다. 한국 사회가 좀 더 행복하고 발전적이기 위해서는 각자가 자기 자리에서 리더쉽에 대한 고민을 더 많이 해야하지 않을까 싶다.

도널드 B. 루빈과의 대화 (2)

1편에서 이어집니다.

1980년대 초 하버드에서의 루빈

1980년대 초 하버드에서의 루빈

다시 하버드로: 성향 점수, 다중 대치법 등

파브리: ETS에서 그렇게 생산적인 시간을 보내고, 당신은 EPA(미국의 환경 보호 기관)에서 시간을 좀 보냅니다. 분명히 ETS에서 그렇게 잘 지냈는데 왜 옮기신거죠?

: 누가 저에게 “당신 ETS에 얼마나 오래 있었나요?”라고 묻는 걸 “너무 오래요”, 라고 농담삼아 대답한 것이 부분적으로나마 그 시작이었습니다. 제가 ETS에서 푸는 문제들은 뭔가 반복적이 되는 것 같아 보였고, 나는 EM과 다중 대치법 등을 통해 그들에게 중요한 공헌을 많이 했다고 느꼈습니다. 이런 기법들은 ETS에서 중요한 문제들인 시험 결과 비교나 데이터를 수집하는 올바른 방법을 찾아내는 것과 같은 주제들에 사용되었거든요. 그래서 나는 뭔가 다른 걸 해보고 싶었습니다. 당시 데이비드 로젠바움(David Rosenbaum)이 EPA의 방사선 프로그램 부서(Office of Radiation Programs)의 대표(head)로 있었죠. 그는 응용수학자와 통계학자들을 모아 한 팀을 꾸린다는 원대한 계획을 갖고 있었습니다. 그는 어찌 제 이름을 찾아내서 저를 (워싱턴) DC로 초대해 제가 그런 그룹을 이끌고 싶은지 알아보려 했죠. 제가 원하는 사람들을 몇 명 고용할 자유와, 괜찮은 정부 월급(“Senior Executive Service” 레벨에서요)을 제안받았습니다. 그래서 저는 “제가 누굴 데려올 수 있는지 한 번 봅시다”라고 대답했습니다. 나는 로드 리틀(Rod Little; 당시엔 영국에 있었습니다)과 폴 로젠바움(Paul Rosenbaum; 제가 아직 ETS에 있을 때 가르친 사람이었습니다) 외에도 몬타나 주립 대학(Montana State University)에서 결측 자료에 대한 학위 논문을 쓴 수잔 힌킨스(Susan Hinkins) 외 두 명을 더 데려올 수 있을 것이라고 확신했습니다. 그게 대통령 선거 얼마 전이었죠. 그리고 민주당이 패배하고 레이건이 대통령이 되며 모든 것이 무너집니다. 갑자기 EPA에서 제 직급 위에 있는 많은 사람들(대부분 대통령에 의해 임명된 사람들이었죠)이 사직서를 준비하고 다음 직장 걱정을 해야 하게 되었죠.

파브리: 그래서 EPA 프로젝트는 시작하기도 전에 끝나게 되었군요.

: 어떤 의미로 보면 그건 아예 시작하지도 않았었죠. 12월 초에 정식으로 사인했는데, 하루 있다가 사직서를 제출했거든요. 그러나 저는 제가 거기에 데려온 모든 사람들에게 책임감을 느꼈죠. 결과적으로 수잔 힌킨스는 IRS의 프릿즈 슈렌(Fritz Scheuren)과 연결이 되었습니다; 폴 로젠바움은 위스콘신-매디슨 대학(University of Wisconsin-Madison)에 자리를 얻었구요; 로드는 인구 통계에 관련된 직업을 얻었습니다. 그 잠시의 시간 동안 좋았던 한 가지는 제가 맡았던 프로젝트들을 통해 허먼 체르노프(Herman Chernoff)나 조지 박스(George Box)와 같은 사람들과 좋은 관계를 형성했다는 겁니다. 조지는 진짜 문제를 푸는데 도움이 되는 통계를 하고자 하는 고집과 위트 있고 상스러운 환상적인 유머 감각, 그리고 발랄함에 대한 사랑 때문에 저와 정말 죽이 잘 맞았죠. 어쨌거나 EPA에서의 자리 때문에 위스콘신 대학 수학 연구소(Math Research Center)에 있던 박스에게 방문 초청을 받았고 저는 기쁘게 승낙했죠. 이것이 기회가 되어 저는 폴(로젠바움)과 성향 점수에 대한 논문들을 마무리합니다(Rosenbaum and Rubin, 1983a, 1983b, 1984a).

: 다양한 응용 분야에서 가장 인기 있는 인과 추론 기법인 성향 점수 얘기가 나와서 말인데, 성향 점수의 역사에 대한 통찰을 좀 주실 수 있나요?

: 저는 1978년 하버드에 구겐하임(Guggenheim) 장학금으로 왔을 때 폴을 처음 만났습니다; 그는 1년차 박사과정 학생이었는데 굉장히 똑똑하고 열성적이었죠. 프린스턴에 있던 시절 저는 러트거스(Rutgers)의 심리학자이자 나중에 킨제이 연구소(Kinsey Institute)에 킨제이를 이어 첫 소장이 된 쥰 라이니시(June Reinisch)에게 컨설팅을 좀 해줬었습니다. 그녀는 유전-환경 논쟁(nature-nurture controversy)에 굉장히 관심이 많았습니다- 무엇이 남자와 여자를 그렇게 다르게 만드는 걸까요? 그녀와 역시 심리학자였던 그녀의 남편은 쥐와 돼지 실험을 하고 있었습니다. 그들은 임신한 동물들의 자궁에 호르몬을 주사해서 태아들을 다른 출산 전 환경에 노출시켰죠; 이런 식의 무작위 실험은 당연히 인간에게는 비윤리적인 것입니다. 폴과 제가 폴의 학위 논문의 일부분이기도 했던 이 프로젝트에서 풀고자 했던 문제 중 하나는 노출된 사람과 노출되지 않은 사람을 배경이 비슷한 사람끼리 대응(matching) 시키는 것이었습니다. 우리가 사용한 공변량(covariate)은 아주 많은 수의 연속(continuous) 변수와 이산(discrete) 변수들을 포함하고 있었는데, 그 중 몇 개는 임신 전이나 초기에 특정한 심각한 병을 앓는 것과 같이 아주 드문 사건에 대한 것이었죠. 머지 않아 표준적인 대응 방법인 마할라노비스 대응(Mahalanobis matching)과 같은 방법은 이렇게 고차원의 문제에서는 적절치 못하다는 것이 분명해졌습니다. 우리는 이런 변수들에 대한 어떤 요약 수치들을 찾아내, 개인과 개인이 단계가 아닌 실험군과 대조군 단계에서 이 요약 수치들이 균형을 이루도록 해야 했습니다. 그리고 우리는 할당 기제(assignment mechanism)이 존재한다면 우리는 할당 확률(assignment probability)를 이용해서 대응을 할 수 있다는 것을 깨달았습니다. 이건 사실 호빗츠와 톰슨(Horbitz-Thompson)이 계통적 오류(systematic bias)를 모두 없애기 위해서 제안한 것과 거의 흡사한 아이디어죠. 정확한 것은 기억나지 않지만 아마 우리는 관상 동맥 우회(coronary artery bypass) 수술에 대한 듀크 데이터 은행 자료를 분석하면서 성향 점수에 대한 아이디어를 처음 얻게 되었다가, 라이니시(Reinisch) 데이터에 사용할 때 다듬었던 것 같습니다. 이론적으로는 둘이 거의 같지만요. 앞에서 언급한 주제들에서와 마찬가지로 성향 점수라는 아이디어는 실제 문제를 풀다가 얻게 된 것이지만 일반성을 갖고 있었죠.

: 다중 대치(multiple imputation; MI) 또한 당신의 영향력 있는 공헌 중 하나였습니다. 당신의 책 “표집 설문 무응답의 다중 대치 (Multiple Imputation for Nonresponse in Sample Surveys, Rubin 1987a)”은 널리 MI의 시초로 인용되고 있죠. 하지만 제가 아는 바에 따르면 당신은 이 아이디어와 MI라는 용어를 훨씬 전부터 갖고 있었습니다.

루빈: 맞습니다. 저는 1978년 ASA 학회지에 낸 논문에서 처음 MI에 대해서 썼죠(Rubin 1972, 1978b). 제가 “18+년이 흐른 이후의 다중 대치 (Multiple Imputation After 18+ Years, Rubin 1996)”를 썼을 때의 “18+년”은 여기에서 온 것입니다.

파브리: MI는 결측 자료의 맥락에서 개발되었지만, 그보다 훨씬 다양한 상황에서 사용할 수 있지요.

루빈: 그렇습니다. 제 생각에 MI는 온갖 상황에서 사용되어 왔으며 앞으로도 그럴 것입니다. 제가 책 이름을 “표집 설문 무응답의 다중 대치”이라고 지은 것은, 공공으로 사용하기 위한 데이터셋을 만들 때 결측 자료를 손보는 사람과 데이터 분석을 하는 사람 사이에 분리가 있어야 함이 적어도 제게는 분명해 보였기 때문입니다. 데이터의 사용자들은 다중 대치를 하기 위한 도구나 자원(예를 들면 기밀 정보 같은)이 없을 수도 있기 때문에, 이런 것이 필요함은 분명했죠. 제 박사과정 학생들인 트리빌로어 라그후나탄(Trivellore Raghunathan; Raghu)과 제리 라이터(Jerry Reiter)은 MI를 이용한 비밀 유지(confidentiality)에 대해 환상적인 공헌들을 했죠. 물론 제 다른 지도학생들인 Nat Schenker, Kim Hung Lee, Xiao-Li Meng, Joe Schafer과 다른 많은 사람들도 MI에 중요한 공헌들을 했습니다. MI의 발전은 이들과 로드 리틀(Rod Little) 같은 사람들, 그리고 그들의 동료들과 학생들 덕분에 이루어졌죠.

파브리: 로드 리틀은 반쯤은 농담으로 “인용을 많이 받고 싶은가요? 그러면 루빈과 함께 책을 쓰십시오!”라고 한 적이 있습니다. 그리고 실제로 그는 당신과 “결측 자료의 통계적 분석(Statistical Analysis with Missing Data)”를 썼는데, 이 책은 지금 결측 자료 교과서의 고전이죠. 그 이후 결측 자료 분석에 있어서 많은 발전과 변화가 있었습니다. 당신은 이러한 변화들을 반영한 책을 쓸 예정이 있나요?

: 오 그럼요, 우리는 지금 그 작업을 하고 있어요. 1987년과 2002년 사이의 주요한 변화는 베이지언 방법론과 MCMC같은 연산의 수용이 훨씬 확대된 것이지요. 로드는 나보다 훨씬 유려하게 글을 쓰는 환상적인 공저자지요. 저는 3판은 1987년 판과 2002년 판 사이의 변화보다 훨씬 큰 변화가 있을 것으로 생각하는데, 이 중 다수가 전산의 발전에 기인한 것이지요.

베이지언에 대해

: 당신은 1978년 Annals (역자주: 통계학의 유명 저널인 ‘통계학 연보(Annals of Statistics)’의 약칭) 논문에서 (Rubin 1978a) 처음으로 인과 효과의 베이지언 추론에 대해 엄격한 공식을 만들었죠. 그러나 아주 최근까지만 해도 인과 추론의 베이지언 접근을 하는 사람은 많지 않았고, 인과 추론의 영역에 있는 사람들은 대부분 현재까지도 주로 빈도주의자 들입니다. 당신은 인과 추론에 있어서 베이지언 접근의 역할에 대해 어떻게 보시나요?

: 저는 베이지언 통계가 문제들을 접근하는 옳은 방법이라고 믿습니다. 피셔 식의 검정이나 네이만의 비편항 추정 혹은 신뢰 구간과 같은 기본적인 빈도주의 접근은 잡음(nuisance) 변수가 많은 복잡한 문제들에서는 대체로 잘 작동하지 않습니다. 그러니까 새로운 절차를 만드려면 베이지언 통계를 사용해야 하죠. 귀무가설을 기각할 근거를 찾는 용도로 사후 분포의 예측력 확인(posterior predictive checks)을 하거나, 직접적으로 우도 함수를 건드리는 방식(Frumento et al, 2012)으로 부분적인 베이지언 접근을 할 수도 있습니다; 데이터가 흥미로운 귀무가설과 일치한다면 그걸 받아들여야 하죠. 하지만 네이만 식의 베이지언 절차에 대한 빈도주의 평가는 여전히 의미가 있습니다.

: 하지만 왜 인과 추론 분야는 여전히 빈도주의가 대세인 것일까요?

: 제 생각에 여기엔 여러가지 이유가 있습니다. 첫째로, 많은 베이지언 통계학자들이 과학에는 관심이 없고 MCMC 대수나 알고리즘에만 너무 치중합니다. 둘째로, 제가 생각하기에 빈도주의의 적률추정(method of moments; MOM) 접근은 동기 부여가 잘 되고 정보의 출처가 뚜렷해 가르치기가 쉽습니다. 예를 들어서 도구 변수(instrumental variable)을 단방향 비순응 문제에 사용하는 간단한 상황을 생각해 봅시다. 단순한 적률 추정치를 보고서 정보가 어디에서 왔는지 파악하는 것은 정말 쉽습니다. 베이지언 방법론을 사용하면, 답은 어떤 의미론, 그냥 당신의 눈 앞에 있습니다. 그런데 정보가 어디에서 왔냐고 묻는다면, 당신은 어떤 임의의 값으로부터 시작해서, 반복적으로 조건부 기대값을 계산하거나 결합 분포(joint distribution)으로부터 뽑아내야 하지요. 베이지언 아이디어를 이해하기 위해서는 훨씬 복잡한 수학적 사고를 해야만 합니다. 결측 자료 문제 중에는 어떤 변수에 대해서는 적률추정을 이용한 유일하고 일관된 추정치가 있지만, 결합 최우도 추정치(joint MLE)는 경계이 있는 경우들이 있죠(Efron 1994에 대한 제 논의를 보세요). 그러니까 제가 생각하기에 아이디어를 전달할 때는 간단한 추정치나 간단한 절차의 동기를 설명하고 너무 효율적이려 하지는 않는 것이 교육적으로 쉬운 경우들이 많습니다. 인과 추론에 있어서는 Rubin 1977에서처럼 비편향이나 거의 비편향으로 인과 추정을 하는 것이 여기 해당하죠. 현재 대부분의 통계학자들이 받아온 교육에 따른 문제들도 있습니다.

: EM 이후 1980년 초부터 당신은 베이지언 연산 방법을 개발하는 데 깊게 관여했는데, 여기엔 베이지언 부트스트랩(Bayesian bootstrap; Rubin 1981), 표본추출 중요도 재추출 (Sampling Importance Resampling; SIR; Rubin 1987b), 그리고 (덜 알려진) “근사 베이지언 계산 (Approximate Bayesian Computation; ABC; Rubin 1984, Section 3.1)이 포함되죠.

: 그 시점에는 컴퓨터가 베이지언 통계가 더 널리 쓰여지는 것을 가능케 할 것이라는 점이 분명했지요. 당신과 Simon Tavare, Christian Robert 그리고 Jean-Michel Marin 등은 처음으로 ABC를 제안한 공로를 저에게 돌렸지요. 고맙습니다! 그렇지만 솔직히 말해서 저는 간단한 충분 통계량(sufficient statistics)이 있는 경우가 아니고서는 이것이 유용한 알고리즘이 될 것이라는 생각은 전혀 하지 못했습니다.

파브리: 그렇지만 당신은 이런 아이디어를 사용할지라도 계속해서 연구하지는 않죠. 그리고 당신은 베이지언 추정에 근본적이고 중요한 아이디어들을 제공하는 굉장한 공헌을 하고서도 스스로를 베이지언이나 빈도주의자로 규정하지는 않습니다.

: 일단 저는 모든 “종교”에 적대적입니다. 얼마 전 독일 밤베르크에서 라구(Raghu)의 강연을 들었는데, 그는 그의 세상엔 억만겁의 많은 신들이 존재한다고 하더군요. 그리고 저는 그가 맞다고 생각해요. 이 좋은 생각에 하나, 저 좋은 생각에 하나씩, 무수히 많은 신들이 있어야 합니다. 그리고 각자가 원하는 대로 각자의 신들을 만들어낼 수 있죠. 나는 베이지언 진영에 완전히 맹세한 회원이 아닙니다- 나는 그들과 친구가 되는 것이 좋지만, 종교적으로 베이지언이 되고 싶었던 적은 한 번도 없어요. 제 생각에 한 종류의 추론 방법에 문제를 야기하는 어려움은 다른 종류의 추론 방법에도 방식이 다를 뿐 꼭 문제를 야기합니다. 예를 들자면, 교란이 일어난 실험군 배정이 빈도주의 추정에 문제를 일으킨다는 점은 자명하죠. 이것이 베이지언 추정에도 문제를 야기하나요? 그렇습니다. 1978년 Annals 논문이 이 점을 지적하죠: 무작위화(randomization)은 베이지언에게도 영향을 미치죠. 빈도주의에서처럼 추론의 근본에 영향을 주지는 않지만, 우도 함수(likelihood function)에 영향을 줍니다.

제가 폴 로젠바움(Paul Rosenbaum)과 1984년에 쓴, 폴에게 있어서는 유일한 (적어도 저와 쓴 것 중에서는) 베이지언 논문이 있는데 (Rosenbaum and Rubin, 1984b) , 지금 박사과정 학생인 비비안나 가르시아(Viviana Garcia)와 함께 그것을 더욱 발전시키고 있습니다. 폴과의 논문에서 우리는 시뮬레이션을 통해 중단 규칙(stopping rule)이 베이지언 추정에 영향을 준다는 사실을 보였습니다. 중단 규칙을 갖고 있고 또 균일 부적절 사전 분포(uniform improper prior)와 같이 “잘못된” 사전 분포를 사용하는데 반면 데이터는 “올바른” 사전 분포로부터 생성된다면, “잘못된” 사전 분포로부터 얻은 해답과 올바른 사전 분포로부터 얻은 해답은 다르다는 것입니다. 이건 아주 많은 상황으로 확장될 수 있고, 무관성(ignorability)에 대한 온갖 정리들과 관련되어 있으며, 올바른 메져(measure)에 맞는 올바른 모델이 사용해야 한다는 교훈을 줍니다. 물론 이것은 실제로는 불가능하므로, 잘못된 모델을 사용하는 베이지언 절차에 대한 노이만 식 빈도주의 평가가 필요해지게 됩니다 (Rubin 1984). 이론적으론 베이지언 분석은 언제나 잘 작동합니다만, 때로는 작동하게 만들기가 굉장히 어려울 수 있습니다! 현실적으로는 베이지언 분석이 잘 작동한다고 해도, 얼마나 결론이 뒤틀릴 수 있는지에 대해서 다른 이론적 근거들을 갖고 있는 것이 필요합니다. 그러니까 뭔가 잘못되었을 때의 대비책이 필요한 것이고요, 그래서 저는 빈도주의 평가가 굉장히 중요하다고 생각합니다. 물론 모든 질점 사전분포(point mass prior)에 대한 비조건부 네이만-피어슨 (unconditional Neyman-Pearson) 빈도주의 평가 말고, 주어진 상황에서 고려해야 하는 문제의 군(class of problems) 속에서 평가해야겠죠.

: 1984년 “응용통계학자를 위한, 베이지언 식으로 정당화 가능한 적절한 빈도 계산(Bayesianly Justifiable and Relevant Frequency Calculations for the Applied Statistician, Rubin 1984)”은 제가 가장 좋아하는 논문 중 하나입니다. 조지 박스의 이전 논문(Box, 1980)에서와 같이 이 논문은 “보정된 베이지언(calibrated Bayes)” 패러다임을 일반적으로 접근하는데, 이것은 베이지언과 빈도주의 패러다임의 절충 혹은 중간 지점으로 볼 수 있죠. 이 논문은 많은 사람들에게 깊은 영향을 주었습니다. 특히 로드 리틀(Rod Little)은 2005 ASA 회장 추천 연설과 2012 피셔 강의를 포함 많은 강연에서 21세기 통계학의 로드맵을 얘기할 때 “보정된 베이지언”을 강하게 변호했죠. 당신이 이 논문을 쓰게 된 배경과 이유는 무엇인가요?

: 흥미로운 질문이군요. 저는 1981년과 1982년 사이에 수학 연구 센터(Mathematics Research Center)에 있는 박스(Box)를 방문했고 Rubin (1983)을 그  때 썼습니다- 제가 생각하기에 그건 괜찮은 아이디어인 좋은 논문이었지만, 만족스러운 큰 그림이 빠져 있었습니다. 그 큰 그림에 대한 불만이 1984년 논문으로 이어졌죠. 그걸 “제대로” 해내기 위해 아주 오랜 시간이 걸렸습니다만, 이제는 전 모든게 자명해 보입니다. 사후 분포의 예측력 확인(posterior predictive check)은 Meng (1984), Gelman, Meng and Stern (1996), 그리고 여러 저자가 쓴 “베이지언 데이터 분석(Bayesian Data Analysis)” (Gelman et al., 1995, 2003, 2014)에서 더 명확해지고 발전되었죠.

파브리: 가장 유명한 베이지언 교과서 중 하나인 “베이지언 데이터 분석(Bayesian Data Analysis)” 책에 대해서 좀 더 얘기해주실 수 있나요?

: 넵, 제 생각에 그 Gelman et al. 책은 최고로 유명한(THE most popular) 베이지언 교과서입니다. 그건 1980년 중반 아니면 후반 제가 학과장일 때 존 칼린(John Carlin)이 가르친 베이지언 수업 노트로부터 시작했죠. 앤디(Andrew Gelman)은 아마 그 때 대학원생이었을 거고, 학문에 대한 엄청난 열정을 갖고 있었습니다. 존 (칼린) 은 자기 고향인 호주로 돌아가려 했고 학과는 강의 예산이 좀 남아 있어서 우리는 존을 일 년 더 붙잡아두려 했습니다 – 자세한 건 기억이 나지 않네요. 그렇지만 강의 노트를 한 권의 책으로 만들어야겠다는 생각이 그 때 시작되었다는 것은 기억합니다. 할 스턴(Hal Stern)도 조교수로 우리와 함께 있었고, 우리 넷은 한번 해보기로 결정했습니다. 우리는 기본적으로 챕터를 나누었고 작성을 시작했죠. 존의 초기 강의 자료로 시작한 것이긴 했지만, 앤디가 “맡기” 시작하자 많은 것들이 바뀌었습니다. 곧 앤디와 할이 가장 활발해졌죠. 앤디와 할의 역할은 2판에서는 더욱 지배적이었고, 저는 몇가지를 더하고 편집하긴 했지만 분명히 이건 앤디의 작품이었습니다. 2014년 초에 막 나온 3판에선 그게 더 심해져서 앤디가 좋아하는 연구를 하는 두 사람(데이비드 던슨(David Dunson)과 아키 베타리(Aki Vehtari))이 추가됐고, 그들은 앤디의 요청을 잘 수용해 줬지요. 그룹의 나이 든 사람으로서 저는 그냥 저를 마지막 저자로 만들어 달라고 요구했습니다; 앤디는 당연히 첫번째 저자였고, 두번째와 세번째는 1판에서와 같이 했지요. 어떤 면에 있어서 저는 앤디가 에디터인 저널의 준 에디터(associate editor)가 된 것 같은 느낌이 듭니다! 우리는 잘 어울리고, 그 책은 분명히 성공적이죠.

: 1990년대 초 통계학의 혁명적인 발전은 MCMC 방법론입니다. 당신은 겔만-루빈 통계량(Gelman-Rubin statistic)으로 겔만과 함께 여기에 공헌했는데, 이건 당신의 이전 연구와 관련이 깊어 보입니다.

: 그렇습니다. 우리는 다중 대치(multiple imputation)에서 규칙들을 조합하는 아이디어를 사용해, MCMC의 수렴을 확인하는 문제를 다중 다치와 다중 경로(multiple chain) 프레임워크 안으로 끌어왔죠. 다중 경로(multiple chain)을 사용하는 아이디어는 앤디의 물리학 지식에서 온 것으로, 제 아이디어는 아니었습니다. 제 공헌은 다중 대치에서 규칙들을 조합하는 방법을 변형해서 적용하라고 조언한 것이었죠. 아 아이디어는 단순하기 때문에 강력합니다. 시작점이 영향을 주지 않는다면, MCMC에 문제가 없는 것이고 그것으로 끝이죠. 진짜 어려운 문제는 수렴을 확인하기 위한 추정량(estimand)의 함수를 선택하는 것이죠. 항상 그렇다시피 이 함수가 정규분포에 잘 점근 수렴(asymptotically converge)해야 겔만-루빈 통계량의 단순한 정당성이 대충이라도 확보되니까요.

1990년대: 경제학자들과의 공동 연구

파브리: 1990년대에 당신은 경제학자들과 일하기 시작하죠. 조슈아 앵그리스트(Joshua Angrist)와 특히 귀도 임벤스(Guido Imbens)와 함께 당신은 잠재적 결과(potential outcome)와 도구 변수를 이용한 인과 추론을 연결하는 일련의 아주 영향력 있는 논문들을 써냅니다. 어떻게 이런 공동 연구가 시작되었는지 말씀해주실 수 있나요?

: 그럼요. 저는 언제나 경제학을 좋아했습니다; 많은 경제학자들은 성격이 아주 좋죠! 90년대 초에 하버드 경제학과의 신임 교수였던 귀도가 내 연구실에 찾아와서 “나는 당신이 재미있어 할 만한 것을 갖고 있어요”라는 식으로 얘기했습니다. 그와 나는 초면이었고, 그는 도구 변수와 같은 개념이 통계학에서 사용된 역사가 있는지 물어보았죠. 귀도와 조쉬 앵그리스트는 이미 Econometrica 논문에서 LATE (Local Average Treatment Effect)라는 개념을 정의했었습니다. 나는 더 기술적이고 정확한 CACE(Compiler Average Causal Effect)라는 이름이 훨씬 더 나은 이름이라고 생각하지만요. 지역적(local)이라는 말은 여러 가지 의미로 사용될 수 있잖아요. 보스톤의 지역(local)이라던가, 여성의 신체 부위라(local)던가 하는 식으로요. 여하간 그래서 저는 “흠, 어떤 문제인지에 대해서 얘기해주세요, 저는 통계학 내에서는 그것에 대해 들어본 적이 없군요”라고 대답했고, 그가 설명하는 동안 나는 “우와, 이거 중요해 보이는데! 난 이런 걸 본 적이 없어”라고 생각하기 시작했지요. 그리고선 저는 “내일 만나서 이것에 대해 더 얘기해봅시다”라고 말했습니다. 왜냐하면 이런 종류의 가정들 (단조성(monotonicity)라던가 “배제 제한(exclusion restriction)”)은 제게 매력적이었고, 여기에 제가 전혀 진지하게 생각해보지 못한 무엇인가가 있음이 분명했기 때문이지요; 그건 굉장했습니다. 이것이 마침내 도구 변수 논문(Angrist, Imbens and Rubin, 1996)과 베이지언 논문(Imbens and Rubin 1997)으로 이어졌죠.

당시 제가 AMGEN의 ALS(amyotrophic lateral sclerosis)를 치료하기 위한 제품에 대한 컨설팅 프로젝트를 하고 있었던 것이 여기에 긴밀하게 관련되어 있습니다. ALS는 루게릭 병이라고도 불리는 진행형(progressive) 신경근(neuromuscular) 질병으로, 결국엔 운동 신경을 파괴시키고 죽음에 이르게 하죠. 새로운 제품은 무작위 할당 후 2년 뒤의 QOL(quality of life; 삶의 질) 측면을 주로 대조군과 비교되는데, QOL은 말하자면 풍선을 얼마나 불어낼 수 있는지 평가하는 “forced vital capacity” (FVC)로 측정됩니다. 사실 많은 사람들이 무작위 할당 후 2년간 생존하지 못하기 때문에, 2년 뒤의 QOL은 죽음에 인해서 절단(truncate) 혹은 검열(censor)되죠. 사람들은 결측 자료(missing data)의 틀에 이 문제를 맞추려고 노력했지만, 나는 단번에 바로 이 문제는 그것과는 다르다는 것을 깨달았습니다.

: 본질적으로 두 아이디어는 모두 주층화(Principal Stratification)의 특수한 경우인데, 여기서 얘기해 봐도 좋겠네요.

: 네, 그럼요. 귀도와의 연구와, 또 그와 같은 사고의 방식은 지나치게 최소 제곱 추정에 집착했던 후대 경제학자들 보다는 틴버겐(Tinbergen)이나 하벨모(Haavelmo)와 같은 3~40년대 유럽의 경제학자들의 생각에 더 가까웠죠. 둘 중 하나(아마 하벨모일 겁니다)와 네이만은 이 가상적인 수요와 공급 실험에 대해서 좀 교신을 했었습니다. 유럽의 두뇌들은 기술적인 수학을 논하지 않았을 뿐 서로 얘기하고 있었던 것이죠!

파브리: 저는 당신이 귀도를 만나기 수년 전부터 튜키와 같은 다른 통계학자들과 함께 경제학자들이 선택(selection)이나 결측 자료 문제를 다루는 방식에 대해 논의했다는 것을 알고 있습니다. 그러나 당신은 경제학자들이 최소한으로 말해서도 모험적이라 할 정도로, 당신이 연구한 문제들을 완전히 무시하고 다루는 것을 본 경험들이 있었죠.

: 네, 제임스 헥먼(James Heckman)은 내가 ETS를 퇴직하고 시카고로 간 1980년대 초부터 내 연구를 따라오고 있었죠. 공식적인 의견 교환은 하워드 와이너(Howard Wainer)가 편집하고 헥먼(Heckman), 튜키(Tukey), 하티건(Hartigan)이 주석을 단 ETS 책(여기에 Glynn, Laird and Rubin 1986이 등장하죠)이 처음이었습니다.

파브리: 경제학은 인과 관계라는 개념이 아주 중요한 분야이죠; 당신은 이것 때문에 경제학에 관심을 갖게 된 건가요? 경제학자들이 갖고 있는 문제들은 대개 아주 재미있지요.

1980년대 후반 하버드 강의실에서

1980년대 후반 하버드 강의실에서

: 수업에서 사회과학과 학생들이 던지는 질문들 중에 재미있는 것이 많습니다. 최근의 예를 들자면 “미국이 유럽에 의해서 세워지지 않았으면 어떻게 되었을까?”와 같은 질문을 어떻게 대답해야 할 것인가에 대한 것이었죠. 저는 질문자에게 “그럼 누구에 의해서 세워질까요? 중국인? 아프리카 인? 당신은 무슨 얘기를 하고 있는 겁니까? 우리는 지금의 미국을 무엇과 비교하고 있는 거죠?” 다른 예는 내가 지도한 앨리스 시앙(Alice Xiang)의 학사 논문입니다. 뛰어난 학위 논문으로 훕스 상(Hoopes Prize)과 경제학에서 해리스 상(Harris Prize)을 받은 이 논문은 인종 차별 철폐 조처(racial affirmative action)의 법대 입학 결과에 대한 인과 효과와 사회경제학적인 위치(socioeconomic status)에 조건법적인 같은 비율을 비교합니다. 이건 칵테일 파티에서나 얘기하는 가벼운 내용이 아닙니다- 이것은 최근 미국 대법원에서의 피셔 대 텍사스 주립대(Fisher v. University of Texas) 사건이었고(하급 법원에 되돌려 보내졌습니다), 최근엔 미시건 주의 법에 영향을 받게 되기도 했습니다. 귀도 (임벤스), 예전 박사과정 학생들, 댄 호(Dan Ho), 짐 그레이너(Jim Greiner), 저와 다른 사람들이 미국 대법원에 의견서를 써서 제출하기도 했구요.

(왼쪽부터) 귀도 임벤스, 돈 루빈, 조쉬 앵그리스트, 2014년 3월

(왼쪽부터) 귀도 임벤스, 돈 루빈, 조쉬 앵그리스트, 2014년 3월

이렇게 질문을 명확하게 나타내는 것은 아주 중요한 일이고, 제가 생각하기에는 통계학의 중심에 있는 일입니다. 인과 관계에 대한 당신의 질문을 명확하게 나타내는 것은 정말 중요합니다. 당신이 대학 졸업률이나 변호사 자격 통과율에 대한 차별 철폐 조처의 인과 효과를 얘기할 때, 당신이 고려하는 다른 개입 방안은 무엇인가요? 성급하게 문제를 최소제곱추정(OLS) 회귀 분석으로 만드는 것은, 적어도 제가 보기에는 잘못된 접근입니다.

: 당신은 분명히 오랫동안 법학에 관심을 가졌지요; 앞서 언급한 차별 철폐 법안 논문 외에도, 통계학을 법학에 적용하는 연구들을 했습니다.

: 네. 아마 제 생각에 폴 로젠바움이 제 하버드에서의 학생들 중엔 처음으로 법학에서 통계학을 사용했지요. 1978년 그의 자격 시험 논문 (qualifying paper) 아니면 수업 논문이 사형 제도의 효과에 대한 것이었습니다. 저의 다른 훌륭한 박사과정 학생이었고 하버드 통계학과에 들어오기 전에 법학 학위를 갖고 있던 짐 그레이너(Jim Greiner)는 박사학위 논문(과 그리고 이어진 여러 중요한 논문들)에서 잠재적 효과와 불변 속성(immutable characteristics)의 인과 효과를 다뤘습니다. 그는 지금 하버드 법대의 정교수지요. 그 외에도 과거 제겐 통계학과 법학에 관심이 있던 학부생들이 여럿 있었습니다만, (슬프게도) 대부분 법대로 갔습니다. 1980년부터 저는 여러 법적인 주제에 관여해 왔습니다.

새로운 천년(millenium): 주층화(principal stratification)

파브리: 귀도와의 공동연구와, 사망으로 인한 검열(censoring)에 대한 연구는 주층화(principal stratification)에 대한 논문(Frangakis and Rubin, 2002)으로 이어집니다. 이 논문은 콘스탄틴 프랑가키스(Contantine Frangakis)라는 당신의 뛰어난 학생과 함께 썼는데, 그는 판의 지도교수이기도 하죠.

: 네, 콘스탄틴은 굉장했지만, 그 논문의 원래 제목은 그의 학위 논문 제목과 같이 굉장히 길었죠. 그 제목은 라틴어 조금, 이탈리아어 조금, 불어 조금, 그리고 그리스어 조금을 섞어가며 계속 이어졌습니다! 물론 저는 몹시 짜증이 났고, 논문의 제목을 ‘인과 추론에서의 주층화(Principal Stratification in Causal Inference)’ 로 단순화하라고 설득했죠. 그는 정말 명석해서 자기 머리 속에서 벌어지는 온갖 복잡한 생각들을 다 감당할 수 있었지만, 그런 이유로 그는 가끔 그 모든 아이디어 속에서 핵심을 뽑아내 단순화하는 일에는 어려움을 겪었습니다.

: 당신은 주층화의 발전에 있어서 가장 중요한 성과는 무엇이었다고 생각하나요?

: 주층화는 인과 문제에 있어서 진짜 정보가 무엇인지에 대한 완전히 새로운 사고방식의 집합입니다. 진짜 정보가 무엇인지 이해하고 나면, 어떻게 그 정보를 이용해서 원하는 질문에 대답할지 생각할 수 있게 되지요; 항상 가정은 필요하고, 주층화는 가정을 명확하게 하도록 강제합니다. 최소제곱추정처럼 어떤 사회과학자나 의사도 이해하지 못할 개념 말고, 과학적이나 의학적인 개념들을 통해서요. 그리고 가정은 필요하기 때문에, 솔직하고 분명하게 가정을 얘기해야 합니다. 예를 들면 나는 당신들의 다중 사후 무작위화 결과(multiple post-randomization outcomes)에 대한 논문들(Mealli and Pacini, 2013; Mattei, Li and Mealli, 2013)을 좋아합니다. 당신들은 어떤 결과에 대해서는 배제 제한(exclusion restriction)이나 다른 구조에 대한 가정(structural assumption)이 더 적합할 수 있다고 논의하기 때문이죠.

파브리: 주층화는 종종 조정 분석(mediation analysis)과 같은 도구들과 비교됩니다- 조정 효과(mediation effect)의 추정에 대한 당신의 생각은 어떤가요?

: 제 생각에 우리(돈과 파브리)가 최근에 JRSS-A에서 한 논문에 대해 논의한 것 같은데, 그 논의가 저(혹은 우리)의 입장에 대한 요약입니다. 말하자면 조정 효과에 대해 논문을 쓰는 사람들은 함수가 무엇인지 잘 모르는 것 같습니다. 그들은 인수(argument)가 두 개 들어있는 괄호가 있는 뭔가를 쓰고, 인수 사이에 쉼표를 넣고서는, 뭔가가 잘 정의됐다고 생각하는 것 같아요!

: 인과 추론이 통계학과 다른 분야들에서 점점 주목을 받고 있음에도 불구하고, 인과 추론에 대한 오해, 오용, 오독, 그리고 신비화(mystifying)가 많이 일어나는 것 같습니다. 왜일까요? 그리고 무엇이 변화해야 할까요?

: 저는 부분적으로는 인과 추론이 다른 통계학의 많은 주제들과는 매우 다르게 기술적인 고급 수학 지식을 필요로 하지 않지만 개념적이고 기본적인 수학적 세련됨(sophistication)을 요구하기 때문이 아닌가 합니다. 주층화가 그런 예 중 하나죠. 기호를 적는다고 해서 기호의 의미를 이해하거나 수학적으로 뭔가를 증명하게 되는 건 아닙니다. 또 부분적으로는 인과 추론이 인기 있는 주제가 되었기 때문에 엉성한 논문들이 쏟아져서 그런 것도 있습니다. 어떤 분야에서는 (모든 것이 최소제곱추정에 기반한) “낡은” 생각과 새로운 생각들을 연결하는 것이 중요합니다. 이것이 귀도와 제가 책을 쓰면서 끊임없이 노력해온 점이죠 (Imbens and Rubin, 2015).

: ‘그 책’을 언급하셨는데요; 그 책 언제나 나오나요? 지난 십년간 계속 나온다고 했는데요.

: (웃으며) 에이 판, 너무하는데요! 그게 십년밖에 안 되었다고요? 우리는  출판사(Cambridge University Press)에게 2013년 9월 30일까지 다 쓰겠다고 약속했습니다. 거의 500페이지에 25챕터로 구성되어 있을 거예요. 주층화나 IV 환경(setting) 이상에 대한 내용들은 다음 권에 들어갈 겁니다. 이건 분량 문제 때문이기도 했고, 또 우리가 회귀 불연속 설계(regression discontinuity design)나 다중 대조군(multiple treatments)에서 성향 점수(propensity score)를 사용하는 것과 같은 주제들이 아직 명확하고 분명하게 체계화되지 못했다고 생각하기 때문이기도 합니다. 또 1권에서는 역학(epidemiology)에서 중요한 사례 조절 연구(case control study)를 다루지 못했어요; 역학 연구자들에게 온갖 기교만 가르치기보다 이런 연구를 말이 되는 체계 안으로 들여오는 것은 굉장히 중요합니다.

멘토링, 컨설팅 그리고 편집자로서의 활동

파브리: 당신은 50명 이상의 박사과정 학생들과 많은 학사과정 학생들을 지도했습니다. 이거 무슨 채용 인터뷰처럼 들리긴 합니다만, 당신의 교육 철학은 무엇인가요?

: 제 관점은 교육은 학생 각각의 성격과 지향점에 맞춰서 완전히 다르게 접근해야 한다는 것입니다. 하버드에는 굉장한 학부와 대학원 학생들이 있지만, 이들은 각각 다른 장점과 목표를 갖고 있습니다. 오래 전 저는 수업에서 학생들의 주목을 받기 위한 엔터테이너가 되겠다는 의지나 능력이 없다고 결론지었습니다. 그들이 제가 재밌다고 느끼면 좋죠; 그렇지만 제가 강의하는 내용이 재미있다고 느끼는 게 더 낫습니다.

파브리: 당신의 학생들 중 다수가 학계 뿐만이 아니라 많은 곳에서 리더가 되었습니다. 그리고 당신은 자주 당신이 가장 자랑스러워하는 것은 당신의 학생들이라는 말을 했죠. 여기서 그들에 대해 하나 하나 언급하는 것은 당연히 말도 되지 않지만, 학생들과의 좋았던 기억들을 좀 들려주실 수 있나요?

: 파브리, 우리가 이 인터뷰를 하루 더 하지 않는 이상 그건 불가능하겠군요. 제가 말할 수 있는 것은 정말 많은 재능있는 학생들을 지도하게 되어 대단히 행복했다는 것입니다. 시카고 대학과 하버드에서의 내 뛰어난 박사과정 학생들을 열거하는 것으로 시작할 수 있겠죠. 제 학생들은 모두 다양한, 때로는 남다른 측면에서 재능이 뛰어났습니다; 제 학생들 중 두 명이 COPSS 상을 탔고, 한 명은 ASA 회장, 한 명은 ENAR 회장, 두 명이 JSM program chair 등등 많은 영예를 얻었고, 다수가 정부, 학계와 산업에 중요한 공헌을 했습니다.

: 당신은 다양한 종류의 주제에 있어 많은 학부 학생들을 지도하기도 했습니다. 사람들은 대학원생 지도에 비해 학부생 지도가 더 어렵고 보람은 덜하다고 생각하기 때문에 이건 상당히 드문 일이지요. 당신은 여기에 대해 어떻게 생각하시나요?

: 나는 이런 종류의 비난에 있어 완전히 결백한 건 아닙니다. 나는 학부생이든 대학원생이든 의욕 없는 학생들에게 의욕을 불어넣고 응석을 받아주는 일에는 전혀 관심이 없습니다. 그렇지만 하버드는 굉장히 재능과 의욕이 있는 학부생들을 끌어들이고, 즐겁게도 저는 그들 중 일부를 지도할 수 있었죠. 그들 중 다섯이 Hoopes 상을 탔고 뛰어난 학부 졸업 논문에 대한 다른 상들도 탔습니다.

파브리: 이제 판과 제가 직접적인 경험이 있는 (비록 다른 사람들도 많지만) 글쓰기에 대해서 얘기를 해 보죠. 당신은 글쓰기에 있어 완벽주의자로 알려져 있습니다. 당신이 앞서 언급했다시피, 당신은 합격한 논문도 백 퍼센트 만족하지 못하면 철회할 의사가 있죠.

: 네, 여러분이 알다시피 저는 공동저자로서 아주 짜증나는 사람이죠. 저는 이제까지 세개의 논문을 철회하고 더 발전시키려 노력했습니다; 모두 결국엔 다시 게재 승인(accept)됐죠. 하나는 당신들과의 논문이고 그 외엔 CDX 탄저병 백신 실험의 다중 대치(multiple imputation)에 대한 것(Li et al., 2014)이었습니다. 당신들은 처음엔 이걸 그렇게 기뻐하지 않았죠.

파브리: (웃으며) 네, 우리들은 저항하려 했지만 소용 없었죠. 다른 질문입니다: 당신은 게재 거절(rejection)을 어떻게 받아들이시나요? 여기에 대해 젊은 통계학자들에게 조언해 주실 수 있나요?

: 많은 시간 동안 제 논문 중 다수가 바로 거절되거나 다시 제출하는 것이 현명하지 못할 것이라는 조언과 함께 거절되었습니다. 그렇지만 이들 중 대부분이 이로 인해 어떤 측면에선가는 훨씬 좋아진 논문이 되었습니다. 사실 저는 계속해서 거절된 논문들이 저를 대표하는 공헌이라고 생각합니다. 분명히 반복된 거절과 여러 조언을 반영하려 한 제 노력을 통해 글쓰기가 좀 더 나아졌고, 가끔은 문제 정의까지 좋아지기도 했습니다. 가장 중요한 점은 비판적인 사람들이 적대적이라고 생각하지 않는 것입니다. 거의 대부분의 경우 편집인(editor)과 리뷰어(reviewer)들은 그들의 시간을 포기해가며 저자들을 도우려 하고, 흔히 젊거나 경험이 부족한 저자들에게 특별히 관대하다고 저는 믿습니다. 거절 편지(rejection letter)를 개인적인 공격으로 받아들이지 마세요. 그런 일은 정말 거의 없으니까요.

도널드 루빈(왼쪽)과 톰 벨린(오른쪽) 그리고 톰의 딸 재닛(가운데), 캠브리지 2008

도널드 루빈(왼쪽)과 톰 벨린(오른쪽) 그리고 톰의 딸 재닛(가운데), 캠브리지 2008

: 1978년 당신은 JASA의 조정 및 응용 편집인(Coordinating and Applications Editor)이 되었죠. 당신이 편집인으로서 특별한 점이 있나요?

: 저는 저자로서 게재 수락된 논문을 철회할 의지가 있습니다. 새로운 편집인으로서 저는 이전의 편집인이 승인한 논문들을 철회하라고 저자들에게 적어도 권유는 해볼 생각이 있었습니다! 저는 초반에 그것 때문에 불타올랐지요. 저는 이전의 편집 위원회(editorial board)가 승인하고 출판을 위해 편집 대기중인 논문들을 몽땅 읽었습니다; 제가 좋지 않은 논문이라고 생각한 것들에 대해서는 (제가 기억하기에 그런 논문은 여덟개가 있었습니다) 저자들에게 “친애하는 저자들에게, 저는 당신이 논문을 철회할 것을 고려해야 한다고 생각합니다”로 시작해서 왜 이 논문이 출판되면 그들이 망신당하게 될 지를 설명하는 긴 설명이 이어지는 편지를 썼습니다. 파브리는 내가 이런 조언에 있어서 얼마나 무참할 정도로 솔직했는지 알 겁니다.

: 저자들이 받아들였나요?

: 네, 하나 빼고는요. 이 저자는 투쟁했고 저는 계속 “당신은 이걸 고쳐야 합니다” 라고 얘기했죠. 결과적으로는 이렇게 논문을 수정해서 괜찮은 논문이 됐습니다. 다른 논문들의 경우 저자들이 저의 비판을 받아들였죠: 이전의 편집인이 좋은 리뷰어를 섭외하는데 실패하거나 실수를 방관했다고 해서, 그 논문이 출판되어야 하는 것은 아니죠. 그렇지만 (이래서) 저는 적어도 초반엔 별로 인기가 없었습니다.

파브리: 당신은 아주 다양한 종류의 컨설팅을 했습니다. 당신의 연구에 있어서 컨설팅은 어떤 역할을 했나요?

: 제게 있어서 컨설팅은 관심을 자극하는 문제들을 얻는 원천이었지요. 앞서 언급했다시피, 성향 점수(propensity score)에 대한 기술은 부분적으로 쥰 라이니쉬에게의 컨설팅을 통해 발전됐습니다.

파브리: 가장 논란거리가 되는 당신이 컨설팅한 사례 중에는 미국 담배 소송 건에서 전문가 증인으로 담배 회사들을 대표한 것이 있습니다. 이 소송에 대한 당신의 생각을 좀 나누어 주시겠어요?

: 기꺼이 그렇게 하죠. 이건 우리 가족이 변호사들을 다뤄온 역사에서 나온 겁니다. 우리는 어떤 것들은 합법이고 어떤 것들은 불법인 법체제(legal system)가 있습니다. 일반적으로는 법률을 싫어하더라도 따르거나 아니면 그걸 바꾸려고 노력해야 합니다. 회사가 합법적인 제품을 만들고, 그것을 현재의 법률 상 합법적으로 광고한다면, 그걸 받아들이거나 법을 바꿔야죠. 그들이 거짓말을 한다면, 법적으로 가능하다면 처벌해야 하고요. 스포츠카 광고에서 코너를 돌 때 굉장히 천천히 안전하게 돌지는 않잖아요. 차를 어떻게 광고하나요? 대개 코너를 미끄러지듯 도는 것을 보여주고, “절대로 따라하지 마세요” 라고 얘기하죠. 즐거운 것들은 대개 불확실성이나 위험성을 갖고 있습니다. 파브리를 보러 유럽으로 날아가는 것은 위험성이 있죠!

센칭 식당에서 돈의 70번째 생일을 축하하며, Harvard Square, 2014년 3월 29일. 앞줄 (왼쪽부터 오른쪽으로): Alan Zaslavsky, Elizabeth Stuart, Xiao-Li Meng, TE Raghunathan, 뒷줄(왼쪽부터 오른쪽으로): Fan Li, Elizabeth Zell, Fabrizia Mealli, Don Rubin. 이 식당에는 돈의 이름이 붙여진 "루빈"이란 접시가 있습니다.

센칭 식당에서 돈의 70번째 생일을 축하하며, Harvard Square, 2014년 3월 29일. 앞줄 (왼쪽부터 오른쪽으로): Alan Zaslavsky, Elizabeth Stuart, Xiao-Li Meng, TE Raghunathan, 뒷줄(왼쪽부터 오른쪽으로): Fan Li, Elizabeth Zell, Fabrizia Mealli, Don Rubin. 이 식당에는 돈의 이름이 붙여진 “루빈”이란 접시가 있습니다.

분명히 저는 제가 어떻게 담배 흡연을 줄이려고 개입하던 간에 폐암 발병률은 내려갈 것이라는 사실을 알고 있습니다. 그렇지만 흡연을 줄이는 어떤 조처가 담배 산업의 불법적인 활동을 줄이는 데 기여할 것이냐- 이건 법적인 문제의 정수라고 할 수 있죠.

처음 담배 회사의 변호사가 저에게 연락했을 때, 저는 그들을 컨설팅하는 것을 대단히 주저했고, 제가 정직할 수 없도록 압력을 받으면 어떻게 하나 걱정했습니다만, 주욱 그런 일은 없었습니다. 원래의 주제는 단순히 원고의 전문가들이 결측 자료를 다룬 방식에 대해서 논평해 달라는 것이었죠. 살펴보니 제가 보기에 그들의 방법은 최적이라고 할 순 없었고 나쁘게 보자면 한심했습니다 (예를 들면 “혼인 여부” 항목이 결측이면 “기혼”으로 처리). 이 초기 보고서들을 읽어 나갈수록 저는 천억 달러 단위의 돈이 걸린 일이 이런 분석에 기초해 있다는 사실에 경악하지 않을 수 없었습니다. 더 넓은 관점에서 보자면, 대부분의 분석이 기초하고 있는 논리 역시 제가 보기엔 완전히 혼란스러웠습니다. 예를 들자면, 혐의를 받고 있는 위법 행위는 대부분의 계산에서 아무런 역할을 하지 않았고, “…에 의해”와 “…의 영향으로”라는 구절은 거의 생각 없이 혼동되고 있었습니다. 우리가 피고가 악하고 유죄라는 사실을 “알고” 있는 것 만으로 이렇게 그릇된 논리와 나쁜 통계 분석에 기초해 수조 달러에 달하는 피해를 입었다고 결론지을 수 있는 것일까요? 만약에 담배 산업이 그들의 제품에 대해 거짓말을 했다는 이유로 수조 달러의 벌금을 물리는 것이라면, 저는 놀라겠지만 침묵할 것입니다. 그렇지만 이 보고서들은 통계적인 분석을 통해 금액을 결정하고 있습니다 – 피고인이 유죄라는 것을 “알고” 있다는 이유만으로 나쁜 통계를 통해 숫자를 정하는 것이 합당한가요? 이것은 어떤 선례를 남깁니까? 이 컨설팅에 관련된 윤리에 대해서는 Rubin (2002)에서 제법 다루고 있습니다.

파브리: 우리는 통계에 대해서는 상당히 많은 얘기를 했습니다. 이제 당신의 다른 열정들에 대해서 얘기해보죠. 예를 들면 음악, 오디오 시스템이나 스포츠카에 대해서요.

: 저는 다른 열정들도 갖고 있고, 그 순서는 상당히 나이에 영향을 많이 받았습니다 (당신의 인지에 이상의 판단을 맡기죠). 예를 들어서 어렸을 때는 스포츠카를 운전하는 것이나 제작하는 것이 세 손가락 안에 드는 취미였습니다. 그렇지만 나이가 들면서 (눈이 나빠지고, 반응이 느려지고, 여기저기가 아파오는 등) 음악 쪽으로 균형이 많이 옮겨갔죠. 라이브 음악과 녹음된 음악 모두요 – 다행히 아직 이런 것들을 즐기기에 제 귀는 충분히 좋지만, 나이가 더 들면 달라질 수 있겠죠.

판과 파브리: 음, 우리가 얘기를 시작한 지 벌써 세시간이 되었군요. 당신이 저녁을 먹으러 가도록 해주기 전에 마지막 질문입니다: 젊은 통계학 연구자들을 위해 짧은 조언을 해주실 수 있나요?

: 즐기십시오! 틱틱대지 말아요. 운이 좋다면 환상적인 70번째 생일 잔치를 할 때까지 살 수 있을 겁니다!

감사의 말

Elizabeth Zell, Guido Imbens, Tom Belin, Rod Little, Dale Rinkel과 Alan Zaslavsky의 조언에 감사를 표합니다. 이 작업은 부분적으로 NSF-SES Grant 1155697에서 지원을 받았습니다.

A note on relationship between marginal probabilities and conditionals.

I occasionally come across people who define their models by a “Gibbs” sampling algorithm, without explicitly specifying a marginal distribution. That is, to model a bivariate distribution on X and Y, these people do not define their marginal distribution p(x,y); instead, they show me a pair of conditional distributions p(x \mid y) and p(y \mid x), and tell me that’s their probabilistic model. This always make me feel very uncomfortable, but I couldn’t tell exactly why that’s a bad idea; so I gave it some thought this time. I could not find a compelling reason to be against this practice, but in the process I learned some interesting facts about marginal probabilities and conditional probabilities; I was so entertained that I wanted to write down my thought process here.

I started thinking about whether a bivariate random variable X,Y is fully specified by p(x \mid y) and p(y \mid x). In other words, if you are given p(x \mid y) and p(y \mid x), how much do you know about p(x,y)? If there is any hole, then I thought that could make a strong argument. I started by coming up with a somewhat atrocious pair of conditional distributions which I thought to be a counter-example:

X|Y=y \sim I(X=y), Y|X=x \sim I(Y=x),

where I(\cdot) is an indicator function. That is, given Y=y, X=y with probability 1; and also, given X=x, Y=x with probability 1. This pair of conditional probabilities give you absolutely no information about marginal distribution of X, Y, or X,Y. X could be a normal distribution, a Cauchy, or a whatever distribution you name it. So this is an example specifying conditional distributions is not enough.

I was not satisfied with this example, however, because one would argue that nobody would use such a stupid distribution to specify their model. Then, I came up with a better-looking example:

X|Y=y \sim \mathcal{N}(y, 1^2),Y|X=x \sim \mathcal{N}(x, 1^2),

where \mathcal{N}(\mu, \sigma^2) is a normal distribution with mean \mu and standard deviation \sigma. This may look somewhat legitimate if you don’t pay enough attention, but this does not specify a well-defined probability distribution either; if you run Gibbs sampling algorithm with these conditional distributions, for example, your samples will follow a random walk and will drift to anywhere in \mathbb{R}^2. So, this implies that some pair of conditional distributions do not specify a non-degenerate marginal distribution, and therefore care should be taken if you are specifying your model with only conditionals.

However, I still felt uncomfortable that some may still argue that my counter-examples do not satisfy some necessary regularity conditions, while theirs do. It occurred to me that Gibbs sampling works under fairly weak regularity conditions; since you can recover your distribution up to arbitrary precision with Gibbs sampling algorithm, actually conditional distributions should be enough to specify the marginal distribution. So this time, I wrote down conditional distributions as follows:

p(x \mid y) p(y) = p(y \mid x) p(x).

Then, I realized that

\frac{p(y)}{p(x)} = \frac{p(y \mid x)}{p(x \mid y)}.

If you integrate both sides in y, since \int p(y) dy = 1, you get

\frac{1}{p(x)} =\int \frac{p(y \mid x)}{p(x \mid y)} dy,

in other words,

p(x)=\frac{1}{\int \frac{p(y \mid x)}{p(x \mid y)} dy}.

This implies that you can recover the marginal distribution p(x) from conditional distributions. You can also get marginal distribution on X,Y by p(x) \cdot p(y \mid x), so a pair of conditional distributions actually fully specifies the model as long as the above integration can be done with probability 1. Going back to the previous example where X|Y=y \sim \mathcal{N}(y, 1^2),Y|X=x \sim \mathcal{N}(x, 1^2), the ratio of these conditional density function is a constant and not integrable everywhere; that was why this pair of conditional distributions do not define a non-degenerate marginal distribution.

In general, it may not be easy to check whether \int \frac{p(y \mid x)}{p(x \mid y)} dy is integrable with probability 1. However, I feel like this is not a strong enough argument yet… I feel like there has to be more constraints on conditional probabilities, but I don’t know about them yet. On the other hand, the ratio of two conditional densities \frac{p(y \mid x)}{p(x \mid y)} seems pretty interesting! I wonder whether it turned out to be useful in somewhere else.

도널드 B. 루빈과의 대화

번역자의 서문

도널드 B. 루빈 (Donald B. Rubin) 교수님의 학문적 성과는 현대 통계학의 중추를 형성했을 뿐만 아니라, 현재 많은 관심을 받고 있는 인공지능 기계학습이나 이미지/음성 인식과 같은 응용 분야의 기초가 되기도 했습니다. 교수님의 성과 중 하나인 EM(Expectation Maximization) 알고리즘은 많은 분들에게 친숙할 것입니다. 루빈 교수님과의 본 인터뷰는 원래 Statistical Science라는 저널에 실린 것으로, 저자 판 리(Fan Li) 교수님과 페브리지아 밀리(Febrizia Meali) 교수님 및 Institute of Mathematical Science의 허락을 얻어 글을 번역하여 공개합니다. 인터뷰 전문은 블로그 포스팅으로는 조금 길기도 하고, 제가 번역하기에 좀 지치기도 해서 두 개의 포스팅으로 나누고 두 번째는 추후에 올리고자 합니다. 번역상의 실수는 모두 제 잘못이며, 피드백은 yungilbert@gmail.com 으로 보내주실 것을 부탁드립니다. 원 글은 http://arxiv.org/abs/1404.1789 에서 읽으실 수 있습니다. 논문 레퍼런스는 원 글에서 참조해 주시기를 부탁드립니다.

초록: 도널드 브루스 루빈(Donald Bruce Rubin; 이후 돈으로 약칭)은 하버드 대학 통계학과의 존 L. 로엡 교수입니다. 그는 결측 자료, 인과 관계 추론, 표본 조사, 베이지언 추론, 전산과 다양한 응용 분야(심리학, 정책, 법, 경제, 역학, 공공 보건, 사회과학과 생체 의학 등)에 사용되는 통계 분석의 발전에 핵심적인 기여를 했습니다.

돈은 1943년 12월 22일 워싱턴 DC에서 해리엇(Harriet)과 앨런(Allan) 루빈의 아들로 태어났습니다. 태어난 지 일 년 만에 그의 가족은 일리노이 주 에반스톤으로 집을 옮겼고, 돈은 거기서 성장했습니다. 그는 고등학교에서 과학과 수학에 깊은 관심을 갖게 됩니다. 그는 1961년 물리학을 전공하고자 프린스턴 대학에 입학했지만, 1965년 심리학 전공으로 졸업합니다. 이후 그는 하버드 대학 심리학과 대학원에 입학하지만, 전산학으로 옮겨 1966년 석사 학위를 받고 1970년 빌 코크란(Bill Cochran) 아래서 마침내 통계학 박사 학위를 받습니다. 하버드를 졸업한 이후 그는 하버드 통계학과에서 1년간 강의하다가, 1971년부터는 ETS(Educational Testing Service)에서 일하기 시작함과 동시에 프린스턴 대학에 새로 생긴 통계학과의 방문 교수가 됩니다. 그는 이후 십년간 하버드, UC 버클리, University of Texas at Austin, University of Wisconsin at Madison 등에 방문 교수로 재직합니다. 그는 1981년부터 1983년까지는 University of Chicago에서 정교수로 일하다가 1984년 하버드 통계학과로 돌아와 현재까지 재직하며 1985년과 1994년, 2000년과 2004년 사이에 학과장을 맡았습니다.

돈은 50명 이상의 박사과정 학생을 지도하거나 공동 지도했으며, 12권 이상의 책을 쓰거나 편집했고, 400편에 가까운 논문을 발표했습니다. 구글 스콜라(Google Scholar)에 따르면 2014년 5월 기준 루빈의 학문적 성과는 150,000번 인용되어 (2013년만도 16,000번) 그는 전 세계에서 가장 많은 인용을 받는 학자 중 하나입니다.

그의 많은 기여에 따라 돈은 US National Academy of Sciences, the American Academy of Arts and Sciences, the British Academy의 회원으로 선출되었으며, American Statistical Association, Institute of Mathematical Sciences, International Statistical Institute, Guggenheim Foundation, Humboldt Foundation, 그리고 Woodrow Wilson Society의 Fellow입니다. 그는  American Statistical Association에서 Samuel S. Wilks 메달을, Statistical Societies의 회장 위원회로부터 Parzen Prize for Statistical Innovation, the Fisher Lectureship, 그리고 George W. Snedecor 상을 받았습니다. 그는 American Statistical Association의 보스톤과 시카고 지부로부터 올해의 통계학자(Statistician of the Year)로 지정받았습니다. 또한, 그는 독일의 Bamberg 대학과 슬로베니아의 University of Ljubljana로부터 명예 학위를 받았습니다.

개인적으로 그는 음악과 오디오 애호가이며, 전통적인 스포츠카 팬이기도 합니다.

본 인터뷰는 몬트리올에서의 Joint Statistical Meeting 학회가 열리던 중인 2013년 8월 7일에 루빈의 70번째 생일에 앞서 한 것이며, 이후 수개월에 걸쳐 내용을 추가하였습니다.

시작

다섯살 때의 루빈

다섯 살 때의 루빈

: 일단 당신의 어릴 적 이야기부터 해보죠. 제가 알기로 당신은 변호사 집안에서 자라났고, 그것이 지적인 영향을 많이 주었을 것 같습니다. 당신의 가족에 대해서 좀 얘기해 볼 수 있나요?

: 그렇죠. 저의 아버지는 전원이 변호사인 사형제 중 막내였고, 우리는 온갖 주제에 대해 열띤 토론을 하곤 했습니다. 아마 가장 논쟁적이었던 삼촌은 (워싱턴) DC에서 온 사이(Sy; Seymour Rubin. 그는 Arnold, Fortas and Porter의 시니어 파트너이며 외교관이고 American University의 법학 교수입니다)였을 겁니다. 그는 해리 트루먼부터 제리 포드 대통령까지, 그리고 아들라이 스티븐슨(Adlai Stevenson)같은 대통령 선거의 도전자나 많은 대법원 재판관들의 개인적인 감사 편지의 틀을 잡아주는 일을 했지요. 이런 경력은 아주 인상적이긴 했지만 저를 좀 기죽게 만들기도 헀습니다. 제가 왜 이런 얘기를 하느냐면, 분명히 이런 제 경험이 제가 법률 시스템에 대해 깊은 경의를 갖게 했고, 법학에 있어서 통계학이 아주 중요하다고 생각하는 제가 통계학을 사형 제도나 차별 철폐 조처(affirmative action), 담배 소송 등과 같은 다양한 법학의 주제들에 적용하는 일을 하는데 영향을 주었기 때문입니다.

파브리: 이 주제는 나중에 다시 돌아올 겁니다만, 당신이 통계학에 관심을 갖는데 영향을 준 사람은 없었나요?

: 아마 제일 큰 영향을 준 건 당시엔 총각이었던 치과의사 외삼촌 멜(Mel)이 아닌가 합니다. 그는 작은 돈을 걸고 도박을 하는 것을 정말 좋아했어요. 그는 리글리 필드(Wrigley Field, 역자주: 시카고 컵스 경기장)에 나가서 컵스가 지는 것을 보면서 다음 공의 결과에 돈을 걸거나, 알링턴 경마장(Arlington Race track)에서 내기를 하곤 했죠. 저는 어려서부터 2불씩 돈을 잃으며 출주표(Racing Form)를 읽고 경기 각각의 승리 확률을 계산하는 방법을 배우곤 했습니다. 제가 아직 아동이었던 시절 날씨가 따뜻한 달의 수요일과 토요일 오후가 통계학을 배우는 시간이었습니다- 비록 이따금 마권 업자들이 단속을 당하긴 했지만요. 제가 기억하기로 저는 외삼촌의 괜찮은 학생이었지만 그래도 여전히 돈은 좀 잃었습니다.

1950년 후반과 1960년 초반에 제가 통계학에 관심을 갖게 만든 두가지 요인이 있었습니다. 첫번째는 아버지가 정부에 계실 때부터 오랜 친구셨고 UC 버클리 대학교의 경제학 명예 교수셨던 조지 메렌(George Mehren)입니다. 이 분과 즐겁고 (제겐) 교육적인 논쟁을 벌인 것이 제가 지금까지 경제학을 높이 사게 만들었지요. 그리고 제가 Evanston Township 고등학교에 있을 때 환상적인 물리학 선생님이셨던 로버트 앤스파우(Robert Anspaugh)가 진짜 과학자처럼 생각하는 법과 과학을 목적으로 수학을 사용하는 법을 가르쳐 주신 것이 두번째입니다.

제가 고등학교를 졸업하고 대학에 진학할 즈음 저는 도박으로부터 약간의 통계적 사고 능력을, 물리학으로부터 과학적인 사고 능력을 갖추었고, 엄밀한 수학 뿐만 아니라 물리학이나 법학과 같은 다른 분야에도 깊은 경의를 품고 있었지요. 이제 와서 생각하면 제가 나중에 하게 된 통계학 연구에 이런 경험들이 많은 영향을 미쳤습니다. 제 멘토들이 제게 미친 영향에 대해서는 Rubin (2014b)에서 자세히 읽으실 수 있습니다.

프린스턴에서의 학창시절

: 당신은 1961년에 프린스턴에 들어가서 처음엔 물리학 전공이었지만 나중에 심리학으로 바꿨죠. 왜 그랬나요?

: 좋은 질문입니다. 앤스파우 선생님 덕분에 저는 과학자가 되고 싶었어요. 저는 3년짜리 학사 과정에 들어갔었는데, 들어가기 전에는 몰랐지만 그건 5년만에 물리학 박사를 받는 미친 프로그램의 일부였습니다. 리처드 파인만의 박사과정 지도교수이자 아주 유명한 물리학 교수였던 존 윌러(John Wheeler)가 만든 심오한 계획이었죠. 지나고 생각하면 적어도 제게 있어서 그건 지나치게 야심찼습니다. 베트남 전쟁(과 그에 관련된 징병), 윌러 교수의 이 중요한 시점에서의 안식년 등 여러가지 복합적인 요소 때문에 아마 아무도 이 5년짜리 통합 박사과정을 마치지 못했을 겁니다. 어쨌거나 당시에 저같이 프린스턴에 있던 주로는 수학이나 물리학에 관심이 있던 아이들은 다른 분야에 관심을 가져볼 것을 권유받았습니다. 저는 그것을 따랐고, 당시 들었던 수업 중 하나가 후일 저와 좋은 친구가 된 환상적인 교수 실번 톰킨스(Silvan Tomkins)가 가르친 성격 이론(personality theory) 수업이었지요. 두번째 해가 끝났을 때 저는 저처럼 수학과 과학 배경지식을 갖고 있는 사람이 좀 더 드물고 인정받는 심리학과로 옮깁니다. 그건 좀 미성숙한 결정이었지만 (성숙한 사람이 어떻게 했을지는 잘 모르겠습니다), 그래도 새로운 방식으로 생각하는 법을 배우게 되었고 굉장한 학문적 스승들을 만났으니 그렇게 나쁜 결정은 아니었습니다.

파브리: 당신은 그 당시엔 드물었던 전산 능력도 갖추고 있었죠? 그러니까 당신은 컴퓨터를 상당히 일찍부터 사용하기 시작했군요.

: 그렇습니다. 프린스턴에서의 첫 해와 두번째 해 사이 언제쯤 저는 포트란을 독학했습니다. 당신이 말한 대로 그 땐 프린스턴 같은 곳에서도 이런 능력은 흔하지 않았죠.

파브리: 포트란을 배운 건 그냥 재미를 위해서였나요, 아니면 특별히 이런 기술을 이용해 풀고 싶은 문제가 있어서였나요?

: 문제 해결을 위해서였습니다. 제가 심리학과에 있을 때 생활비를 벌려고 PSTAT이라는 프린스턴의 초창기 통계 소프트웨어 패키지 개발의 코딩을 도왔거든요. UCLA의 BDMP라는 패키지의 경쟁 제품이었죠. 인간의 행동을 시뮬레이션하는 프로그램들도 많이 짰습니다.

: 프린스턴에서 4학년 때 당신은 심리학과 박사과정에 지원했고 아주 좋은 곳들에 합격했었죠.

: 네, 저는 스탠포드, 미시간, 그리고 하버드에 합격했었어요. 이 프로그램들을 방문하면서 굉장한 사람들을 만났었습니다. 저는 스탠포드로 처음 가서 윌리엄 에스터스(William Estes)라는 조용하지만 놀라운 교수를 만났는데, 수학 실력이 아주 강하고 비꼬는 농담을 잘 하는 사람으로 나중에 하버드로 옮겼죠. 미시간은 굉장히 좋은 수리심리학 프로그램을 갖고 있었고, 제가 1965년 봄 방문했을 때 굉장히 유망한 박사 졸업생이었던 아모스 트버스키(Amos Tversky)의 안내를 받았는데 그는 인간 행동과 사람이 위험을 어떻게 관리하는지에 대해서 매우 흥미로운 연구를 하고 있었습니다. 후일 그는 다른 심리학자인 대니얼 카네만(Daniel Kahneman)과 만나 심리학과 경제학에 굉장히 영향이 큰 논문들을 줄줄이 써냈고 덕분에 카네만은 2002년에 노벨 경제학상을 받게 되죠; 트버스키는 1996년 별세해서 노벨상을 받을 수 없었습니다. 카네만(최근에 오바마로부터 국가 과학 메달(National Medal of Science)를 받은 사람이죠)은 항상 자기가 받은 노벨상은 트버스키와 공동으로 받은 것이라고 말하곤 했습니다. 작년 언젠가 제가 카네만과 같은 위원회에 있었는데, 제가 트버스키를 카네만보다 오래 알고 지냈다는 것을 알게 되어 흥미로웠죠.

: 그렇지만 당신은 결국 하버드를 선택했죠.

: 뭐, 우린 모두 다 이상한 결정을 하기 마련이죠. 그 이유는 아직 졸업이 일 년 남은 여자친구가 동부에 있어서였습니다.

하버드에서의 대학원 시절

파브리: 당신은 당시엔 사회 관계(Social Relations) 학과였던 심리학과 박사과정 학생으로 1965년 하버드에 도착하고서 얼마 지나지 않아 실망하고, 전산학과로 옮겼습니다. 무슨 일이 있었나요?

: 제가 1965년 여름 하버드를 방문했을 때 사회 관계 학과의 시니어들을 몇 만났는데, 그들은 제 수학과 물리학 배경을 매력적으로 봐줬고 기초적인 수리 수업들을 면제해 주겠다고 약속했죠. 하지만 제가 막상 도착하자 사회학자였던 학과장은 “안돼 안돼, 자네 성적표를 보니 ‘통계학 방법론’같은 수업들을 듣지 않아 과학적인 소양이 부족하더군. 지금 그런 수업들을 듣던가 아니면 나가게” 라는 식으로 얘기했습니다. 프린스턴에서 많은 수학과 물리학 수업들을 들었기에 저는 모욕당한 느낌이었습니다! 저는 학과를 나가야만 했죠. 저는 하버드 심리학과 밖에서 NSF 대학원 장학금을 받고 있었기 때문에, 부담 없이 주위를 살펴봤습니다. 당시에 응용수학은 나중엔 ‘공학과 응용과학대학(School of Engineering and Applied Sciences)’이 된 ‘공학과 응용물리 분과(Division of Engineering and Applied Physics)’에서 주로 하는 것 같아 보였습니다. 분과는 여럿으로 나뉘어 있었는데 그 중 하나가 전산학(Computer Science; CS)이었고 저를 환영했죠.

: 그렇지만 당신은 또 금방 지루해하죠. 그건 당신에게 전산학 문제들이 재미가 없었거나 충분히 도전적이지 못한 것으로 생각되어서였나요?

: 아뇨, 별로 그런 건 아니었습니다. 거기엔 여러 이유가 있었죠. 첫째로는 당시가 냉전 시기였기 때문에 자동 언어 번역이 아주 강조되고 있었고 전산학과는 지금은 DARPA인 당시 ARPA(Advanced Research Projects Agency)로부터 돈을 엄청 많이 받고 있었습니다. 소련은 철의 장막 뒤편에서 엄청난 양의 러시아어 문서를 쏟아냈지만, 미국엔 그걸 다 번역할 만한 사람이 충분하지 않았죠. 어려운 점은 그들의 맥락을 알지 못하고서는 번역할 수 없는 문장들이 많았다는 겁니다. 저는 아직도 예제를 하나 기억하는데요: “Time flies fast” 라는 세 단어 문장은 셋 중 어떤 단어가 동사인지에 따라 세 가지 다른 의미가 있죠. 이런 세 단어 문장도 번역하지 못한다면, 어떻게 자동으로 (컴퓨터 같은 것을 써서) 복잡한 문단을 번역할 수 있겠습니까? 강 건너 MIT에 있는 노암 촘스키의 변형 문법(Transformational Grammar)에 대한 연구가 이것과 연관이 있죠.
(역자주: 현재 기계 번역의 트렌드가 통계적 모델을 통해 맥락을 추정하는 것임을 생각하면, 통계학의 대가인 루빈 교수가 당시에 이렇게 생각했다는 것은 흥미로운 사실입니다.)
두번째로, 전산학과에서 튜링 머신이나 괴델의 정리 등을 다루는 계산복잡도 같은 수리적인 주제의 진짜 수학 수업들은 재미있었지만, 다른 많은 수업들은 제겐 지루했습니다. 대부분 그런 건 프로그래밍에 대한 거였거든요. 당시에 했던 프로젝트 중 아직도 기억하는 하나가 DEC PDP-1 컴퓨터를 이용해 4차원 도형들을 2차원에 투영하고 돌리는 것이었습니다. 이건 정말 엄청난 시간이 걸렸죠. 제 프로그램은 완벽히 동작했지만, 저는 대단한 시간 낭비를 한 것처럼 느꼈습니다. 그리고 저는 수업에 한번도 가지 않았기 때문에 C+를 받았죠. 아주 많은 학생들을 상대하고 난 지금 저는 제가 C+를 받을 만 했다고 생각하지만, 제가 아직 애였을 땐 그럴 수 없었죠. 저는 4차원 도형들을 회전시키고 C+를 받는 것보다 더 나은 일이 있을거라고 생각했습니다. 그렇지만 베트남 논밭을 행군한다던가 캐나다 어딘가로 가는건 별로 내키지 않았습니다. 그래서 1966년 전산학 석사를 받고서 일년간 더 전산학과에 있고 나서야 저는 다른 걸 시도할 준비가 되었습니다.

파브리: 어떻게 통계학을 진로로 선택하게 된 거죠?

돈: 1996년 여름 프린스턴에서의 아르바이트 덕분이었습니다. 전 존 튜키(John Tukey)를 위해 포트란, 리스프와 코볼로 프로그래밍을 좀 해주고 있었죠. 저는 프린스턴의 사회학과 교수인 로버트 알트하우저(Robert Althauser)에게 컨설팅을 좀 해주고 있었는데, 기본적으로 템플 대학교(Temple University) 중도 포기율의 인종 격차를 연구하기 위해 흑인과 백인을 대응시키는 대응 표집(matched sampling)을 하는 프로그램을 짜는 거였습니다. 저는 알트하우저와 제 하버드에서의 심리학과 전산학 공부가 잘 풀리지 않고 있는 것에 대한 대화를 했습니다. 그는 심리학에서 반쯤은 테크니컬한 연구를 했기 때문에 프레드 모스텔러(Fred Mosteller)를 (개인적인 건 아니었지만) 알고 있었고, 하버드가 1957년 설립되어 10년이 된 통계학 학과를 갖고 있다는 것도 알고 있었습니다. 그는 저보고 모스텔러를 만나보라고 권유했죠. 저는 하버드로 돌아가고 나서 프레드에게 찾아갔고 그는 통계 수업을 몇개 들어보라고 조언했습니다. 그래서 하버드에서의 세번째 해에 저는 주로 통계 수업들을 들었고 적당히 잘 했죠. 그리고 통계학과는 저를 받아들여 주었습니다. 제가 NSF에서의 금전적인 지원을 받았던 것도 도움이 됐죠; 이유는 잘 알 수 없지만 NSF는 매년 제게의 지원을 갱신해 주었는데 (아마 그들이 보는 눈이 없다는 걸 보여주는 것일 겁니다) 뭐 제게는 잘 된 일이었죠. 어쨌거나 세번째 해가 끝날 때 저는 통계학과로 옮겼고 그게 제 4년간 세번째 학과였습니다.

파브리: 모스텔러 외에 교수진엔 누가 있었나요? 당신이 말한 대로 그건 꽤 초창기였는데요.

: 다른 시니어 교수는 빌 코크란(Bill Cochran)과 아마 막 정년 보장을 받았을 아트 뎀스터(Art Dempster) 정도가 있었죠. 주니어 교수로는 폴 홀랜드(Paul Holland), 확률론을 하는 제이 골드만(Jay Goldman), 그리고 버클리에서 왔고 에릭 레만(Erich Lehmann)의 제자였던 슐라미트 그로스(Shulamith Gross)가 있었습니다.

파브리: 그리고 당신은 빌과 일을 하기로 했죠.

: 사실 저는 처음엔 프레드한테 찾아갔습니다. 프레드는 항상 하고 있는 프로젝트들이 아주 많았죠; 하나는 존 튜키와 함께하는 것이었고 그는 저보고 그 일을 하라고 했습니다. 저는 저 스스로도 대응 표집을 하는 프로젝트를 하고 있다고 말해줬고, 그는 그럼 코크란과 얘기해보라고 했습니다. 그 때 코크란은 몇 년 전 의무감(Surgeon General)이 작성하는 흡연과 폐암에 대한 보고서의 자문 역할을 했었죠. 그건 분명히 임의화 실험(randomized experiments)이 아닌 관측 자료(observational data)에 기반한 것이었고, 프레드는 코크란이 역학과 생물 통계학에서 발생하는 이런 이슈들에 대해서 아주 잘 알고 있다고 했습니다. 그래서 저는 빌의 문을 두드렸죠. 그는 툴툴거리는 목소리로 “그래” 라고 했고, 저는 그래서 들어갔는데 그는 “아니 지금 말고 나중에!” 라고 말했습니다. 그래서 저는 “음… 까다로운 사람이군”이라고 생각했는데, 알고 보니 정이 많은 사람이었고, 스코틀랜드 식 건조한 유머 감각을 갖고 있었으며 스카치 위스키와 담배를 사랑했죠 (저는 전자는 이해했지만 후자는 그렇지 못했습니다).

파브리: 코크란은 당신에게 긴 영향을 남겼죠, 맞습니까?

: 네, 그는 제게 엄청난 영향을 줬죠. 어느날 저는 전 대응(matching) 분석에 대한 별로 중요치 않은 산수를 좀 했습니다 (요즘 학계에 그게 다시 나타나고 있더군요). 저는 빌에게 그걸 보여줬고, 그는 “돈, 자네는 이게 중요하다고 생각하나?”라고 물어봤습니다. 저는 “글쎄요, 잘 모르겠는데요”라고 했죠. 그러자 그는 “이건 나에겐 중요하지 않네. 자네가 이걸 하고 싶다면 다른 지도교수를 찾아보게. 나는 의미가 있는 통계학 문제에 관심이 있지, 이미 존재하는 것들을 엡실론만큼 나아지게 만드는 것엔 관심 없네.”라고 했죠. 그 밖에 저에게 큰 영향을 준건 아트 뎀스터 입니다. 한 번은 Data Text라는 PSTAT이나 BMDP같은 컴퓨터 프로그램 모음 프로젝트에 컨설팅을 했었죠. 저는 지금 생각해 보면 아주 부족한 연산 능력(computing power)을 갖고도 분산 분석(Analysis of Variance), 회귀분석, 보통 최소 제곱 추정(ordinary least squares), 역행렬 연산 등을 하는 프로그램을 디자인하고 있었습니다. 저는 이 중 몇개에 대해 다변수 함수에 기하학에 대한 깊은 이해를 바탕으로 항상 엄청난 직관을 갖고 있었던 (아주 피셔 스타일이죠) 뎀스터에게 조언을 구했죠.

: 당신의 박사 학위 논문은 대응 분석에 대한 것이었고 당신의 인과 추론에 대한 평생의 연구의 시발점이 되었죠. 어떻게 인과 추론에 관심을 갖게 되었나요?

: 제가 알트하우저와 인종간 격차 문제에 대한 일을 하고 있었을 때, 저는 항상 그에게 이건 본질적으로 기술(descriptive) 통계이고 인과 관계를 보여주지 못한다고 강조했습니다. 저는 고등학교와 프린스턴에서 받은 물리학 교육으로부터 연관 관계와 인과 관계는 다르다는 사실 정도는 기억하고 있었죠. 그러니까 저는 아마도 인과 추론 그 자체보다는, 사회 과학자들이 그것에 갖고 있는 혼란에 더 관심이 있었던 것 같습니다. 인과 관계를 추론하기 위해서는 먼저 실제로든 가상으로든 우리가 개입해서 그 영향으로 (예를 들면 대조군의) 결과가 바뀌는 것을 볼 수 있는 실험을 상정해야 하죠. 만약에 당신이 개입에 대해서 얘기하지 않고 있다면, 당신은 인과 관계에 대해서 얘기하고 있는 것이 아닙니다. 왜인지 모르겠지만 오래된 철학을 보면 그들은 이걸 제대로 이해하지 못했던 것 같아요. 그 전의 수백년 동안 몇몇 실험자들은 이걸 이해했지만요. 그들은 소를 기르거나 매를 교배하곤 했죠. 당신이 훌륭한 암컷 매와 수컷 매를 교배한다면, 그 결과인 다음 세대 매들은 대체로 무작위로 교배한 매들보다 더 훌륭한 사냥꾼들입니다. 20세기에 와서 많은 과학자들과 경험주의자들이 이걸 깨달았습니다.

파브리: 그러니까 당신은 박사 학위 논문에서 기술적인(descriptive) 비교들만을 했을 뿐, 잠재적 결과(potential outcome)에 대한 기호(notation)는 아직 거기 없었던 거군요.

: 부분적으로 맞는 말입니다. 1968년 코크란이 가르친 수업에서 무작위 설계에 대한 토론을 시작할 때 잠재적 결과에 대한 기호를 사용했기 때문에, 내 머릿속에선 그 생각을 하고 있었어요. 초창기엔 그건 전부 임의화(randomization), 비편향성(unbiasedness), 피셔의 검증(Fisher’s test) 등에 기반한 것이었죠. 그렇지만 당시엔 아무도 보통 최소 제곱 추정(ordinary least squares; OLS) 회귀 분석 이상의 계산을 할 수 없었기 때문에 모든 개념들은 최소 제곱 추정으로 환원되어야 했습니다. 빌( 코크란)이 가르친 회귀 분석과 실험 설계 수업에서 가르치는 것 중 하나가 간소화된 두리틀(Dolittle) 방법을 사용해 손으로(!) 역행렬 계산을 하는 거였죠. 그러니까 당시엔 임의화 검정(randomization test) 같은 건 일반적으론 할 수가 없었습니다. 제가 실험과 사회 과학에 대해 관심을 가진 건 가족 환경 떄문이기도 했지요. 항상 다음과 같은 법적인 문제를 의식하곤 했습니다: “혐의를 받고 있는 이 행위의 영향으로 무슨 일이 있을 수 있었을까?”

: 1970년에 박사 학위를 받고 나서 첫 직장은 무엇이었나요?

: 일부는 강의로, 일부는 ARPA에서 지원하는 캠브리지 프로젝트(MIT의 전산학 기술과 하버드의 사회 과학 연구를 한데 모아 사회과학에서 엄청난 걸 해보자는 아이디어였습니다)로 지원받아 강사로 하버드에서 일년을 더 지냈죠. 통계학과에서 저는 밥 로젠탈(Bob Rosenthal)과 “심리학자를 위한 통계학”수업을 가르쳤는데, 역설적이게도 그건 5년 전 사회 관계 학과에서 저보고 수강하라고 강요해서 저를 그 학과에서 나가게 만든 바로 그 과목이었습니다! 밥은 그때나 지금이나 실험 설계와 다른 실용적인 이슈들에 대해 굉장한 직관을 가지고 있고, 우리는 많은 논문을 같이 썼지요.

1967년 경 루빈과 그의 개 토르

1967년 경 루빈과 그의 개 토르

ETS에서의 10년: 결측 자료, EM 그리고 인과 추론

: 그 일 년이 지나고 나서 당신은 연구 중심 대학의 신임 교수 자리 대신 프린스턴에 있는 ETS로 갔죠. 당신이 쉽게 저명한 대학의 통계학과 교수로 갈 수 있었음을 생각하면 상당히 특이한 결정이었습니다.

: 그렇죠- 많은 사람들이 제가 얼빠진 놈이라고 생각했습니다. 저는 좋은 제안을 여러개 받았는데 그 중엔 하버드에 계속 남는 것도 있었고 다트머스(Dartmouth)로 가는 것도 있었죠. 그렇지만 저는 매디슨에서 열린 학회에서 나중 ETS에서의 제 보스가 된 알 비튼(Al Beaton)을 만났는데, 그가 제게 자리를 제안했고, 저는 그걸 수락했죠. 알은 하버드 교육학과 박사를 갖고 있었고, 뎀스터와 쓸어내기 연산(sweep operator)과 같은 계산 문제에 대한 연구를 했었죠. 그는 실용적인 전산 이슈에 대한 깊은 이해를 갖고 있는 굉장한 사람이었습니다. 제가 프린스턴에서 학부를 나왔기 때문에 ETS로 가는 것은 집에 가는 것 같았습니다. 몇 년 간 저는 프린스턴에서 수업을 한 개씩 가르쳤죠. ETS와 프린스턴에서 일하는 것으로 저는 하버드에서 받았을 연봉의 두배를 벌어서, 그 돈으로 구형 메르세데스 로드스터를 조립할 차고가 딸린 1.5에이커짜리 집을 살 수 있었죠. 캠브리지에서와는 다른 종류의 삶이었습니다.

: ETS에서는 하고 싶은 연구를 할 수 있는 자유가 많이 주어졌던 것 같습니다. ETS에서 당신의 직무는 무엇이었나요?

: ETS에서의 제 직책은 학교 교수 업무에서 강의를 빼고, 대신 심리 테스트나 교육 성취도 시험 같은 ETS에서의 사회과학 문제들에 대한 컨설팅이 들어갔다고 보면 됩니다. 저는 컨설팅이 강의보다 훨씬 쉬웠고, ETS는 재미있는 문제들을 많이 갖고 있었어요. 그리고 심리측정학(psychometrics)에서 권위가 있는 프레드 로드(Fred Lord)처럼 아주 능력있는 사람들이 많이 있었지요. 프린스턴의 교수진도 굉장히 좋았습니다. 더빈-왓슨(Durbin-Watson) 통계량을 만든 제프리 왓슨(Geoffrey Watson)이 학과장이었죠; 피터 블룸필드(Peter Bloomfield)는 노스 캐롤라이나로 옮기기 전에 거기서 신임 교수로 있었고요; 그리고 당연하지만 (존) 튜키도 여전히 거기 있었습니다. 비록 대부분 시간을 벨 연구소(Bell Labs)에서 보내긴 했지만요. 존은 언제나 존 답게 굉장하면서도 또 특이한 방식으로 생각했지요- 명백한 천재였습니다. 스튜어트 헌터(Stuart Hunter)는 그 땐 공대에 있었습니다. 그 때는 내가 중요하다고 생각하는 연구를 할 수 있는 자유가 엄청나게 주어진 좋은 때였죠.

파브리: 어떤 방식으로 측정하든, ETS에 있는 동안 당신의 업적은 엄청났습니다. 1976년 당신은 현대적인 결측 자료 분석의 토대가 된 논문 “추론과 결측 자료(Inference and Missing Data, Rubin 1976)”를 바이오메트리카(Biometrika)에 냈죠; 1977년 아서 뎀스터(Arthur Dempster)와 낸 레어드(Nan Laird)와 함께 당신은 EM 논문인 “EM 알고리즘을 이용한 불완전 데이터의 최고 우도 추정(Maximum Likelihood from Incomplete Data via the EM Algorithm”을 JRSS-B에 냈고요 (Dempster, Laird and Rubin, 1977); 1974, 1977, 1978년 당신은 루빈 인과 모형(Rubin Causal Model; Rubin 1974, 1977, 1978a)의 토대를 형성합니다. 이 시기는 당신에게 어떤 때였나요? 어떻게 이렇게 많은 혁신적인 아이디어들이 당신으로부터 동시에 터져나올 수 있었던 겁니까?

: 아마도 가장 중요한 이유는 저는 항상 실제 문제를 푸는데 관심이 있었다는 것일 겁니다. 저는 논문 쓸 인기 있는 주제를 찾기 위해 문헌을 읽지 않았어요. 저는 항상 수학을 좋아했지만, 저는 대부분의 수리통계가 진짜 수학이라고 생각한 적은 한번도 없습니다- 수리통계의 대부분은 단지 엄청 따분하죠. 당신들은 그 많은 엡실론을 다 따라갈 수 있는 겁니까?

파브리: 이 모든 논문들이 결측 자료라는 공통된 주제를 갖고 있었던 것은 우연이 아니겠지요.

: 맞습니다. 그 주제는 제가 대학원생일 때부터 생각하게 되었어요. 제가 혼자 쓴 첫 논문이기도 했던 결측 자료에 대한 제 첫 논문은 분산 분석에 대한 것으로 거의 알고리즘 논문에 가까웠죠. 코크란의 실험 설계 수업을 들을 때부터, 대조군에서의 잠재적 결과(potential outcome)를 결측 자료로 보고 실험을 설계해야 한다는 것은 항상 분명해 보였습니다. 그렇지만 제게는 너무 이상하게도 관찰 연구(observational study)를 그런 식으로 하는 사람은 아무도 없었어요. 아무도 무작위 실험의 맥락 외에서는 잠재적 결과를 사용하지 않았고, 무작위 실험의 경우에도 대부분 저자들이 실제로 일을 할 때에는 잠재적 결과를 버리고 최소 제곱(least squares)을 썼죠.

: 당신이 등장하기 이전 결측 자료 연구는 어떤 상태였습니까?

: 무지무지하게 임시변통에 불과했지요. 표준적인 결측 자료 접근 방법은 평균값으로 채워 넣는 편향을 비교하거나, 상황에 따라 회귀 대치(regression imputation)을 하는 거였지만, 거의 항상 “완전 무작위 결측 (Missing Completely at Random)”을 가정했지요. 순수히 기술적인 측면에서 이런 논문들은 견고했습니다. 그렇지만 저는 항상 특정한 방법론의 적절성을 부정하는 반례를 찾을 수 있었고, 이걸 제대로 탐구하기 위해서는 각각의 상황마다 석사 논문 하나 정도가 필요했지요. 저는 그보다는 일반적인 차원에서 한 종류의 문제들을 한꺼번에 다루고 싶었습니다. 제 방법은 자료에 결측이 생겨나는 기제가 있음을 상정하는데, 이 기제가 무엇인지가 결측 자료를 다뤄야 할 방법의 대부분을 결정하지요. 이렇게 형식적인 지표(indicator)를 결측 자료에 사용하는 아이디어는 실험 설계와 설문 설계의 맥락에서부터 있어온 겁니다. 제가 1970년 이걸 관찰 연구에 도입할 때까지 왜 아무도 이것을 하지 않았는지가 저는 항상 너무 신기합니다; 아마 누군가 했는지도 모르겠지만 제가 몇 년을 논문을 읽었는데도 하나도 찾을 수 없었어요. 하지만 제가 결측 자료를 다루는 방식이 상대적으로 새로웠기 때문에, 저는 이 연구를 출판하기가 굉장히 어려웠습니다 (Rubin 2014a에서 더 자세하게 다룹니다).

: EM 알고리즘은 현대 통계학에 있어서 또다른 중요한 전환점이었습니다; EM은 전산학에도 영향을 미쳤고 데이터 마이닝에서는 가장 중요한 알고리즘 중 하나죠. 몇몇 특수한 상황에서 비슷한 아이디어들은 이미 나와 있었는데, 아무도 EM의 일반성을 깨닫지 못했습니다. 어떻게 뎀스터, 레어드와 당신은 이런 일반성을 찾을 수 있었나요?

: EM에서의 첫 몇 년 동안 저는 하버드에 있는 코크란, 뎀스터, 홀란드, 로젠탈과 계속해서 긴밀하게 일할 수 있는 기회가 주어졌었고, 그건 저에게 굉장히 중요했습니다. 저는 항상 원칙적이고 생각이 깊은 뎀스터와 얘기하는 것이 즐거웠어요. 저는 ETS에서의 컨설팅 프로젝트들을 몇 개 조율해서 그를 프린스턴으로 데려올 수 있었죠. 한번은 우리가 결측 자료 문제에 대해 얘기하다가 어떻게 결측값들을 채워넣을 수 있을지 얘기하기 시작했는데, 저는 그게 일반적으로는 되지 않을 것임을 알고 있었어요. 하틀리의 1956년 논문(Hartley, 1956)에서 가산 자료(count data)를 다룰 때처럼 반복적으로 결측 자료를 채우는 접근을 버리고, 정규 분포를 다루기 위해서는 그 반복적인 알고리즘 대신 (아마) 뉴턴-랩슨(Newton-Rhapson) 알고리즘을 사용한 하틀리와 호킹(Hartley and Hocking, 1971)의 논문을 보여줬죠. EM의 여러 측면들은 오랫동안 알려져 있었지만, 하틀리를 비롯한 다른 사람들은 EM의 언저리에서만 맴돌고 있었고 아무도 그걸 하나의 알고리즘으로 일반화하지 못했습니다. 아트 (뎀스터)와 저는 결측 자료에 충분 통계량(sufficient statistic)을 채워넣으면 된다는 걸 깨달았어요. 저는 t 분포, 요인 분석(factor analysis; ETS 애들은 이걸 사랑했어요), 잠재 계층 모델(latent class model) 등 온갖 예제를 알고 있었죠. 아트의 뛰어난 대학원생인 낸 레어드가 몇몇 부분들을 채워넣었고, 우리는 논문을 쓰기 시작했죠. EM 논문은 JRSS-B에 무려 초청 토론까지 받아 바로 합격했어요.

: 이제 인과 추론에 대해서 더 얘기해보죠. 당신은 잠재적 결과(potential outcome)이라는 틀을 제안한 것으로 알려져 있었습니다. 잠재적 결과의 기호를 처음 언급한 것은 네이만의 박사 학위 논문이지만 (Neyman 1990), 그 기호는 오랫동안 잊혀져 왔었죠.

: 네, 그건 무작위 실험 외에서는 무시되고 있었습니다. 무작위 실험 연구 내에서는 이 기호가 표준이 되었고 예를 들면 켐쏜(Kempthorne) 같은 사람의 연구에서 사용되었지만, 제가 먼저 언급했다시피 다른 곳에는 무시되었죠.

: 당신은 그 전에 네이만의 연구 결과에 대해서 알고 있었나요?

: 아뇨, 저는 그의 설문에 대한 연구(Neyman 1934)와 그 연장(Rubin 1990a와 Rubin 1990b를 보십시오) 때문에 제 관점을 네이만 덕분에 형성된 것으로 인정해 왔었지만, 1990년 그의 박사학위 논문이 영어로 번역되기 전까지 그의 잠재적 결과에 대한 연구는 모르고 있었습니다.

파브리: 당신은 사실 1970년 중반 버클리를 방문했을 때 네이만을 만났지요. 점심을 그렇게 많이 같이 먹으면서 인과 추론과 잠재적 결과에 대해서는 토론한 적이 한번도 없었나요?

: 했었죠. 사실 제 연구실이 그의 연구실 바로 옆이었어요. 네이만은 30대 후반에 버클리로 왔죠. 그는 꼭 수리통계학자로서만이 아니라 한 사람의 인간으로서 정말 인상적인 사람이었어요. 그 주위에서는 늘 엄청난 아우라가 느껴졌죠. 버클리에 도착하자 마자 저는 결측 자료와 인과 추론에 대한 대한 발표를 했죠. 다음날 저는 네이만과 점심을 먹으러 갔고 저는 대충 “제게 있어서는 무작위 실험 뿐만 아니라 관찰 연구에 있어서도 인과 추론 문제들을 잠재적 결과가 결측인 것으로 보고 푸는 것이 당연한 것처럼 보여요”라는 식으로 얘기했습니다. 네이만은 “아닙니다, 인과 추론은 무작위가 아닌 상황에서는 훨씬 심오해요” 정도로 대답했죠 (이 말을 하면서 자신이 잠재적 결과를 처음 도입한 사람이었다는 점을 언급하지 않았다는 것이 지금 생각하면 놀랍죠). 그는 자신의 전기에 나오는 이 말을 반복했습니다: “…무작위로 설계하지 않은 실험은 나중에 어떻게 분석하든 별 가치가 없습니다” (여기에 대한 제 생각은 Rubin 2010을 참고하세요). 그리고서 그는 예의바르면서도 확고하게 “우리 그 얘기는 그만 하고 대신 천문학에 대해서나 얘기합시다”라고 했죠. 그는 당시 천문학에 굉장히 심취해 있었어요.

파브리: 당신은 아마 그가 왜 빈도주의 접근에 그렇게 천착했는지 알 기회도 있으셨겠죠.

: 네. 우리가 신뢰 구간의 진짜 의미와 왜 네이만-피어슨(Neyman-Pearson) 접근이 제게는 무의미하게 느껴지는지에 대해서 얘기한 적이 한 번 있었던 것을 기억합니다. 그는 대충 “당신은 우리의 연구를 잘못 해석하고 있습니다. 우리는 수학을 하고 있었어요; 돌아가서 제가 처음 신뢰구간을 정의한 1934년 논문을 읽어보세요.” 라는 식으로 얘기했죠. 그는 모든 사전 분포(prior distribution)에 대해서 올바른 포함(coverage) 확률을 갖는 절차로 신뢰 구간을 정의했었습니다(Neyman 1934의 589 페이지를 읽어보세요). 이런 식으로 생각하면 당신은 모든 질점 사전 분포(point mass prior)들을 고려하지 않을 수 없고, 그러면 네이만-피어슨을 사용할 수밖에 없게 되죠. 그는 (대충 말하자면) “당신이 어떤 한 종류의 문제에 대해서만 연구하는 진짜 과학자라면, 당신은 질점 사전 분포에 대해서는 신경쓸 필요가 없고 그 종류에 적합한 사전 분포만 고려하면 되죠. 하지만 당신이 수학을 하는 거라면, 당신은 당신이나 다른 누군가가 푸는 문제 그 자체에만 대한 얘기는 할 수 없습니다.” 나는 Rubin 1995에서 이 부분을 언급했지만, 그다지 다른 사람들에게 공감을 샀던 것 같지는 않습니다.

파브리: 폴 홀랜드(Paul Holland)는 그의 유명한 1986년 JASA 논문에서, 인과 모형에 사용하는 잠재적 결과라는 틀을 “루빈 인과 모형(Rubin Causal Model; RCM)”라는 이름으로 부르기 시작하죠 (Holland, 1986). 만약 당신이 “루빈 인과 모형”이라는 이름이 당신의 공헌에 적합한 이름이라고 생각한다면, 왜 그렇게 생각하는지 말씀해주실 수 있겠습니까?

: 사실 앙그리스트(Angrist), 임벤스(Imbens)와 저는 1996년 JASA 논문에서 다시 만나 (Angrist, Imbens and Rubin, 1996) 왜 우리는 그게 괜찮다고 생각하는지 설명했죠. 네이만이 무작위 실험의 맥락에서 잠재적 결과를 도입한 선구자인 것은 이론의 여지가 없습니다. 그러나 1974년 논문에서 (Rubin 1974) 저는 무작위 실험 뿐만 아니라 관찰 연구에 있어서도 전면적으로 잠재적 결과를 이용해 인과 효과(causal effect)를 정의하도록 만들었는데, 이것은 분명히 제가 처음이었습니다. 네이만이 버클리에 있던 당시 얘기했다시피, 그는 무작위 실험의 테두리 밖에서 인과 효과를 통계적으로 추정할 수 있다는 것을 믿지 않았죠.

: 그리고 RCM에서의 할당 기제(assignment mechanism)을 정의하는 것과 같은 측면들도 당신이 도입한 것이었죠.

: 그렇습니다, 무작위 실험들이 더 일반적인 할당 기제의 집합 속에 속한다는 사실을 인식하는 것은 굉장히 중요했는데 아직 그런 연구 결과는 없었죠. 그리고 1978년 논문에서 (Rubin, 1978a) 저는 RCM 틀의 세가지 중요한 요소들을 제안합니다; 잠재적 결과, 할당 기제, 그리고 과학적인 (베이지언) 모델이죠. 나머지 두 개는 네이만은 다루지 않았을 뿐만 아니라, 그는 아마도 마지막 것은 좋아하지도 않았을 겁니다. 사실 저는 죽은 사람에게 무언가의 공로를 기리는 것은 정당하지 않다고 생각해요. 그 사람은 그걸 거부할 수도 있었을 테니까요. 피셔의 좁은 영가설에 대한 무작위 검증과 같이 근본적인 아이디어가 분명히 그 사람으로부터 온 것이라면, 당연히 공로를 피셔에게 돌려야죠. Brillinger, Jones and Tukey (1978)가 그렇게 한 것 처럼요. 파노스 툴리스(하버드의 괜찮은 박사과정 학생)는 제가 ETS 시절 존( 튜키)이 건네줘서 읽어 기억하고 있던 원고를 찾아내는 데 도움을 줬습니다:
“컴퓨터가 없던 시절에는 대부분의 문제를 한번에 해결할 수 있다는 것이 아주 중요했습니다. 그래서 그 결과로 무작위를 이용한 접근의 장점들은 – 무작위 분포를 이용해 한번에 문제를 해결할 수 있는 드문 경우를 빼놓고서는 – 그 가치가 제대로 인정되지 못했죠.
저평가의 이유 중 하나는 무작위화(randomization)가 다루기 쉬운 특정 통계량에 한정된 이상, 검증 통계량(test statistic)이 어떤 때 포착하고자 하는 변화에 가장 민감할 지 (때로는 혼란을 가져다주지만 때로는 중요하고 가치있는) 직관을 얻을 방법이 전혀 없어 보였다는 겁니다. 컴퓨터의 부상으로 이 문제가 사라졌다는 사실은 충분한 주목을 받지 못하고 있습니다.” (Brillinger, Jones and Tukey, 1978, Chapter 25, page F-5)

파브리: 톰 벨린(Tom Belin)의 잠재젹 결과에 대한 흥미로운 질문을 여기서 인용해 보죠: “당신은 잠재적 결과가 사람들 속에 어떤 정해진 숫자로 존재한다고 믿으십니까, 아니면 잠재적 결과라는 개념은 인과 추론을 하기 위한 도구일 뿐인가요?”

: 당연히 후자입니다. 여기엔 여러가지 이유가 있는데요, 이를테면 어떤 사람의 잠재젹 결과는 시간에 따라 달라질 수 있는데 어떻게 과거에 연구한 사람이 오늘의 그 사람과 교환 가능(exchangeable)하다고 할 수 있겠습니까? 하지만 과학에서의 많은 도구들이 다 이런 식이죠.

: RCM에서는 분석을 시작하기 전 항상 먼저 원인(cause)와 개입(intervention)을 정의해야 하죠. 그러니까 RCM은 “원인의 영향”을 분석하고자 하는 도구이지, “영향의 원인”을 분석하는 도구가 아닌 것입니다. 어떤 사람들은 이것을 큰 한계점이라고 지적하지요. 당신은 이것을 한계점이라고 생각하나요? 당신은 영향의 원인을 자료로부터 추론하는 것이 가능하다고 생각하나요? 아니면 이건 대답하기 위해선 더 연구해봐야 할 흥미로운 문제인가요?

: 저는 사건의 ‘원인’에 대한 주제를 칵테일 파티에서나 토론할 주제로 생각하지, 과학적인 탐구의 주제로 생각하지는 않습니다. 그것은 이 주제에 대한 토론은 한없이 퇴행할 수 있기 때문이지요. 어떤 사람이 “그는 하루에 세 갑씩 담배를 피웠기 때문에 폐암으로 죽었어”라고 하죠; 그러면 다른 사람은 “아냐, 그는 그의 부모가 하루에 세 갑씩 담배를 피웠고, 그래서 그는 하루에 담배를 세 갑씩 피지 않는 것은 생각도 할 수 없었기 때문에 죽었어”라고 반박하죠; 그러면 또다른 사람은 “아냐 아냐, 그의 부모들은 그의 조부모가 담배를 피웠기 때문에 따라 피운거야- 그들은 노스 캐롤라이나에 살고 있었고, 그 당시 거기선 모두가 세 갑씩 담배를 피웠지. 그러니까 조부모가 살았던 동네가 원인이야.” 도대체 얼마나 과거로 돌아가서 살펴봐야 하는 것일까요? 어떤 사건의 ‘원인’에 대해서는 논리적으로 얘기할 수 없습니다; 그러나 ‘(여러가지 원인 중) 그 원인으로 어떤 효과가 있을 수 있었는가?’에 대해서는 얘기할 수 있죠. 개념적으로는 이런 두번째 종류의 질문들은 모두 대답할 수 있습니다. 그러나 단일한 원인(the cause)이라? 저는 그런 개념은 무의미하다고 생각합니다.

파브리: 당신은 통계학의 역사에 대해서 알고 있는 것이 통계학의 근본에 대해서 생각하는데 도움이 되었다고 느끼시나요?

: 저는 역사를 좀 알긴 하지만 많이 아는 것은 아닙니다. 저는 피셔나 네이만과 같은 통계학의 거인들이 왜 잘못을 했는지 이해했다고 느꼈을 때 가장 큰 공부가 되었어요. 평범한 사람이 왜 잘못했는지 이해하는 것으로부터는 조금밖에 배우지 못하지만, 왜 천재가 잘못했는지 이해하는 것으로부터는 엄청나게 많이 배우게 됩니다.

(2편으로 이어집니다)

위대한 개츠비

(소설의 내용을 포함하고 있습니다. 스포일러를 원치 않는 분은 피해주세요.)

개츠비는 과거를 바꿀 수 있다고 믿는 사람이다. 그렇기에 이름도 본명인 제임스 갓츠에서 제이 개츠비로 바꾸고, 옥스포드를 나온 부유층 자제 행세를 하며 살아간다. 언뜻 보기에 그의 노력은 성공적인 것으로 보인다. 그가 매일같이 여는 화려한 파티에는 정상급의 연예인과 정치인들이 늘 북적거린다. 그러나 개츠비가 정말 바꾸려고 하는 과거는, 자신이 가난하고 볼품없던 시절 놓쳤던 여인 데이지늘 놓쳤던 것이다. 바람기가 많고 마초적인 남편 톰과 불행한 결혼 생활을 하던 그녀는 개츠비에게 다시 사랑을 느끼고, 그에게 돌아갈 마음을 먹는다. 그러나 과거를 바꾸고야 말겠다는 개츠비의 집착은 오만할 정도로 지나친 것을 데이지에게 요구한다. 남편 톰을 사랑했다는 사실을 완전히 부정하라는 것이다. 데이지는 개츠비의 요구에 못이겨 끝내 남편에게 당신을 사랑한 적이 없다고 선언하지만, 이내 이렇게까지 할 수는 없다며 무너지고 만다. 그리고 이내, 개츠비가 가장해 온 과거의 허구성이 하나씩 드러나기 시작한다. 그가 불법적인 주류 판매와 같은 범죄를 통해 부를 축적한 사람이라는 것을 알게된 데이지는 개츠비에게 마음을 닫고, 이어지는 일련의 사건들은 그를 죽음에까지 이르게 만든다. 그의 장례식에 나타난 사람들은 제임스 갓츠로서의 진짜 과거에 속해 있는 그의 아버지와, 개츠비의 화려한 저택에서 그 진실성을 의심하던 뺑뺑이 안경을 쓴 중년의 남자(middle-aged man with owl-eyed spectacles) 뿐이다. 그가 과거를 바꾸고자 했던 노력이 얼마나 허망한 것이었는지 명백하게 나타나는 순간이다.

개츠비는 20세기 초 ‘아메리칸 드림’의 표상이다. 무엇이든 극복하고 무엇이든 이루어낼 수 있다고 믿던 그들의 모습은 분명 화려했지만 과연 그 안에서 진실된 삶의 의미를 찾을 수 있는 것인지, 개츠비의 몰락을 통해 우리는 생각해볼 기회를 얻는다.

단체를 남기는 보람

이제 십년도 더 지난 학부 시절엔 학교에서 ‘브레멘’이란 밴드 동아리를 했었다. 페이스북에 동아리의 그룹 페이지가 있어 썩 활발하지는 않지만 종종 공연 소식 등이 올라오는데, 그럴 때마다 2003년 봄 언젠가의 동아리 모임이 떠오르곤 한다.

당시 회장 형은 썩 밝지 않은 표정으로 회의를 소집하고선, 우리 동아리가 과연 올해에 새로 회원을 모집해야 할지 여부를 얘기해 보자고 했다. 보통의 동아리라면 새 학년이 시작할 때마다 신입 회원을 모집하는 것이 당연하겠지만, 당시 동아리 브레멘은 선뜻 그런 결정을 쉽게 할 수 있는 상황이 아니었다. 그 이전 해 겨울, 포항공대 각 동아리의 회장들이 모인 동아리 연합회에서는 ‘가등록’ 동아리였던 브레멘을 정식 동아리로 승격하는 것에 대해 과반수가 반대 의견을 표시했고, 따라서 2002년 뿐이 아닌 2003년에도 브레멘은 가등록 상태로 남아야 했던 것이다.

가등록 동아리는 동방을 가질 수 없고, 밴드 동아리는 연습할 공간이 필요하다. 2002년 내내 브레멘의 회원들은 학생회관의 대회의실을 빌려서 사용하느라 연습을 시작할 때마다 드럼과 앰프 등의 무거운 장비들을 옮겨와서 설치하고, 끝날 때면 해체해서 다시 옮겨놓아야 했다. 대회의실을 사용하는 것은 브레멘 뿐만이 아니기 때문에, 때로는 다른 동아리들이 사용하는 시간을 피해 새벽 세시에 연습을 시작했다가 일출을 보며 기숙사로 내려오기도 했다. 굳이 이런 고생을 한 학번 더 물려주어야 하는 걸까? 동아리 연합회를 통해 다른 학우들이 브레멘이란 동아리의 존재가치에 대해 의문을 표시하고 있는 상황에서도?

몇몇 선배들은 굳이 신입생을 뽑을 필요 없이, 우리끼리만 이제까지 해오던 대로 재미있게 합주하다가 졸업하면서 정리하면 되지 않겠냐는 의견을 제시했다. 특별히 그 의견에 반박할만한 근거를 찾기는 어려웠는데, 그럼에도 불구하고 왜였는지 우리는 신입생을 뽑기로 결정했다. 훨씬 더 환경이 좋은 동아리가 많은데도 굳이 이 생고생을 하겠다고 나서는 변태같은 03학번 신입생들이 제법 있었고, 그들과 한 해 더 고생을 했고, 그 해 겨울 동아리연합회에서는 드디어 브레멘을 정식 동아리로 승인해 주었다. 그 날 정말 몸이 안좋았지만 술을 마시러 나가지 않을 수 없었다. 특별히 기념하려고 했던 것도 아닌데 어쩌다가 그 날의 폴라로이드 사진이 남아있다. 이듬해엔 드디어 우리만의 동방이 생겼고 – 음량 문제로 인해 주위의 동아리들에게는 상당히 안좋은 소식이었지만 – 이제 그로부터 십년이 넘게 흘렀으니 동방이 없는 시절을 겪은 세대는 동아리 역사의 극히 일부분에 불과하다.

요즘 동아리가 어떻게 돌아가는지, 페이스북에 올라오는 사진들 너머의 이야기를 나는 전혀 알지 못한다. 학부를 졸업하고서는 바로 미국으로 넘어왔고, 한국에 남아있었더라도 02학번 선배가 아직까지 동아리 일에 관여하며 민폐를 부릴 수는 없었을 것이다. 무슨 음악을 하는지도 잘 모르겠고, 회원들끼리 화목하게 지내는지도 모르겠다. 그렇지만, 왠지 모를 이유로 우리가 그 때 그 회의에서 신입생을 뽑기로 마음먹었기 때문에, 적어도 아직까지는, 동방이 있고, 한 사람의 지갑에서는 나오기 힘든 금액에 상당하는 앰프며 드럼이며 하는 악기들이 있고, 그래서 혹시 다른 동아리에서 음악을 할 기회를 찾지 못한 학생이 기회를 찾을 수 있다. 공연이 끝나고 공연 사진들이 올라올 때마다 참으로 그 회의에서 그렇게 결정하기를 잘 했다는 생각이 들고, 새로운 조직에 들어가거나 모임에 참여할 때마다 이 생각을 하면서 더 좋은걸 남기고 떠나야겠다고 마음먹곤 한다.

사족: 십년도 더 된 이야기를 남겨놓는 변명이라면, 다른 누군가가 내 대신 이런 글을 남겼던 것 같지 않아서… 내가 아저씨가 되어서 자꾸 어렸을 때 생각만 나서 그런 것이 아닙니다, 정말 아닙니다…

자존감과 타인에 대한 존중

계속 올리는 내용 없는 글 씨리이즈…!

내 주위 사람들은 많이들 알겠지만, 나는 자존감이 낮은 편이다. 지나친 겸손이라며 재수 없어하는 사람들도 좀 있을지 모르겠고, 나도 내가 그런 것 아닌가 종종 의심해 보기도 하는데, 이따금 ‘내가 스스로에 대해 너무 낮게 평가했었구나’라고 확인할 수 있는 순간들이 찾아오는 걸로 봐서 꼭 가식만은 아닌 것 같다.

그냥 개념적으로 생각하기에는 자존감이 낮으면 겸손하고 친절한 사람이 될 것 같은데, 내가 그런 사람으로 실제 살아보니 그게 꼭 그런 것은 아니고 오히려 반대의 효과를 내는 경우가 많다. 왜냐하면 나는 스스로가 재능이 없는 사람이라고 느끼는 만큼 ‘나조차도’ 왠만치 할 수 있는 일을 남이 제대로 하지 못하는 것을 이해하기가 어렵기 때문이다. 그래서 나는 대학원을 입학하기 전 한국에서 대학을 다닐 때나 잠시 직장 생활을 할 때, 남들이 나보다 부족한 점이 있으면 어째서 이런 것도 하지 못하냐며 쉽게 짜증을 내는 굉장히 싸가지가 없는 사람이었다. (미안했어요…)

그런데 대학원에 와서는 이런 태도를 고칠 수밖에 없었다. 학문적인 연구는 각자가 스스로의 영역에 고도로 전문화하기 때문에, 지도교수조차도 내 연구 주제의 디테일에 들어가면 아무래도 나보다는 이해도가 떨어질 수밖에 없기 때문이다. 다양한 연구자들을 만나 서로의 전문 영역에 대한 지식을 교류하면서 처음에는 내가 잘 알고 있는 것을 상대가 잘 모르는 것에 놀라고 속으로는 답답해하기도 했지만, 교류를 계속함에 따라 이내 그들이 그 외의 면에 있어서는 얼마나 박식하고 사고력이 뛰어난지를 확인하게 되면서, 각자가 자신만의 장점을 갖고 있다는 초등학교 도덕 교과서에나 나올만한 당연한 진실을 뒤늦게서야 깨닫게 되었다.

그래서 지금은 타인의 단점에 (상대적으로) 많이 관대해진 것 같아 나름 뿌듯하다. 대학원에 와서 얻은 것들이 아주 많지만, 그 중에 으뜸을 꼽자면 이 경험을 꼽고 싶다. 스스로를 아끼는 연습은 좀 더 해야겠지만.

이항(binomial) 분포의 계층적(hierarchical) 베이지안 추정

개인적인 Python 연습을 위해 Bayesian Data Analysis 책 (Gelman et. al, 3rd Edition) Chapter 5.3에 소개된 이항(binomial) 분포의 계층적(hierarchical) 베이지안 분석을 Python으로 재현해 보았습니다. 저처럼 베이지안 분석에 첫 걸음을 떼시는 분들께 도움이 될까 하여 공유해 봅니다.

http://nbviewer.ipython.org/github/bikestra/bdapy/blob/master/ch5_3_rat_tumor.ipynb

악기를 배우는 자세

나는 대학에 진학해서야 기타를 배우기 시작했다. 동아리에서 같은 학번에 기타를 치는 사람이 나밖에 없었기 때문에, 내 실력이 형편없으면 동아리 얼굴에 먹칠을 할 것 같아서 빨리 실력을 늘려야 한다고 많이 조급해했지만… 막상 잘 늘지 않아서 동아리 얼굴에 똥칠을 하고 말았었다 (먼산).

동아리에게는 안타까운 일이었지만 (눈물) 성인이 되어서 스스로 악기를 배우는 것은 개인적으로는 굉장히 유익한 경험이었다. 어릴 때에는 워낙 흡수력이 빠르기도 하고, 대개 부모님 돈으로 경험 있는 강사의 지도를 받으니까 별 생각 없이 연습해도 꾸준히 발전하게 된다. 그런데 성인이 되어 적잖이 이미 손과 머리가 굳은 다음에 자력으로 악기를 배우려니, 별 생각 없이 연습해서는 도무지 나아지지가 않았다. 아주 많은 시행착오를 겪은 다음에야 다음과 같은 몇가지 당연한 사실들을 깨닫게 되었다.

1. 편안하게 연주할 수 있는 박자에서 천천히 연습하기 시작해서, 정확성을 유지하며 차분히 템포를 올려야 는다.
2. 스스로에게 필요한 연습이 무엇인가를 적극적으로 찾아내서 연습해야 발전이 있다. 아무 생각 없이 곡을 처음부터 끝까지만 연습하고 앉아있으면 잘 치는 부분을 계속 잘 치느라 시간을 낭비하게 된다. 못 치는 부분을 찾아내서 연습해야 한다.
3. 2를 실행하기 위해서라도, 자신이 연주하는 소리를 집중해서 듣고 분석하며 연습해야 부족한 부분의 보완이 되지, TV 틀어놓고 띵가띵가 하면서 시간만 많이 보낸다고 늘지 않는다.
4. (이것은 성격이 비뚤어진 나같은 사람만 해당하는 문제였던 것 같은데…) 연주와 무관한 감정을 들고 있으면 쓸데없는 에너지만 소모하게 된다. 자신의 마음을 들여다보고, 이런 감정들을 내려놓으려고 노력해야 한다. ‘아 씨빨 쟤는 되는데 나는 왜 이게 안되지?’같은 쓸데없는 조급함, 시기심, 열등감 등은 3에 방해만 되고 술만 는다…
5. 재능과 경험의 차이는 너무나도 분명히 있다. 이미 성인이 된 내가 죽었다 깨어나도 애초에 태어나길 민첩한 손가락을 갖고 태어난 사람과 어려서부터 폭넓은 음악을 듣고 귀를 예민하게 키운 사람을 따라갈 길은 없다. 내가 어떤 다른 일을 잘 하는 사람이라고 해서 음악도 잘 할 수 있는 것은 아니다. (사실 내가 썩 잘 하는 일도 없지만… 그래도 공부는 그나마 좀 나으니까… 했던 생각이었다)

그런데 이런 깨달음들은 사실 공부에도 그대로 적용될 수 있는 것이어서, 당시에 대학에 들어가서 공부하는 태도를 갖추는 데 큰 도움이 되었던 것 같다. 막상 기타 실력을 늘리는 데는 큰 도움이 되지 않아서 (그럼 이게 무슨 깨달음이지!?) 아직까지도 ‘우와, 기타를 갓 잡은 사람 치고는 대단한데요?’라는 소리를 들으며 기타를 치고 있다… 요즘 피아노를 연습하다 보니 대학에 처음 들어가서 기타 배우며 고생하던 생각이 나서 글을 끄적여 본다.