‘P-해킹’은 얼핏 듣기에 일종의 다크웹 암호 화폐에 관련된 행위 같다. 그러나 사실 이것은 원하는 결과를 산출하기 위한 유사 과학적 연구 조작으로서, 다른 영역에서의 음습한 관행이다. ‘p’는 심리학자인 유리 사이먼손, 조지프 시먼스, 레이프 넬슨이 거의 10년 전에 만들어낸 것으로서, 결과가 우연히 나올 가능성을 보여주기 위해 연구에 부여한 ‘p값’에서 유래한 말이다. 값이 0.05(5%)보다 낮으면 연구자들이 연구 결과를 ‘통계적으로 유의미한 것’으로 선언할 수 있게 되므로 연구 결과가 지면을 통해 발표될 가능성이 상당히 높아진다. p-해킹은 가설을 증명하기 위해서라기보다 데이터를 살펴봐서 어떤 가설을 증명할 수 있는지 알아보기 위해 역으로 작업하는 것을 의미한다.1 어떤 연구자가 특정 연구(예를 들어 체중 감량을 위해 아침을 먹는 것의 이점)에서 찾아낸 결과가 부족해서 아쉽다고 생각하면, 수집된 모든 정보를 다시 뒤져 무작위적인 별난 사항(예를 들어 스토브톱 커피 메이커를 사용하는 참여자들이 더 많은 살을 뺐다)을 찾아내서 연구의 주제를 바꿔버릴 수 있다는 것이다. 앤드루 겔먼과 에릭 로큰은 2013년의 논문에 “아무 일도 일어나지 않을 때라도 열심히 살펴보면 p가 .05보다 작은 대조를 찾아내는 건 쉽다.”고 썼다. “그리고 훌륭한 과학자는 열심히 살피는 일에 특화되어 있다.” 실제로, 2013년에 코넬 대학교 식품 및 브랜드 연구소의 수장인 브라이언 원싱크는 한 연구자에게 애초에는 별다른 관심을 끌지 않고 지나갔던 뷔페에 대한 연구에서 쓸 만한 데이터를 모두 뒤져 뭔가를 찾아내라고 지시했다. 이렇게 역으로 작업한 결과로 나온 것이 ‘남자는 여자와 함께 있을 때 더 많이 먹는다.’와 같이 기억하기 쉽고 언론 친화적인 제목의 연구 결과 네 가지다. 그러나 p-해킹이 언제나 마키아벨리 같은, 즉 권모술수에 능한 것이라고 예단하는 것은 잘못이다. 연구자들이 이전에 수집해두었던 데이터를 검사하는 것은 바람직한 일일 수 있다. 다른 분야에서의 과학적 돌파구가 완전히 다른 방향에서 새로 들여다보기 시작한 사람들에 의해 이루어진 경우가 많았던 것도 그런 이유다. 결과적으로, 겔먼과 로큰조차도 이 용어가 그처럼 유행하게 된 것에 아쉬움을 토로했다. “마치 연구자들이 비교하고 또 비교하면서, 물고기가 걸려들 때까지 반복적으로 그물을 던지는 것 같은 모습으로 연상되어버렸어요. 연구자들이 정해놓고 그런다는 생각을 할 이유가 없거든요.” 그러므로 무언가에 대한 묘사가 사실처럼 보일 때는, 그걸 정말 깊이 파헤치면서 자신이 목표 지점에 도달하기 위해 진실을 왜곡하는지조차 모르고서 찾아냈다는 의미일 수 있다는 것이다. GOOD IDEA: REPLICATIONS 글: Harriet Fitch Little P-해킹은 ‘재현성의 위기’라고 하는 연구의 광범위한 이슈 중 일부를 차지한다. 이 말은 여러 중요한 연구에서, 특히 인간의 행위에 관한 연구에서 새로운 연구자들이 이전과 같은 실험을 반복할 때 아무리 동일한 조건을 완벽하게 구현해도 같은 결과를 산출해내지 못하는 불편한 사실을 나타낸다. ‘프로젝트 파이프라인(Project Pipeline)’이라는 이름의 계획이 진행된 적이 있는데, 결과를 발표하기 ‘전에’ 이 문제를 해결해보려고 자원해서 연구를 시도하고 재현할 연구팀을 모집했다. 인시아드(INSEAD, 프랑스에 있는 세계적인 경영대학원-옮긴이)의 조직행동학 부교수인 에릭 루이스 울만은 2016년 『더 애틀랜틱』과의 인터뷰에서 이렇게 말했다. “그 아이디어는 계획의 결과가 언론 매체는 물론 모든 이들의 강의에 인용되기 전에, 결과의 확고성을 확인해보려는 것이었어요.” 울만은 자신의 연구 논문을 기니피그처럼 사용했으며, 결과적으로 몇몇 연구에서는 재현에 성공했지만 일부는 실패했다. 이를테면 울만의 원래 연구에서는 위법 행위에 대한 비난에 대응하지 않는 회사가 죄를 인정한 회사와 동등하게 가혹한 심판을 받는다는 결과를 내놓았는데, 이것을 재현한 연구들에서는 침묵하는 쪽이 다섯 배나 더 가혹한 심판을 받는다는 결론이 나온 것이다. 크게 엇갈리는 결과였다. 결국 연구를 무효화하게 되어 자부심에 상처를 입기는 했지만, 울만은 『더 애틀랜틱』에 자신은 장기적으로 이것이 모든 이에게 더 나은 일이라고 생각한다고 말했다. “발표해버리기 전에 실패하는 게 덜 예민해진다고 할까요. 아직 아무도 그 효과에 대해 들어본 적이 없으니까요. 나의 평판이 그런 일에 좌우되지는 않고요. 방어적일 필요가 없어요.” (1) 정치를 비롯한 여러 분야의 여론 통계 조사를 실시하는 웹사이트 ‘파이브서티에잇(FiveThirtyEight)’에서는 경제 부문에서 p-해킹의 문제를 설명하기 위해 이용자가 미국 경제에 관한 각종 데이터 포인트를 조작할 수 있는 웹사이트를 운영하고 있다. 공화당과 민주당 중 어느 쪽이 권력을 잡느냐에 따라 영향을 받는다는 것을 ‘증명’하기 위한 것인데, 이용자가 어떤 변수를 선택하느냐에 따라 데이터를 사용하여 원하는 방식으로 통계 사례를 만들 수 있다. 이 기사는 킨포크 43호에서 발췌하였습니다. 구입하기 (1) 정치를 비롯한 여러 분야의 여론 통계 조사를 실시하는 웹사이트 ‘파이브서티에잇(FiveThirtyEight)’에서는 경제 부문에서 p-해킹의 문제를 설명하기 위해 이용자가 미국 경제에 관한 각종 데이터 포인트를 조작할 수 있는 웹사이트를 운영하고 있다. 공화당과 민주당 중 어느 쪽이 권력을 잡느냐에 따라 영향을 받는다는 것을 ‘증명’하기 위한 것인데, 이용자가 어떤 변수를 선택하느냐에 따라 데이터를 사용하여 원하는 방식으로 통계 사례를 만들 수 있다. 이 기사는 킨포크 43호에서 발췌하였습니다. 구입하기 TwitterFacebookPinterest Related Stories Arts & Culture 로봇이 아닙니다 당신이 로봇이 아님을 증명하라. Arts & Culture 기계 속의 유령들 온라인 세상에서 죽는 방법 Arts & Culture 시그널 부스트 지위 불안은 어떻게 문화를 충동하는가. Arts & Culture 나의 가장 소중한 것 죽음 인도자 알루아 아서가 들려주는 자신의 가장 소중한 크리스털에 얽힌 이야기 Arts & Culture 단어: 위생 극장 연출된 소독에 대하여. Arts & Culture 필사의 횡단 NGO 시워치의 올리비아 슈필리가 우리가 잘 모르는 지중해의 현실을 자세히 설명한다