Archive for the ‘statistics’ tag
통계라는 이름의 거짓말
오랜만에 도서관에 갔다. 원래는 다른 소셜 미디어와 UX와 관련된 책을 보러 갔는데, 지나가다 우연히 눈에 띈 책이 있었다 – 통계라는 이름의 거짓말 (Damned lies and statistics), Joel Best / 노혜숙 역. 뽑아 조금 읽어보니 흥미진진해서 아예 열람대에서 앉아 노트북 펴고 문장들을 옮기며 읽었다 – 적다 보니 너무 많아서 중간은 그냥 쭉 읽어나갔다.
간단히 요약하면, 이 책은 사회 문제에 있어서 통계가 가지는 불완전성을 얘기하며 이를 잘 읽어야 한다고 말한다. 순진하거나 냉소적인 것은 도움이 되지 않으며 통계를 비판적으로 바라봐야 현상에 더 가까워질 수 있다고 말한다.
통계학을 배우는 것 보다 이런 통계의 성질을 배우는 것이 훨씬 더 필요하다. 실제로 이 책은 어려운 계산이 전혀 나오지 않는다. 평균과 비율만 따질 수 있어도 된다.
또한 저자는 사회 문제가 형성되는 과정 중에 통계가 어떻게 이용되고 또 얼마나 오도되기 쉬운지 언급하고 있다. 주의할 것은, 저자도 언급하였듯이, 사회 운동가들이 비록 발기인으로서의 의욕과 신념으로 인해 많은 서툰 실수들을 저지르지만 그렇다고 해서 그들의 문제 제기를 무의미한 것으로 치부하는 것은 바람직하지 않다는 것이다.
꼭 읽어보길 권하는 책!
우리는 사회문제를 논하는 사람들이 자신들의 입장을 뒷받침하기 위해 통계를 선택하고 제시한다는 것을 알아둘 필요가 있다.
p. 25
일반 대중은 새로운 사회문제에 대한 주장을 쉽게 받아들이는 경향이 있고, 사회통계에 대해 좀처럼 비판적으로 생각하지 않는다. 숫자는 확실한 사실처럼 보이기 때문에 대중매체는 통계 보도를 좋아한다는 것을 기억하자. 대중은 수긍을 잘하고, 보통 통계를 사실로 취급한다.
p. 26
우리는 때로 통계에 대해 바위처럼 움직일 수 없는, 완전히 사람들과는 별개로 존재하는 사실처럼 이야기하고 마치 수석 채집가가 돌을 주워오는 것처럼 통계를 수집한다. 이것은 잘못이다. 모든 통계는 사람들의 활동을 통해 만들어진다. … 모든 통계는 사회적인 산물이고, 사람들의 노력에 의한 결과이다.
p. 33
우리가 새로운 통계를 접할 때마다 해야 하는 세 가지 기본적인 질문은 다음과 같다.
1. 누가 이 통계를 만들었나
… 창조자가 누구인지를 물을 때는 그 숫자를 만든 사람들의 이름보다는 통계와 관련된 그들의 역할에 좀더 관심을 가져야 한다. …
2. 이 통계는 왜 만들어졌나?
통계를 만드는 사람들의 정체를 알면 종종 그 동기를 알 수 있다. …
3. 이 통계는 어떻게 만들어졌나?
… 모든 통계가 불완전하지만, 어떤 통계는 다른 통계를보다 훨씬 더 불완전한다. …
p. 34
운동가들은 새로운 문제가 크고 중요하다고 진지하게 믿기 때문에, 그리고 보고 되지 않거나 기록ㅚ지 않은 사례로 인해 아주 큰 암수[dark figure]가 있다고 생각하기 때문에, 그들이 제시하는 추정값은 커지고 과장되기 쉽다.
p. 42
일단 어떤 숫자가 기사화되면 그 기사는 그 사회문제에 관심을 가지게 되는 사람들의 강력한 출처가 된다. 공무원들, 전문가들, 운동가들 그리고 다른 기자들이 그 기사에서 말한 숫자를 되풀이한다. 그 숫자는 그 자체의 생명력을 지니고 ‘숫자 세탁’을 거친다. 그 숫자가 누군가의 어림짐작이라는 사실은 잊혀지고 이제 계속 되풀이되는 과정에서 정확하고 신뢰할만한 당연한 사실로 취급을 받는다.
p. 43
사회문제의 크기가 어느 정도인지를 추측하는 것은 잘못이 아니다. 우리는 문제의 실제 범위를 알 수 없는 경우가 많다. 그럴 때 근거 있는 추측 – 그리고 그것이 누구의 추측이라는 것을 분명히 한다면 – 은 출발점이 될 수 있다. 진짜 문제는 사람들이 추측을 사실로 취급하고, 그 숫자를 되풀이하고, 그것이 어떻게 해서 생겨났는지를 잊어버리고, 거기에 덧칠을 하고, 그 선전과 방어에 혈안이 되고, 처음에 누군가의 추측에서 비롯된 것인지에 대한 의문을 갖는 사람을 공격할 때 시작된다.
p. 46
우리가 통계를 사용할 때마다 필연적으로 일부 정보, 특히 복잡한 정보가 유실된다.
p. 176
비판형이 되려면 단순히 어떤 통계의 결함을 지적하는 것으로 끝나서는 안 된다. 다시 말하지만, 모든 통계는 결함이 있다. 문제는 어떤 특정한 통계의 결함이 그 유용성에 흠이갈 정도로 심각하냐는 것이다.
p. 176
덧. Tumblr에도 올림.