[한겨레] 우리말 논술
유형별 논술 교과서 / 13. 문제점 설명
■ 기출문제 유형 1 - 한양대 2008 모의 [난이도 수준-중2~고1]
< 가 > 와 < 나 > 를 활용하여 집단의 속성과 구성원의 속성을 관련시켜 생각할 때 발생할 수 있는 문제점에 대해 서술하시오.
(가)
집단의 속성을 전체적으로 파악하기 위해서는 다양한 대푯값이 사용된다. 가장 흔히 사용되는 것이 산술평균이다. 이는 집단 구성원의 속성값을 모두 더한 후 구성원의 수로 나눈 것이다. 하지만 다른 종류의 대푯값도 있다. 우선 집단에 속한 개별 구성원이 가장 많이 가지고 있는 속성값을 대푯값으로 취하는 최빈값이 있다. 그리고 집단의 속성을 크기순으로 배열한 후 중간에 있는 값을 택하는 중간값도 있다. 어떤 경우든 집단의 대푯값은 집단 구성원 각각이 가지고 있는 개별적 속성값과 구별되어야 한다. 우리나라 가구당 자녀 수가 1.2명이라 할 때, 실제로 1.2명의 자녀를 가지고 있는 가구는 한 가구도 없을 것이기 때문이다.
(나)
사례(1) 우리나라 이혼한 부부를 대상으로 한 최근 통계조사에 따르면 평균적으로 결혼 후 10년 정도 지난 후에 이혼하는 것으로 나타났다. 하지만 정작 이혼이 가장 많이 이루어지는 시기는 결혼 직후부터 3년 사이의 결혼생활 초반기와 자식들이 다 장성한 후 '황혼 이혼'이 이루어지는 결혼생활 후반기이다.
사례(2) 흡연은 폐암의 주요 원인으로 지목되고 있다. 현재 폐암은 우리나라 사람의 사망원인 중 중요한 부분을 차지하기에 사회적인 의료비용을 증가시키는 중요한 원인으로 여겨지고 있다. 이 점을 고려하여 정부는 흡연을 줄일 수 있는 사회적 대책을 여러모로 강구하고 있다. 하지만 우리 주변에는 매일 줄담배를 피우면서도 폐암에 걸리지 않고 장수하는 사람이나 평생 담배 근처에 가보지 않았는데도 폐암에 걸려 사망한 사람을 찾아볼 수 있다.
사례(3) 지금은 타계한 유명한 진화생물학자 스티븐 제이 굴드는 40대 초반에 중피종이라는 희귀한 악성 종양에 걸렸다는 판정을 받았다. 그는 이 병의 중간값 생존율이 8개월이라는 말을 듣고 절망했다고 한다. 그러나 굴드는 중피종에 대해 자세히 알아본 결과 이 병의 생존기간 분포가 오른쪽 꼬리가 매우 긴 형태라는 것을 알아냈다. 그리고 자신이 오른쪽 꼬리 부근에 위치한 개인일 가능성이 높다는 근거, 즉 아직은 젊고 의료 환경이 좋은 곳에서 살고 있으며 비교적 조기에 병을 발견했고 병과 싸워 이기려는 투지가 불타고 있다는 사실을 근거로 자신은 8개월보다 훨씬 높은 생존 가능성이 있다는 결론을 내렸다. 실제로 굴드는 이런 결론에 근거하여 적극적으로 건강관리를 한 덕택에 중피종 진단 이후에도 상당 기간 활발한 학술활동을 수행할 수 있었다.
■ 해결 전략
논제에서는 문제가 발생할 수 있는 상황을 구체적으로 제시하고 있다. '집단의 속성과 구성원의 속성을 관련시켜 생각할 경우'라고 명시한 것이다. 여러 구성원이 모여 이뤄진 하나의 집단의 속성을 드러내기 위해 흔히 대푯값이 사용된다. 대푯값은 산술 평균, 최빈값, 중앙값 등 여러 가지로 표현되는데, 개별값의 분포가 어떠하냐에 따라 각각의 값 중 집단의 속성을 가장 잘 드러낼 수 있는 값은 달라지게 된다. 단, 어떤 대푯값을 선택하더라도 그것을 구성원 각각의 속성과 동일시할 수는 없고, 집단의 경향성 정도를 파악하는 선에서 이해해야 한다.
제시문에서는 대푯값이 구성원의 속성을 제대로 나타내지 못하는 여러 경우를 들어 논제 해결의 실마리로 삼도록 했다. 먼저 평균 이혼 시기에 대한 것으로, 실제 이혼이 가장 많이 이뤄지는 시기와 평균 이혼 시기의 불일치를 보여줬다. 또, 폐암과 흡연의 높은 상관관계에도 불구하고, 흡연과 전혀 상관없이 폐암을 앓거나 앓지 않는 경우 즉, 예외가 많다는 것을 들어 대푯값이 구성원의 속성과 일치하지 않음을 암시하고 있다.
대푯값의 산출 과정 및 제시된 사례는 대푯값과 구성원의 속성을 동일시할 경우 문제가 생길 수 있음을 암시한다. 먼저 대푯값을 구성원의 속성으로 이해할 경우 잘못된 판단을 내릴 수 있다. 스티븐 J. 굴드가 평균생존율로 자신의 남은 생을 예측하는 것이 타당하지 않을 수 있다는 문제를 제기한 것처럼 대푯값에서 소외된 개별값이 의미있을 수도 있기 때문이다. 또 평균값, 중앙값, 최빈값 등 다양한 대푯값이 각기 다른 수치로 나타날 수 있는데, 이런 불일치는 통계를 이용해 상대방을 설득하는 데 의도적으로 쓰이기도 한다.
■ 자료 검색
통계의 눈속임과 오류
평균에 대한 오해
한 아이가 10달러를 다 가지고 있으며, 다른 아홉 명은 돈을 하나도 가지고 있지 않다고 가정해 보자. 그래도 1인당 가지고 있는 돈의 평균은 1달러이다. 이러한 평균값이 그 집단을 정확하게 표현한다고 할 수 있을까? 실제로 정치판의 여론 조작 전문가들은 현실을 화려하게 채색하기 위한 눈속임으로 평균소득을 자주 이용한다. 예를 들어 부자들에게만 세금을 감면해 주는 슈퍼 레이거노믹스 체제에서 소수의 백만장자들이 엄청난 부를 축적하고, 빈곤선에 있는 대부분의 사람들은 더 궁핍해졌다고 가정해 보자. 이 때 1인당 평균소득은 증가한 것으로 나타날 것이다. 갑부 한 사람의 소득이 연간 600만 달러에서 6억 달러로 늘어난 것이 몇 백만 극빈자의 소득 감소를 상쇄하기 때문이다. 한 사람이 5억 9400만 달러를 벌고 1억 명이 모두 5달러씩 수입이 감소되었다 하더라도(총 5억 달러) 전체 집단의 평균 소득은 올라간다. 그러나 속임수로 이용하는 경우를 빼고는 이러한 경우에도 감히 사람들의 평균 수입이 늘어났다고 말할 수는 없다.
-스티븐 J. 굴드, < 풀 하우스 >
통계의 오용 및 통계분석의 오류
통계자료는 그 자체가 확정적인 관계를 보여주지 못하고 확률적 성격을 갖기 때문에, 어떻게 제시하는가에 따라서 전혀 다른 의미를 나타낼 수 있다. 뿐만 아니라 자료를 모으거나 표본을 추출하는 과정에서 어떤 편의가 들어가게 되면 통계처리의 결과가 잘못된 결론에 이르게 될 수도 있다. 예를 들어, 경제성장률과 같은 경우 비교시점을 어떻게 잡는가에 따라 성장률이 완전히 다르게 나타날 수 있다. 경제성장률처럼 어떤 변수의 변화율은 직전 기간과 비교할 수도 있고, 지난해 같은 기간과 비교할 수도 있다. 연간 자료의 경우 직전 기간이 지난해이기 때문에 차이가 없지만, 분기별 자료의 경우 전혀 다른 결과가 나올 수 있다.
표본을 바르게 추출하지 못해서 생기는 통계분석의 오류로 1936년 미국 대통령 선거의 여론조사 같은 경우가 대표적이다. 당시 경합을 벌였던 루스벨트와 랜든 후보에 대해 리터러리 다이제스트에서 여론조사를 실시했는데, 그 결과 랜든 후보가 크게 이길 것으로 예측되었다. 그러나 실제 선거에서는 루스벨트가 압승을 거두었다. 이처럼 전혀 엉뚱한 결과가 나왔던 것은 당시 여론조사가 전화번호부에서 추출한 표본에 대해 설문을 발송하여 실시되었기 때문이었다. 당시로서는 전화를 가지고 있다는 것이 부유층을 의미하였고, 이들 부유층은 대부분 공화당의 랜든 후보를 지지하였던 것이다.
이처럼 통계자료를 이용해 어떤 분석을 시도하거나, 통계를 이용해 분석된 어떤 결론에 대해서는 항상 어느 정도 객관성을 확보할 수 있는지에 대한 분명한 판단이 있어야 하는 것이다.
-노택선·김중렬, < 통계와 함께 배우는 경제학 >
■ 관점 넓히기
한나라당 대통령 후보 경선과정의 국민 여론조사 반영 방식을 보면서 정치인들을 비롯한 많은 사람들이 여론조사를 지나치게 믿는 듯해 우려스럽다. 이번 경선 과정에서 여론조사를 이용함으써 발생된 세 가지 문제점을 짚어보고자 한다.
첫째, 기본적인 통계원리가 무시되었다. 이번 한나라당 경선 과정에서의 여론조사는 표본오차를 무시하고 세 여론조사 기관들을 통해 추출된 표본들로부터 후보자들의 지지율 평균치를 구하여 단순히 득표 수로 환산하는 방식이었다. 이와 같은 방식은 표본조사에서 필연적으로 나타나는 오차를 무시하는 기괴한 방식이다. 만약 어떤 두 후보의 평균 지지율 차이가 오차범위 안에 있다면, 전체 유권자를 조사대상으로 가정했을 때 두 후보의 평균 지지율에 유효한 차이가 없음을 의미한다.
두번째로 표본추출 방법상의 문제다. 표본추출에서 세 여론조사 기관에서는 지역·성·연령별 비례 할당 추출법을 사용한 것으로 알고 있는데, 엄밀히 말해 이것은 무작위 추출방법도 아니고, 표본의 동일확률 추출방법도 아니어서 표본이 정확히 전체 유권자를 대표했다고 보기 어려운 편향성의 문제가 제기될 수 있다. 미국의 여론조사 기관들의 경우 전화조사에서 완벽한 무작위 추출법을 사용하며, 지역·성·연령 등의 변수는 인구조사 데이터로써 조사 이후에 조정하는 방식을 택하고 있다.
마지막 문제점으로 조사에서 단위 무응답에 대한 무관심이다. 이 조사는 지난 19일 일요일 오후 1시에서 저녁 8시까지 이루어졌다고 한다. 조사기관당 목표 표본 2000명의 인터뷰를 7시간 내에 끝낸 셈이다. 전화조사의 경우 인터뷰어가 미리 정해진 표본 내의 응답자에게 전화를 할때 부재 중이어서 접촉이 안 된 경우는 모두 단위 무응답층에 해당된다. 이번 조사의 경우 조사기간 7시간 동안 부재 중이었던 표본 대상들은 조사에서 아예 배제될 수밖에 없게 되었다. 이 부분은 표본추출의 심각한 편향성을 다시 한번 드러내는 대목이다.
이상과 같은 방법상의 문제점들을 고려할 때 국가의 대통령 후보를 결정하는 정당의 경선 과정에서 여론조사 반영 부분이 반드시 필요했는지 한나라당에 묻지 않을 수 없다. 더군다나, 여론조사 부분에서 후보가 바뀌었다.
이건, < 한겨레 > 2007년 8월27일치.
ⓒ 한겨레신문사, 무단전재 및 재배포 금지
유형별 논술 교과서 / 13. 문제점 설명
■ 기출문제 유형 1 - 한양대 2008 모의 [난이도 수준-중2~고1]
< 가 > 와 < 나 > 를 활용하여 집단의 속성과 구성원의 속성을 관련시켜 생각할 때 발생할 수 있는 문제점에 대해 서술하시오.
(가)
(나)
사례(1) 우리나라 이혼한 부부를 대상으로 한 최근 통계조사에 따르면 평균적으로 결혼 후 10년 정도 지난 후에 이혼하는 것으로 나타났다. 하지만 정작 이혼이 가장 많이 이루어지는 시기는 결혼 직후부터 3년 사이의 결혼생활 초반기와 자식들이 다 장성한 후 '황혼 이혼'이 이루어지는 결혼생활 후반기이다.
사례(2) 흡연은 폐암의 주요 원인으로 지목되고 있다. 현재 폐암은 우리나라 사람의 사망원인 중 중요한 부분을 차지하기에 사회적인 의료비용을 증가시키는 중요한 원인으로 여겨지고 있다. 이 점을 고려하여 정부는 흡연을 줄일 수 있는 사회적 대책을 여러모로 강구하고 있다. 하지만 우리 주변에는 매일 줄담배를 피우면서도 폐암에 걸리지 않고 장수하는 사람이나 평생 담배 근처에 가보지 않았는데도 폐암에 걸려 사망한 사람을 찾아볼 수 있다.
사례(3) 지금은 타계한 유명한 진화생물학자 스티븐 제이 굴드는 40대 초반에 중피종이라는 희귀한 악성 종양에 걸렸다는 판정을 받았다. 그는 이 병의 중간값 생존율이 8개월이라는 말을 듣고 절망했다고 한다. 그러나 굴드는 중피종에 대해 자세히 알아본 결과 이 병의 생존기간 분포가 오른쪽 꼬리가 매우 긴 형태라는 것을 알아냈다. 그리고 자신이 오른쪽 꼬리 부근에 위치한 개인일 가능성이 높다는 근거, 즉 아직은 젊고 의료 환경이 좋은 곳에서 살고 있으며 비교적 조기에 병을 발견했고 병과 싸워 이기려는 투지가 불타고 있다는 사실을 근거로 자신은 8개월보다 훨씬 높은 생존 가능성이 있다는 결론을 내렸다. 실제로 굴드는 이런 결론에 근거하여 적극적으로 건강관리를 한 덕택에 중피종 진단 이후에도 상당 기간 활발한 학술활동을 수행할 수 있었다.
■ 해결 전략
논제에서는 문제가 발생할 수 있는 상황을 구체적으로 제시하고 있다. '집단의 속성과 구성원의 속성을 관련시켜 생각할 경우'라고 명시한 것이다. 여러 구성원이 모여 이뤄진 하나의 집단의 속성을 드러내기 위해 흔히 대푯값이 사용된다. 대푯값은 산술 평균, 최빈값, 중앙값 등 여러 가지로 표현되는데, 개별값의 분포가 어떠하냐에 따라 각각의 값 중 집단의 속성을 가장 잘 드러낼 수 있는 값은 달라지게 된다. 단, 어떤 대푯값을 선택하더라도 그것을 구성원 각각의 속성과 동일시할 수는 없고, 집단의 경향성 정도를 파악하는 선에서 이해해야 한다.
제시문에서는 대푯값이 구성원의 속성을 제대로 나타내지 못하는 여러 경우를 들어 논제 해결의 실마리로 삼도록 했다. 먼저 평균 이혼 시기에 대한 것으로, 실제 이혼이 가장 많이 이뤄지는 시기와 평균 이혼 시기의 불일치를 보여줬다. 또, 폐암과 흡연의 높은 상관관계에도 불구하고, 흡연과 전혀 상관없이 폐암을 앓거나 앓지 않는 경우 즉, 예외가 많다는 것을 들어 대푯값이 구성원의 속성과 일치하지 않음을 암시하고 있다.
대푯값의 산출 과정 및 제시된 사례는 대푯값과 구성원의 속성을 동일시할 경우 문제가 생길 수 있음을 암시한다. 먼저 대푯값을 구성원의 속성으로 이해할 경우 잘못된 판단을 내릴 수 있다. 스티븐 J. 굴드가 평균생존율로 자신의 남은 생을 예측하는 것이 타당하지 않을 수 있다는 문제를 제기한 것처럼 대푯값에서 소외된 개별값이 의미있을 수도 있기 때문이다. 또 평균값, 중앙값, 최빈값 등 다양한 대푯값이 각기 다른 수치로 나타날 수 있는데, 이런 불일치는 통계를 이용해 상대방을 설득하는 데 의도적으로 쓰이기도 한다.
■ 자료 검색
통계의 눈속임과 오류
평균에 대한 오해
한 아이가 10달러를 다 가지고 있으며, 다른 아홉 명은 돈을 하나도 가지고 있지 않다고 가정해 보자. 그래도 1인당 가지고 있는 돈의 평균은 1달러이다. 이러한 평균값이 그 집단을 정확하게 표현한다고 할 수 있을까? 실제로 정치판의 여론 조작 전문가들은 현실을 화려하게 채색하기 위한 눈속임으로 평균소득을 자주 이용한다. 예를 들어 부자들에게만 세금을 감면해 주는 슈퍼 레이거노믹스 체제에서 소수의 백만장자들이 엄청난 부를 축적하고, 빈곤선에 있는 대부분의 사람들은 더 궁핍해졌다고 가정해 보자. 이 때 1인당 평균소득은 증가한 것으로 나타날 것이다. 갑부 한 사람의 소득이 연간 600만 달러에서 6억 달러로 늘어난 것이 몇 백만 극빈자의 소득 감소를 상쇄하기 때문이다. 한 사람이 5억 9400만 달러를 벌고 1억 명이 모두 5달러씩 수입이 감소되었다 하더라도(총 5억 달러) 전체 집단의 평균 소득은 올라간다. 그러나 속임수로 이용하는 경우를 빼고는 이러한 경우에도 감히 사람들의 평균 수입이 늘어났다고 말할 수는 없다.
-스티븐 J. 굴드, < 풀 하우스 >
통계의 오용 및 통계분석의 오류
통계자료는 그 자체가 확정적인 관계를 보여주지 못하고 확률적 성격을 갖기 때문에, 어떻게 제시하는가에 따라서 전혀 다른 의미를 나타낼 수 있다. 뿐만 아니라 자료를 모으거나 표본을 추출하는 과정에서 어떤 편의가 들어가게 되면 통계처리의 결과가 잘못된 결론에 이르게 될 수도 있다. 예를 들어, 경제성장률과 같은 경우 비교시점을 어떻게 잡는가에 따라 성장률이 완전히 다르게 나타날 수 있다. 경제성장률처럼 어떤 변수의 변화율은 직전 기간과 비교할 수도 있고, 지난해 같은 기간과 비교할 수도 있다. 연간 자료의 경우 직전 기간이 지난해이기 때문에 차이가 없지만, 분기별 자료의 경우 전혀 다른 결과가 나올 수 있다.
표본을 바르게 추출하지 못해서 생기는 통계분석의 오류로 1936년 미국 대통령 선거의 여론조사 같은 경우가 대표적이다. 당시 경합을 벌였던 루스벨트와 랜든 후보에 대해 리터러리 다이제스트에서 여론조사를 실시했는데, 그 결과 랜든 후보가 크게 이길 것으로 예측되었다. 그러나 실제 선거에서는 루스벨트가 압승을 거두었다. 이처럼 전혀 엉뚱한 결과가 나왔던 것은 당시 여론조사가 전화번호부에서 추출한 표본에 대해 설문을 발송하여 실시되었기 때문이었다. 당시로서는 전화를 가지고 있다는 것이 부유층을 의미하였고, 이들 부유층은 대부분 공화당의 랜든 후보를 지지하였던 것이다.
이처럼 통계자료를 이용해 어떤 분석을 시도하거나, 통계를 이용해 분석된 어떤 결론에 대해서는 항상 어느 정도 객관성을 확보할 수 있는지에 대한 분명한 판단이 있어야 하는 것이다.
-노택선·김중렬, < 통계와 함께 배우는 경제학 >
■ 관점 넓히기
한나라당 대통령 후보 경선과정의 국민 여론조사 반영 방식을 보면서 정치인들을 비롯한 많은 사람들이 여론조사를 지나치게 믿는 듯해 우려스럽다. 이번 경선 과정에서 여론조사를 이용함으써 발생된 세 가지 문제점을 짚어보고자 한다.
첫째, 기본적인 통계원리가 무시되었다. 이번 한나라당 경선 과정에서의 여론조사는 표본오차를 무시하고 세 여론조사 기관들을 통해 추출된 표본들로부터 후보자들의 지지율 평균치를 구하여 단순히 득표 수로 환산하는 방식이었다. 이와 같은 방식은 표본조사에서 필연적으로 나타나는 오차를 무시하는 기괴한 방식이다. 만약 어떤 두 후보의 평균 지지율 차이가 오차범위 안에 있다면, 전체 유권자를 조사대상으로 가정했을 때 두 후보의 평균 지지율에 유효한 차이가 없음을 의미한다.
두번째로 표본추출 방법상의 문제다. 표본추출에서 세 여론조사 기관에서는 지역·성·연령별 비례 할당 추출법을 사용한 것으로 알고 있는데, 엄밀히 말해 이것은 무작위 추출방법도 아니고, 표본의 동일확률 추출방법도 아니어서 표본이 정확히 전체 유권자를 대표했다고 보기 어려운 편향성의 문제가 제기될 수 있다. 미국의 여론조사 기관들의 경우 전화조사에서 완벽한 무작위 추출법을 사용하며, 지역·성·연령 등의 변수는 인구조사 데이터로써 조사 이후에 조정하는 방식을 택하고 있다.
마지막 문제점으로 조사에서 단위 무응답에 대한 무관심이다. 이 조사는 지난 19일 일요일 오후 1시에서 저녁 8시까지 이루어졌다고 한다. 조사기관당 목표 표본 2000명의 인터뷰를 7시간 내에 끝낸 셈이다. 전화조사의 경우 인터뷰어가 미리 정해진 표본 내의 응답자에게 전화를 할때 부재 중이어서 접촉이 안 된 경우는 모두 단위 무응답층에 해당된다. 이번 조사의 경우 조사기간 7시간 동안 부재 중이었던 표본 대상들은 조사에서 아예 배제될 수밖에 없게 되었다. 이 부분은 표본추출의 심각한 편향성을 다시 한번 드러내는 대목이다.
이상과 같은 방법상의 문제점들을 고려할 때 국가의 대통령 후보를 결정하는 정당의 경선 과정에서 여론조사 반영 부분이 반드시 필요했는지 한나라당에 묻지 않을 수 없다. 더군다나, 여론조사 부분에서 후보가 바뀌었다.
이건, < 한겨레 > 2007년 8월27일치.
ⓒ 한겨레신문사, 무단전재 및 재배포 금지
'논술자료' 카테고리의 다른 글
[열려라논술 고등 인문계] 구체적 사례 넣어야 설득력 높아 (0) | 2008.10.09 |
---|---|
개별답안 연결해 하나의 주제 부각하라 (0) | 2008.09.29 |
유형별 논술교과서 / 13. 문제점 설명 (0) | 2008.09.29 |
[대입논술 가이드]경쟁력과 경쟁윤리 (0) | 2008.09.29 |
[고등 자연계 논술] 과학적 근거·실험 모형 제시가 고득점 열쇠 (0) | 2008.09.24 |