시작하기 전에 여론조사 안 믿는 분들을 위해, 16년 총선때와 달리 최근 여론조사는 안심번호 허용+유무선비율 조정으로 그때보다는 의외로 정확함. 하지만 요즘 여론조사들도 몇가지 확인 제대로 안하고 보면 저번 20대 총선처럼 "저기 물에 떠다니는거 뭐야, 세훈이 아니야?" 꼴 날수도 있으니 조심해야함. 이런 것만 잘 걸러보면 정확하다.


1. 유/무선 비율


20대 총선때만해도 유선 100% 70% 같은 방법을 쓴 덕에, 평일 오전에 집에서 주로 노는 백수/노인/가정주부(아시다시피 이 계층에서는 주로 보수 지지자가 많은 편이다.) 들이 상대적으로 과대표집되는 경향이 있었음. 보통 여론조사 기관들 쿼터(인구비율을 고려해서 만드는 목표 할당량인데, 만약 조사하는 지역 인구가 10만, 그 중 남자 6만 여자 4만이면 표본 1000명으로 조사할 때 보통 남자 600명, 여자 400명 이런 식으로 인원을 맞추고 함)잡을 때 직업별/소득별 비율은 잘 고려하지는 않기 때문에 이런 방법을 쓰면 보수 지지층이 높게 나온다. 


지난 지방선거때도 이런 방법 쓰다가 피 본 기관이 많았는데, 보다시피 유선 100%로 울산 시장 조사 결과 16% 넘게 김기현이 앞선다고 나왔고, 일부 보수층들이 이거 보고 여론조사 조작설 더 믿기도 했다. 그런데 동 기간에 시행된 유선 16% 짜리 조사를 보면



이렇게 결과가 정반대로 뒤바뀌었고, 실제 선거 결과 52:40으로 송철호가 당선됐다. 물론 저때는 지금보다 샤이 보수가 훨씬 많아서 여론조사랑 비교해 보수 후보 지지한다는 응답이 실제보다 더 적게 나온 것도 감안해야한다. 예시를 하나 더 들어보자면



이 조사는 충청남도 도지사 조사 결과로, 앞에 있는게 민주당 양승조고 두번째가 한국당 이인제다. 이 조사만 보면 이인제가 3% 차로 이기고 있었지만, 정작 실제 개표결과는 62:35로 양승조가 압승했다.

위 두개를 보면 실제로도 유선 조사는 보수 지지계층이 과대표집되는 걸 볼 수 있고, 그런 이유로 요즘 조사기관에서는 대부분 무선:유선 8:2를 쓰거나 아예 무선 100%를 사용하는게 일반적이다. 비율을 그렇게 맞추는 이유는 요즘은 노인들도 90% 이상 스마트폰(즉 무선전화)를 들고 있어서 굳이 유선 조사를 할 필요가 없긴 하지만, 농촌 지역에 사시는 노인분들은 집에 유선 전화기가 대부분 있고 스마트폰이 없는 분들도 꽤 돼시기 때문이다. 

이런 이유로 지역별로도 유선:무선의 적정 비율이 달라지는데, 일산이나 서울같이 도시 지역에는 아예 무선 100%로 하거나 유선을 최대 10% 미만으로 잡는게 대부분 정확하고, 괴산이나 철원같은 시골 지역에는 유선 40% 정도까지 정확할 때도 있다.

2. ARS와 면접의 차이

ARS는 리얼미터, 조원씨엔아이 등에서 쓰는 조사방법으로, 사람들이 면접보다 더 본인 정치 성향에 대해 응답을 잘하지만(아무래도 그냥 기계에서 물어보는 거라 본인 성향을 밝힌다는 것에 대한 거리낌이 적으니까) 정치에 상대적으로 무관심한 중도층들을 잘 표집 못해서(모르는 번호로 전화왔는데 뜬금없이 ARS로 기계음 들리면 광고전화인 줄 아는 분들이 많은 편임) 거대 양당 지지율이 면접보다 높다.

면접은 한국갤럽, 한국리서치에서 쓰는 조사 방법으로, 정치에 상대적으로 무관심한 사람도 응답을 잘 하지만(사람이 얘기하는데 중간에 끊기에는 미안해하는 사람이 많아서) 샤이 지지층들을 잘 표집 못하는 편이다(아무래도 사람한테 직접 본인 성향을 다 까발려야 하니까)

둘 중 어느 조사가 정확한지는 특별히 밝혀진 것은 없고, 그때 그때 다르다.

요즘 여론조사는 위에 언급한 두 가지만 잘 걸러서 보면 꽤 정확한 편이다. 그리고 몇 가지 더 얘기하면

1. 오차범위-의외로 사람들이 많이 간과하는데, 어떤 조사 오차범위가 플마3%면, 최대 6% 차이까지는 역전될 수 있다는 소리다. 그래서 보통 격차가 오차범위 내에 있으면 언론사들에서 "오차범위 내 경합중입니다." 이러지 "누구누구가 2% 차로 우세합니다." 이런 얘기는 선거법 상 못하게 되어있음.

2. 지역별, 계층별 추세-위에 1번과도 연결되는데, 리얼미터나 한국갤럽에서 하는 전국조사보면 지역별로 지지율이 나오는데, 이게 전국적으로 다 합하면 표본이 1000명이 보통 넘지만, 지역별로는 인구가 많으면 200명, 적은 지역은 수십명대도 볼 수 있고, 표본이 적을 수록 그 계층의 오차범위는 더더욱 커진다. 그래서 전국 조사 안에서의 지역/계층별 지지율을 그대로 믿기는 곤란하고, 전체적인 추세를 보고 판단할 필요가 있다. 여론조사 보면 TK에서는 거의 변함없이 미통당이, 호남/수도권에서는 거의 변함없이 민주당이 앞서는 추센데 이렇게 판단하라는 거다.

3. 특정 정당 지지율 과표집?-가끔 기사를 보면, "어떤 기관 조사에서 지난 대선 당선자에 투표했다는 비율이 60%다!" 이런 말이 나오는데, 이게 이렇게 나오는 이유는 미래 시점 의향과 실현율 차이로, 직전 이슈 같은 거에 따라 달라지기도 한다.(얘를 들어 남북정상회담 직후에는 평소보다 현 대통령에 투표했단 사람이 많이 나올거고, 정부의 실정 직후에는 평소보다 현 대통령에 투표했단 사람이 적게 나올 수도 있단 말). 또한 이런 거는 '사회적 바람직성 편향'도 원인인데, 대표적 예시로는 '선거 투표 의향' 조사를 들 수 있음

보다시피 매 선거마다 "꼭 투표할 것이다" 비율이 실제 투표율에 비해 매우 높은데, 이게 왜 그러냐면 보통 사람들은 선거에 투표하는게 대세라고 생각하기 때문이다(이것도 맞는게 재보선 아니면 선거때 투표율이 절반 밑으로 떨어진 건 못봤다. 대선때는 80%에 육박하고). 지난 대선 투표 후보 응답에서도 비슷한 상황이 나오는데, 보통 당선자를 투표했다는 사람이 실제 득표율보다 많이 나온다고 한다. 이런 이유는 전과 비슷하게 낙선한 후보에 투표한 걸 숨기고 싶어서 그냥 당선자에 투표했다는 사람도 있는데다, 그 당시 당선된 후보 투표한게 '대세'기 때문이다. 이런 문제는 샤이 진보/보수 문제와도 연결되는데, 지난 지방선거때만 해도 더불어민주당의 세가 압도적이었기 때문에 여론조사를 보면 보통 더불어민주당 후보가 실제 득표율보다 많이 나온 경우가 많았다.



일단 여론조사에 대한 의혹도 최대한 해명해봤고, 잘 걸러서 보는 방법도 알려줬지만, 이렇게 해도 안 믿겠다면 그건 그 사람 마음이니 내가 어떻게 할 수는 없는거다. 이 글보고 여론조사에 관한 오해나 궁금증이 풀리기를 바란다.