수정:

19회 분석

1. 팬덤과 캐릭터 편

2. 음악 편

-----


18회 인기투표가 끝난지 언제인데 이제 와서 왜 뒷북이냐고?

그건 내가 인기투표 결과에서 이 캐릭터가 받은 표의 분포를 연령, 성별 등에 따라 보여준다는 걸 이제 알아서 그럼


https://toho-vote.info/results/18/character


다음은 플랑이 받은 표의 집단별 분포임




이 결과는 아마 설문 조사까지 참여한 사람들만 반영된 거라서 실제와는 차이가 있을 수 있음

오시캐 응답만 세는 건지는 모르겠음 이것도 아마 그럴 거 같은데 (수정: 아닌 거 같음)

응답률은 현재 대상이 된 캐릭터에 대해서만 총 응답수로 나눈 거고, 전체 응답률은 집단의 인구 비율을 나타내는 거라고 생각됨

차이는 (응답률-전체 응답률)pt로 계산됨

만약 모든 캐릭터들이 각 집단에게 차별 없이 비슷하게 선호된다면 차이는 0에 가까워야 하지만 결과는 그렇지 않음

거꾸로 이것을 통해 각 캐릭터들이 어떤 집단에게 특히 선호되는지 알아낼 수 있을 거임


정리해보면 플랑의 경우는 10대(특히 초중반) 여자에게 인기가 많았네


근데 여기서 끝이 아니고 이와 같은 분석을 상위 100명의 캐릭터에 대해서 해보고 하나의 이미지로 표현해보겠음

 자세한 방법 설명 

각 캐릭터가 어떤 집단으로부터 받은 표의 상대적인 비율이 그 집단의 인구 비율보다 많으면 그 집단에게 주목받고 있다는 뜻임

차별 없이 동등하게 각 집단에게 여겨지고 있다면 받은 표의 분포가 집단별 인구 분포와 비슷하게 나올거라고 기대해야 함

이항분포를 이용하면 얼마나 기대와 어긋났는지 알아볼 수 있음

p = 그 집단의 실제 인구 비율

n = 그 캐릭터의 전체 득표수

표본비율의 표준편차 = sqrt(p(1-p)/n)

차이를 이걸로 나눠줌

연령 집단 10개, 성별 집단 3개가 있었으니 각 캐릭터마다 13개의 feature를 갖게 됨


그리고 주성분 분석(PCA)을 해서 차원을 줄일 거임

원래는 13개 전부 한 번에 해야겠지만 그렇게 하면 주축의 의미를 해석하기가 어려워져서 각각 나눠서 10개와 3개로 함

주성분 분석에 대한 자세한 설명은 생략함

원래 변수 간에 상관성이 높으면 그걸 합쳐버리는 느낌으로 이해하면 됨


연령의 경우는 첫 번째 고유 벡터가 분산의 65%를 설명할 수 있었는데 사실 이걸로는 부족하지만 성별축이랑 같이 2차원 이미지로 나타내기 위해서 그거 하나만 사용함

그렇게 해서 나온 게

x축 = 0.0869*연령1 + 0.6357*연령2 + 0.3665*연령3 + (-0.3764)*연령4 + (-0.3499)*연령5 + (-0.3381)*연령6 + (-0.2146)*연령7 + (-0.1435)*연령8 + (-0.0823)*연령9 + (-0.047)*연령10

연령1~3은 20세 미만 집단이었고 이들이 그 외의 20세 이상 집단과 비교해서 비슷하게 뭉쳐진 걸 보니 성향이 약간 나눠진다는 의미임

x축에서 오른쪽에 위치한 캐릭터는 그래서 저연령층에게 상대적으로 더 주목받았다고 볼 수 있음


성별의 경우는 첫 번째 고유 벡터만으로도 분산의 96.6%를 설명할 수 있어서 하나만 사용함

y축 = 0.7057*성별1 + (-0.7025)*성별2 + (-0.092)*성별3

참고로 성별3은 성별 문항에서 남녀 그 외라고 체크한 집단임

해석해보면 y축에서 위쪽에 위치한 캐릭터는 남성에게 상대적으로 더 주목받았다고 볼 수 있음




그렇게 해서 나온 이미지가 이거임

2차원으로 하느라 x축의 설명력은 y축에 비해 상대적으로 약하니 그 점은 유의해주셈



이미지가 잘 안 보이니 클릭해서 봐주셈


여기서 인기 투표 순위가 높을수록 빨간 점으로 표시했고 낮을수록 파란 점으로 표시함

점 옆에 써있는 수가 캐릭터의 순위임

무슨 캐릭터인지 궁금하면 https://toho-vote.info/results/18/character 가서 볼 수 있음


이 이미지에서 흥미로운 점들은 다음과 같음


1. 저연령층 선호 영역에 있는 캐릭터들은 인기가 많지만 그 수가 상대적으로 적음

이건 저연령층에선 일종의 '인기 몰빵'이 있다고 볼 수 있음

x좌표가 10 이상인 캐릭터들은 1, 2, 4, 5, 6, 7, 17위의 캐릭터인데 차례대로 플랑, 마리사, 요우무, 사쿠야, 코이시, 레밀리아, 루미아임

그리고 저 중에선 요우무, 코이시만이 남성에게 더 선호되었음

범위를 더 넓혀서 보자면 모코우와 미코가 저연령층 여성에게 더 선호되었고, 스와코와 모미지가 저연령층 남성에게 더 선호되었음


2. 레이무는 3위인 캐릭터인데 이미지를 보면 알 수 있듯이 치우치지 않은 모습을 볼 수 있음

역시 하쿠레이의 무녀의 모습임

비슷한 캐릭터로는 10위의 유유코가 있음


3. 고연령층 남성에게 선호되면서 인기가 많은 캐릭터들

11, 12, 14, 18, 25위, 더 넓게 보면 9, 16, 19위의 캐릭터들도 포함할 수 있음

차례대로 앨리스, 아야, 사나에, 텐시, 코가사, 사토리, 유카리, 파츄리인데...

이유가 무엇인지 필자도 정말 궁금한 바이다


코메이지 자매는 둘 다 남성에게 선호되었지만 코이시는 저연령층, 사토리는 그보다 살짝 고연령층에게 선호됨

아무래도 선호하는 분위기나 취향이 자기 나이를 따라간다는 의미일 수도


4. 고연령층 남성에게 선호되지만 인기는 상대적으로 그닥인 캐릭터들

62, 63, 69, 70, 76, 77, 80위

차례대로 이쿠, 쿠타카, 미스티아, 카게로, 코스즈, 코마치, 하타테


5. 고연령층 여성의 선호 영역

이 영역에서 인기가 많은 캐릭터는 그렇게 발견되지 않음

굳이 따지자면 유카, 순호, 카구야

인기가 그닥인 캐릭터들로는 야치에, 마미조, 쇼우 등이 있음



마지막으로는 연령과 성별을 분리하지 않고 주성분 분석을 해서 설명력만을 좀 더 높인 이미지임 (2개로 80%)

각 축의 의미는 크게 없고 어떻게 군집을 묶을 만한지 참고용임