• mksong8

[데이터 분석] 영화 리뷰 사이트 Rotten Tomatoes 웹크롤링 및 비평가 vs 관객 영화 평점 차이 분석

Rotten Tomatoes와 IMDB와 같은 리뷰사이트의 흥행 성공은 많은 점을 시사합니다. 영화는 리뷰가 중요합니다. 다른 사람의 의견은 중요하지 않다고 말하는 사람도 많지만, 영화 리뷰 사이트나 영화의 리뷰가 영화의 흥행에 있어 그 중요성이 날로 되는 것을 보면 이 반대 의견을 증명해 보이는 듯 합니다. 영화 이외에도 대부분의 경우 리뷰는 비즈니스 성공에 매우 중요한 역활을 합니다.



많은 사람들이 영화를 선택하는 이미 영화를 본 사람들의 리뷰를 참고 하고 있습니다. 그리고 내가 영화를 볼때 느꼈던 즐거움을 다른 사람들과 공유하는 것만큼 즐거운 것도 없습니다. 어떤 사람의 리뷰에 반대하는 의견을 제시하는 것 또한 의미있는 일입니다. 그러나 영화 후기를 이용하는 주된 목적은 아직 영화를 보지 않은 사람들이 이 영화를 볼지 안볼지 결정을 하는 것을 도와주는데 있습니다. 리뷰어들은 영화 리뷰 사이트를 이용하는 사람들에게 영향을 줄 수 있다는 것을 잘 알고 있습니다.

영화를 본 관객들은 자신의 경험에 따라 점수(0점에서 5점)를 주게 됩니다. 영화에 따라 고객들이 주는 점수는 다양합니다.

영화 중에는 비평가와 일반 관객의 평점이 크게 차이나는 영화 장르가 있습니다. 2019년 개봉된 '조커'는 관객들로부터 89% 긍정적 평가를 받은 반면, 비평가들로부터는 69%만 긍정적 평가를 받았습니다. 데이브 샤펠의 '2019 스페셜'은 반응이 더 달랐습니다. 청중들로부터 99% 긍정적 평가를 받은 반면 비평가들의 25% 에게서만 긍정적 평가를 받았습니다.

또 다른 예로 '미드소마' (비평가 83% ; 청중 63% ) 및 '스타워즈: 라스트 제다이' (비평가 91% ; 청중 44%)와 같은 영화가 있습니다.

관객의 문화 차이에 따라 영화의 점수에도 차이가 납니다. 관객이 경험한 문화의 차이가 부분적으로 영화에 반영이 되어 점수에 차이가 납니다.


문제 제기

영화 리뷰 사이트 Rotten Tomatoes의 관객의 점수와 비평가의 점수 중 어느 점수가 영화의 인기나 예술성을 정확하게 반영한다고 볼 수 있을까요? 대답하기 어려운 문제이지만 이 두가지 점수를 갖고 이 질문에 대한 해답을 만들어 볼 수도 있을 것입니다.

아주 다른 두 집단인 비평가 집단이 보통 관객들에게 영화에 대한 조언을 준다면 적절한 조언일까요? 아마도 비평가의 영화 후기는 관객이 참고하지 말아야 할 후기일 수도 있습니다. 그러나 디즈니 영화의 경우는 이야기가 다릅니다. 관객이 준 낮은 점수때문에 '조커'와 같은 영화를 놓치고 싶지 않기도 하지만 비평가가 준 높은 점수 때문에 '스타워즈: 라스트 제다이'와 같은 영화를 보고 싶지도 않습니다. 어떻게 해야 현명한 판단일까요?

비평가와 관객의 영화 점수의 차이를 분석해 내어 이 점수차이를 제거하여 해결하는 것이 방법일 수 있습니다. 이런 방법이라면 비평가와 일반 관객 모두 참고할 수 있는 점수가 될 것입니다.


웹크롤링 데이터 수집

이러한 방법으로 영화 점수를 분석 하기 위해 Rotten Tomatoes의 데이터를 크롤링 하였습니다. 총 16장르에서 장르별 최고 평점순(비평가 점수)으로 100개의 영화 데이터를 수집했습니다. 1600개 영화에 대한 데이터를 파이썬으로 분석하고 그래프를 그렸습니다.

파이썬으로 제목, 평점, 평론가 점수, 관객 점수, 런타임, 박스 오피스를 수집하였고 점수차이(%)는 다음과 같이 계산하였습니다.

def pcntchange(a,b):

list_ = []

for a, b in zip(audience_score, critic_score):

list_.append(100 * (b - a)/a)

return list_


데이터 분석

박스오피스 데이터는 두가지 형식으로 수집되었는데 점수간 차이가 너무 커서 로그 변환을 이용하여 영화 수익에 대한 분포가 이해가 용이하도록 하였습니다.


그리고, 관객의 점수와 비평가 그룹간의 점수 차이(%)와 등급을 아래와 같이 그래프로 그려 보았습니다.



결론

분석 결과 중 일부는 에측한 결과와 일치했습니다. 비평가의 점수는 일반적으로 관객의 점수보다 높았습니다. 다른 더 놀라운 사실은, 비평가와 일반 관객의 점수차이(%)는 PG-13 등급 영화와 양의 상관 관계가 있었습니다. 비평가와 일반 관객의 점수차이(%)와 R 등급의 영화 사이에는 음의 관계가 있음이 분석 되었습니다.

많은 후속 분석이 이어져야 하지만 두집단의 접수차이와 영화 등급간의 상관관계를 알아낸다면 좀더 영화 리뷰에 현명하게 반응하거나 선택할 수 있을 것이라 생각합니다. 이 분석이 영화 후기에 대한 비평과와 일반 관객의 견해 차이에서 오는 문제를 극복하는 효과적이고 흥미로운 방법이 될 것이라고 생각합니다.



조회 219회

​고객센터

Tel: 02-596-8900  Fax : 02-6930-5709

10시 - 오후 7시(토, 일요일 및 공휴일은 휴무)

개인정보관리책임자 : 황재준   상호 : 유펜솔루션   대표자 : 김재훈   사업자등록번호 : 426-86-00939
주소 : (본사)대전광역시 유성구 엑스포로446번길 38, 3층 302호 / (지사 및 연구소)서울시 성동구 연무장 15길 11, B동 2층
​ⓒ 2019 UpennSolution Co., Ltd. All rights reserved.