#. 429 보궐선거) (좌)빅데이터 + (우)프레임 = 1% 전쟁 ? [관악을]
– 빅데이터 선거
– 프레임 선거
– 64 지방선거 (서울) 분석
– 730 보궐선거 (동작을) 분석
– 429 보궐선거 (관악을) 프레임 디자인(오신환, 정태호, 이상규)
#. 1% 전쟁
1) 프레임 전쟁: 지역과 계층적 프레임을 활용하라.
==> 가정, 교육, 미래, 교통, 개발, 서민, 희망…
2) 빅데이터 전쟁: 트렌드(타임라인)를 파악하고 선거 프레임의 응집력을 높여라.
==> 선거 관련 하위 프레임(단어)과 상관 관계를 높여야 한다.
==> (선거 핵심 프레임에서 멀어지는) 사회적 프레임(이슈)에 갇히지 않아야 한다.
#. 당선 프레임 디자인
– 당선 가능성을 높이는 프레임
– [동작을] 선거 과정에서 프레임 추출
– [관악을]과 [동작을] 지리적 인접 효과
#. 당선 프레임(주제어) 트렌드 디자인
#. 당선 트렌드(타임라인) 디자인
#. 프레임 선거
– (2014) 730보궐선거 동작을 분석
– [나경원, 노회찬] 프레임(주제어) 비교
– 중앙일보 정치>선거 섹션 48건 뉴스 주제어 분석
– 기간: 2014.7.14 ~ 7.30
– 중앙일보 뉴스에서 고유 프레임(주제어) 추출
==> 상대 후보에게서는 나타나지 않고 해당 후보에만 언급된 프레임(주제어)
– 1.2%격차로 당선: 나경원 3만8311표(49.9%)와 노회찬 3만7382표(48.69%) 무효 929표
#. 나경원 후보 프레임
고유 프레임(주제어) – 지역과 계층적 프레임
강남, 가정, 교육, 미래, 자식, 개발…
#. 노회찬 후보 프레임
고유 프레임(주제어) – 정치적 프레임
야권연대, 회동, 방식, 담판, 경합…
#. 빅데이터 선거
– (2014) 64지방선거 [박원순, 정몽준] (주제어 타임라인) 분석
– 중앙일보 정치>선거 섹션 169건 뉴스 주제어 분석
– 기간: 5.7 ~ 6.2
– 중앙일보 뉴스에서 고유 프레임 (주제어) 추출
==> 상대 후보에게서는 나타나지 않고 해당 후보에만 언급된 주제어
#. 프레임(주제어) 상관관계 분석 : 선거 프레임과 당선 가능성 비교
–> 타임라인 표준편차 0.5 이상, 3주 연속 출연, 4회 이상 빈도
–> 선거 핵심 프레임과 당선 가능성 비교
#. 박원순
– 선거 관련 하위 프레임(단어)과 상관 관계가 높게 나타나는 경향
– 수도권 새정치민주연합 후보와 상관관계가 낮게 나타남
– 인천 후보 송영길 후보와 빈도가 낮고 역상관관계 패턴을 보임
==> 뉴스에서 언급되는 패턴에서 관련성이 적다는 뜻.
– 경기 후보 김진표 후보와는 연관되지 않은 것으로 보임
==> (표준편차 0.5이상, 3주 연속 언급, 4회이상 출현한 것을 기준을 적용)
#. 정몽준
– 사회적 프레임(이슈)과 관련된 단어의 상관관계가 높게 나타나는 경향
==> 선거 핵심 프레임에서 멀어지는 효과
– 수도권 새누리당 후보와 같이 언급되면서 (박원순 후보보다는) 상관관계가 높게 나타남.
#. 프레임(주제어) 상관관계 분석 : 연관 인물 프레임과 당선 가능성 비교
–> 타임라인 표준편차 0.5 이상, 3주 연속 출연, 4회 이상 빈도
#. 특징1
경쟁 상태 후보와 가장 많이 연관되어 나타나고, 이어서 같은 당 소속 수도권 후보와 연관되어 언급됨.
#. 특징2
보수 교육감 단일후보인 문용린 후보가 같이 연관되어 나타나지 않고 고승덕 후보 관련 인물이 (상대적으로) 높게 나타남.
이에 반하여 박원순 후보는 진보 교육감 조희연 후보와 연관되어 나타남.
#. 특징3
야당은 문재인 (전의원)과 안철수 대표가 연관되어 나타났지만 김한길 대표는 연관되어 나타나지 않았다.
참고한 뉴스:
중앙일보 온라인 뉴스 > 정치 > 선거 섹션: [2014.07.14. ~ 07.30.] (48건)
중앙일보 온라인 뉴스 > 정치 > 선거 섹션: [2014.05.7. ~ 06.03.] (169건)
http://joongang.joins.com/list/news/politics/election.html?cloc=joins|navi_top|politics_election
분석엔진 : 빅데이터(Big Data) 엔진 2014.06.10 버전
빅데이터(Big Data) 엔진 2014.07.30 버전
통합 주제어 색인 엔진 8.0 (통계적 형태소 분석에 의한 불완전성 포함)
스프레드시트형 표 / 차트: 구글 문서도구 스프레드시트(http://www.google.co.kr/)
스프레드시트형 표 / 차트: 애플 넘버(Numbers)
단어구름 차트: http://www.tagxedo.com/ ( Word Cloud with Styles )
그래프: gephi (engine)