대선후보 3차 TV토론 분석, 2012 선거 분석, 빅데이터 (2012.12.17)

By | 2017-12-22

빅데이터 분석, 빅데이터 선거 분석, 빅데이터 대선 분석, 대통령 선거 분석,

대선 후보 3차 TV토론 분석, 박근혜, 문재인

대선후보 3차 TV토론 분석, 2012 선거분석, 빅데이터

이 글은  아래 출처 뉴스를 주제 색인 엔진으로 분석한 후에 빅데이터(Big Data-복잡계) 엔진으로 처리한 것이다. 특히 주제 색인은 확률적인 방법에 의하여 분류하였기 때문에 통계적으로 주제어를 추출한다. 따라서 일부 주제어는 누락될 수도 있으며 아니면 반대로 포함될 수도 있다.

 # 대선후보 3차 TV토론 분석 – 단어 구름 WordCloud

#. 대선후보 3차 TV토론 주제어 통계 순위 106위까지

– 총 1291 주제어 중에서 6회 이상 출현한 주제어

– 106개의 주제어가 전체 출현 주제어의 36.74%를 차지한다.

순위 주제어 빈도 누적빈도 누적빈도점유율
1 국민 45 45 1.45
2 지금 33 78 2.5
3 필요 30 108 3.47
4 박후보 28 136 4.37
5 정부 28 164 5.27
6 과학기술 26 190 6.1
7 반값등록금 25 215 6.9
8 대통령 22 237 7.61
9 문제 22 259 8.32
10 전교조 22 281 9.02
11 공약 21 302 9.7
12 말씀 18 320 10.28
13 국가 17 337 10.82
14 부담 17 354 11.37
15 이명박 16 370 11.88
16 문후보 15 385 12.36
17 참여정부 15 400 12.85
18 등록금 14 414 13.29
19 수사 14 428 13.74
20 일자리 14 442 14.19
21 지원 14 456 14.64
22 과기부 13 469 15.06
23 과학기술인 13 482 15.48
24 중요 13 495 15.9
25 민주당 12 507 16.28
26 새누리당 12 519 16.67
27 원전 12 531 17.05
28 잘못 12 543 17.44
29 거기 11 554 17.79
30 계속 11 565 18.14
31 부분 11 576 18.5
32 주장 11 587 18.85
33 학생 11 598 19.2
34 확대 11 609 19.56
35 강화 10 619 19.88
36 교육 10 629 20.2
37 대학 10 639 20.52
38 안전 10 649 20.84
39 전체 10 659 21.16
40 행복 10 669 21.48
41 국정원 9 678 21.77
42 그부분 9 687 22.06
43 모든 9 696 22.35
44 무상보육 9 705 22.64
45 반대 9 714 22.93
46 연구 9 723 23.22
47 연구원 9 732 23.51
48 우선 9 741 23.8
49 전환 9 750 24.08
50 정치 9 759 24.37
51 중심 9 768 24.66
52 경제민주화 8 776 24.92
53 경찰 8 784 25.18
54 무엇 8 792 25.43
55 비정규직 8 800 25.69
56 사실 8 808 25.95
57 실천 8 816 26.2
58 약속 8 824 26.46
59 여직원 8 832 26.72
60 이번 8 840 26.97
61 이야기 8 848 27.23
62 장학금 8 856 27.49
63 정권교체 8 864 27.75
64 평가 8 872 28
65 폐지 8 880 28.26
66 경쟁력 7 887 28.48
67 기업 7 894 28.71
68 발전 7 901 28.93
69 부활 7 908 29.16
70 사건 7 915 29.38
71 사대강 7 922 29.61
72 7 929 29.83
73 신재생에너지 7 936 30.06
74 아이 7 943 30.28
75 얼마 7 950 30.51
76 여성 7 957 30.73
77 예산 7 964 30.96
78 요구 7 971 31.18
79 운영 7 978 31.41
80 중소기업 7 985 31.63
81 처음 7 992 31.86
82 투자 7 999 32.08
83 확인 7 1006 32.31
84 과제 6 1012 32.5
85 국정 6 1018 32.69
86 근본적 6 1024 32.88
87 기초노령연금 6 1030 33.08
88 나라 6 1036 33.27
89 도입 6 1042 33.46
90 발생 6 1048 33.65
91 6 1054 33.85
92 보육시설 6 1060 34.04
93 사람 6 1066 34.23
94 사업 6 1072 34.43
95 선행학습 6 1078 34.62
96 시설 6 1084 34.81
97 아동수당 6 1090 35
98 이유 6 1096 35.2
99 자사고 6 1102 35.39
100 재원 6 1108 35.58
101 정규직 6 1114 35.77
102 정책 6 1120 35.97
103 특목고 6 1126 36.16
104 판단 6 1132 36.35
105 하나 6 1138 36.54
106 합의 6 1144 36.74

 

#. 대선 후보 3차 TV토론, 주제어 연결망 [전체]

#. 대선 후보 3차 TV토론, 주제어 연결망 [국민]

#. 대선 후보 3차 TV토론, 주제어 연결망 [과학기술]

#. 대선 후보 3차 TV토론, 주제어 연결망 [반값등록금]

#. 대선 후보 3차 TV토론, 주제어 연결망 [전교조]

#. 대선 후보 3차 TV토론, 주제어 연결망 [일자리]

#. 대선 후보 3차 TV토론, 주제어 연결망 [원전]

#. 대선 후보 3차 TV토론, 주제어 연결망 [경제민주화]

#. 대선 후보 3차 TV토론, 주제어 연결망 [비정규직]

#. 대선 후보 3차 TV토론, 주제어 연결망 [4대강]

#. 대선 후보 3차 TV토론, 주제어 연결망 [문재인후보]

– 아래 내용은 [문재인]후보가 발언한 것이 아니아 박근혜 후보가 문재인 후보를 언급했던 내용임.

#. 대선 후보 3차 TV토론, 주제어 연결망 [박근혜후보]

– 아래 내용은 [박근혜]후보가 발언한 것이 아니아 문재인 후보가 박근혜 후보를 언급했던 내용임.

순서 사용 예문 (↙: 문단 구분 문자)
1 ↙▲문 = 과기부가 없어지니 과학기술 경쟁력 떨어지듯이 저출산 고령사회
2 말씀 하시는 거 같다.↙↙▲박 = 과학기술은 우리의 미래라고 할 수 있다. 저 자신이
3 전자공학과 출신인데 그래서 더욱 과학기술의 소중함에 대해 잘 알고 절실히 느낀다.
4 우리나라의 산업화 과정에서 과학기술이 얼마나 큰 역할 했는지 가까이에서
5 자부심을 잃어가고 있다. 과학기술은 제가 새로운 성장 패러다임으로 제시한
6 제시한 창조경제론의 핵심이다. 과학기술을 국정운영의 중심에 놓으려고 한다.
7 국정운영의 중심에 놓으려고 한다. 과학기술도 결국 사람이 하는 것이다. 과학기술인이
8 유공자 예우를 확대하겠다. 과학기술 발전을 위해 연구개발 투자를 GDP 5%
9 5% 수준으로 확대하겠다. 국가의 과학기술을 책임질 미래창조과학부를 설립하겠다.↙
10 ↙▲문 = 새누리당 정권의 과학기술 정책 실패를 단적으로 보여주는 것이
11 못했다. 실제 국제기관에서 조사한 과학기술 경쟁력을 보면 참여정부 6위에서 지금
12 근본적인 원인은 과기부를 폐지해서 과학기술 정책에 대한 컨트롤타워를 없애 버린 게
13 과학기술부를 부활해서 무너진 국가 과학기술의 사령탑을 다시 세우겠다. 초중등
14 정년도 연장하겠다. 연구환경 개선, 과학기술 R&D 예산을 크게 늘려 과학기술인이
15 나로호 발사실패로 상징되는 한국 과학기술의 무너진 자존심을 세우겠다.↙↙▲박 =
16 조치가 필요하다고 본다.↙↙정말 과학기술은 우리는 자원이 따로없는 나라다. 인력이
17 최대 자원이 아닌가. 그렇다면 과학기술 인력이 우리나라 세계적 경쟁력을
18 박정희 전 대통령은 해외에서 과학기술 인력을 유치했고, 그런 기조가
19 이명박 정부 들어 과학기술의 침체, 과학기술 인력의 사기를 크게 떨어뜨린 결정적인
20 폐지한 것이 이명박 정부 들어 과학기술의 침체, 과학기술 인력의 사기를 크게
21 창조경제론을 주장하는 데 핵심이 과학기술이다. 그 과학기술이 따로 남는 게 아니라 전
22 데 핵심이 과학기술이다. 그 과학기술이 따로 남는 게 아니라 전 분야, 농업,
23 농업, 서비스 분야까지도 ICT나 과학기술을 융합함으로써 비타민같이 시들시들한
24 국정운영에 하나의 중심과제로서 과학기술을 중요시하고 있기 때문에 지난 과기부보다
25 역할을 하게 될 것이다.↙↙▲박 = 과학기술을 국정 전반에 활용하려면 과학기술인이
26 것을 지키려 한다. 민주당은 말로는 과학기술을 강조하지만 실천이 따르지 않는다. 총선
순서 사용 예문 (↙: 문단 구분 문자)
1 한다. 무상급식, 무상보육, 반값등록금, 그래서 꼭 해야 한다. 고령화에도
2 수밖에 없다.↙↙▲문 = 박 후보도 반값등록금을 공약했다. 저도 반값등록금을 공약하는데
3 반값등록금을 공약했다. 저도 반값등록금을 공약하는데 그러나 내용은 좀 다르다.
4 그러나 내용은 좀 다르다. 우선 반값등록금이 필요한 것은 당연하고 공감한다. 그런데
5 것은 당연하고 공감한다. 그런데 반값등록금에 대해서도 박 후보의 주장이나 태도가 늘
6 때 한나라당 대표로 계시면서 반값등록금을 주장했다. 2007년 대선 때도
7 주장했다. 2007년 대선 때도 반값등록금을 공약을 했다. 그런데 18대 국회에서는
8 18대 국회에서는 4년 내내 민주당이 반값등록금을 요구했는데 시종일관 거부했다. 작년에
9 작년에 강연하면서도 박원순 시장의 반값등록금에 대해 포퓰리즘이라고 비판하셨다. 선거
10 비판하셨다. 선거 때가 되니 다시 반값등록금을 하겠다고 나섰다. 지난 5년동안
11 하겠다고 나섰다. 지난 5년동안 반값등록금을 하지 않은 것은 잘못된 거 맞나.↙↙▲박
12 것은 잘못된 거 맞나.↙↙▲박 = 반값등록금에 대해 이 정부가 약속하고 실행 안 한
13 주장했고 그걸 거부한 적은 없다. 반값등록금이 논란이 됐을 때도 저는 학생들에게 너무
14 한다는 데 힘을 실어서 얘기했지 반값등록금을 반대한 적 없다.↙↙▲문 = 민주당
15 ↙▲문 = 민주당 의원들이 낸 반값등록금 법안, 친박계 의원들만 찬성했어도
16 통과됐을 거다.↙↙▲박 = 반값등록금도 문 후보가 주장하는 것과 제가 주장하는
17 어떻게 해마다 가능한가. 박 후보의 반값등록금은 무늬만 반값등록금이다.↙↙▲박 =
18 박 후보의 반값등록금은 무늬만 반값등록금이다.↙↙▲박 = 학생들의 부담 때문에 많은
19 사과했고 그에 대한 사과로 나온게 반값등록금이다. 그걸 박 후보가 먼저 공약했다. 그러면
20 실천해야 하지 않나. 5년 내내 반값등록금 해달라는 많은 요구들을 묵살하지
21 낮추는게 아니라 장학금을 늘려 반값등록금 혜택을 주겠다는 거다. 그래서 앞뒤가
22 묵살하지 않았나. 선거 때 와서 반값등록금을 하겠다는 건데 그것도 등록금을 낮추는게
23 많이 올랐으니 이명박 정부 때 반값등록금 안 해도 된다는 건가. 갑자기 왜 이명박
24 건가. 갑자기 왜 이명박 정부 때 반값등록금 실천 안 했냐고 하니 참여정부 때 이야기
25 때 그렇게 등록금이 올라서 반값등록금이 대두됐다. 그랬으면 실천해야 한다.↙
순서 사용 예문 (↙: 문단 구분 문자)
1 다 들어있다. 그리고 또 문 후보는 전교조와 깊은 유대관계 갖고 오셨다. 과거에
2 깊은 유대관계 갖고 오셨다. 과거에 전교조 해직교사 변호도 맡으셨고 이번에
3 변호도 맡으셨고 이번에 선대위에 전교조 출신 인사들이 요직에 참여하고 있다.
4 있다. 서울시 교육감 후보 출마한 전교조 위원장 출신인 이수호 후보하고 지난
5 교육에 대한 가치관은 무엇인가. 전교조하고의 긴밀한 유대관계도 이어갈 건가.↙↙▲문
6 유대관계도 이어갈 건가.↙↙▲문 = 전교조하고 관계가 무슨 특별한 문제가 되나. 오히려
7 박 후보의 질문 취지를 보면 뭔가 전교조는 함께 해선 안될 세력, 불순한 세력이라는
8 거 아닌가. 늘 통합, 통합 하는데 전교조와 관계있으니 수상하지 않냐 이러는 거
9 등으로 학교 현장을 혼란에 빠트린 전교조와 유대를 계속 강화하는 게 문제없나.↙
10 맺어왔고 변호도 했다.↙↙▲박 = 전교조가 그동안 여러 학교 현장을 혼란에
11 여러 학교 현장을 혼란에 빠트려온 전교조로 국민이 알고 있다. 계속 강화를
12 그런 뜻으로 받아들여 우려스럽다. 전교조가 근본적으로 바뀌어야 한다고 생각한다.
13 정치에 휘둘려선 안된다↙↙▲문 = 전교조가 했던 참교육과 촌지근절 같은 교직에서의
14 말씀을 드리는 거다. 변질이 된 전교조에 대해 잘못된 것을 생각하지 않고 계속
15 거 아닌가.↙↙▲문 = 저는 전교조나 한교총 가리지 않는다. 옳은 부분에는
16 부분에는 찬동하지 않는다. 지금 전교조를 일률적으로 상대해선 안 된다는 식의
17 이념적이라 생각하고. 박 후보는 왜 전교조랑 교류 맺지 않나.↙↙▲박 = 전교조가
18 교류 맺지 않나.↙↙▲박 = 전교조가 처음에 참교육은 잘한 거라고 생각한다.
19 생각하는 거 같지 않다. 그러니까 전교조 출신 위원장 후보를 지지하고.↙↙▲문 =
20 문제 때문에 전교조와 갈등을 빚고 전교조 요구를 수용하지 않고 나이스를 끝까지
21 때도 나이스(NEIS) 문제 때문에 전교조와 갈등을 빚고 전교조 요구를 수용하지
22 받을 수 없다.↙↙▲박 = 처음에 전교조가 갖고 있던 교육적 가치나 참신하게
순서 사용 예문 (↙: 문단 구분 문자)
1 부탁 말씀 드린다.↙↙질문은 원전에 대해서. 지금 후쿠시마 원전사고 이후
2 지금 후쿠시마 원전사고 이후 원전 안전이 무엇보다 중요한데 박 후보는
3 중요한데 박 후보는 수명이 만료된 원전에 대해 스트레스 테스트를 거쳐서 폐기
4 ▲박 = 후쿠시마 사태도 본 마당에 원전은 우리한테 큰 도움도 주지만 무엇보다
5 할 문제라고 본다.↙↙▲문 = 원전 말씀을 드렸는데. 지금 신재생에너지
6 특별히 고민이 없으신 것 같다. 원전은 일자리가 별로 안 만들어지는 반면에
7 신재생에너지로 정책을 돌리고 원전을 줄여나가면 그만큼 일자리 만들어질 수
8 있어서 거의 30% 이상, 40% 정도가 원전에서 공급되기 때문에 지금 어떤 대책도 없이
9 = 지금 이명박 정부 들어서 연일 원전이 사고가 나고 있고. 그래서 아까
10 있고. 그래서 아까 설계수명이 다한 원전 뿐만 아니고 설계수명이 남은 원전을
11 원전 뿐만 아니고 설계수명이 남은 원전을 포함해 전체 23기 중에 5기가 가동이
12 불구하고 설계수명이 만료된 원전을 계속 가동해야 한다는 거냐.↙↙▲박 =

# 주제어 분석과 주제어의 의미적 차이

주제 색인 기법을 이용하여 텍스트에 나타난 주제어를 추출한 후에 주제어를 가지고 수학적 그래프 이론을 적용하여 만든 것이다. 의미적으로 동일 인물이더라도 표기가 다르면 서로 다른 주제어로 간주한다. 예를 들어, [홍길동] 후보와 [홍 후보]는 의미적으로 똑같아도 표기상 각각 다른 주제어로 처리했으므로 [홍 후보]라는 주제어는 [홍길동] 주제어에는 포함시키지 않는다.

—- 아래와 같은  자료와 도구의 활용하여 작성한 것임 —

소스 뉴스 : 2012.12.16. 연합뉴스

1) http://media.daum.net/politics/assembly/newsview?newsid=20121216203615349

2) http://media.daum.net/politics/assembly/newsview?newsid=20121216204405510

3) http://media.daum.net/politics/assembly/newsview?newsid=20121216210010814

4) http://media.daum.net/politics/assembly/newsview?newsid=20121216210206851

5) http://media.daum.net/politics/assembly/newsview?newsid=20121216214005228

6) http://media.daum.net/politics/assembly/newsview?newsid=20121216214105236

7) http://media.daum.net/politics/assembly/newsview?newsid=20121216220305508

8) http://media.daum.net/politics/others/newsview?newsid=20121216220412524

9) http://media.daum.net/politics/assembly/newsview?newsid=20121216222807778

복잡계 빅데이터(Big Data) 엔진 2012.12.16 버전

주제어 색인 엔진 7.3 (통계적 형태소 분석에 의한 불완전성 포함)

스프레드시트형 표: 구글 문서도구 스프레드시트(http://www.google.co.kr/)

스프레드시트형 차트: 구글 문서도구 스프레드시트

버블차트: (ManyEyes) http://www-958.ibm.com/software/data/cognos/manyeyes/

단어 나무(Word Tree) : http://www-958.ibm.com/software/data/cognos/manyeyes/

단어 구름(Word Cloud) : http://www.wordle.net/

그래프엔진 : ASV_Toolbox_completev1.0

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

Time limit is exhausted. Please reload CAPTCHA.