[프로젝트] 텍스트 분석을 활용한 데이터 분석(3)

cmkkws·2025년 2월 19일

5. 분석 결과

우선 주차별로 다음과 같은 분석 결과를 내보았다.

  • 방송국별 영상 보도 제목의 단어 빈도 상위 15개 분석
  • 단어 빈도 시각화 - wordcloud
  • 텍스트 네트워크 분석
  • 감성 분석

분석하기에 앞서 한국갤럽에서 발표한 최근 6주간 대통령 직무 수행평가와 주요 정치 이슈에 대해 정리한 것을 토대로 12월 3주간 생긴 일에 대해 확인해보자.

5.1. 12월 1주차

1주차의 주요 키워드는 '대통령', '탄핵', '계엄', '윤'으로 나타났고, 이외에도 '국민 힘', '한동훈', '국회', '표결' 등 단어들이 9개의 방송국에서 공통으로 보도되었다.
다른 방송국과의 차별적인 단어를 쓴 방송국을 확인해보았다.
YTN의 '내란죄','MBC'의 '윤석열', '내란', '퇴진'으로 나타났고,'TV조선'의 '이재명' 등이 있었다.



다음은 네트워크 분석을 통해 차별적인 단어를 쓴 방송국을 확인한 결과이다.
YTN(1번 그림)은 '대통령 - 내란죄', '내란죄 - 수사'등으로 연결된 것으로 확인했다.
MBC(4번 그림)는 '대통령 - 내란 - 퇴진 - 탄핵','윤석열 - 퇴진'등으로 연결된 것으로 나타났다.
TV조선(7번 그림)은 '한동훈 - 이재명'으로 연결되어있음을 알 수 있었다.

5.2. 12월 2주차

2주차의 주요 키워드는 '대통령', '윤', '계엄', '탄핵','한동훈', '국민 힘' 등으로 1주차와 비슷했고, 추가로 '김용현', '구속', '수사', 등이 있었다.
차별적인 단어는 1주차의 '내란'의 키워드를 자주 쓴 방송국이 'MBC', 'YTN'에서 'JTBC', 'MBN', 'TV조선', '채널 A'로 확대되었고, 자주 쓰지 않은 방송국은 'KBS', 'SBS' ,'연합뉴스'인 것으로 나타났다.



네트워크 분석 결과 '내란'과 관련된 키워드는 1주차 'MBC'와 비슷하게 '대통령', '윤석열' 등과 연결되어 있었다.

5.3. 12월 3주차

3주차의 주요 키워드는 '대통령', '윤', '계엄', '탄핵' 과 더불어 '출석', '헌재', '권성동', '거부' 등 이었다.


5.4. 12월 4주차

4주차는 '대통령', '윤', '탄핵', '공수처', '헌재', '재판관', '노상원', '한덕수' 등이 있었다.



5.5. 감성분석 결과

다음은 방송국별 보도 제목의 긍정/부정 합(Pos/Neg), 총 단어 수(Total Words), 감성 지수(Sentiment Index)에 대한 결과를 정리한 표이다.


9개의 방송사는 12월 4주차 '채널 A'(0.00447)를 제외한 모든 감성 지수가 음의 기호를 나타난 것으로 나왔다. 12월의 가장 큰 키워드는 '탄핵'이었기 때문에 예측할 수 있었다.
1주차에 가장 낮은 SI 값을 보였으며 편차가 작았음을 알 수 있다.
2주차 부터는 전체적으로 평균은 약간 증가하지만 편차가 큰것을 보아 같은 사건에서 바라보는 방송국들의 시각의 차이가 큼을 알아볼 수 있었다.
위의 현상은 3,4주차에 더 뚜렷하게 나타났다.
가장 높은 SI값을 가진 'MBC'(-0.03155)와 가장 낮은 SI값을 가진 'YTN'(-0.00212) 통해 'MBC'는 3주차에 일어난 사건들에 대해 부정적인 단어를 선택했으며, 'YTN'은 상대적으로 부정적인 단어 사용을 줄인 것을 알 수 있었다.
4주차에는 'JTBC'(-0.02375)는 부정적인 단어를 가장 많이 사용하였고, '채널 A'(0.00447)는 부정적인 단어와 긍적적인 단어를 거의 비슷하게 사용한 것으로 나타났다.

다음은 방송사들의 12월 동안의 감성지수의 평균을 나타낸 것이고, 검정색 실선은 전체 평균이다.
전체 평균을 기준으로 'KBS'는 9개의 방송사 가운데 평균에 가까운 값으로 나타났다.
평균보다 낮은 채널은 총 4개로 , 가장 낮은 순서로 '채널 A', 'MBN', '연합뉴스', YTN' 순으로 나타났다.
위의 채널들은 '탄핵'과 관련된 사건들에 대해 부정적인 단어 선택을 타 방송국보다 적게 하고 있다는 것을 알 수 있었다.
평균을 웃도는 방송국은 총 4개로, 가장 높은 순서로 'MBC', 'JTBC', 'TV조선', 'SBS'인 것으로 나타나.
특히 평균을 크게 상회하는 방송국인 'MBC'와 'JTBC'는 12월 '탄핵'의 사건에서 부정적인 단어를 타 방송국보다 자주 기용하고 있다는 것을 확인했다.

0개의 댓글