tak's data blog
네이버 뉴스댓글 어뷰징분석 (2)간단분석 본문
이번 시간에는 지난번 크롤링 했던 데이터를 기반으로 간단한 인사이트 도출을 실시하도록 하겠습니다. 어떤 사건으로 인해 댓글수가 많아졌는지 그리고 어떠한 사건이 있었을 때 어뷰징 유저들이 즐비하였는지 등의 순서로 나아가보도록 하겠습니다.
우선 수집된 데이터가 다양하지 않고 그리고 전체적인 흐름만 살펴보려고 하기 때문에 눈에 띌만한 인사이트는 도출하지 않았습니다.
분석에는 다음과 같은 내용들이 활용되었습니다.
- 기사: 기사 id, 기사 제목, 기사 입력 시각, 기사 내용
- 댓글: 댓글 작성 기사id, 작성자 id, 댓글 작성 시각, 댓글 내용, 공감수, 비공감수
전체 댓글 수
노트북 성능 상 2년간의 모든 데이터를 수집할 수 없었고 일부 데이터만 살펴보았을 때 2022년 2월을 기점으로 우하향하는 그래프를 확인할 수 있었습니다.
# 2022년 3월 대통령 선거를 기점으로 우하향함을 확인할 수 있었습니다. 실제 이 때문에 댓글수의 급증이 일어난 것인가 확인하기 위해 기사 타입별 그래프로 확인해보겠습니다.
[정치] 전체 댓글 수
실제로 다른 뉴스 기사대비 정치기사에 해당 패턴이 나타났음을 확인하였습니다.
추가적으로 다른 타입의 기사도 확인해보겠습니다.
[세계] 전체 댓글 수
해당 기사의 경우에는 우크라이나-러시아 전쟁(2022.2)과 코로나 종식 선언관련 사건으로 인해 튀는 시기들을 확인할 수 있었습니다.
[경제] 전체 댓글 수
[사회] 전체 댓글 수
[생활, IT] 전체 댓글 수
기사타입별 총 댓글수를 살펴본 결과 실제로 정치분야의 댓글의 큰 변동을 확인할 수 있었습니다. 나아가서 어떤 뉴스 기사타입의 유저들이 어뷰징을 일으키는가? 기사별 유저 분석을 추가 진행하도록 하겠습니다. 해당 분석은 간단한 현황만 살펴보는 것이기 때문에 특별한 인사이트가 없었지만 유저별 댓글 분석은 기대가 되네요...!
'프로젝트 > 네이버 뉴스댓글 어뷰징 분석' 카테고리의 다른 글
네이버 뉴스댓글 어뷰징분석 (4)GMM 모델링 (0) | 2024.06.30 |
---|---|
네이버 뉴스댓글 어뷰징분석 (3)어뷰징 정의 및 분석 (2) | 2024.03.09 |
네이버 뉴스댓글 어뷰징분석 (1)크롤링 (0) | 2024.01.13 |