목록프로젝트/네이버 뉴스댓글 어뷰징 분석 (3)
tak's data blog
지난 시간에 이어서 어뷰징 정의 및 분석 단계로 나아가보겠다. 어뷰저의 기준은 크게 다음과 같다. 1. 어뷰징 정의 작성한 댓글로 하여금 타인에게 영향을 끼치게 만들고(부정적이든 긍정적이든) 그 댓글의 순위가 top 10내에 들어가야 함.(그만큼 남에게 많은 영향력을 끼친 댓글일 것) 일반유저와 달리 눈에 띄는 특징이 있을 것임 위의 기준을 근거로 본석한 결과, 각 뉴스 타입별로 어뷰저라고 의심할 만한 유저 몇명을 정의할 수 있었다. 1) 정치 user1 - 전체 작성 댓글 35개 중 top 10안에 들어간 댓글 29개 (82.86%) 2) 사회 user11 - 전체 작성 댓글 214개 중 top 10안에 들어간 댓글 184개 (85.98%) 3) 경제 user34 - 전체 작성 댓글 40개 중 top ..
이번 시간에는 지난번 크롤링 했던 데이터를 기반으로 간단한 인사이트 도출을 실시하도록 하겠습니다. 어떤 사건으로 인해 댓글수가 많아졌는지 그리고 어떠한 사건이 있었을 때 어뷰징 유저들이 즐비하였는지 등의 순서로 나아가보도록 하겠습니다. 우선 수집된 데이터가 다양하지 않고 그리고 전체적인 흐름만 살펴보려고 하기 때문에 눈에 띌만한 인사이트는 도출하지 않았습니다. 분석에는 다음과 같은 내용들이 활용되었습니다. 기사: 기사 id, 기사 제목, 기사 입력 시각, 기사 내용 댓글: 댓글 작성 기사id, 작성자 id, 댓글 작성 시각, 댓글 내용, 공감수, 비공감수 전체 댓글 수 노트북 성능 상 2년간의 모든 데이터를 수집할 수 없었고 일부 데이터만 살펴보았을 때 2022년 2월을 기점으로 우하향하는 그래프를 확인..
주의 사항: 어뷰저라고 정의하는 방법이나 분석 방향 등은 순전히 작성자만의 생각이고 Naver는 전혀 상관없다고 말씀드리고 싶습니다. Naver는 편향성을 가지지 않는 중립적인 플랫폼입니다. 0. 문제 정의 문득 뉴스, 웹툰, 게임 등 여러 매체들의 댓글을 보면 심상치 않은 상황들이 오고갑니다. 서로 시비를 걸며 싸우거나 각자의 생각을 주입하며 선동하기도 하고 또는 광고성 댓글로 댓글창을 어지럽히곤 합니다. 저는 이러한 상황에서 데이터분석으로 어뷰저를 판별해볼 수 있지 않을까?라는 물음을 가지게 되었습니다. 여기서 제가 정의하는 어뷰저란 1) 남에게 생각을 주입하는 등의 영향력을 끼칠 수 있는 댓글 2) 특정 광고성 댓글 3) 특정한 패턴을 보이는 댓글 이렇게 일반 댓글과는 다른 형태를 가지는 댓글들 이..