목록프로젝트 (13)
tak's data blog

지난 결론으로는 nextfield의 적응/비적응 여부와 이탈은 통계적으로 유의성이 없다는 결론을 내릴 수 있었습니다.https://taek98.tistory.com/76 피파온라인4 - 인과관계를 고려한 이탈 분석(PSM 매칭기법)전에 작성했었던 자료에 이어서 분석을 진행하도록 하겠습니다! https://taek98.tistory.com/66 피파온라인4 이탈, 진성유저 분석_이탈유저는 nextfield에 적응할까? 배경 선정 이탈 분석이라는 주제를 잡taek98.tistory.com 마지막 프로젝트를 진행하면서 그래서 이탈과 관련이 있거나 없으면 어떻게 액션을 제시할 수 있을까? 직접적인 액션으로 나아갈 수 있는 새로운 분석방법은 또 무엇이 있을까??고민을 하던 찰나에 인과추론에 대해 조금씩 공부해보..

지난 시간에 이어서 어뷰징 정의 및 분석 단계로 나아가보겠다. 어뷰저의 기준은 크게 다음과 같다. 1. 어뷰징 정의작성한 댓글로 하여금 타인에게 영향을 끼치게 만들고(부정적이든 긍정적이든) 그 댓글의 순위가 top 10내에 들어가야 함.(그만큼 남에게 많은 영향력을 끼친 댓글일 것) 일반유저와 달리 눈에 띄는 특징이 있을 것임위의 기준을 근거로 본석한 결과, 각 뉴스 타입별로 어뷰저라고 의심할 만한 유저 몇명을 정의할 수 있었다. 1) 정치user1 - 전체 작성 댓글 35개 중 top 10안에 들어간 댓글 29개 (82.86%)2) 사회user11 - 전체 작성 댓글 214개 중 top 10안에 들어간 댓글 184개 (85.98%)3) 경제user34 - 전체 작성 댓글 40개 중 top 10안에 ..

이번 시간에는 지난번 크롤링 했던 데이터를 기반으로 간단한 인사이트 도출을 실시하도록 하겠습니다. 어떤 사건으로 인해 댓글수가 많아졌는지 그리고 어떠한 사건이 있었을 때 어뷰징 유저들이 즐비하였는지 등의 순서로 나아가보도록 하겠습니다. 우선 수집된 데이터가 다양하지 않고 그리고 전체적인 흐름만 살펴보려고 하기 때문에 눈에 띌만한 인사이트는 도출하지 않았습니다. 분석에는 다음과 같은 내용들이 활용되었습니다. 기사: 기사 id, 기사 제목, 기사 입력 시각, 기사 내용 댓글: 댓글 작성 기사id, 작성자 id, 댓글 작성 시각, 댓글 내용, 공감수, 비공감수 전체 댓글 수 노트북 성능 상 2년간의 모든 데이터를 수집할 수 없었고 일부 데이터만 살펴보았을 때 2022년 2월을 기점으로 우하향하는 그래프를 확인..

주의 사항: 어뷰저라고 정의하는 방법이나 분석 방향 등은 순전히 작성자만의 생각이고 Naver는 전혀 상관없다고 말씀드리고 싶습니다. Naver는 편향성을 가지지 않는 중립적인 플랫폼입니다. 0. 문제 정의 문득 뉴스, 웹툰, 게임 등 여러 매체들의 댓글을 보면 심상치 않은 상황들이 오고갑니다. 서로 시비를 걸며 싸우거나 각자의 생각을 주입하며 선동하기도 하고 또는 광고성 댓글로 댓글창을 어지럽히곤 합니다. 저는 이러한 상황에서 데이터분석으로 어뷰저를 판별해볼 수 있지 않을까?라는 물음을 가지게 되었습니다. 여기서 제가 정의하는 어뷰저란 1) 남에게 생각을 주입하는 등의 영향력을 끼칠 수 있는 댓글 2) 특정 광고성 댓글 3) 특정한 패턴을 보이는 댓글 이렇게 일반 댓글과는 다른 형태를 가지는 댓글들 이..

전에 작성했었던 자료에 이어서 분석을 진행하도록 하겠습니다! https://taek98.tistory.com/66 피파온라인4 이탈, 진성유저 분석_이탈유저는 nextfield에 적응할까? 배경 선정 이탈 분석이라는 주제를 잡고 진성, 이탈 유저들의 플레이 특징을 위주로 파악해보려고 하였다. 우선 피파온라인4는 특성상 nextfield라는 체감 개선 업데이트가 거의 반기별로 이루어 taek98.tistory.com 우선 아래와 같은 방법을 위해 ncsoft의 데이터분석 블로그를 참고했다는 점을 말씀드리고 싶습니다. 참고: https://danbi-ncsoft.github.io/works/2020/06/17/works-pk_analysis.html PK를 당한 유저는 게임에서 이탈할까? danbi-ncso..

배경 선정 이탈 분석이라는 주제를 잡고 진성, 이탈 유저들의 플레이 특징을 위주로 파악해보려고 하였다. 우선 피파온라인4는 특성상 nextfield라는 체감 개선 업데이트가 거의 반기별로 이루어진다. 침투 플레이, 중거리 슛, 헤딩, 패스 등의 개선이 이루어지는 것이다. 피파4를 이탈했다가 돌아올 때가 되면 nextfield 업데이트가 이루어져 있고, 이로 인해 나의 플레이타입도 변화를 주어야 이길 가능성이 높아져 또 적응의 시간이 필요하다. 그래서 적응을 하지 못해 다시 이탈한 경험이 있기 때문에 이탈 유저는 nextfield에 적응을 잘 할 것인가?를 가설로 세우게 되었다. 실제로 아래는 7차 nextfield가 이루어졌을 때 유저들의 반응이다. 다수의 유저들도 비슷한 생각을 가지고 있었음을 확인하였..

피파4 api를 통해서 데이터를 불러오고 활용할만한 데이터를 수집하는 법을 작성하도록 하겠다. 아래는 실제 나의 닉네임이다. 닉네임을 입력하면 아래와 같이 json형태로 데이터가 구성되어 있음을 확인할 수 있다. 유저 고유의 accessid랑 level등이 존재한다. 피파온라인4와 같은 게임은 rpg게임과 다르게 부캐를 육성하는 사람들이 대다수이므로 레벨은 추후 분석에서 제외하고 진행할 예정이다. 우선 위의 accessId를 기준으로 유저의 매치정보, 상세정보, 게임 내 슛, 수비, 패스 등의 정보도 추가로 가져올 수 있다. accessId를 통해 데이터를 불러오는 과정을 아래와 같이 함수로 정의하였다. import json import requests import pandas as pd import n..

직전에 작성했던 회고록에서 다짐한 일들을 이뤄낼 차례다! 아래와 같은 의문을 시작으로 토이프로젝트를 진행해보기로 하였다. 이전에 인턴경험으로 했던 이탈분석을 오랜시간 즐겨하고있는 피파온라인4에서는 어떻게 수행할 수 있을까?라는 의문을 가지게 되었다. 표본을 얻기 위해서는 많은 시간이 소요될 줄 알았는데, 피파온라인4 개발자 센터에서 api를 통해 최근 100경기를 기준으로 데이터 수집이 가능하다는 것을 알게 되었다. 이를 통해 이탈분석 뿐만 아니라 여러 궁금증을 해결해나가도록 하겠다. 이탈분석을 진행하려는 계기는 다음과 같다. 게임을 플레이하면서 항상 접속을 유지하는 것은 아니다. 특정한 사건(강화 실패, 유저와의 실력차이로 인한 몰수패 등)에 의해 유저 이탈이 일어날 수 있다. 필자도 게임을 플레이하면..