tak's data blog

3개월간의 스타트업 인턴 후기 본문

생각정리

3개월간의 스타트업 인턴 후기

hyuntaek 2021. 7. 11. 23:47

안녕하세요, 거의 3개월만에 포스팅을 하게 되었네요... 인턴을 진행하면서도 한달에 몇번은 꾸준하게 올리고자 다짐했지만

변명아닌 변명을 해보자면 학교수업과 동아리 활동까지 정신이없었네요

이번엔 좋은 기회에 4월1일부터 데이터사이언티스트 직무로 인턴을 하게 되었습니다. 원래 계약을 3개월로 두고 진행하였지만, 계약 기간 연장을 통해 우선 최대한 많은 것을 얻어가기로 하였습니다. 

 

저는 양재시민의숲역에 있는 한 스타트업에 다니게 되었습니다.

원래 원하고자하는 목표가 있다면 그 주변을 먼저 가보거나 탐방(?) 해야한다고 들었습니다.

최종 목표인 판교로 입성하기 위해서 어느정도 근처에 위치하여서 한발자국 다가가지 않았나???라는 생각도 가볍게 해봅니다. 

양재시민의숲

첫출근날 4월 벚꽃이 필 때 찍어두었던 사진입니다. 어느덧 푸릇푸릇하네요... 출근길 풍경이 변하는것을 보며 시간이 참 빠르게 흘러 갔구나 생각이 드네요 ㅠㅠ 

 

맡은 역할/ 느낀점

저는 데이터사이언티스트 직무로 사실 동아리나 책, 유튜브 등을 보고 공부하였을때랑 다르게, 많이 부족함을 느꼈습니다...

실무는 역시 다르다라는 현실을요

 

캐글의 타이타닉 예제나 다른 데이터 분석 과정을 아무리 해보아도 직접 경험해보는것 만큼 빠르고 가파르게 실력을 높일길은 없다고 느꼈습니다.

 

단순히 어떠한 모델링을통해 성능을 90% -> 93%등으로 높이는것이 능사가 아니라는 것을 깨달았습니다. 데이터 전처리 과정과 도메인에 대한 데이터를 이해하고 인사이트를 발견하는것이 80%이상이지 않을까 감히 생각해봅니다!!

 

첫 프로젝트로 자세히는 말을 할 수 없지만, 헬스뷰티 관련 프로젝트를 진행하였습니다. 실제 기업의 데이터는 데이콘이나 캐글에서처럼 그렇게 깨끗하지 않았습니다. 그 기업의 방식, 로직대로 데이터를 수집하고 기록하여서 처음 이해하는데도 엄청난 시간을 투자하였습니다.  이 때 처음으로 sql과 파이썬도 연동해서 써보고, 수천만줄의 데이터를 읽을 때 데이터가 읽어와지지 않아 chunk size를 통해 나눠서 읽거나, sql where절을 활용해서 조건을 줘서 읽어오는 등 다양한 시도를 하며 많이 배우게 되었습니다. 적재적소에 맞는 plot그리기와 수업시간에 배웠던 반응변수가 0,1로 이루어진 이진변수일때의 logistic regression 등의 이론을 적용해 보는 계기가 되었습니다.

 

단순히 correlation만 계산해서 a와b가 상관관계가 높으니 큰 영향이 있을 것 같습니다!라는 단순한 결론이 아닌, pairplot도 같이 그려보며 이상치가 존재하지는 않는지?? 이상치를 제거하였을때의 correlation은 어떤지 비교해볼수도 있었습니다.

 

또한 그래프를 비교하여 작성할 때는 각각의 그래프를 ylim을 통해 y축 범위를 맞춰서 보여주는 등 큰 기술이 아닌 사소한 코드하나가 데이터를 처음보는, plot을 처음보는 고객이나 사람들에게 설명할때 엄청 중요한 부분을 차지한다고 생각했습니다. 

 

가장 중요하게 느낀 것은 이렇게 각 고객별로 존재하는 데이터를 분석하였을때

넓게 보지 않고 우선 1명의 특이점이 있는 고객을 위주로 살펴보고 비슷한 클러스터로 묶어 확장해나가는 방식이 꽤나 중요하다고 생각했습니다. 또한 여정 고객이 일생동안 어떠한 행동을 했고 어떠한 방향으로 나아가 어떠한 결과를 가졌는지 시간 데이터로 추세를 살펴보는 것의 중요성을 깨달았습니다. 

 

자세한 내용을 말씀드릴 수는 없어 대략적으로만 적어두었지만 추후에 더 자세하게 배운 내용과 얻어간 내용을 정리하도록 하겠습니다!!

데이터 관련 직무를 희망하는 저는 이번 인턴 기회가 인생의 터닝포인트 중 하나가 아닐까 자신있게 말씀드릴 수 있습니다. 스타트업에서 배운것이 너무나도 많고 회사가 흘러가는 로직이나 회의를 진행하고 의견을 표출하는 등 많은 것을 해볼 수 있었습니다. 

 

 

좋은 데이터분석가, 사이언티스트는 항상 물음을 가지고 이를 통해 가설을 세우고 증명하기위해 하나씩 꼬리를 무는 자세를 가져야 한다고 느끼게 되었습니다.

 

 

대학생활을 하면서 3개월 단위의 인턴을 최소 2번 이상 진행하고자 하는 목표가 있었습니다. 요번에 연장을 하면서 어느정도 목표를 이루었다고 생각합니다. 

2학년 겨울방학 막연하게 책부터 피면서 혼자 공부를 시작하며 3학년 2학기에 원하는 동아리boaz에 들어가게 되었고,  4학년 1학기 - 2학기 스타트업 데이터분석까지 너무나도 운이 좋았던 것 같습니다. 앞으로 좋은 기회 쭉 살려서 원하는회사에 들어가고자 더 노력하고 성장해나가도록 하겠습니다.

여기까지 긴글 읽어주셔서 감사합니다 :)

 

 

'생각정리' 카테고리의 다른 글

Modern Growth Stack 2023을 다녀오고나서..  (0) 2023.07.28
굿 퀘스천 후기  (0) 2023.02.05
역마 후기  (0) 2022.12.19
'일본전산 이야기' 후기  (0) 2022.07.29
'데이터 읽기의 기술' 후기  (0) 2022.06.04