목록전체 글 (82)
tak's data blog

SQL을 공부하면서 문제풀이를 공유하고자 합니다. 나아가서 나중에는 직접 데이터를 가져와 문제 풀이 내용을 바탕으로 실습해볼 예정입니다!! 문제 payment 테이블에서 단일 거래의 amount의 액수가 가장 많은 고객들의 customer_id를 추출해라. 단, customer_id의 값은 유일. 1. payment 테이블의 구조를 살펴본다. 테이블을 살펴본 후 한꺼번에 생각하지 말고 차례대로 나눠서 생각해보자 2. 전체 거래 중 amount의 액수가 가장 큰 amount를 구한다. 첫번째로 desc를 써 내림차순으로 한 후 limit 1을 정해 가장 큰 amount를 구합니다. 3. payment 테이블에서 가장 큰 amount를 가진 customer_id를 구하고 중복을 제거한다. where절에서 서..

예전에 kaggle 필사를 하면서 그 순간만 이해하고 기억이 오래가지 못해서 방학을 계기로 이번에 '머신러닝 탐구생활'이라는 책을 공부하기로 하였습니다. 처음 주제로 kaggle 'Santander Product Recommendation' 대회 필사내용과 느낀점을 공유해보고자 합니다! 처음으로 데이터를 살펴보자면 훈련 데이터에는 총 1,300만 개의 고객 데이터가 존재하며, 고객마다 48개의 변수가 존재합니다. info 결과로 fecha_dato변수는 날짜 전용 data type이 아닌 object 형태였고, 고객의 나이를 기록하는 age변수는 int형태가 아닌 object형태인것을 확인 할 수 있었다. 이 데이터 뿐만 아니라 다른 대회의 데이터들도 데이터타입에 맞지 않는 변수들은 추후에 타입변환이 중..