tak's data blog
[BOAZ 프로젝트] json 파일 이미지 다운 본문
ACCM모델을 기본으로 저희는 리뷰와 이미지를 중점적으로 활용하기로 했습니다.
그래서 이미지를 크롤링 할 때 따로 json파일로 저장을 해두었고, 이번에는 저장한 주소를 활용해 이미지를 다운 받는 과정을 보여드리도록 하겠습니다!!
아래와 같이 json파일을 읽어오고 직전 review와 같이 하나의 지점을 기준으로 여러개의 이미지가 저장된 dictionary형태로 저장되어 있는것을 확인할 수 있습니다.
아래와 같은 함수를 짜서 image가 저장된 json_data의 key1을 각각 하나의 지점 ex) 양재역 스타벅스 등으로 지정하고, json_data[key1].keys() -> 즉 각각 한 명의user를 의미합니다. 그리고 image를 알아보기 쉽게 ex) 양재역 스타벅스_user.jpg 형태로 저장합니다. url을 따로 크롤링 할 때 저장해 두었으니 urllib.request.urlretrieve를 활용해 이미지를 불러옵니다.
각 지점마다 review는 있어도, image가 없는 경우가 존재하기 때문에, try / except구문을 써줍니다.
그 결과 아래와 같이 구글 드라이브에 저장되어 있는 것을 확인할 수 있었습니다.(colab으로 돌렸기 때문입니다.)
여기까지 json파일을 열고, image를 저장까지 해보는 과정을 가졌습니다. 읽어주셔서 감사합니다 ㅎㅎ
'BOAZ' 카테고리의 다른 글
[BOAZ] 15기 분석 수료 후기 (1) | 2021.08.21 |
---|---|
[BOAZ 프로젝트] 카페 추천시스템 (마지막) (1) | 2021.08.21 |
[BOAZ 프로젝트] 크롤링 데이터 프레임화 (1) | 2021.07.12 |
[BOAZ 프로젝트] 카카오맵 카페 크롤링 2(수정) (3) | 2021.04.04 |
[BOAZ 프로젝트] 카카오맵 카페 크롤링1 (0) | 2021.03.09 |