# 실습4: 네이버 해피빈 긁기

#### 참고: https://happybean.naver.com/donation/DonateHomeMain

In [12]:
# 이번 실습에서는 Rest API로 네이버 해피빈에서 데이터를 가져오는 연습을 한다.
# html 태그를 찾는 크롤링 방식에서 가장 어려운 것이 태그 위계를 찾는 것이라면,
# Rest API에서는 request url을 찾는 것이 가장 어렵다.
# 이번 실습을 통해 request url 찾는 방법을 익혀보자

import requests as req

# 아래의 url과 parameter를 찾는 것이 핵심이다.
# url을 잘 찾는 팁은 아쉽게도 없다.
# 개발자도구 -> Network탭 -> Fetch/XHR 클릭 후 일일이 하나하나 살펴보아야 한다.
url = 'https://happybean.naver.com/rdona-service/rdona/rdonaboxes?'

params_dict = {
    'begin':1,
    'end':810,
    'order':'rcmd_ymdt',
    'sortType':'desc'
}

In [14]:
res = req.get(url, params=params_dict)
res.text

'{"result":{"totalCount":812,"rdonaBoxes":[{"rdonaBoxNo":"H000000186665","happyId":"asianfriends","stateCode":"IN_PROGRESS","completeCode":null,"title":"불가촉천민 로티아나 마을학교에 희망꽃이 피어나요.","registDate":"2022-10-04T05:38:20.000+00:00","defaultImage":"https://happybean-phinf.pstatic.net/20221004_135/1664860873551foE1b_PNG/WhatsApp_Image_2022-09-17_at_18.36.07_(1).png","summary":"인도 불가촉천민지역인 로티아나 마을학교 운영과 함께 빈곤 아동·청소년들에게 기초영양식을 지원하는 모금함입니다.","hlogName":"사단법인 아시안프렌즈","rdonaBoxType":"RD2001","currentAmount":257600,"donationCount":109,"goalAmount":650000,"startYmd":"20221004","endYmd":"20221103","rcmdDate":"20221013"},{"rdonaBoxNo":"H000000186661","happyId":"sgnoin","stateCode":"IN_PROGRESS","completeCode":null,"title":"냉기로 가득한 방, 연탄 한 장으로 전하는 온기","registDate":"2022-10-04T03:08:37.000+00:00","defaultImage":"https://happybean-phinf.pstatic.net/20221012_223/16655631332717Alz4_JPEG/메인_연탄_모금.jpg","summary":"소득 독거 어르신을 대상으로 난방유, 연탄을 지원함으로써 경제적 부담 경감 및 건강한 겨울나기 지원을 통해 정서적 안정을 도모하기 위한 모금함 입니다.","hlogName"

In [16]:
import json
import pandas as pd

j = json.loads(res.text)

# Json 데이터의 key값을 조회하는 방식은 딕셔너리와 동일하다.
# key값을 하나하나 조회해보면서 미리 생각해둔 데이터 구성 방식을 따라가는 것이 핵심이다.
j['result']['rdonaBoxes']

# Rest API를 통해 가져온 데이터의 가장 큰 장점은 아래와 같이 dataframe으로 바로 만들 수 있다는 것이다.
# 딕셔너리를 만들고 key, value쌍을 하나하나 지어주어야 했던 태그 크롤링 방식과 달리
# Rest API는 한번에 dataframe을 만들 수 있다는 큰 장점이 있다.
df = pd.DataFrame(j['result']['rdonaBoxes'])
df

Unnamed: 0,rdonaBoxNo,happyId,stateCode,completeCode,title,registDate,defaultImage,summary,hlogName,rdonaBoxType,currentAmount,donationCount,goalAmount,startYmd,endYmd,rcmdDate
0,H000000186665,asianfriends,IN_PROGRESS,,불가촉천민 로티아나 마을학교에 희망꽃이 피어나요.,2022-10-04T05:38:20.000+00:00,https://happybean-phinf.pstatic.net/20221004_1...,인도 불가촉천민지역인 로티아나 마을학교 운영과 함께 빈곤 아동·청소년들에게 기초영양...,사단법인 아시안프렌즈,RD2001,257600,109,650000,20221004,20221103,20221013
1,H000000186661,sgnoin,IN_PROGRESS,,"냉기로 가득한 방, 연탄 한 장으로 전하는 온기",2022-10-04T03:08:37.000+00:00,https://happybean-phinf.pstatic.net/20221012_2...,"소득 독거 어르신을 대상으로 난방유, 연탄을 지원함으로써 경제적 부담 경감 및 건강...",광주서구노인종합복지관,RD2001,383900,213,7950000,20221004,20221231,20221013
2,H000000186635,wjsm1004,IN_PROGRESS,,금치!김치! 어르신의 긴 겨울 반찬 걱정을 덜어 주세요,2022-09-30T09:07:17.000+00:00,https://happybean-phinf.pstatic.net/20220930_2...,올 해 물가가 하늘 높은지 모르고 계속해서 인상이 되고 있습니다. 취약계층 어르신들...,원주소망주기복지센터,RD2001,405100,206,6500000,20220930,20221229,20221013
3,H000000186674,weca,IN_PROGRESS,,뇌전증을 앓는 연희의 웃음을 지켜주세요,2022-10-04T06:49:27.000+00:00,https://happybean-phinf.pstatic.net/20221004_1...,뇌전증을 앓고 있는 18살 연희와 연희를 간호하고 있는 할머니를 응원해 주세요.,사단법인 세계교육문화원,RD2001,800300,300,9900000,20221004,20230102,20221013
4,H000000186497,ourhappy1004,IN_PROGRESS,,우리의 꿈과 희망을 바이올린에 담아,2022-09-23T05:49:46.000+00:00,https://happybean-phinf.pstatic.net/20221012_2...,기쁜우리지역아동센터 아동들에게 코로나 속 힐링이 되어주는 음악 수업을 위한 모금함입니다.,기쁜우리지역아동센터,RD2001,447100,400,5000000,20220923,20221222,20221012
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
805,H000000186726,westart,IN_PROGRESS,,유준이를 위해 일을 그만둔 엄마,2022-10-06T07:58:26.000+00:00,https://happybean-phinf.pstatic.net/20221006_1...,유준이를 위해 생계를 포기한 엄마를 응원해주세요.,위스타트,RD2001,21800,15,5000000,20221006,20221231,19700101
806,H000000186719,stump,IN_PROGRESS,,매달 돌아오는 고지서만 10개.. 흔들거리는 센터..,2022-10-06T06:40:32.000+00:00,https://happybean-phinf.pstatic.net/20221006_1...,센터의 기본 운영에 필요한 공과금을 모금하고자 합니다.,그루터기지역아동센터,RD2001,76900,19,2250000,20221006,20230104,19700101
807,H000000186727,hantutt,IN_PROGRESS,,김*환씨의 환갑여행 (제주도떠나요 모든걸 훌훌버리고 ),2022-10-06T08:19:33.000+00:00,https://happybean-phinf.pstatic.net/20221010_1...,김*환씨의 환갑 여행에 손을 모아 주실 후원자분들과 함께 하고 싶습니다.,한뜻마을,RD2001,17900,12,2500000,20221006,20230104,19700101
808,H000000186709,ksm7070,IN_PROGRESS,,우리민족서로돕기운동 2022년 4분기 활동을 응원합니다,2022-10-06T02:49:02.000+00:00,https://happybean-phinf.pstatic.net/20221006_2...,우리민족서로돕기운동 2022년 4분기 활동을 응원합니다!,우리민족서로돕기운동,RD2001,24900,8,1500000,20221006,20230104,19700101
