### requests 모듈 활용하기

#### get() 메소드 / text 속성

In [None]:
# 모듈 불러오기
import requests
import urllib3 # 경고창 없애기 위해서 불러와야 하는 모듈

# 목표url을 문자열로 입력한 후 url 변수명으로 저장
url = "https://www.naver.com"

# requests모듈의 get() 메소드를 사용하여 접속을 시도하고, 그 결과(객체)를 res변수에 저장
res = requests.get(url, verify=False)

# SSL 경고창 없애기
requests.packages.urllib3.disable_warnings(requests.packages.urllib3.exceptions.InsecureRequestWarning)

print(res.text) # 받아온 바이트 데이터를 UTF-8로 기본 디코딩하여 텍스트 문자열로 반환

#### params 파라미터

In [None]:
# get 방식 접근
import requests

# SSL 경고창 없애기
requests.packages.urllib3.disable_warnings(requests.packages.urllib3.exceptions.InsecureRequestWarning)

param = {"query" : "아이유"} # request 시 전달하고자 파라미터 정보를 딕셔너리 자료형으로 작성해 전달 가능
url = "https://search.naver.com/search.naver"
res = requests.get(url, params = param, verify=False) # .post() 메소드에서도 동일하게 사용 가능. 단, post에서는 param 대신 data 사용

# 실제 request된 url의 내용을 보려면 res.request.url 로 확인 가능
print("url 주소: ", res.request.url)
# res.request.url 결과를 보면, param 변수에 입력된 정보가 parameter로 붙어 url 생성, request된 것을 알 수 있음
# 위 print(res.request.url) 결과 = https://search.naver.com/search.naver?query=%ED%8F%AC%EC%8A%A4%EC%BD%94
print(res.text)

In [None]:
res.status_code
res.request.url
res.request.headers
res.request.method
res.encoding

#### header 정보

 - headers 파라미터: User-Agent 정보 변경하기
 - 사용중인 기기/브라우저의 User-Agent 보기(추천 : 방법1)
    - 방법1) 특정 페이지 접속 후 크롬 개발자 모드의 네트워크탭에서 Request Header를 보면 확인가능
    - 방법2) https://www.whatismybrowser.com/detect/what-is-my-user-agent 접속 *스마트폰 등 개발자 모드를 사용하기 어려운 환경에서 유용

##### header 없이

In [None]:
# header정보 없이 request
import requests

url = "https://finance.naver.com/item/sise_day.nhn?code=005490"
res = requests.get(url, verify=False)
print(res.text)

##### header추가

In [None]:
# header정보 변경하기
import requests

h = {"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36"}

url = "https://finance.naver.com/item/sise_day.nhn?code=005490"
res = requests.get(url, headers=header, verify=False)
print(res.text)

In [None]:
# header 정보 없이 접속한 header정보 확인하기
import requests

url = "https://finance.naver.com/item/sise_day.nhn?code=005490"
res = requests.get(url, verify=False)
# 접속한 res의 User-Agent정보 확인하기
print(res.request.headers)

#### post() 메소드 / data 파라미터
- url찾는 방법 : ID와 PW를 입력 후 로그인 클릭, Fetch/XHR에서 정보 찾기

In [None]:
# post 방식 접근
import requests
import pyautogui

my_pw = pyautogui.password(title= "PW 입력", text = "PW를 입력하세요")

# POST방식 접근. 한국데이터산업진흥원 로그인 페이지 접속하여 로그인 실행
url = "https://lp.posco.co.kr/S22/S22A10/member/login/ajax/login.do"
fd = {"email":"mk@poscohrd.com", "password": my_pw}

res = requests.post(url, data = fd, verify=False)

# header정보가 없어서 정보를 못받음
print(res.text)

- header정보 추가

In [None]:
# post 방식 접근
import requests
import pyautogui

my_pw = pyautogui.password(title= "PW 입력", text = "PW를 입력하세요")

# POST방식 접근. 한국데이터산업진흥원 로그인 페이지 접속하여 로그인 실행
url = "https://lp.posco.co.kr/S22/S22A10/member/login/ajax/login.do"
fd = {"email":"mk@poscohrd.com", "password": my_pw}
h = {"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36"}

res = requests.post(url, data = fd, headers = h, verify=False)

print(res.text)

#### session() 메소드 : LP사이트

In [None]:
import requests
import pyautogui

# my_pw = pyautogui.password(title= "PW 입력", text = "PW를 입력하세요")

# POST방식 접근. 한국데이터산업진흥원 로그인 페이지 접속하여 로그인 실행
url = "https://lp.posco.co.kr/S22/S22A10/member/login/ajax/login.do"

#로그인 시 파라미터(form input값)으로 보낼 아이디/비번을 미리 지정
fd = {"email":"mk@poscohrd.com", "password": my_pw}
h = {"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36"}

# session() 메소드를 사용해 객체를 생성, 변수(s)에 저장 → 변수에 저장된 객체는 requests 모듈의 모든 메소드 사용가능
# 변수 s(객체)를 통해 .get() 혹은 .post() 메소드를 사용하면 세션이 유지되어 로그인된 상태로 탐색 가능
s = requests.session()
res_login_page = s.post(url, data=fd, headers = h, verify=False)  #post() 메소드를 통해 접속한 후 세션을 유지

#세션이 유지된 채로(=로그인된 상태로) 페이지 탐색(마이러닝-학습현황)
fd2 = {"length": 10, "stepCode": "ING"}
res_my_lp = s.post("https://lp.posco.co.kr/S22/S22A10/member/myLearning/ajax/getMyCourseCsList.do", data = fd2, verify=False)
print(res_my_lp.text)

- json데이터로 변환

In [None]:
data = res_my_lp.json()

- 첫번째 데이터 확인

In [None]:
csname = data["data"][0]["courseName"]
csstartdate = data["data"][0]["eduStartDt"]
csenddate = data["data"][0]["eduEndDt"]
print(csname, csstartdate, csenddate)

- for문 : 수강과정 리스트

In [None]:
results = []
for cs in data["data"]:
    csname = cs["courseName"]
    csstartdate = cs["eduStartDt"]
    csenddate = cs["eduEndDt"]
    result = {"수강과정" : csname, "교육시작일" : csstartdate, "교육종료일" : csenddate}
    results.append(result)

- 결과확인

In [None]:
results

#### cookies 파라미터

In [None]:
# 한국데이터산업진흥원 접수조회 cookie 딕셔너리로 저장
import requests
  
url = "https://www.dataq.or.kr/www/mypage/accept/list.do"
cookie = {"JSESSIONID" : "87FA0B6E8DA009666961D50282D15BBB"}

res = requests.post(url, cookies=cookie, verify=False)
res.text

In [None]:
# 한국데이터산업진흥원 접수조회 header의 쿠키 복사
import requests
  
url = "https://www.dataq.or.kr/www/mypage/accept/list.do"
h = {"Cookie" : "JSESSIONID=87FA0B6E8DA009666961D50282D15BBB; _ga=GA1.1.1230915695.1653891645; _ga_L0H13KV0WL=GS1.1.1655171289.2.1.1655172918.0"}

res = requests.get(url, headers=h, verify=False)
res.text

#### browser_cookie3 모듈

In [None]:
# 예스24 마이페이지 접속하기
import requests
import browser_cookie3

# 크롬 웹브라우저의 쿠키 저장경로 지정 (본인 윈도우 계정명에 맞춰 변경해야 함)
cookie_file_path = r"C:\Users\poscouser\AppData\Local\Google\Chrome\User Data\Default\Network\Cookies"

# 크롬에 있는 예스24(.yes24.com) 쿠키값을 그대로 가져오기 (cookie jar 객체 형태로 저장)
yes_cookie = browser_cookie3.chrome(cookie_file=cookie_file_path, domain_name=".yes24.com")

#로드한 쿠키값을 사용하면 예스24에 로그인한 채로 마이페이지에 접속가능 → 접속 후 마이페이지 정보 로드
url = "http://www.yes24.com/Member/FTMypageMain.aspx"

res = requests.get(url, cookies = yes_cookie)
print(res.text) # 마이페이지의 정보가 html로 출력됨

### 이미지 자료 가져오기

#### content속성

In [None]:
# 이미지 불러오기(예. 위키피디아 포스코 이미지)
import requests

img_url = "https://www.posco.co.kr/docs/kor6/jsp/_images/02_corp/corporate_citizenship_kor.jpg"
res = requests.get(img_url, verify=False)

print(res.content)

# PC에 파일로 저장
# open()함수 : 파일 생성
# 옵션 : r(읽기모드), w(쓰기모드, 내용 있으면 삭제하고 쓰기), x(쓰기모드, 내용이 있으면 오류 발생), a(쓰기모드, 파일이 있으면 뒤에 내용 추가)
# t(텍스트모드, 텍스트 문자 기록에 사용/디폴트), b(바이너리모드, 바이트단위 데이터 기록에 사용)

open("기업시민헌장.jpg", "wb").write(res.content)

### 인코딩&디코딩

In [None]:
s = "포스코"
b = s.encode("UTF-8")
print(b)

s2 = b.decode("UTF-8")
print(s2)