<span style="color:blue">   

# Web Scraping 기초

#### ■ 필요한 패키지 설치
#### - pip install requests 
    
 </span>

## 0. 기본 package 설정



In [1]:
## 기본 패키지 불러오기
import numpy as np                      # numpy 패키지 가져오기
import pandas as pd                     # pandas 패키지 가져오기

import requests                      # requests 패키지 가져오기 

import warnings
warnings.filterwarnings('ignore')

## 1. Web Scraping

###  - requests 모듈 이용 방법
####     ▶ requests 는 지정된 웹사이트의 정보를 가져옴
####     ▶ res = requests.get(url) : url주소에 데이터 요청
####     ▶ res.text  : 응답 데이터는 텍스트형식
####     ▶ res.content  : 응답 데이터는 binary 형식
####     ▶ res.json  : 응답 데이터는 JSON형태
####     ▶ res.url : 해당 url 을 반환
####     ▶ res.status_code : 응답 상태코드 (200 이면 성공)


In [3]:
# res = requests.get('http://naver.com', headers={'USER-AGENT' : 'myBot'} )
# requests 를 이용하여 웹 정보를 가져오기

# requests 에서 웹 호출을 진행한 후 결과는 Response 객체에 담기게 됨

res = requests.get('https://www.naver.com/')  # requests의 get 메소드를 이용하여 instance 를 생성 

print("응답 코드: ", res.status_code)  # 응답코드가 200 이면 정상,  그렇지 않으면 에러가 발생한 경우 (400번대 코드)
print('\n')

if res.status_code ==  requests.codes.ok:
    print("정상입니다")
else:
    print("에러가 발생했습니다. [에러코드 ", res.status_code, "]")

응답 코드:  200


정상입니다


### 2. 웹 서버의 응답 결과가 에러인 경우

In [5]:
# 상태 코드 속성을 이용하여 확인
# 방법 1 

url = 'https://en.wikipedia.org/wiki/this_is_error'

res = requests.get(url)

if res.status_code == requests.codes.ok :
    print("정상입니다")
else:
    print("에러가 발생했습니다. [에러코드 ", res.status_code, "]")  

에러가 발생했습니다. [에러코드  404 ]


In [6]:
# 방법 2 : raise_for_status method 이용하기 
# 위의 if~ else 문장 기능과 동일한 기능을 제공하는 request 내 함수, 에러발생시 에러메시지를 출력
res.raise_for_status()

print("웹 스크래핑을 진행합니다")

HTTPError: 404 Client Error: Not Found for url: https://en.wikipedia.org/wiki/This_is_error

In [7]:
# 수신한 웹 페이지 정보의 크기를 확인

print(len(res.text))       # 스크래핑한 문서의 크기를 반환  

27888


### 3. 스크래핑한 자료를 화일로 저장하기

In [8]:
res = requests.get('https://www.google.co.kr/')

res.raise_for_status() 

print(len(res.text))   # 수집된 데이타 크기를 확인하고 

print(res.text)      # 수집된 내용을 확인

13202
<!doctype html><html itemscope="" itemtype="http://schema.org/WebPage" lang="ko"><head><meta content="text/html; charset=UTF-8" http-equiv="Content-Type"><meta content="/images/branding/googleg/1x/googleg_standard_color_128dp.png" itemprop="image"><title>Google</title><script nonce="jXzYUHuaJjuWg3BsOE6bLw==">(function(){window.google={kEI:'ClVfYLW_JYGsoASIhqzwCg',kEXPI:'0,1302440,59,56910,954,756,2355,1993,207,4804,2316,383,246,5,1354,5250,6386,1116130,1232,1196558,493,328984,51223,16115,17444,1954,9286,9188,8384,4859,1361,9291,3027,4740,6,12835,1238,2782,978,13228,2054,920,873,4192,6430,14527,236,4281,2778,919,2277,8,570,2226,887,706,1279,2212,241,289,149,1103,840,517,1522,4258,1449,2,2669,2023,2297,1704,2565,328,1284,8789,3227,2845,7,5599,6755,5096,7877,3747,1181,108,3407,908,2,941,2614,2397,7470,3275,3,346,230,1835,4624,149,5990,7985,4,1528,2304,1236,1145,4658,1791,2893,459,1555,4067,9544,3011,1753,2658,3906,1,854,912,564,464,656,30,3854,23,2999,1253,3283,2,2214,2305,638,1494,

In [11]:
# 스크래핑한 자료를 화일로 저장하기
# with open 문 이용 
# 화일 저장 후 현 디렉토리에 저장이 되었는지 확인

with open('mygoogle.html','w', encoding= 'utf8') as f:
    f.write(res.text)

### 4. requests.text 와  requests.content

#### ▶ requests.text : 해당 URL 의 내용을 readable한 내용으로 디코딩 
#### ▶ requests.content: Binary 형식으로 반환, 이미지 등의 미디어 파일을 받고자 할 때 사용


In [12]:
# 구글에서 '자연어 처리' 입력 후 위키피디아 페이지로 이동

# url = 'https://ko.wikipedia.org/wiki/%EC%9E%90%EC%97%B0%EC%96%B4_%EC%B2%98%EB%A6%AC'

url = 'https://ko.wikipedia.org/wiki/%EC%9E%90%EC%97%B0%EC%96%B4_%EC%B2%98%EB%A6%AC'

res = requests.get(url)

res.text

'<!DOCTYPE html>\n<html class="client-nojs" lang="ko" dir="ltr">\n<head>\n<meta charset="UTF-8"/>\n<title>자연어 처리 - 위키백과, 우리 모두의 백과사전</title>\n<script>document.documentElement.className="client-js";RLCONF={"wgBreakFrames":!1,"wgSeparatorTransformTable":["",""],"wgDigitTransformTable":["",""],"wgDefaultDateFormat":"ko","wgMonthNames":["","1월","2월","3월","4월","5월","6월","7월","8월","9월","10월","11월","12월"],"wgRequestId":"4ef223a6-3006-4fde-8db7-cb92e5926e70","wgCSPNonce":!1,"wgCanonicalNamespace":"","wgCanonicalSpecialPageName":!1,"wgNamespaceNumber":0,"wgPageName":"자연어_처리","wgTitle":"자연어 처리","wgCurRevisionId":28556173,"wgRevisionId":28556173,"wgArticleId":177102,"wgIsArticle":!0,"wgIsRedirect":!1,"wgAction":"view","wgUserName":null,"wgUserGroups":["*"],"wgCategories":["출처가 필요한 글/2010년 10월","출처가 필요한 모든 글","전체에 출처가 필요한 글","LCCN 식별자를 포함한 위키백과 문서","NDL 식별자를 포함한 위키백과 문서","자연어 처리","전산언어학","음성 인식","인공지능"],"wgPageContentLanguage":"ko",\n"wgPageContentModel":"wikitext","wgRelevantPageName":"자연어_처리","w

In [13]:
# 해당 페이지의 인코딩 방식을 확인

res.encoding

'UTF-8'

In [14]:
# content 메소드를 이용하여 내용 확인하기 
# res = requests.get(url)

res.content

b'<!DOCTYPE html>\n<html class="client-nojs" lang="ko" dir="ltr">\n<head>\n<meta charset="UTF-8"/>\n<title>\xec\x9e\x90\xec\x97\xb0\xec\x96\xb4 \xec\xb2\x98\xeb\xa6\xac - \xec\x9c\x84\xed\x82\xa4\xeb\xb0\xb1\xea\xb3\xbc, \xec\x9a\xb0\xeb\xa6\xac \xeb\xaa\xa8\xeb\x91\x90\xec\x9d\x98 \xeb\xb0\xb1\xea\xb3\xbc\xec\x82\xac\xec\xa0\x84</title>\n<script>document.documentElement.className="client-js";RLCONF={"wgBreakFrames":!1,"wgSeparatorTransformTable":["",""],"wgDigitTransformTable":["",""],"wgDefaultDateFormat":"ko","wgMonthNames":["","1\xec\x9b\x94","2\xec\x9b\x94","3\xec\x9b\x94","4\xec\x9b\x94","5\xec\x9b\x94","6\xec\x9b\x94","7\xec\x9b\x94","8\xec\x9b\x94","9\xec\x9b\x94","10\xec\x9b\x94","11\xec\x9b\x94","12\xec\x9b\x94"],"wgRequestId":"4ef223a6-3006-4fde-8db7-cb92e5926e70","wgCSPNonce":!1,"wgCanonicalNamespace":"","wgCanonicalSpecialPageName":!1,"wgNamespaceNumber":0,"wgPageName":"\xec\x9e\x90\xec\x97\xb0\xec\x96\xb4_\xec\xb2\x98\xeb\xa6\xac","wgTitle":"\xec\x9e\x90\xec\x97\xb0\xec\x

### 5. "params" option 사용하기 (1)

In [None]:
# 아래 url 문자열 중에서 "?" 이하가 parameter 에 해당
# 전자신문 홈페이지에서 '인공지능' 을 검색했을 경우

url = 'https://search.etnews.com/etnews/search.php?kwd=%EC%9D%B8%EA%B3%B5%EC%A7%80%EB%8A%A5'

res = requests.get(url)

res.text

In [28]:
# 위의 url 문자열 중에서 "?" 이하를  parameter 로 변수화 
# 위와 같은 결과를 얻을 수 있음 

url = 'https://search.etnews.com/etnews/search.php'

param = '?kwd=%EC%9D%B8%EA%B3%B5%EC%A7%80%EB%8A%A5'

res = requests.get(url, params=param)   # (주의) "params" option 은 복수형 

res.text

'<!----> \r\n<!DOCTYPE html>\r\n<html lang="ko">\r\n<head>\r\n    <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />\r\n    <title>대한민국 IT포털의 중심! 이티뉴스</title>\r\n    <meta http-equiv="Expires" content="-1" />\r\n    <meta http-equiv="Pragma" content="no-cache" />\r\n    <meta http-equiv="Cache-Control" content="no-cache" />\r\n    <meta http-equiv="X-UA-Compatible" content="IE=edge" />\r\n    <meta name="robots" content="all" />\r\n    <meta name="author" content="www.etnews.com" />\r\n    <meta name="copyright" content="Copyright &copy; Electronic Times Internet. All Right Reserved." />\r\n    <meta name="keywords" content="전자신문,전자신문인터넷,Etnews,Etnews.com,뉴스,News,속보,방송,연예,통신,SW,바이오,소재,부품,과학,전자,자동차,경제,금융,산업,정책,글로벌,리포트,동영상," />\r\n    <meta name="description" content="전자신문인터넷" />\r\n    <link rel="shortcut icon" href="https://img.etnews.com/favicon.ico" />\r\n    <link rel="alternate" type="application/rss+xml" title="etnews.com [RSS]" href="http://rss.etnews.com/" />\

### 5. "params" option 사용하기 (2)

In [15]:
# 매일경제신문 사이트에서 '반도체' 를 검색하면 아래와 같은 url을 얻을 수 있음

url = 'https://find.mk.co.kr/new/search.php?s_kwd=%B9%DD%B5%B5%C3%BC&page=total&ADSTK=&ADSTL=&s_keyword=%B9%DD%B5%B5%C3%BC'

res = requests.get(url).text    # get 메소드와  text 속성을 동시 사용 

res

'<html lang=\'ko\'>\n<head>\n<title>MK °Ë»ö</title>\n<meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1">\n<meta http-equiv=\'Content-Type\' content=\'text/html; charset=euc-kr\'>\n<meta http-equiv=\'Cache-Control\' content=\'no-cache\'>\n<meta http-equiv=\'Pragma\' content=\'no-cache\'>\n<meta NAME=\'description\' CONTENT=\'NO.1 °æÁ¦Æ÷ÅÐ,¸ÅÀÏ°æÁ¦,¸Å°æ,¸ÅÀÏ°æÁ¦½Å¹®,½Å¹®,´º½º,¹æ¼Û,¸Å°æÀÎÅÍ³Ý,Áõ±Ç,ºÎµ¿»ê,±ÝÀ¶,mbn,¸¸È\xad,Á¤Ä¡,»çÈ¸,±¹Á¦,¸Å°æÀÌÄÚ³ë¹Ì,ÀÎ»ç,ºÎÀ½,ÁÖ½Ä,Àü¼¼,¿ù¼¼,¸Å¸Å,µ·,È¯À²,ÁÖ°¡,ºÐ¾ç,±â¾÷,º¥Ã³,Áß¼Ò±â¾÷,°æ¿µ,±â¾÷,»ê¾÷,Ã¢¾÷,Á¤ºÎ,Á¤Ã¥,Áö½Ä,±³À°,ºñÁî´Ï½º,Áý°ª,Æøµî,ÄÚ½ºÇÇ,ÄÚ½º´Ú\'>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/top_header.css\'/>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/search.css\'/>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/search_2016_add.css\'/>\n<style type="text/css">\n.gnb_more .bottom .txt {\n\tdisplay: block; padding-top: 0px !important;

In [19]:
# url 주소 중에 '?' 이하에서 parameter 를 추출
# 검색어 : " 반도체"
# url = "https://find.mk.co.kr/new/search.php?s_kwd=%B9%DD%B5%B5%C3%BC&page=total&ADSTK=&ADSTL=&s_keyword=%B9%DD%B5%B5%C3%BC"

url = 'https://find.mk.co.kr/new/search.php'

params = { 
    "s_kwd": "반도체",
    "page" : "total",
    "ADSTK": "",
    "ADSTL": "",
    "s_keyword": "반도체"
    
}

res = requests.get(url, params=params).text

res       # 위 셀과 같은 결과인지 확인

'<html lang=\'ko\'>\n<head>\n<title>MK °Ë»ö</title>\n<meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1">\n<meta http-equiv=\'Content-Type\' content=\'text/html; charset=euc-kr\'>\n<meta http-equiv=\'Cache-Control\' content=\'no-cache\'>\n<meta http-equiv=\'Pragma\' content=\'no-cache\'>\n<meta NAME=\'description\' CONTENT=\'NO.1 °æÁ¦Æ÷ÅÐ,¸ÅÀÏ°æÁ¦,¸Å°æ,¸ÅÀÏ°æÁ¦½Å¹®,½Å¹®,´º½º,¹æ¼Û,¸Å°æÀÎÅÍ³Ý,Áõ±Ç,ºÎµ¿»ê,±ÝÀ¶,mbn,¸¸È\xad,Á¤Ä¡,»çÈ¸,±¹Á¦,¸Å°æÀÌÄÚ³ë¹Ì,ÀÎ»ç,ºÎÀ½,ÁÖ½Ä,Àü¼¼,¿ù¼¼,¸Å¸Å,µ·,È¯À²,ÁÖ°¡,ºÐ¾ç,±â¾÷,º¥Ã³,Áß¼Ò±â¾÷,°æ¿µ,±â¾÷,»ê¾÷,Ã¢¾÷,Á¤ºÎ,Á¤Ã¥,Áö½Ä,±³À°,ºñÁî´Ï½º,Áý°ª,Æøµî,ÄÚ½ºÇÇ,ÄÚ½º´Ú\'>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/top_header.css\'/>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/search.css\'/>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/search_2016_add.css\'/>\n<style type="text/css">\n.gnb_more .bottom .txt {\n\tdisplay: block; padding-top: 0px !important;

### 6. 검색시 한글 코드 확인 및 해결

- Response(웹 호출 결과)의 text 속성은 str 클래스 타입으로서, requests 모듈에서 자동으로 데이타 인코딩을 수행

- 즉, requests는 HTTP 헤더 정보를 통해 데이타의 인코딩을 수행한 후 

- Response 객체의 encoding 속성에 그 값을 지정하고, text 속성을 엑세스할 때 이 encoding 속성을 사용


In [20]:
# 위 매일경제 사이트의 경우 (검색어 : " 반도체") 

url = "https://find.mk.co.kr/new/search.php?s_kwd=%B9%DD%B5%B5%C3%BC&page=total&ADSTK=&ADSTL=&s_keyword=%B9%DD%B5%B5%C3%BC"
res = requests.get(url)

# 수집된 내용의 인코딩 방식을 확인하기

res.encoding     # 현재 코딩은'ISO-8859-1' 인코딩 방식을 사용하므로  한글이 깨져 보임

'ISO-8859-1'

In [21]:
# 내용을 확인

res.text

'<html lang=\'ko\'>\n<head>\n<title>MK °Ë»ö</title>\n<meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1">\n<meta http-equiv=\'Content-Type\' content=\'text/html; charset=euc-kr\'>\n<meta http-equiv=\'Cache-Control\' content=\'no-cache\'>\n<meta http-equiv=\'Pragma\' content=\'no-cache\'>\n<meta NAME=\'description\' CONTENT=\'NO.1 °æÁ¦Æ÷ÅÐ,¸ÅÀÏ°æÁ¦,¸Å°æ,¸ÅÀÏ°æÁ¦½Å¹®,½Å¹®,´º½º,¹æ¼Û,¸Å°æÀÎÅÍ³Ý,Áõ±Ç,ºÎµ¿»ê,±ÝÀ¶,mbn,¸¸È\xad,Á¤Ä¡,»çÈ¸,±¹Á¦,¸Å°æÀÌÄÚ³ë¹Ì,ÀÎ»ç,ºÎÀ½,ÁÖ½Ä,Àü¼¼,¿ù¼¼,¸Å¸Å,µ·,È¯À²,ÁÖ°¡,ºÐ¾ç,±â¾÷,º¥Ã³,Áß¼Ò±â¾÷,°æ¿µ,±â¾÷,»ê¾÷,Ã¢¾÷,Á¤ºÎ,Á¤Ã¥,Áö½Ä,±³À°,ºñÁî´Ï½º,Áý°ª,Æøµî,ÄÚ½ºÇÇ,ÄÚ½º´Ú\'>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/top_header.css\'/>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/search.css\'/>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/search_2016_add.css\'/>\n<style type="text/css">\n.gnb_more .bottom .txt {\n\tdisplay: block; padding-top: 0px !important;

In [22]:
# 방법 1 : 인코딩 방식을 'euc-kr' 로 수정하기
res.encoding = 'euc-kr'

# 수정된 내용을 확인 
res.text

'<html lang=\'ko\'>\n<head>\n<title>MK 검색</title>\n<meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1">\n<meta http-equiv=\'Content-Type\' content=\'text/html; charset=euc-kr\'>\n<meta http-equiv=\'Cache-Control\' content=\'no-cache\'>\n<meta http-equiv=\'Pragma\' content=\'no-cache\'>\n<meta NAME=\'description\' CONTENT=\'NO.1 경제포털,매일경제,매경,매일경제신문,신문,뉴스,방송,매경인터넷,증권,부동산,금융,mbn,만화,정치,사회,국제,매경이코노미,인사,부음,주식,전세,월세,매매,돈,환율,주가,분양,기업,벤처,중소기업,경영,기업,산업,창업,정부,정책,지식,교육,비즈니스,집값,폭등,코스피,코스닥\'>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/top_header.css\'/>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/search.css\'/>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/search_2016_add.css\'/>\n<style type="text/css">\n.gnb_more .bottom .txt {\n\tdisplay: block; padding-top: 0px !important; position: relative; top: 0px !important;\n}\n.gnb_more .bottom .btn {\n\tdisplay: block; padding-top: 2px !im

In [24]:
# 방법 2  : requests 모듈의 자동 인코딩을 하지 않도록 option 을 지정 

url = "https://find.mk.co.kr/new/search.php?s_kwd=%B9%DD%B5%B5%C3%BC&page=total&ADSTK=&ADSTL=&s_keyword=%B9%DD%B5%B5%C3%BC"
res = requests.get(url)
res.encoding = None

# 수정된 내용을 확인 

res.text

'<html lang=\'ko\'>\n<head>\n<title>MK 검색</title>\n<meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1">\n<meta http-equiv=\'Content-Type\' content=\'text/html; charset=euc-kr\'>\n<meta http-equiv=\'Cache-Control\' content=\'no-cache\'>\n<meta http-equiv=\'Pragma\' content=\'no-cache\'>\n<meta NAME=\'description\' CONTENT=\'NO.1 경제포털,매일경제,매경,매일경제신문,신문,뉴스,방송,매경인터넷,증권,부동산,금융,mbn,만화,정치,사회,국제,매경이코노미,인사,부음,주식,전세,월세,매매,돈,환율,주가,분양,기업,벤처,중소기업,경영,기업,산업,창업,정부,정책,지식,교육,비즈니스,집값,폭등,코스피,코스닥\'>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/top_header.css\'/>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/search.css\'/>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/search_2016_add.css\'/>\n<style type="text/css">\n.gnb_more .bottom .txt {\n\tdisplay: block; padding-top: 0px !important; position: relative; top: 0px !important;\n}\n.gnb_more .bottom .btn {\n\tdisplay: block; padding-top: 2px !im

In [25]:
# 방법 3  : content.decode method 이용하기 

url = "https://find.mk.co.kr/new/search.php?s_kwd=%B9%DD%B5%B5%C3%BC&page=total&ADSTK=&ADSTL=&s_keyword=%B9%DD%B5%B5%C3%BC"
res = requests.get(url)
res.content.decode('euc-kr')

'<html lang=\'ko\'>\n<head>\n<title>MK 검색</title>\n<meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1">\n<meta http-equiv=\'Content-Type\' content=\'text/html; charset=euc-kr\'>\n<meta http-equiv=\'Cache-Control\' content=\'no-cache\'>\n<meta http-equiv=\'Pragma\' content=\'no-cache\'>\n<meta NAME=\'description\' CONTENT=\'NO.1 경제포털,매일경제,매경,매일경제신문,신문,뉴스,방송,매경인터넷,증권,부동산,금융,mbn,만화,정치,사회,국제,매경이코노미,인사,부음,주식,전세,월세,매매,돈,환율,주가,분양,기업,벤처,중소기업,경영,기업,산업,창업,정부,정책,지식,교육,비즈니스,집값,폭등,코스피,코스닥\'>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/top_header.css\'/>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/search.css\'/>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/search_2016_add.css\'/>\n<style type="text/css">\n.gnb_more .bottom .txt {\n\tdisplay: block; padding-top: 0px !important; position: relative; top: 0px !important;\n}\n.gnb_more .bottom .btn {\n\tdisplay: block; padding-top: 2px !im

In [26]:
# 위 (방법 1)에서 만약 euc-kr 대신 UTF-8 로 인코딩 하면?
# 내용 확인 하기 
url = "https://find.mk.co.kr/new/search.php?s_kwd=%B9%DD%B5%B5%C3%BC&page=total&ADSTK=&ADSTL=&s_keyword=%B9%DD%B5%B5%C3%BC"
res = requests.get(url)
res.encoding = 'UTF-8'

# 수정된 내용을 확인 
res.text

'<html lang=\'ko\'>\n<head>\n<title>MK �˻�</title>\n<meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1">\n<meta http-equiv=\'Content-Type\' content=\'text/html; charset=euc-kr\'>\n<meta http-equiv=\'Cache-Control\' content=\'no-cache\'>\n<meta http-equiv=\'Pragma\' content=\'no-cache\'>\n<meta NAME=\'description\' CONTENT=\'NO.1 ��������,���ϰ���,�Ű�,���ϰ����Ź�,�Ź�,����,���,�Ű����ͳ�,����,�ε���,����,mbn,��ȭ,��ġ,��ȸ,����,�Ű����ڳ��,�λ�,����,�ֽ�,����,����,�Ÿ�,��,ȯ��,�ְ�,�о�,���,��ó,�\u07fcұ��,�濵,���,���,â��,����,��å,����,����,����Ͻ�,����,����,�ڽ���,�ڽ���\'>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/top_header.css\'/>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/search.css\'/>\n<link rel=\'stylesheet\' type=\'text/css\' href=\'//common.mk.co.kr/common/css/search_2016_add.css\'/>\n<style type="text/css">\n.gnb_more .bottom .txt {\n\tdisplay: block; padding-top: 0px !important; position: relative; top: 0px !impo

### 7. 이미지 저장하기

In [27]:
# 사진 이미지 저장하기 
# 구글에서 원하는 이미지를 검색 한 후 마우스 오른쪽 버튼 클릭 - 이미지 주소 복사 - 아래 url에 복사

img_url = 'https://img1.daumcdn.net/thumb/R800x0/?scode=mtistory2&fname=https%3A%2F%2Ft1.daumcdn.net%2Fcfile%2Ftistory%2F2408DD3658A648B12C'

download_img = requests.get(img_url)

with open('img_save.jpg',  'wb') as photo:
    photo.write(download_img.content) 