## 1-1 데이터 다운로드하기

### urllib.request 를 이용한 다운로드

파일을 다운로드할 때는 urllib.request 모듈에 있는 urlretrieve() 함수를 사용.

In [4]:
# 라이브러리 읽기
import urllib.request

In [5]:
# url과 저장 경로 지정하기
url = "http://uta.pw/shodou/img/28/214.png"
savename = "test.png"

In [6]:
# 다운로드
urllib.request.urlretrieve(url, savename)
print("저장되었습니다..!")

저장되었습니다..!


### urlopen() 으로 파일에 저장하는 방법

In [7]:
# 다운로드
#
mem = urllib.request.urlopen(url).read()

In [8]:
# 파일로 저장하기
#
with open(savename, mode = "wb") as f:
    f.write(mem)
    print("저장되었습니다..!")

저장되었습니다..!


<h3> 웹에서 데이터 추출하기</h3>
<h4>클라이언트 저속 정보 출력하기</h4>

In [9]:
# IP 확인 API로 접근해서 결과 출력하기
# 모듈 읽어 들이기
import urllib.request

In [10]:
# 데이터 읽어 들이기
url = "http://api.aoikujira.com/ip/ini"
res = urllib.request.urlopen(url)
data = res.read()

In [11]:
# 파이너리를 문자열로 변환하기
text = data.decode("utf-8")
print(text)

[ip]
API_URI=http://api.aoikujira.com/ip/get.php
REMOTE_ADDR=39.117.208.117
REMOTE_HOST=39.117.208.117
REMOTE_PORT=55560
HTTP_HOST=api.aoikujira.com
HTTP_USER_AGENT=Python-urllib/3.6
HTTP_ACCEPT_LANGUAGE=
HTTP_ACCEPT_CHARSET=
SERVER_PORT=80
FORMAT=ini




<h4>매개변수를 추가해 요청을 전송하는 방법</h4>

파이썬으로 요청 전용 매개변수를 만들 때는 urllib.parse 모듈의 urlencode() 함수를 사용해서 매개변수를 URL로 인코딩

In [12]:
import urllib.request
import urllib.parse

In [13]:
API = "http://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp"

In [16]:
# 매개변수를 URL 인코딩
# dictionary 자료형의 매개변수를 URL 인코딩하며, urllib.parse 모듈을 사용
values = {
    'stnId' : '108'
}
params = urllib.parse.urlencode(values)
print(params)

stnId=108


In [18]:
# 요청 전용 URL 생성
# 요청 전용 URL을 생성하고 표준출력에 URL 출력
url = API + "?" + params
print("url = ", url)

url =  http://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp?stnId=108


In [19]:
# 다운로드
data = urllib.request.urlopen(url).read()
text = data.decode("utf-8")
print(text)

<?xml version="1.0" encoding="utf-8" ?>
<rss version="2.0">
<channel>
<title>기상청 육상 중기예보</title>
<link>http://www.kma.go.kr/weather/forecast/mid-term_01.jsp</link>
<description>기상청 날씨 웹서비스</description>
<language>ko</language>
<generator>기상청</generator>
<pubDate>2017년 12월 03일 (일)요일 06:00</pubDate>
 <item>
<author>기상청</author>
<category>육상중기예보</category>
<title>전국 육상 중기예보 - 2017년 12월 03일 (일)요일 06:00 발표</title>
<link>http://www.kma.go.kr/weather/forecast/mid-term_01.jsp</link>
<guid>http://www.kma.go.kr/weather/forecast/mid-term_01.jsp</guid>
<description>
	<header>
		<title>전국 육상중기예보</title>
		<tm>201712030600</tm>
		<wf><![CDATA[기압골의 영향으로 7~8일 사이에 중부지방과 전라도, 제주에는 비 또는 눈이 오는 곳이 있겠습니다. <br />그 밖의 날은 고기압의 가장자리에 들어 가끔 구름많겠습니다.<br />기온은 평년(최저기온: -8~3도, 최고기온: 3~12도)보다 조금 낮겠습니다.<br />강수량은 평년(0~2mm)보다 조금 많겠으나, 경상도는 적겠습니다.]]></wf>
	</header>
	<body>
				

		<location wl_ver="3">
				<province>서울ㆍ인천ㆍ경기도</province>
				<city>서울</city>
				
				<data>
					<mode>A02</m

<h4>매개변수를 명령줄에서 지정하기</h4>

명령줄에서 곧바로 지역 번호를 입력하고 사용하려면?

In [20]:
import sys
import urllib.request as req
import urllib.parse as parse

In [41]:
# 명령줄 매개변수 추출
# 명령줄 매개변수는 sys.argv에 리스트 형태로 들어옴
if len(sys.argv) <= 1:
    print("USAGE: download-forecast-argv <Region Number>")
    sys.exit()
regionNumber = 108

In [42]:
# 매개변수를 URL 인코딩
API = "http://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp"
values = {
    'stnId': regionNumber
}
params = parse.urlencode(values)
url = API + "?" + params
print("url = ", url)

url =  http://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp?stnId=108


In [43]:
# 다운로드
data = req.urlopen(url).read()
text = data.decode("utf-8")
print(text)

<?xml version="1.0" encoding="utf-8" ?>
<rss version="2.0">
<channel>
<title>기상청 육상 중기예보</title>
<link>http://www.kma.go.kr/weather/forecast/mid-term_01.jsp</link>
<description>기상청 날씨 웹서비스</description>
<language>ko</language>
<generator>기상청</generator>
<pubDate>2017년 12월 03일 (일)요일 06:00</pubDate>
 <item>
<author>기상청</author>
<category>육상중기예보</category>
<title>전국 육상 중기예보 - 2017년 12월 03일 (일)요일 06:00 발표</title>
<link>http://www.kma.go.kr/weather/forecast/mid-term_01.jsp</link>
<guid>http://www.kma.go.kr/weather/forecast/mid-term_01.jsp</guid>
<description>
	<header>
		<title>전국 육상중기예보</title>
		<tm>201712030600</tm>
		<wf><![CDATA[기압골의 영향으로 7~8일 사이에 중부지방과 전라도, 제주에는 비 또는 눈이 오는 곳이 있겠습니다. <br />그 밖의 날은 고기압의 가장자리에 들어 가끔 구름많겠습니다.<br />기온은 평년(최저기온: -8~3도, 최고기온: 3~12도)보다 조금 낮겠습니다.<br />강수량은 평년(0~2mm)보다 조금 많겠으나, 경상도는 적겠습니다.]]></wf>
	</header>
	<body>
				

		<location wl_ver="3">
				<province>서울ㆍ인천ㆍ경기도</province>
				<city>서울</city>
				
				<data>
					<mode>A02</m

### 네이버 금융에서 환율 정보 추출하기

네이버 금융의 시장 지표 페이지  
http://info.finance.naver.com/marketindex

In [44]:
from bs4 import BeautifulSoup
import urllib.request as req

In [45]:
url = "http://info.finance.naver.com/marketindex/"
res = req.urlopen(url)

In [46]:
soup = BeautifulSoup(res, "html.parser")

In [58]:
# 원하는 데이터 추출하기
price = soup.select_one("div.head_info > span.value").string
print("usd/krw = "+ price + "원")

usd/krw = 1,087.00원
