In [None]:
### 웹 상에서 정보 수집 방법
# 파이썬에서는 urllib 모듈을 사용하여 정보 수집

# urllib.request 모듈 : 웹 사이트에 있는 데이터에 접근할 수 있는 기능을 제공
#                       인증, 리다이렉트, 쿠키 등 인터넷을 이용한 다양한 요청과 처리 지원
# 파일을 다운로드 할 때 urllib.request 모듈에 있는 url

In [2]:
# 예시

# 라이브러리 import
import urllib.request

# 접속 경로 및 저장 이름
url = "https://uta.pw/shodou/img/8/4534-min.png"
savename = "test_download.png"

# 다운로드(디렉토리 미리 생성)
urllib.request.urlretrieve(url, "download\\"+savename)

('download\\test_download.png', <http.client.HTTPMessage at 0x1bcd48fb430>)

In [3]:
# 실습 1

url = "https://s.pstatic.net/static/www/mobile/edit/20220503/mobile_2018301937.gif"
savename = "naver_main_0504.gif"

urllib.request.urlretrieve(url, "download/"+savename)

('download/naver_main_0504.gif', <http.client.HTTPMessage at 0x1bcd48fb3d0>)

In [21]:
# 실습 2 - open을 이용한 NAVER 로고 다운로드
# 저장 파일명은 naver_log_open_use.확장자

# 라이브러리 임포트
import urllib.request

# urlopen을 이용하여 데이터 저장(버퍼)
url = "https://s.pstatic.net/static/www/mobile/edit/20220503/mobile_2018301937.gif"
buff = urllib.request.urlopen(url).read() # <class 'http.client.HTTPResponse'> -> read() -> <class 'bytes'> HTTPresponse

# 저장된 내용을 open을 이용하여 저장(binary값으로 처리)
# open("download/naver_log_open_use.gif", 'wb').write(buff)
# 쌤 답
with open("download/naver_log_open_use.gif", "wb") as f :
    f.write(buff)
    print("download 폴더에 네이버 로고 저장 완료")

download 폴더에 네이버 로고 저장 완료


In [23]:
### api 접속

# 모듈 import
import urllib.request as rq

# 데이터 읽기
url = "https://api.aoikujira.com/ip/ini"
res = urllib.request.urlopen(url)
data = res.read()

# 바이너리를 문자열로 변환
text = data.decode("utf-8")
print(text)


[ip]
API_URI=http://api.aoikujira.com/ip/get.php
REMOTE_ADDR=211.217.209.132
REMOTE_HOST=211.217.209.132
REMOTE_PORT=33748
HTTP_HOST=api.aoikujira.com
HTTP_USER_AGENT=Python-urllib/3.10
HTTP_ACCEPT_LANGUAGE=
HTTP_ACCEPT_CHARSET=
SERVER_PORT=443
FORMAT=ini




In [1]:
# 실습 1 - 미국USD 환율만 빼오기
# https://finance.naver.com/ 에 접속하여 달러 환율 정보 확인
import urllib
from bs4 import BeautifulSoup as bs

url = "https://finance.naver.com/"
data = urllib.request.urlopen(url).read().decode("euc-kr")
htmls = bs(data, 'html.parser')

price = htmls.select_one('div.group1 > table.tbl_home > tbody > tr.up.bold > td').string
print("미국 환율 : " + price)

미국 환율 : 1,272.00


In [2]:
# 실습 2 - 거래 상위 10개를 추출해서 출력 - 종목 가격 << 식으로
import urllib.request
from bs4 import BeautifulSoup

url = "https://finance.naver.com/"
data = urllib.request.urlopen(url).read().decode('euc-kr')
htmls = BeautifulSoup(data, 'html.parser')
items = htmls.select('#_topItems1 > tr > th > a')
prices = htmls.select('#_topItems1 > tr > td')

item = [items[i].string for i in range(10)]
price = []
for x in prices :
    if x.string :
        price.append(x.string)
        
for x in range(10) :
    print(f"{x+1}위 {item[x]} - {price[x]}원")

1위 대한전선 - 2,210원
2위 KODEX 200선물인버스2X - 2,660원
3위 부산주공 - 963원
4위 이스트아시아홀딩스 - 302원
5위 삼성 인버스 2X WTI원유 선물 ETN - 125원
6위 소니드 - 1,340원
7위 대원전선 - 2,165원
8위 이루온 - 2,900원
9위 TYM - 3,505원
10위 휴림로봇 - 3,825원


In [None]:
# 기상청 RSS : https://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp      << XML 파일
# 서울경기 지역 날씨 : https://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp?stnid=109  << stnId=매개변수(지역)
# 전국(108) 서울경기(109) 강원도(105) 충청북도(131) 충청남도(133) 전라북도(146) 전라남도(156) 경상북도(143) 경상남도(159) 제주도(184)

import urllib.request
import urllib.parse
API = "https://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp"

# 매개변수를 URL인코딩
values = {
    "stnId" : "184"
}
params = urllib.parse.urlencode(values)     # urlencode() : dict / tuples => URL query string
# print(params)     # 출력 : stnId=184
url = API + "?" + params

# 데이터 다운로드
data = urllib.request.urlopen(url).read()
text = data.decode("utf-8")
print(text)


In [None]:
# 입력값(지역번호)를 받아서 해당 지역의 날씨 정보를 받아오기

import urllib.request as rq
import urllib.parse

n = input('지역번호를 입력하세요 : ')
value = {
    "stnId" : n
}
param = urllib.parse.urlencode(value)

API = "https://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp"
url = API + "?" + param

data = urllib.request.urlopen(url).read()
text = data.decode("utf-8")
print(text)

In [4]:
## selenium 사용하기 >> 웹 테스트 자동화 도구

# 1. 모듈 설치하기
# pip install selenium

# 2. web 드라이버 다운로드 - 크롬 버전에 맞춰서 다운받기
# https://chromedriver.chromium.org/downloads

# 3. 제어 시작하기 !
# 라이브러리 임포트
import selenium 
from selenium import webdriver

path = "c:\\webdriver\\chromedriver.exe"
driver = webdriver.Chrome(path)
driver.get("https://www.naver.com")

# 클래스 이름으로 찾아서 가져오기
elements = driver.find_elements_by_class_name("title")
print(type(elements))
print(elements[0].text)

for element in elements :
    print(element.text)

  driver = webdriver.Chrome(path)
  elements = driver.find_elements_by_class_name("title")


<class 'list'>
오늘 읽을만한 글
오늘 읽을만한 글
급등했던 안양시 하락의 비밀
경기도에서 아파트가 가장 비싼 지역 TOP 10
극과 극 인천 분양시장...검단 '4억 로또' 줍줍 나온다
'방화3구역' 1445가구 짓는다…10년 만에 정비계획안 통과
5년 전만 해도 전세 살다 1.8억원 보태면 집 살 수 있었는데
"어쩐지 많이 빠지더라"…공매도로 본 '6만전자'
[단독] `잠실 롯데월드` 33년 만에 전면 재개발 추진
삼성가, 상속세 위해 대규모 블록딜…주가 `날벼락`
노후 대비하려면 이건 알아 둬야죠, 2022년 개정된 기초연금제도 알아보기
빌라라도 잡자…올해 3월 서울 빌라 매입 비중 64.8% 역대 최고
1기 신도시 재건축, 얼마나 ‘빨리’ 진행될 수 있을까?
"난 괜찮겠지" 부동산 세금 전략 안 짰다 수억원 날벼락
일론 머스크의 뉴럴링크, 인체 실험 앞뒀다
"주행거리 660km"…9천만 원대 벤츠 EQE 최초 시승
[단독] 尹, 6월 방미 추진…4대 그룹 동행 유력
월급쟁이부자라는 말이 개소리인 이유와 사회초년생을 위한 재테크 조언ㅣ황금대지 3부







































































공지사항
Creators
Partners
Developers
웨일 브라우저
프로젝트 꽃


In [57]:
# 로그인 창 클릭하기
driver.find_element_by_class_name("link_login").click()

  driver.find_element_by_class_name("link_login").click()


In [67]:
driver.get("https://www.daum.net")
driver.find_element_by_class_name("link_news").click()

In [68]:
driver.back()

  driver.find_element_by_class_name("link_news").click()
