### requests 모듈
- 파이썬에서 HTTP 요청을 보내고 응답을 받는 기능을 제공하는 라이브러리
- 주요 메서드
  - GET 메서드는 주어진 URL에서 데이터를 가져올 때 사용
  - POST 메서드는 주어진 URL에 데이터를 보낼 때 사용
  - PUT 메서드는 주어진 URL에 데이터를 업로드할 때 사용
  - DELETE 메서드는 주어진 URL에서 데이터를 삭제할 때 사용

In [1]:
# get 메서드 사용 예제

import requests

response = requests.get('http://www.example.com/')

print(response.text)

<!doctype html>
<html>
<head>
    <title>Example Domain</title>

    <meta charset="utf-8" />
    <meta http-equiv="Content-type" content="text/html; charset=utf-8" />
    <meta name="viewport" content="width=device-width, initial-scale=1" />
    <style type="text/css">
    body {
        background-color: #f0f0f2;
        margin: 0;
        padding: 0;
        font-family: -apple-system, system-ui, BlinkMacSystemFont, "Segoe UI", "Open Sans", "Helvetica Neue", Helvetica, Arial, sans-serif;
        
    }
    div {
        width: 600px;
        margin: 5em auto;
        padding: 2em;
        background-color: #fdfdff;
        border-radius: 0.5em;
        box-shadow: 2px 3px 7px 2px rgba(0,0,0,0.02);
    }
    a:link, a:visited {
        color: #38488f;
        text-decoration: none;
    }
    @media (max-width: 700px) {
        div {
            margin: 0 auto;
            width: auto;
        }
    }
    </style>    
</head>

<body>
<div>
    <h1>Example Domain</h1>
    <p>This domai

In [2]:
# 참고용 post 메서드 사용 예제

data = {'username' : 'user', 'password' : 'pass'}

response = requests.post('http://www.example.com/login', data = data)

print(response.status_code)

404


### urllib 하위 모듈
- urllib.request: 이 모듈은 URL 열고 데이터를 읽어오는데 사용됩니다. urlopen() 함수를 사용하여 URL에서 데이터를 가져올 수 있습니다. 이 모듈에는 HTTP, FTP, HTTPS 및 파일 URL을 처리하는 다양한 클래스와 함수가 포함되어 있습니다.

- urllib.parse: 이 모듈은 URL을 파싱하고 조작하는데 사용됩니다. urlparse() 함수를 사용하여 URL을 파싱하고, urlunparse() 함수를 사용하여 파싱된 URL을 다시 조립할 수 있습니다.

- urllib.error: 이 모듈은 urllib.request 모듈에서 발생하는 예외를 처리하는데 사용됩니다. 이 모듈에는 다양한 예외 클래스들이 정의되어 있습니다.

- urllib.robotparser: 이 모듈은 robots.txt 파일을 파싱하고 해석하는데 사용됩니다. RobotFileParser 클래스를 사용하여 robots.txt 파일을 파싱하고, can_fetch() 함수를 사용하여 주어진 로봇이 특정 URL에서 데이터를 가져올 수 있는지 여부를 확인할 수 있습니다.

In [3]:
# 데이터 가져오기

import urllib.request

url = 'http://www.example.com'

response = urllib.request.urlopen(url)
html = response.read()

print(html)

b'<!doctype html>\n<html>\n<head>\n    <title>Example Domain</title>\n\n    <meta charset="utf-8" />\n    <meta http-equiv="Content-type" content="text/html; charset=utf-8" />\n    <meta name="viewport" content="width=device-width, initial-scale=1" />\n    <style type="text/css">\n    body {\n        background-color: #f0f0f2;\n        margin: 0;\n        padding: 0;\n        font-family: -apple-system, system-ui, BlinkMacSystemFont, "Segoe UI", "Open Sans", "Helvetica Neue", Helvetica, Arial, sans-serif;\n        \n    }\n    div {\n        width: 600px;\n        margin: 5em auto;\n        padding: 2em;\n        background-color: #fdfdff;\n        border-radius: 0.5em;\n        box-shadow: 2px 3px 7px 2px rgba(0,0,0,0.02);\n    }\n    a:link, a:visited {\n        color: #38488f;\n        text-decoration: none;\n    }\n    @media (max-width: 700px) {\n        div {\n            margin: 0 auto;\n            width: auto;\n        }\n    }\n    </style>    \n</head>\n\n<body>\n<div>\n    

In [4]:
# url 파싱

url = 'http://www.example.com/search?q=python'
parsed_url = urllib.parse.urlparse(url)

print(parsed_url)

ParseResult(scheme='http', netloc='www.example.com', path='/search', params='', query='q=python', fragment='')


In [5]:
#  urllib.error.HTTPError 예외

import urllib.error

url = 'http://www.example.com/404'

try :
    response = urllib.request.urlopen(url)
    
except urllib.error.HTTPError as e :
    print('HTTP Error : ', e.code, e.reason)

HTTP Error :  404 Not Found


In [6]:
# status 및 getheader() 메서드를 사용하여 응답의 상태 코드 및 헤더를 확인

url = 'http://www.example.com'

response = urllib.request.urlopen(url)
print(response.status, '\n')
print(response.getheader('Content-Type'), '\n')
html = response.read()
print(html)

200 

text/html; charset=UTF-8 

b'<!doctype html>\n<html>\n<head>\n    <title>Example Domain</title>\n\n    <meta charset="utf-8" />\n    <meta http-equiv="Content-type" content="text/html; charset=utf-8" />\n    <meta name="viewport" content="width=device-width, initial-scale=1" />\n    <style type="text/css">\n    body {\n        background-color: #f0f0f2;\n        margin: 0;\n        padding: 0;\n        font-family: -apple-system, system-ui, BlinkMacSystemFont, "Segoe UI", "Open Sans", "Helvetica Neue", Helvetica, Arial, sans-serif;\n        \n    }\n    div {\n        width: 600px;\n        margin: 5em auto;\n        padding: 2em;\n        background-color: #fdfdff;\n        border-radius: 0.5em;\n        box-shadow: 2px 3px 7px 2px rgba(0,0,0,0.02);\n    }\n    a:link, a:visited {\n        color: #38488f;\n        text-decoration: none;\n    }\n    @media (max-width: 700px) {\n        div {\n            margin: 0 auto;\n            width: auto;\n        }\n    }\n    </style>   

In [7]:
# byte 를 text로 변환

url = 'http://www.example.com'

response = urllib.request.urlopen(url)
byte_data = response.read(100)
print(byte_data, '\n')
text_data = byte_data.decode('utf-8')
print(text_data)

b'<!doctype html>\n<html>\n<head>\n    <title>Example Domain</title>\n\n    <meta charset="utf-8" />\n    <m' 

<!doctype html>
<html>
<head>
    <title>Example Domain</title>

    <meta charset="utf-8" />
    <m


In [8]:
from bs4 import BeautifulSoup

url = 'http://www.example.com'
response = urllib.request.urlopen(url)

soup = BeautifulSoup(response, 'html.parser')

soup

<!DOCTYPE html>

<html>
<head>
<title>Example Domain</title>
<meta charset="utf-8"/>
<meta content="text/html; charset=utf-8" http-equiv="Content-type"/>
<meta content="width=device-width, initial-scale=1" name="viewport"/>
<style type="text/css">
    body {
        background-color: #f0f0f2;
        margin: 0;
        padding: 0;
        font-family: -apple-system, system-ui, BlinkMacSystemFont, "Segoe UI", "Open Sans", "Helvetica Neue", Helvetica, Arial, sans-serif;
        
    }
    div {
        width: 600px;
        margin: 5em auto;
        padding: 2em;
        background-color: #fdfdff;
        border-radius: 0.5em;
        box-shadow: 2px 3px 7px 2px rgba(0,0,0,0.02);
    }
    a:link, a:visited {
        color: #38488f;
        text-decoration: none;
    }
    @media (max-width: 700px) {
        div {
            margin: 0 auto;
            width: auto;
        }
    }
    </style>
</head>
<body>
<div>
<h1>Example Domain</h1>
<p>This domain is for use in illustrative example

### BeautifulSoup 
- Python에서 HTML과 XML 문서를 파싱하여 원하는 정보를 추출하기 위한 라이브러리입니다.
- BeautifulSoup은 HTML 문서를 파싱하여 파이썬 객체로 변환합니다. 이 파이썬 객체를 다루면서 원하는 정보를 추출할 수 있습니다.
- BeautifulSoup을 사용하여 다음과 같은 작업을 수행할 수 있습니다.
    - HTML/XML 문서를 파싱하여 파이썬 객체로 변환하기
    - 파이썬 코드를 사용하여 문서 내부에서 데이터를 검색하고 추출하기
    - CSS 선택자와 XPath 표현식을 사용하여 문서 내부에서 원하는 요소를 선택하기
    - 선택한 요소의 속성과 값을 가져오기
    - 문서 내부에서 링크, 이미지 등의 다른 요소를 추출하기
    - 파싱된 데이터를 다시 HTML/XML 문서로 출력하기
- BeautifulSoup에서 제공하는 다양한 메서드

    - find() 메서드: HTML 문서에서 지정된 태그를 찾아내고 첫 번째로 발견된 태그를 반환합니다.

    - find_all() 메서드: HTML 문서에서 지정된 태그를 찾아내고, 모든 발견된 태그를 리스트로 반환합니다.
    
    - select_one() 메서드: CSS 선택자를 사용하여 HTML 문서에서 지정된 태그를 찾아내고, 첫번째로 발견된 태그를 리스트로 반환합니다.    
    - select() 메서드: CSS 선택자를 사용하여 HTML 문서에서 지정된 태그를 찾아내고, 모든 발견된 태그를 리스트로 반환합니다.

    - prettify() 메서드: 파싱된 HTML 문서를 보기 좋게 정리하여 반환합니다.

    - get() 메서드: HTML 태그의 속성(attribute) 값을 반환합니다.

    - text 속성: HTML 태그 안에 있는 텍스트를 추출합니다.

    - parent 속성: 현재 태그의 부모 태그를 반환합니다.

    - children 속성: 현재 태그의 자식 태그들을 리스트로 반환합니다.

BeautifulSoup 라이브러리를 사용하여 DOM 객체로 변환하고, 필요한 데이터를 추출
- 먼저 HTML 코드를 BeautifulSoup 객체로 변환한다. 이후, select 메서드를 사용하여 a 태그를 선택하고, href 속성을 사용하여 링크 URL을 추출한다. 이를 for 루프를 사용하여 출력할 수 있다.
- 따라서, 이와 같이 BeautifulSoup 라이브러리를 사용하여 DOM을 탐색하고 필요한 데이터를 추출할 수 있으며, 이를 이용하여 파이썬 웹 크롤러를 구현
- 위의 코드에서, HTML은 루트 요소인 $<html>$ 태그로 시작하며, 이 하위에 $<head>$ 태그와 $<body>$ 태그가 있다. $<html>$ 태그 안에는 문서 제목을 나타내는 $<title>$ 태그가 포함되어 있다.
- $<body>$ 태그는 HTML 문서에서 가장 중요한 부분으로, 페이지 내용을 담고 있는 부분이다. $<body>$ 태그 안에는 $<h1>$ 태그와 $<ul>$ 태그가 포함되어 있으며, $<h1>$ 태그는 페이지의 제목을 나타낸다. $<ul>$ 태그는 목록을 나타내며, 여기에는 3개의 $<li>$ 태그가 포함되어 있으며, 각각의 $<li>$ 태그 안에는 $<a>$ 태그가 포함되어 있다.

- 따라서, 위의 HTML 코드에서의 DOM 구조는 루트 요소인 $<html>$ 태그를 중심으로 계층 구조를 이루고 있으며, 이를 이용하여 자바스크립트나 파이썬 등의 스크립트 언어로 HTML 문서를 동적으로 조작하거나 데이터를 추출할 수 있다.

In [9]:
# html 코드를 파싱하여 beautifulsoup 객체로 만들기

html = """
<!DOCTYPE html>
<html>
<head>
<title>웹 크롤링 예시</title>
</head>
<body>
<h1>웹 크롤링 예시</h1>
<ul>
<li><a href="https://www.example.com">Example 1</a></li>
<li><a href="https://www.example.net">Example 2</a></li>
<li><a href="https://www.example.org">Example 3</a></li>
</ul>
</body>
</html>
"""

soup = BeautifulSoup(html, 'html.parser')

# 링크 url 추출하기

links = soup.select('a')

for link in links :
    
    print(link['href'])

https://www.example.com
https://www.example.net
https://www.example.org


In [10]:
with open('test.html', 'w') as f :
    f.write(
'''
<!doctype html>
<html>
  <head>
    <title>제목입니다</title>
  </head>
  <body>
    <p class="content">본문입니다.</p>
    <p>두 번째 단락입니다.</p>
    <a href="http://example.com">링크입니다.</a>
  </body>
</html>
''')
    

In [11]:
html = '''
<!doctype html>
<html>
  <head>
    <title>제목입니다</title>
  </head>
  <body>
    <p class="content">본문입니다.</p>
    <p>두 번째 단락입니다.</p>
    <a href="http://example.com">링크입니다.</a>
  </body>
</html>
'''

In [12]:
# soup 객체 생성

soup = BeautifulSoup(html, 'html.parser')
print(type(soup), '\n', soup)

<class 'bs4.BeautifulSoup'> 
 
<!DOCTYPE html>

<html>
<head>
<title>제목입니다</title>
</head>
<body>
<p class="content">본문입니다.</p>
<p>두 번째 단락입니다.</p>
<a href="http://example.com">링크입니다.</a>
</body>
</html>



In [13]:
# find 사용 예제

title = soup.find('title')
print(title)

<title>제목입니다</title>


In [14]:
# find_all  사용예제

paragraphs = soup.find_all('p')

for p in paragraphs :
    print(p.text)

본문입니다.
두 번째 단락입니다.


In [15]:
# select 메서드 사용 예제 href = hyper text reference 하이퍼 링크 생성할때 사용

link = soup.select('a')[0]

print(link['href'])

http://example.com


In [16]:
link = soup.select_one('a')

print(link['href'])

http://example.com


In [17]:
# prettify 메서드 사용

print(soup.prettify())

<!DOCTYPE html>
<html>
 <head>
  <title>
   제목입니다
  </title>
 </head>
 <body>
  <p class="content">
   본문입니다.
  </p>
  <p>
   두 번째 단락입니다.
  </p>
  <a href="http://example.com">
   링크입니다.
  </a>
 </body>
</html>



In [18]:
# get 메서드 사용 예제

link = soup.select('a')[0]
print(link)
print(link.get('href'))

<a href="http://example.com">링크입니다.</a>
http://example.com


In [19]:
# text 사용 예제

para = soup.find('p', {'class' : 'content'})
print(para)
print(para.text)

<p class="content">본문입니다.</p>
본문입니다.


In [20]:
# parent 사용 예제

para = soup.find('p', {'class' : 'content'})
print(para)
print(para.parent.name)

<p class="content">본문입니다.</p>
body


In [21]:
# children 속성 사용 예제

para = soup.find('body')

for child in para :
    print(child)



<p class="content">본문입니다.</p>


<p>두 번째 단락입니다.</p>


<a href="http://example.com">링크입니다.</a>




In [22]:
html = """
<html><body>
  <h1>스크레이핑이란?</h1>
  <p>웹 페이지를 분석하는 것</p>
  <p>원하는 부분을 추출하는 것</p>
</body></html>
"""

soup = BeautifulSoup(html, 'html.parser')

h1 = soup.html.body.h1
p1 = soup.html.body.p
p2 = p1.next_sibling.next_sibling # 첫번째 next_sibling 선택되는 요소는 줄바꿈 문자와 같은 공백 문자열이기 때문에 두번 쓴다


print(h1)
print('h1 = ' + h1.string)
print('p = ' + p1.string)
print('p = ' + p2.string)

<h1>스크레이핑이란?</h1>
h1 = 스크레이핑이란?
p = 웹 페이지를 분석하는 것
p = 원하는 부분을 추출하는 것


In [23]:
print('#title=' + h1.string)
print('#body=' + p2.string)
print(p1.text) # 첫번째만
print(p1.get_text()) # 전부다

#title=스크레이핑이란?
#body=원하는 부분을 추출하는 것
웹 페이지를 분석하는 것
웹 페이지를 분석하는 것


In [24]:
# find_all

texts = soup.find_all('p')

for t in texts :
    print(t.text)

웹 페이지를 분석하는 것
원하는 부분을 추출하는 것


In [25]:
html = """
<html><body>
  <ul>
    <li><a href="http://www.naver.com">naver</a></li>
    <li><a href="http://www.daum.net">daum</a></li>
  </ul>
</body></html>
"""

soup = BeautifulSoup(html, 'html.parser')

links = soup.find_all('a')

for a in links :
    href = a.attrs['href']
    text = a.string
    print(text, '>', href)

naver > http://www.naver.com
daum > http://www.daum.net


In [26]:
html="""
<head>
    <title>crawler</title>
</head>
<body>
    <p class="a" align="center"> text1</p>
    <p class="b" align="center"> text2</p>
    <p class="c" align="center"> text3</p>
    <div>
        <img src="/source" width="300" height="200">
    </div>
</body>
</html>
"""

soup = BeautifulSoup(html, 'html.parser')
contents = soup.find('body')

for child in contents.children :
    print(child)



<p align="center" class="a"> text1</p>


<p align="center" class="b"> text2</p>


<p align="center" class="c"> text3</p>


<div>
<img height="200" src="/source" width="300"/>
</div>




In [27]:
# body 의 자손은 p div img

for d in contents.descendants :
    print(d)



<p align="center" class="a"> text1</p>
 text1


<p align="center" class="b"> text2</p>
 text2


<p align="center" class="c"> text3</p>
 text3


<div>
<img height="200" src="/source" width="300"/>
</div>


<img height="200" src="/source" width="300"/>






In [28]:
img_tag = contents.find('img')

print(img_tag, '\n')
print(img_tag.parent)

<img height="200" src="/source" width="300"/> 

<div>
<img height="200" src="/source" width="300"/>
</div>


In [29]:
print(list(img_tag.parents))

[<div>
<img height="200" src="/source" width="300"/>
</div>, <body>
<p align="center" class="a"> text1</p>
<p align="center" class="b"> text2</p>
<p align="center" class="c"> text3</p>
<div>
<img height="200" src="/source" width="300"/>
</div>
</body>, 
<head>
<title>crawler</title>
</head>
<body>
<p align="center" class="a"> text1</p>
<p align="center" class="b"> text2</p>
<p align="center" class="c"> text3</p>
<div>
<img height="200" src="/source" width="300"/>
</div>
</body>

]


In [30]:
# 태그 객체

print(contents.div.img)

<img height="200" src="/source" width="300"/>


In [31]:
soup = BeautifulSoup(html, 'html.parser')
contents = soup.find('body')

print(contents, '\n')

img_tag = contents.find('img')
print(img_tag.find_parent('body'), '\n')
print(img_tag.find_parent('div'))

<body>
<p align="center" class="a"> text1</p>
<p align="center" class="b"> text2</p>
<p align="center" class="c"> text3</p>
<div>
<img height="200" src="/source" width="300"/>
</div>
</body> 

<body>
<p align="center" class="a"> text1</p>
<p align="center" class="b"> text2</p>
<p align="center" class="c"> text3</p>
<div>
<img height="200" src="/source" width="300"/>
</div>
</body> 

<div>
<img height="200" src="/source" width="300"/>
</div>


In [32]:
p_tag = soup.find('p', class_ = 'c') # class 가 키워드 여서

print(p_tag)

<p align="center" class="c"> text3</p>


In [33]:
# find_previous_sibling() : 바로 이전 형제 노드 검색
# find_previous_siblings() : 모든 형제 노드 검색

print(p_tag.find_previous_sibling())
print(p_tag.find_previous_siblings())

<p align="center" class="b"> text2</p>
[<p align="center" class="b"> text2</p>, <p align="center" class="a"> text1</p>]


In [34]:
with open('test2.html','w') as f:
    f.write(
'''
<!doctype html>
<html>
<body>
<div id="meigen">
  <h1>위키북스 도서</h1>
  <ul class="items">
    <li>유니티 게임 이펙트 입문</li>
    <li>스위프트로 시작하는 아이폰 앱 개발 교과서</li>
    <li>모던 웹사이트 디자인의 정석</li>
  </ul>
</div>
</body>
</html>
''')

In [35]:
html = '''
<!doctype html>
<html>
<body>
<div id="meigen">
  <h1>위키북스 도서</h1>
  <ul class="items">
    <li>유니티 게임 이펙트 입문</li>
    <li>스위프트로 시작하는 아이폰 앱 개발 교과서</li>
    <li>모던 웹사이트 디자인의 정석</li>
  </ul>
</div>
</body>
</html>
'''

soup = BeautifulSoup(html, 'html.parser')

h1 = soup.select_one('div#meigen > h1').string
print('h1 = ', h1)

li_list = soup.select('div#meigen > ul.items > li')

for li in li_list :
    print('li = ', li.string)

h1 =  위키북스 도서
li =  유니티 게임 이펙트 입문
li =  스위프트로 시작하는 아이폰 앱 개발 교과서
li =  모던 웹사이트 디자인의 정석


In [36]:
fp = open('books.html', encoding = 'utf-8')
soup = BeautifulSoup(fp, 'html.parser')
print(soup, '\n')

sel = lambda q : print(soup.select_one(q).string, '\n')
sel('#nu')
sel('li#nu')
sel('ul > li#nu')
sel('#bible #nu')
sel('#bible > #nu')
sel('ul#bible > li#nu')
sel("li[id = 'nu']")
sel('li:nth-of-type(4)')

print(soup.select('li')[3].string)
print(soup.find_all('li')[3].string)

<ul id="bible">
<li id="ge">Genesis</li>
<li id="ex">Exodus</li>
<li id="le">Leviticus</li>
<li id="nu">Numbers</li>
<li id="de">Deuteronomy</li>
</ul> 

Numbers 

Numbers 

Numbers 

Numbers 

Numbers 

Numbers 

Numbers 

Numbers 

Numbers
Numbers


### 과제1

아래와 같이 출력하세요

- 레몬
- 아보카도
- 아보카도
- 아보카도
- 아보카도
- 아보카도

In [43]:
from bs4 import BeautifulSoup 
fp = open("fruits-vegetables.html", encoding="utf-8")
soup = BeautifulSoup(fp, "html.parser")

print(soup, '\n')

fruits = lambda q : print(soup.select_one(q).string)
fruits('li.yellow')
fruits('li.black[data-lo="us"]')
fruits('ul#ve-list > li:nth-child(4)') # ul#ve-list 내부의 네 번째 li 요소
fruits('ul#ve-list > li:nth-of-type(4)')
print(soup.select('li')[7].string)
print(soup.find_all('li')[7].string)

<html>
<body>
<div id="main-goods" role="page">
<h1>과일과 야채</h1>
<ul id="fr-list">
<li class="red green" data-lo="ko">사과</li>
<li class="purple" data-lo="us">포도</li>
<li class="yellow" data-lo="us">레몬</li>
<li class="yellow" data-lo="ko">오렌지</li>
</ul>
<ul id="ve-list">
<li class="white green" data-lo="ko">무</li>
<li class="red green" data-lo="us">파프리카</li>
<li class="black" data-lo="ko">가지</li>
<li class="black" data-lo="us">아보카도</li>
<li class="white" data-lo="cn">연근</li>
</ul>
</div>
</body>
</html> 

레몬
아보카도
아보카도
아보카도
아보카도
아보카도


### requests 와 BeautifulSoup 을 사용하여 크롤링 하는 예제

In [38]:
url = 'http://www.example.com/'

response = requests.get(url)
html = response.text
print(html, '\n')

soup = BeautifulSoup(html, 'html.parser')

title = soup.find('title').text
para = soup.find_all('p')
links = [a['href'] for a in soup.select('a')]

print('Title:', title, '\n')
print('para : ')

for p in para :
    print('-', p.text)

print('Links : ')

for link in links :
    print('-', link)

<!doctype html>
<html>
<head>
    <title>Example Domain</title>

    <meta charset="utf-8" />
    <meta http-equiv="Content-type" content="text/html; charset=utf-8" />
    <meta name="viewport" content="width=device-width, initial-scale=1" />
    <style type="text/css">
    body {
        background-color: #f0f0f2;
        margin: 0;
        padding: 0;
        font-family: -apple-system, system-ui, BlinkMacSystemFont, "Segoe UI", "Open Sans", "Helvetica Neue", Helvetica, Arial, sans-serif;
        
    }
    div {
        width: 600px;
        margin: 5em auto;
        padding: 2em;
        background-color: #fdfdff;
        border-radius: 0.5em;
        box-shadow: 2px 3px 7px 2px rgba(0,0,0,0.02);
    }
    a:link, a:visited {
        color: #38488f;
        text-decoration: none;
    }
    @media (max-width: 700px) {
        div {
            margin: 0 auto;
            width: auto;
        }
    }
    </style>    
</head>

<body>
<div>
    <h1>Example Domain</h1>
    <p>This domai

### urllib 과 BeautifulSoup 사용하여 웹 크롤링

In [39]:
from urllib.request import urlopen

url = 'http://www.example.com/'

response = urlopen(url)
print(response, '\n')

soup = BeautifulSoup(response, 'html.parser')

title = soup.find('title').text
para = soup.find_all('p')
links = [a['href'] for a in soup.select('a')]

print('Title : ', title)
print('para : ')
for p in para :
    print('-', p.text)

print('Links : ')
for link in links :
    print('-', link)

<http.client.HTTPResponse object at 0x000001921BB26FD0> 

Title :  Example Domain
para : 
- This domain is for use in illustrative examples in documents. You may use this
    domain in literature without prior coordination or asking for permission.
- More information...
Links : 
- https://www.iana.org/domains/example


In [40]:
import urllib.request as req

url = 'http://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp'

res = req.urlopen(url)

soup = BeautifulSoup(res, 'html.parser')

soup



<?xml version="1.0" encoding="utf-8" ?>
<rss version="2.0">
<channel>
<title>기상청 육상 중기예보</title>
<link/>http://www.kma.go.kr/weather/forecast/mid-term_01.jsp
<description>기상청 날씨 웹서비스</description>
<language>ko</language>
<generator>기상청</generator>
<pubdate>2023년 05월 01일 (월)요일 06:00</pubdate>
<item>
<author>기상청</author>
<category>육상중기예보</category>
<title>전국 육상 중기예보 - 2023년 05월 01일 (월)요일 06:00 발표</title>
<link/>http://www.kma.go.kr/weather/forecast/mid-term_01.jsp
<guid>http://www.kma.go.kr/weather/forecast/mid-term_01.jsp</guid>
<description>
<header>
<title>전국 육상중기예보</title>
<tm>202305010600</tm>
<wf><![CDATA[○ (강수) 4일(목) 전남권과 경남권, 제주도에 비가 오겠습니다.<br />○ (기온) 5일(금)~6일(토) 아침 기온은 14~18도로 평년(최저기온 9~14도)보다 높겠고, 그 밖의 날의 아침 기온은 8~15도로 평년과 비슷하겠습니다.<br />          7일(일) 낮 기온은 18~22도로 평년(최고기온 21~25도)보다 낮겠고, 그 밖의 날의 낮 기온은 18~25도로 평년(최고기온 20~25도)과 비슷하겠습니다.<br />○ (주말전망) 6일(토)~7일(일) 전국이 대체로 흐리겠습니다. 아침 기온은 11~18도, 낮 기온은 18~23도가 되겠습니다.<br /><br />* 4일(목)부터 7일(일) 사이 기압골의 발달 정도와 이동 속도에 따라 강수시점과 구역이 변경될

In [41]:
title = soup.find('title').string
wf = soup.find('wf').string

print(title, '\n')
print(wf)

기상청 육상 중기예보 

○ (강수) 4일(목) 전남권과 경남권, 제주도에 비가 오겠습니다.<br />○ (기온) 5일(금)~6일(토) 아침 기온은 14~18도로 평년(최저기온 9~14도)보다 높겠고, 그 밖의 날의 아침 기온은 8~15도로 평년과 비슷하겠습니다.<br />          7일(일) 낮 기온은 18~22도로 평년(최고기온 21~25도)보다 낮겠고, 그 밖의 날의 낮 기온은 18~25도로 평년(최고기온 20~25도)과 비슷하겠습니다.<br />○ (주말전망) 6일(토)~7일(일) 전국이 대체로 흐리겠습니다. 아침 기온은 11~18도, 낮 기온은 18~23도가 되겠습니다.<br /><br />* 4일(목)부터 7일(일) 사이 기압골의 발달 정도와 이동 속도에 따라 강수시점과 구역이 변경될 가능성이 있으니, 앞으로 발표되는 최신 예보를 반드시 참고하기 바랍니다.


In [44]:
import requests
import re

url = 'http://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp'

data = requests.get(url).text
soup = BeautifulSoup(data, 'html.parser')
wf = soup.find('wf').text

print(wf)

wf = ''.join(re.findall('[^A-Z0-9]?[0-9가-힣]+[^A-Z0-9]?', wf))
wf

○ (강수) 4일(목) 전남권과 경남권, 제주도에 비가 오겠습니다.<br />○ (기온) 5일(금)~6일(토) 아침 기온은 14~18도로 평년(최저기온 9~14도)보다 높겠고, 그 밖의 날의 아침 기온은 8~15도로 평년과 비슷하겠습니다.<br />          7일(일) 낮 기온은 18~22도로 평년(최고기온 21~25도)보다 낮겠고, 그 밖의 날의 낮 기온은 18~25도로 평년(최고기온 20~25도)과 비슷하겠습니다.<br />○ (주말전망) 6일(토)~7일(일) 전국이 대체로 흐리겠습니다. 아침 기온은 11~18도, 낮 기온은 18~23도가 되겠습니다.<br /><br />* 4일(목)부터 7일(일) 사이 기압골의 발달 정도와 이동 속도에 따라 강수시점과 구역이 변경될 가능성이 있으니, 앞으로 발표되는 최신 예보를 반드시 참고하기 바랍니다.


'(강수) 4일(목) 전남권과 경남권, 제주도에 비가 오겠습니다.(기온) 5일(금)~6일(토) 아침 기온은 14~18도로 평년(최저기온 9~14도)보다 높겠고, 그 밖의 날의 아침 기온은 8~15도로 평년과 비슷하겠습니다. 7일(일) 낮 기온은 18~22도로 평년(최고기온 21~25도)보다 낮겠고, 그 밖의 날의 낮 기온은 18~25도로 평년(최고기온 20~25도)과 비슷하겠습니다.(주말전망) 6일(토)~7일(일) 전국이 대체로 흐리겠습니다. 아침 기온은 11~18도, 낮 기온은 18~23도가 되겠습니다. 4일(목)부터 7일(일) 사이 기압골의 발달 정도와 이동 속도에 따라 강수시점과 구역이 변경될 가능성이 있으니, 앞으로 발표되는 최신 예보를 반드시 참고하기 바랍니다.'

In [45]:
import urllib.request as rq

url = 'https://news.naver.com/main/main.naver?mode=LSD&mid=shm&sid1=100'

html = rq.urlopen(url)
soup = BeautifulSoup(html, 'lxml')
print(soup, '\n')

text = soup.find('p')
text = text.get_text()
text

<!DOCTYPE HTML>
<html lang="ko">
<head>
<meta charset="utf-8"/>
<meta content="IE=edge" http-equiv="X-UA-Compatible"/>
<meta contents="always" name="referrer"/>
<meta content="600" http-equiv="refresh"/>
<meta content="width=1106" name="viewport"/>
<meta content="정치 : 네이버 뉴스" property="og:title"/>
<meta content="website" property="og:type"/>
<meta content="https://news.naver.com/main/main.naver?mode=LSD&amp;mid=shm&amp;sid1=100" property="og:url"/>
<meta content="https://ssl.pstatic.net/static.news/image/news/ogtag/navernews_800x420_20221201.png" property="og:image"/>
<meta content="국회, 행정, 국방, 외교 등 정치 분야 뉴스 제공" property="og:description"/>
<meta content="네이버" property="og:article:author"/>
<meta content="summary" name="twitter:card"/>
<meta content="정치 : 네이버 뉴스" name="twitter:title"/>
<meta content="네이버 뉴스" name="twitter:site"/>
<meta content="네이버 뉴스" name="twitter:creator"/>
<meta content="https://ssl.pstatic.net/static.news/image/news/ogtag/navernews_800x420_20221201.png" name="twitt

'AiRS추천으로 구성된 뉴스를 제공합니다.'

### 과제 2

url = 'http://news.naver.com' 에서 문서를 가져와서 한글만 출력하세요. (최대한 텍스트 형태)

- requests 사용
- urllib 사용

In [46]:
# request

url = 'http://news.naver.com'

data = requests.get(url).text
soup = BeautifulSoup(data, 'html.parser')
# print(soup)

ko = ' '.join(re.findall(r'[가-힣]+', soup.get_text()))

print(ko)

네이버 뉴스 본문 바로가기 뉴스 연예 스포츠 날씨 프리미엄 검색 언론사별 정치 경제 사회 생활 문화 과학 세계 랭킹 신문보기 오피니언 팩트체크 전체 언론사 뉴스스탠드 라이브러리 콘텐츠 월 전체 언론사 뉴스스탠드 라이브러리 언론사편집 기자 연재 구독설정 속보 돈봉투 의혹 송영길 경선 캠프 관계자들 추가 압수수색 세계일보 내용작성전 올해 월 무역적자 억달러 작년의 차지 헤럴드경제 내용작성전 검찰 민주당 돈봉투 송영길 경선캠프 관계자 추가 압수수색 대전일보 내용작성전 월 무역수지 억 만달러 적자 개월 연속 먹구름 한국일보 월 무역적자 억 만달러 개월 연속 적자 머니 내용작성전 돈봉투 의혹 송영길 캠프 관계자들 추가 압수수색 노컷뉴스 월 수출 억달러 년 전보다 감소 경향신문 월 반도체 수출 전년 무역수지 개월 연속 적자 아시아경제 내용작성전 월 수출 무역적자 억달러 이데일리 검찰 송영길 경선 캠프 관계자들 추가 압수수색 디지털타임스 내용작성전 수출 개월 연속 감소 개월째 무역적자 연합뉴스 월 수출 전년 억 달러 무역적자 뉴시스 내용작성전 월 수출 전년 감소 무역적자 억 달러 개월 연속 뉴스 내용작성전 검찰 송영길 경선 캠프 관계자 추가 압수수색 검찰 돈봉투의혹 송영길캠프 지역본부장 추가 압수수색 머니투데이 내용작성전 속보 닫기 농민신문 월 일 구독 환경오염 해결사 주범 의 두 얼굴 미래는 이미 우리 곁에 와 있다 단지 널리 퍼져 있지 않을 뿐이다 공상과학 소설가이자 미래학자인 윌리엄 깁슨이 년 월 미국의 한 라디오 방송에서 한 말입니다 미래가 성큼 다가왔지만 모두가 뉴스 월 일 구독 주가급등 후 하따까지 이 작전 어디서 봤더라 손엄지의 주식살롱 최근 무더기 하한가 로 드러난 주가조작 사태는 지난 년 월에 개봉한 영화 작전 을 떠오르게 합니다 결국 주식시장은 년이 지나고도 달라진 게 없었는데요 오히려 차익결제거래 라는 레버리지 상품 비즈워치 월 일 구독 자녀장려금 준다는데 받을 아이가 없다 자녀장려금제도의 지속적인 수급요건 완화에도 그 수급자수가 계속해서 감소하고 있는

In [47]:
# urllib

url = 'http://news.naver.com'

data = urllib.request.urlopen(url)
soup = BeautifulSoup(data, 'html.parser')
# print(soup)

ko = ' '.join(re.findall(r'[가-힣]+', soup.get_text()))

print(ko)

네이버 뉴스 본문 바로가기 뉴스 연예 스포츠 날씨 프리미엄 검색 언론사별 정치 경제 사회 생활 문화 과학 세계 랭킹 신문보기 오피니언 팩트체크 전체 언론사 뉴스스탠드 라이브러리 콘텐츠 월 전체 언론사 뉴스스탠드 라이브러리 언론사편집 기자 연재 구독설정 속보 돈봉투 의혹 송영길 경선 캠프 관계자들 추가 압수수색 세계일보 내용작성전 올해 월 무역적자 억달러 작년의 차지 헤럴드경제 내용작성전 검찰 민주당 돈봉투 송영길 경선캠프 관계자 추가 압수수색 대전일보 내용작성전 월 무역수지 억 만달러 적자 개월 연속 먹구름 한국일보 월 무역적자 억 만달러 개월 연속 적자 머니 내용작성전 돈봉투 의혹 송영길 캠프 관계자들 추가 압수수색 노컷뉴스 월 수출 억달러 년 전보다 감소 경향신문 월 반도체 수출 전년 무역수지 개월 연속 적자 아시아경제 내용작성전 월 수출 무역적자 억달러 이데일리 검찰 송영길 경선 캠프 관계자들 추가 압수수색 디지털타임스 내용작성전 수출 개월 연속 감소 개월째 무역적자 연합뉴스 월 수출 전년 억 달러 무역적자 뉴시스 내용작성전 월 수출 전년 감소 무역적자 억 달러 개월 연속 뉴스 내용작성전 검찰 송영길 경선 캠프 관계자 추가 압수수색 검찰 돈봉투의혹 송영길캠프 지역본부장 추가 압수수색 머니투데이 내용작성전 속보 닫기 머니 월 일 구독 만원 저축하면 배 지급 청년내일저축계좌 가입하세요 월 만원씩 저축한 청년에게 년 만기 시 최대 원금의 세 배를 추가로 지급하는 청년내일저축계좌 신청이 시작된다 일 보건복지부에 따르면 이날부터 오는 일까지 청년내일저축계좌 신규 가입자를 모집한다 대상 더팩트 월 일 구독 대통령 국빈방문 마치고 귀국 외화내빈 외화내실 최대 성과로 꼽은 확장억제 강화 에 보수 일각서도 불만 반도체법 구체적 해법 없고 도청 에 철저한 편 윤석열 대통령이 일 박 일간의 미국 국빈 방문을 마치고 귀국했다 년 만에 이 농민신문 월 일 구독 환경오염 해결사 주범 의 두 얼굴 미래는 이미 우리 곁에 와 있다 단지 널리 퍼져 있지 않을 뿐이다 공상과학 소설가이자

### 과제 3

url = 'http://news.naver.com' 에서 문서를 가져와서 p 태그의 한글을 모두 출력하세요.


In [48]:
url = 'http://news.naver.com'

data = requests.get(url).text
soup = BeautifulSoup(data, 'html.parser')
# print(soup)

p = soup.find_all('p')

p = ' '.join([i.get_text() for i in p])
# print(p)

p = ' '.join(re.findall(r'[가-힣]+', p))
print(p)

이철규 국민의힘 사무총장 대선 경선 치르며 처음 인연 맺었다 당 사무총장 살림하고 책임지는 자리 공천 순위는 주민 위해 봉사할 인물 쓴소리에 귀 닫지 않는 열린 마음 소유자 검사 많다고 국내에서 벤츠를 이미 앞지른 제네시스가 글로벌에서도 판매량이 꾸준히 증가하며 승승장구하고 있다 특히 최근에는 컨버터블 콘셉트카를 공개하며 고급 차 이미지 굳히기에 나섰다 일 업계에 따르면 지난해 제네시스 브랜 한국수력원자력은 지난해 월 폴란드전력공사 와 폴란드 원전 건설과 관련한 협력의향서 을 체결했다 원전사업 규모는 최대 억달러 약 조원 에 달할 것으로 전망된다 그런데 이 사업이 예정대로 증권발 폭락 사태에 대해 전문가들의 사전 경고가 있었지만 사태 예방에는 별다른 효과가 없었던 것으로 나타났다 또한 주가조작 의심 세력이 고른 종목 다수는 증권사들이 기업분석 대상에 포함하지 않아 비정상적 주가 활동 무대 옮겨가며 미성년자 성 착취하는 유사 번방 기승 팸 옵챗 오픈채팅 들어가지마셈 온라인 커뮤니티 디시인사이드의 우울증 갤러리 에는 최근 이 같은 내용의 게시물이 여러 건 최근 무더기 하한가 로 드러난 주가조작 사태는 지난 년 월에 개봉한 영화 작전 을 떠오르게 합니다 결국 주식시장은 년이 지나고도 달라진 게 없었는데요 오히려 차익결제거래 라는 레버리지 상품 정부가 특별법 제정으로 추진하는 전세사기 피해자 지원 및 주거안정 방안 은 야당이 발의한 법안에 비해 지원 대상이 한정됐다 피해자들과 야당이 요구하는 정부의 전세보증금반환채권 매입 방안도 빠졌다 정부가 특별법을 그 어디보다 안전해야 할 스쿨존에서 어린이들이 음주운전 차량에 목숨을 잃는 사고가 끊이지 않고 있습니다 경찰이 이 스쿨존과 행락지에서 오늘 일 음주단속을 한다고 해서 저희 사회부 박재연 기자가 그 현장에 다녀 미국을 국빈 방문한 윤석열 대통령이 참석한 행사에 배우 이서진이 모습을 나타냈다 윤 대통령은 지난 일 현지시간 워싱턴 미국영화협회 건물에서 개최된 글로벌 영상콘텐츠 리더십 포럼 에 참석했다 이 월 첫쨰주가 시작됐다

### 과제4

기상청 육상 정보에서 강원도의 지역번호는 105이다 강원도의 날씨예보를 출력하세요

url = 'http://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp?stnld='

In [49]:
region_code = '105'

url = f'http://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp?stnId={region_code}'
data = requests.get(url)

soup = BeautifulSoup(data.text, 'html.parser')
# print(soup)

wf = soup.find_all('wf')
wf = ' '.join(wf.get_text() for wf in wf)
wf = ' '.join(re.findall(r'[가-힣]+', wf))

print(wf)

하늘상태 이번 예보기간은 대체로 흐린 날이 많겠으나 일 월 일 목 은 대체로 맑겠습니다 기온 이번 예보기간 아침 기온은 도로 평년 최저기온 도 과 비슷하거나 조금 높겠고 낮 기온은 도로 평년 최고기온 도 과 비슷하거나 조금 낮겠습니다 해상 동해중부해상의 물결은 일 금 일 토 은 로 높게 일겠습니다 주말전망 일 토 일 일 은 대체로 흐리겠습니다 아침 기온은 도 낮 기온은 도가 되겠습니다 일 목 부터 일 일 사이 기압골의 발달 정도와 이동 속도에 따라 강수시점과 구역이 변경될 가능성이 있으니 앞으로 발표되는 최신 예보를 반드시 참고하기 바랍니다 구름많음 흐림 흐림 흐림 흐림 흐림 흐림 구름많음 맑음 맑음 구름많음 구름많음 맑음 구름많음 흐림 흐림 흐림 흐림 흐림 흐림 구름많음 맑음 맑음 구름많음 구름많음 맑음 구름많음 흐림 흐림 흐림 흐림 흐림 흐림 구름많음 맑음 맑음 구름많음 구름많음 맑음 구름많음 흐림 흐림 흐림 흐림 흐림 흐림 구름많음 맑음 맑음 구름많음 구름많음 맑음 구름많음 흐림 흐림 흐림 흐림 흐림 흐림 구름많음 맑음 맑음 구름많음 구름많음 맑음 구름많음 흐림 흐림 흐림 흐림 흐림 흐림 구름많음 맑음 맑음 구름많음 구름많음 맑음 구름많음 흐림 흐림 흐림 흐림 흐림 흐림 구름많음 맑음 맑음 구름많음 구름많음 맑음 구름많음 흐림 흐림 흐림 흐림 흐림 흐림 구름많음 맑음 맑음 구름많음 구름많음 맑음 구름많음 흐림 흐림 흐림 흐림 흐림 흐림 구름많음 맑음 맑음 구름많음 구름많음 맑음 구름많음 흐림 흐림 흐림 흐림 흐림 흐림 구름많음 맑음 맑음 구름많음 구름많음 맑음 구름많음 흐림 흐림 흐림 흐림 흐림 흐림 구름많음 맑음 맑음 구름많음 구름많음 맑음 구름많음 흐림 흐림 흐림 흐림 흐림 흐림 구름많음 맑음 맑음 구름많음 구름많음 맑음 구름많음 흐림 흐림 흐림 흐림 흐림 흐림 맑음 맑음 맑음 맑음 맑음 맑음 구름많음 흐림 흐림 흐림 흐림 흐림 흐림 맑음 맑음 맑음 맑음 맑음 맑음 구름많음 흐림 흐림 흐림 흐림 흐림 흐림 맑음 맑음 맑음 맑음 맑음 맑음 구름많음 흐림

In [50]:
region_code = '105'

url = f'http://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp?stnId={region_code}'
data = requests.get(url)

soup = BeautifulSoup(data.text, 'html.parser')
# print(soup)

header_wf = soup.find('header').find('wf').get_text()
header_wf = re.findall(r'[가-힣]+', header_wf)
header_wf = ' '.join(header_wf)
print(header_wf, '\n')

for loc in soup.find_all('location') :
#     print(i, '\n')
    
    city = loc.find('city').get_text()
    city = re.search(r'[가-힣]+', city).group()
#     print(city)
    
    for data in loc.find_all('data') :
        tmef = data.find('tmef').get_text()
#         print(tmef)
        
        wf = data.find('wf').get_text()
        wf = ' '.join(re.findall('[가-힣]+', wf))
        # print(weather)

        print(f'{tmef}에 {city}에서 날씨는 {wf} 입니다.\n')

하늘상태 이번 예보기간은 대체로 흐린 날이 많겠으나 일 월 일 목 은 대체로 맑겠습니다 기온 이번 예보기간 아침 기온은 도로 평년 최저기온 도 과 비슷하거나 조금 높겠고 낮 기온은 도로 평년 최고기온 도 과 비슷하거나 조금 낮겠습니다 해상 동해중부해상의 물결은 일 금 일 토 은 로 높게 일겠습니다 주말전망 일 토 일 일 은 대체로 흐리겠습니다 아침 기온은 도 낮 기온은 도가 되겠습니다 일 목 부터 일 일 사이 기압골의 발달 정도와 이동 속도에 따라 강수시점과 구역이 변경될 가능성이 있으니 앞으로 발표되는 최신 예보를 반드시 참고하기 바랍니다 

2023-05-04 00:00에 원주에서 날씨는 구름많음 입니다.

2023-05-04 12:00에 원주에서 날씨는 흐림 입니다.

2023-05-05 00:00에 원주에서 날씨는 흐림 입니다.

2023-05-05 12:00에 원주에서 날씨는 흐림 입니다.

2023-05-06 00:00에 원주에서 날씨는 흐림 입니다.

2023-05-06 12:00에 원주에서 날씨는 흐림 입니다.

2023-05-07 00:00에 원주에서 날씨는 흐림 입니다.

2023-05-07 12:00에 원주에서 날씨는 구름많음 입니다.

2023-05-08 00:00에 원주에서 날씨는 맑음 입니다.

2023-05-08 12:00에 원주에서 날씨는 맑음 입니다.

2023-05-09 00:00에 원주에서 날씨는 구름많음 입니다.

2023-05-10 00:00에 원주에서 날씨는 구름많음 입니다.

2023-05-11 00:00에 원주에서 날씨는 맑음 입니다.

2023-05-04 00:00에 철원에서 날씨는 구름많음 입니다.

2023-05-04 12:00에 철원에서 날씨는 흐림 입니다.

2023-05-05 00:00에 철원에서 날씨는 흐림 입니다.

2023-05-05 12:00에 철원에서 날씨는 흐림 입니다.

2023-05-06 00:00에 철원에서 날씨는 흐림 입니다.

2023-05-06 12:00에 철원에서 날씨는 흐림 입니다.

### 과제 5

'http://www.naver.com' 사이트에서 span 태그에 연결된 한글만을 불필요한 공백을 제거한후 출력하세요

In [51]:
url = 'http://www.naver.com'

data = requests.get(url)

soup = BeautifulSoup(data.text, 'html.parser')

span = soup.find_all('span')
span = ''.join(span.get_text() for span in span)
span = ''.join(re.findall(r'[가-힣]+', span))
print(span)

뉴스스탠드바로가기주제별캐스트바로가기타임스퀘어바로가기쇼핑캐스트바로가기로그인바로가기매일쓰는브라우저보안이걱정된다면안전하고빠른최신브라우저웨일로업데이트하세요매일쓰는브라우저보안이걱정된다면다운로드네이버쥬니어네이버해피빈검색한글입력기자동완성레이어삭제설정이초기화된다면도움말을확인해주세요설정이초기화된다면도움말을확인해주세요도움말도움말자동저장끄기자동저장끄기회로또당첨번호동행복권제공동행복권제공원원바로가기바로가기추가추가추가자세히보기도움말신고도움말신고자동완성끄기자동완성끄기쇼핑쇼핑영등포동가영등포동가리스트형썸네일형설정이전다음닫기닫기이전다음닫기닫기이전다음다음닫기닫기이전다음닫기닫기주제별로분류된다양한글모음개의글이전다음주일전살림허선생살림허선생주일전전원주택라이프전원주택라이프주일전응디응디주일전예진예진개월전주일전치코언니치코언니주일전소이쏘이소이쏘이주일전아잉맘아잉맘이전다음펀딩달성애니먼애니먼펀딩달성네이버웹툰가비지타임네이버웹툰가비지타임기부원기부위스타트위스타트펀딩달성위드마이위드마이펀딩달성분트분트기부원기부천리포수목원천리포수목원주일전르노베르노베주일전림림주일전월간전원속의내집월간전원속의내집주일전찰스퍼니처찰스퍼니처개월전리빙레시피리빙레시피개월전치즈순대치즈순대개월전두와나두와나주일전현대리바트현대리바트주일전러브쏭러브쏭주일전슈슈션션슈슈션션개월전다원다원주일전무더니무더니개월전아늑씨아늑씨주일전전원주택라이프전원주택라이프주일전주일전지아롬지아롬주일전얀듀리얀듀리개월전유난유난주일전랑캐랑캐주일전어나더제이어나더제이이전다음언론사헤드라인보기코로나바이러스감염증현황라이트모드로보기


### 과제 6

만든 과제 웹에 DOM 계층 구조를 3단계로 추가하여 작성하세요