## 웹크롤링 - BeautifulSoup
(Visual Studio Code에서 실행)

- 공식페이지 : https://www.crummy.com/software/BeautifulSoup/
- 참고 : https://wikidocs.net/198942

### 1.라이브러리 설치

In [4]:
!pip install requests



In [1]:
!pip install beautifulsoup4



In [2]:
import bs4 
bs4.__version__

'4.11.2'

### 2.BeautifulSoup 사용

#### [예제] Text 제목 정보 1개 가져오기 in (정적인 페이지)

In [6]:
import requests
from bs4 import BeautifulSoup

url = 'https://search.naver.com/search.naver?where=view&sm=tab_jum&query=10%EC%9B%94+%EC%A0%9C%EC%A3%BC'
print(url)

response = requests.get(url)

if response.status_code == 200:
    html = response.text
    soup = BeautifulSoup(html, 'html.parser')
    title = soup.select_one('#main_pack > section > more-contents > div > ul > li:nth-child(1) > div > div.detail_box > div.title_area > a')
    print(title)
    print(title.get_text())
else : 
    print(response.status_code)
print('----------')

https://search.naver.com/search.naver?where=view&sm=tab_jum&query=10%EC%9B%94+%EC%A0%9C%EC%A3%BC
<a class="title_link _cross_trigger" data-cr-gdid="90000003_0000000000000033F92070A2" href="https://blog.naver.com/kayak71/223222984866" onclick="return goOtherCR(this, 'a=rvw*w.link&amp;r=1&amp;i=90000003_0000000000000033F92070A2&amp;u='+urlencode(this.href))" target="_blank"><mark>10월 제주</mark>도 가볼만한곳 : 제주 서귀포 치유의 숲 예약</a>
10월 제주도 가볼만한곳 : 제주 서귀포 치유의 숲 예약
----------


#### [예제] Text 정보 여러 개 가져오기 in (정적인 페이지)

In [7]:
import requests
from bs4 import BeautifulSoup

print('페이지 정보 추출하기-----')
url = 'https://search.naver.com/search.naver?where=view&sm=tab_jum&query=10%EC%9B%94+%EC%A0%9C%EC%A3%BC'
print(url)

response = requests.get(url)

t_list, d_list, link_list = [], [], []
if response.status_code == 200:
    html = response.text
    soup = BeautifulSoup(html, 'html.parser')
    ul = soup.select_one('ul.lst_view._list_base') #공백에 있을 경우 . 사용
    # 제목, 링크
    titles = ul.select('li > div > div > div.title_area > a')
    for title in titles: 
        t_list.append(title.get_text())
        link_list.append(title.attrs['href'])
#         print(title.get_text())        
    # 상세 설명
    titles = ul.select('li > div > div > div.dsc_area > a')
    for title in titles: 
        d_list.append(title.get_text())  
else : 
    print(response.status_code)
print('페이지 정보 추출완료-----')
t_list, d_list, link_list

페이지 정보 추출하기-----
https://search.naver.com/search.naver?where=view&sm=tab_jum&query=10%EC%9B%94+%EC%A0%9C%EC%A3%BC
페이지 정보 추출완료-----


(['10월 제주도 가볼만한곳 : 제주 서귀포 치유의 숲 예약',
  '제주여행 제주동쪽 10월 가볼만한곳 명소 풍경들',
  '10월 제주도 여행지 추천 제주 표선 가볼만한곳 제주민속촌 입장료',
  '10월 제주도 여행 제주 산굼부리 억새 제주도 명소 추천 코스',
  '10월 제주여행 꽃 구경 할만한 제주도 핑크뮬리 카페 마노르블랑',
  '10월 제주여행 인생사진찍기좋은곳 휴애리 핑크뮬리 제주도 숨은명소',
  '제주 해바라기 축제 명소 제주도 10월 가을 축제',
  '10월 제주여행 2박 3일 추천 코스',
  '10월 제주여행 김포공항 국내선 탑승기',
  '10월 제주도 여행 추천 제주 여행 코스',
  '10월 제주도 여행 제주 오라동 메밀밭 메밀꽃 포토존',
  '10월 제주 가볼 만한 곳 이색 볼거리 가득한 제26회 제주 탐라문화제',
  '[10월 제주여행]숙소_그랜드하얏트 제주',
  '가을 제주 단풍명소 10월 중순부터 11월 말까지 저는 여기 다녀와요',
  '[10월 제주] 제주돌문화공원',
  '10월 제주 가을여행 휴애리 자연생활공원 제주도 핑크뮬리 축제',
  '10월 제주도 여행 제주 핑크뮬리 명소 가볼만한곳 새미동산',
  '10월 제주여행 카페 글렌코 제주도 핑크뮬리 시기 옷차림 날씨',
  '제주도 억새 명소 어음리억새군락지 제주 서쪽 아이랑 10월 11월',
  '10월 중순 제주',
  '10월 제주도 서핑 가능할까요?',
  '9월 10월 제주 가볼만한곳 한적한 여행코스 서부농업기술센터',
  '10월 가볼만한곳 제주도 억새 새별오름 제주 서쪽 오름',
  '제주도 가을여행, 10월 제주 가볼만한곳 BEST 5 추천!',
  '10월 제주는 억새와 핑크뮬리 천지 ~',
  '10월 제주도 여행 제주시 가볼만한곳 제주공항 근처 관광지 볼거리',
  '제주공항근처 가볼만한곳 관광지 10월 11월 제주도 여행',
  '10월 야놀자 제주 항공권 최대 12만원 할인받기',
  '10월 여행지 제주 새별 오름 제주도 억새 

In [8]:
import pandas as pd

data = {'title': t_list, 'desc':d_list,'link':link_list}
df = pd.DataFrame(data)
df

Unnamed: 0,title,desc,link
0,10월 제주도 가볼만한곳 : 제주 서귀포 치유의 숲 예약,돌아가는길 10월 제주도 가볼만한곳 서귀포 치유의숲 오르는길 흐렸다면 돌아갈때는 맑...,https://blog.naver.com/kayak71/223222984866
1,제주여행 제주동쪽 10월 가볼만한곳 명소 풍경들,풍경도 아름답다 하니 10월 해 질 무렵 찾아가면 노을빛에 물든 황홀한 은빛 물결 ...,https://blog.naver.com/ka8564/223230868738
2,10월 제주도 여행지 추천 제주 표선 가볼만한곳 제주민속촌 입장료,대표적인 제주 표선 가볼만한곳으로 10월 제주도 여행지로도 추천하는 곳입니다. 가을...,https://blog.naver.com/overroad89/223224371702
3,10월 제주도 여행 제주 산굼부리 억새 제주도 명소 추천 코스,"10월 제주도 여행 제주 산굼부리 억세 제주도 명소 추천 코스 글, 사진 : 그루터...",https://blog.naver.com/hloveh01/223241505536
4,10월 제주여행 꽃 구경 할만한 제주도 핑크뮬리 카페 마노르블랑,넓어서 10월 제주여행 코스로 손색이 없었죠 게다가 돌담과 이렇게 잘 어울려도 되나...,https://blog.naver.com/grandtheft3/223224941585
5,10월 제주여행 인생사진찍기좋은곳 휴애리 핑크뮬리 제주도 숨은명소,10월 제주여행 제주 인생사진 찍기좋은곳 휴애리 핑크뮬리 10월 첫날 추석 연휴를 ...,https://blog.naver.com/h100489/223231967760
6,제주 해바라기 축제 명소 제주도 10월 가을 축제,10월 31일까지 입장료 없이 편하게 갈 수 있으니 근처 관광지 오면서 들러보면 좋...,https://blog.naver.com/fabrunch/223233646956
7,10월 제주여행 2박 3일 추천 코스,"지금 10월, 11월 팸투어 모집하고 있으니 신청해 보세요~ https://form...",https://blog.naver.com/coolestlove/223225600726
8,10월 제주여행 김포공항 국내선 탑승기,제주 핑크뮬리와 억새를 봐야 한다는 서여니로 인해 계획에 없는 10월 제주여행을 가...,https://perfume700.tistory.com/5437
9,10월 제주도 여행 추천 제주 여행 코스,들판을 만들어 놓은 곳에는 멋진 포토존도 만들어 놓아 제주도 사진 명소로 인기가 좋...,https://blog.naver.com/hnmh2332/223225151538
