## [ CSS Selector 사용법 ]
   
- <b>`select()`</b> 안에 태그 또는 CSS class 이름 등을 넣어주면 된다.


- <b>`select()`</b> 에서는 
    - class 앞에 <b>`.`</b>
    - id 앞에 <b>`#`</b>을 붙여준다.
    
    
- 태그와 클래스, 클래스와 클래스는 <b>`.`</b>으로 연결한다.


- <b>`select()`</b>는 <b>`find_all()`</b>과 동일하게 list형태로 값을 반환한다.


- select 사용 예제
    - tag 이름으로 선택  
    ```python
    select('a')
    ```
        
    - tag + class 이름으로 선택
    ```python
    select('h3.tit_view')
    ```
    - tag + class 여러개가 한 줄에 있을 경우
    ```python
    select('div.ah_roll_area.PM_CL_realtime')
    ```
    - class 이름만 선택
    ```python
    select('.tit_view')
    ```
    - id 로만 선택
    ```python
    select('#video-title')
    ```
    - class, id 를 복합 선택
    ```python
    select('div.tit_view div#link_txt')
    ```
    - 상위, 하위 태그를 한꺼번에 선택
    ```python
    select('html head title')
    select('html>head>title')
    ```
    
- TIP! 크롬 개발자 모드에서 Copy Selector로 추측가능

---
### (1) 예제1 ( 태그 가져오기 )

In [3]:
import requests
from bs4 import BeautifulSoup

url = 'https://news.naver.com/main/read.nhn?mode=LSD&mid=shm&sid1=105&oid=011&aid=0003789378'

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}

res = requests.get(url, headers = headers)
soup = BeautifulSoup(res.content, 'html.parser')

# h3_find = soup.find(id = 'articleTitle')

h3_select = soup.select('h3#articleTitle')
for item in h3_select:
    print(item.get_text())

갤럭시Z폴드2, 9월1일 펴진다


---
### (2) 예제 2 ( 하위 태그 선택 )

In [56]:
import requests
from bs4 import BeautifulSoup

url = 'https://news.naver.com/main/read.nhn?mode=LSD&mid=shm&sid1=105&oid=011&aid=0003789378'

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}

res = requests.get(url, headers = headers)
soup = BeautifulSoup(res.content, 'html.parser')

title_select = soup.select('html  head  title')

for item in title_select:
    print(item.get_text())

갤럭시Z폴드2, 9월1일 펴진다 : 네이버 뉴스


- 또한, html > ... > title, 즉 html에서 title 태그까지의 과정을 생략해도 정상적으로 출력된다.


- 아래 예시는 html 태그와 title 태그의 중간 과정인 head 태그를 생략해서 작성한 경우다. 

In [11]:
title_select = soup.select('html title')

for item in title_select:
    print(item.get_text())

갤럭시Z폴드2, 9월1일 펴진다 : 네이버 뉴스


- 하지만, <b>`>`</b>(꺽쇠) 기호를 이용하여 하위 태그를 표시하는 경우, 생략이 불가능하다.<br>따라서, 위의 예시처럼 과정 생략이 불가능하다.


- 위의 예시에서 <b>`>`</b>을 이용하여 과정생략을 나타낼 경우 아무것도 출력되지 않는다.

In [12]:
title_select = soup.select('html > title')

for item in title_select:
    print(item.get_text())

---
### (3) 예제 3 ( 특정 class 를 가진 내용만 가져오기 )

In [61]:
title_select = soup.select('.tx')

for item in title_select:
    print(item.get_text())

뉴스홈
속보
정치
경제
사회
생활/문화
세계
IT/과학
오피니언
포토
TV
랭킹뉴스
검색


### (4) 예제 4 ( 특정 id 를 가진 내용만 가져오기 )

In [102]:
title_select = soup.select('#articleTitle')

for item in title_select:
    print(item.get_text())

### (5) find -> select로 변환

In [111]:
import requests
from bs4 import BeautifulSoup

url = 'https://datalab.naver.com/keyword/realtimeList.naver?where=main'

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}


res = requests.get(url, headers = headers)
soup = BeautifulSoup(res.content, 'html.parser')

# 보통은 상위 태그를 find로 먼저 가져와서 전체적인 코드를 먼저 확인하는편이다.
li = soup.find_all('li', 'ranking_item')


for item in li:
        rank = item.find('span', 'item_num')
        title = item.find('span', 'item_title')
        print(rank.get_text()+'위 :'+ title.get_text())
    

#content > div > div.selection_area > div.selection_content > div.field_list > div > div > ul:nth-child(1) > li:nth-child(1) > div > span.item_title_wrap > span.item_title

1위 :블랙팬서
2위 :채드윅 보스만
3위 :블랙팬서 사망
4위 :채드윅 보스만 사망
5위 :이도진
6위 :블랙팬서2
7위 :네이버 스마트주문
8위 :이제마스터디카페
9위 :드라마 앨리스
10위 :산다라박
11위 :와칸다 포에버
12위 :이낙연
13위 :한성관
14위 :이낙연 관련주
15위 :변성남
16위 :원더풀 고스트
17위 :신국
18위 :이호철
19위 :최란
20위 :창원 한성관


In [112]:
import requests
from bs4 import BeautifulSoup

url = 'https://datalab.naver.com/keyword/realtimeList.naver?where=main'

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}


res = requests.get(url, headers = headers)
soup = BeautifulSoup(res.content, 'html.parser')

# li = soup.select('li.ranking_item')
#
#
# for item in li:
#        rank = item.select('span.item_num')
#        title = item.select('span.item_title')
#        print(rank[0].get_text()+'위 :'+ title[0].get_text())


for item in soup.select('li.ranking_item'):
       rank = item.select('span.item_num')
       title = item.select('span.item_title')
       print(rank[0].get_text()+'위 :'+ title[0].get_text())

1위 :블랙팬서
2위 :채드윅 보스만
3위 :블랙팬서 사망
4위 :채드윅 보스만 사망
5위 :이도진
6위 :블랙팬서2
7위 :네이버 스마트주문
8위 :이제마스터디카페
9위 :드라마 앨리스
10위 :와칸다 포에버
11위 :산다라박
12위 :이낙연
13위 :더불어민주당 당대표
14위 :이낙연 관련주
15위 :변성남
16위 :원더풀 고스트
17위 :신국
18위 :한성관
19위 :앨리스
20위 :이호철
