# CSS Selector

*  준비: web03.html 파일을 CWD(Current Working Directory)에 업로드

In [1]:
from bs4 import BeautifulSoup

```
BeautifulSoup.select('selector')
```

* CSS Selector
    * `tag_name`
    * `.class_name`
    * `#id_name`
    * `selector:pseudo_selector`
    * `selector1, selector2, ...`
    * `ancestor descendent`
    * `parent > child`

In [2]:
html = open(file='web03.html', mode='r')

In [3]:
soup = BeautifulSoup(markup=html, features='html5lib')

HTML 태그가 div인 element를 모두 찾음

In [4]:
soup.select('div')

[<div class="c1">여기는 c1 클래스입니다.</div>,
 <div class="c1">여기도 c1 클래스입니다.</div>,
 <div class="c2">여기는 c2 클래스입니다.</div>,
 <div class="c2" id="id1">여기는 c2 클래스, 아이디는 id1입니다.</div>]

HTML 태그가 a인 element들을 모두 찾음

In [5]:
soup.select('a')

[<a href="https://www.daum.net/">다음</a>,
 <a href="https://www.naver.com/">네이버</a>,
 <a href="https://www.google.com/">구글</a>]

HTML 태그가 h1인 모든 element들을 찾음

In [7]:
soup.select('h1')

[<h1>CSS(Cascade Style Sheet)</h1>]

# Class Selector

class = 'menu_item'인 element들을 모두 찾음

In [9]:
items = soup.select('.menu_item')
for i, x in enumerate(items):
    print(f'---{i}---')
    print(x)

---0---
<li class="menu_item">  <!-- list item -->
            <a href="https://www.daum.net/">다음</a>
        </li>
---1---
<li class="menu_item">  <!-- list item -->
            <a href="https://www.naver.com/">네이버</a>
        </li>
---2---
<li class="menu_item">  <!-- list item -->
            <a href="https://www.google.com/">구글</a>
        </li>


class='c1'인 element들을 모두 찾음

In [10]:
soup.select('.c1')

[<div class="c1">여기는 c1 클래스입니다.</div>, <div class="c1">여기도 c1 클래스입니다.</div>]

class='c2'인 element들을 모두 찾음

In [11]:
soup.select('.c2')

[<div class="c2">여기는 c2 클래스입니다.</div>,
 <div class="c2" id="id1">여기는 c2 클래스, 아이디는 id1입니다.</div>]

# ID Selector

id='id1'인 element들을 모두 찾음

In [12]:
soup.select('#id1')

[<div class="c2" id="id1">여기는 c2 클래스, 아이디는 id1입니다.</div>]

# 여러 요소를 함께 선택

class='c1' 또는 class='c2'인 element들을 모두 선택

In [13]:
soup.select('.c1, c2')

[<div class="c1">여기는 c1 클래스입니다.</div>, <div class="c1">여기도 c1 클래스입니다.</div>]

class='c1' 또는 id='id1'인 element들을 모두 선택

In [14]:
soup.select('.c1, #id1')

[<div class="c1">여기는 c1 클래스입니다.</div>,
 <div class="c1">여기도 c1 클래스입니다.</div>,
 <div class="c2" id="id1">여기는 c2 클래스, 아이디는 id1입니다.</div>]

# Traversing

# 조상(ancestor) element 아래의 자손(descendent) element를 선택

class='menu'인 element의 자손들 중에서 a 태그 element를 선택

In [15]:
soup.select('.menu a')

[<a href="https://www.daum.net/">다음</a>,
 <a href="https://www.naver.com/">네이버</a>,
 <a href="https://www.google.com/">구글</a>]

### 부모(parent) element 바로 아래의 자식(child) element를 선택

class='menu' element의 바로 아래의 class='menu_item' element의 바로 아래에 있는 a 태그 element를 선택

In [16]:
soup.select('.menu > .menu_item > a')

[<a href="https://www.daum.net/">다음</a>,
 <a href="https://www.naver.com/">네이버</a>,
 <a href="https://www.google.com/">구글</a>]

# Pseudo Selector

In [32]:
soup.select('a')

[<a href="https://www.daum.net/">다음</a>,
 <a href="https://www.naver.com/">네이버</a>,
 <a href="https://www.google.com/">구글</a>]

In [34]:
soup.select('a:nth-of-type(3)')

[<a href="https://www.google.com/">구글</a>]

## Tag.Class

## Tag#ID

In [35]:
soup.select('div')

[<div class="c1">여기는 c1 클래스입니다.</div>,
 <div class="c1">여기도 c1 클래스입니다.</div>,
 <div class="c2">여기는 c2 클래스입니다.</div>,
 <div class="c2" id="id1">여기는 c2 클래스, 아이디는 id1입니다.</div>]

tag name='div'이고, class='c1'인 element들을 선택

In [36]:
soup.select('div.c1')

[<div class="c1">여기는 c1 클래스입니다.</div>, <div class="c1">여기도 c1 클래스입니다.</div>]

비교

In [38]:
soup.select('div .c1')   # ancestor_selector descendent_selector

[]

tag name='div'이고, id='id1'인 element들을 선택

In [39]:
soup.select('div#id1')

[<div class="c2" id="id1">여기는 c2 클래스, 아이디는 id1입니다.</div>]

In [40]:
soup.select('div #id1')

[]

In [41]:
html.close()