In [1]:
!pip install selenium

Collecting selenium
  Downloading selenium-4.35.0-py3-none-any.whl.metadata (7.4 kB)
Collecting urllib3<3.0,>=2.5.0 (from urllib3[socks]<3.0,>=2.5.0->selenium)
  Downloading urllib3-2.5.0-py3-none-any.whl.metadata (6.5 kB)
Collecting trio~=0.30.0 (from selenium)
  Downloading trio-0.30.0-py3-none-any.whl.metadata (8.5 kB)
Collecting trio-websocket~=0.12.2 (from selenium)
  Downloading trio_websocket-0.12.2-py3-none-any.whl.metadata (5.1 kB)
Collecting certifi>=2025.6.15 (from selenium)
  Downloading certifi-2025.8.3-py3-none-any.whl.metadata (2.4 kB)
Collecting typing_extensions~=4.14.0 (from selenium)
  Downloading typing_extensions-4.14.1-py3-none-any.whl.metadata (3.0 kB)
Collecting sortedcontainers (from trio~=0.30.0->selenium)
  Using cached sortedcontainers-2.4.0-py2.py3-none-any.whl.metadata (10 kB)
Collecting outcome (from trio~=0.30.0->selenium)
  Using cached outcome-1.3.0.post0-py2.py3-none-any.whl.metadata (2.6 kB)
Collecting wsproto>=0.14 (from trio-websocket~=0.12.2->sele

---

# 1. selenium 준비

In [None]:
# 라이브러리 임포트
from time import sleep

from selenium import webdriver

# 크롬 드라이버 생성
driver = webdriver.Chrome()

# 사이트 접속하기
driver.get('https://codeit.kr')

# 5초 기다리기
sleep(5)


In [3]:
driver.quit()

---

# 2. selenium 으로 웹사이트 간단 제어

In [4]:
from time import sleep
from selenium import webdriver
from selenium.webdriver.common.by import By


In [None]:
driver = webdriver.Chrome()
driver.implicitly_wait(10)  # 최대 10초 기다리기
driver.get('https://workey.codeit.kr/costagram')
driver.find_element(by=By.CSS_SELECTOR, value='.top-nav__login-link').click() # 로그인 버튼 클릭
driver.find_element(by=By.CSS_SELECTOR, value='.login-container__login-input').send_keys('codeit') # 아이디 입력
driver.find_element(by=By.CSS_SELECTOR, value='.login-container__password-input').send_keys('datascience') # 비밀번호 입력
driver.find_element(by=By.CSS_SELECTOR, value='.login-container__login-button').click() # 로그인 버튼 클릭

- BeautifulSoup 은 html 직접 받음
- Selenium 은 웹 동적 접근이라 페이지 로딩 기다려야할 경우도 있음

- Wait 방식의 2가지
    - implicitly_wait : 설정 시간만큼 기다림 (설정 시간 전에, 원하는걸 찾으면 넘어가지만 그렇지 않으면 설정한 시간만큼 계속 시도됨)
        - 처음 한 번 설정하면 되고, 코드 전체에 적용됨
        - 웹 요소가 존재하는지 여부만 확인함 (버튼 노출-클릭 기능 불러오기 전이라 작동 안해도 모름)
    - sleep : 필요할때마다 사용 가능. 
    - Explicit_wait : 어떤 상태가 될 때까지 기다릴지 명시적으로 적용

In [6]:
# explicit_wait

from selenium.webdriver.support import expected_conditions as EC 
from selenium.webdriver.support.ui import WebDriverWait

driver = webdriver.Chrome()
wait = WebDriverWait(driver, 3)
driver.get('https://workey.codeit.kr/costagram')

# 로그인 버튼 클릭 가능할 때까지 최대 3초 기다리기
login_link = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, '.top-nav__login-link'))) 
# 클릭
login_link.click()

# visibility_of_element_located : 요소가 존재하고, 화면에 보여질 때까지 기다림
id_box = wait.until(EC.visibility_of_element_located((By.CSS_SELECTOR, '.login-container__login-input'))) 
id_box.send_keys('codeit')

pw_box = wait.until(EC.visibility_of_element_located((By.CSS_SELECTOR, '.login-container__password-input'))) 
pw_box.send_keys('datascience') # 비밀번호 입력

login_btn = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, '.login-container__login-button'))) 
# 클릭
login_btn.click()

sleep(5)
driver.quit()

- element_to_be_clickable(): 웹 요소가 클릭 가능한 상태일 때까지 기다림.
- visibility_of_element_located(): 웹 요소가 실제로 보일 때까지 기다림.
- text_to_be_present_in_element(): 웹 요소 안에 텍스트가 로딩될 때까지 기다림.
- invisibility_of_element_located(): 웹 요소가 안 보일 때까지 기다림.

---

### Action Chain

```
사용자의 마우스, 키보드 동작(action)을 사슬(chain)처럼 이어서 실행하는 것을 말해요.
액션 체인을 사용하면 우리가 배운 클릭, 키보드 입력뿐만이 아니라 더블 클릭, 드래그 등 사용자의 모든 마우스, 키보드 동작을 자동화할 수 있는데요.
특히 클릭, 키보드 입력 말고 다른 동작은 액션 체인이 꼭 필요합니다.
그리고 많은 동작을 한 번에 묶어서 실행할 수 있습니다.
사용자 동작 시나리오가 복잡해질 때 유용합니다.
```

- 한 줄의 코드에서, 꼬리에 꼬리를 무는 방식으로 연결하는 방식

In [None]:
from selenium.webdriver.common.action_chains import ActionChains

# 사용자 동작에 필요한 웹 요소들 찾기

(ActionChains(driver)
    # 사용자 액션 정의 
    .perform())


In [7]:
from time import sleep

from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By

driver = webdriver.Chrome()
driver.implicitly_wait(3)

driver.get('https://workey.codeit.kr/costagram/index')

# 로그인 링크 클릭
driver.find_element(by=By.CSS_SELECTOR, value='.top-nav__login-link').click()
sleep(1)

# 아이디 박스, 비밀번호 박스, 로그인 버튼 찾아 놓기
id_box = driver.find_element(by=By.CSS_SELECTOR, value='.login-container__login-input')
pw_box = driver.find_element(by=By.CSS_SELECTOR, value='.login-container__password-input')
login_button = driver.find_element(by=By.CSS_SELECTOR, value='.login-container__login-button')

# 액션 실행
(ActionChains(driver)
 .send_keys_to_element(id_box, 'codeit')
 .send_keys_to_element(pw_box, 'datascience')
 .click(login_button)
 .perform())

driver.quit()



- 하나의 액션은 한 줄로 만들어서 나열하는 방식

In [None]:
from selenium.webdriver.common.action_chains import ActionChains

# 사용자 동작에 필요한 웹 요소들 찾기

actions = ActionChains(driver)

# 사용자 액션 정의

actions.perform()


In [8]:
from time import sleep

from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By

driver = webdriver.Chrome()
driver.implicitly_wait(3)

driver.get('https://workey.codeit.kr/costagram/index')

# 로그인 링크 클릭
driver.find_element(by=By.CSS_SELECTOR, value='.top-nav__login-link').click()
sleep(1)

# 아이디 박스, 비밀번호 박스, 로그인 버튼 찾아 놓기
id_box = driver.find_element(by=By.CSS_SELECTOR, value='.login-container__login-input')
pw_box = driver.find_element(by=By.CSS_SELECTOR, value='.login-container__password-input')
login_button = driver.find_element(by=By.CSS_SELECTOR, value='.login-container__login-button')

# 액션 실행
actions = ActionChains(driver)
actions.send_keys_to_element(id_box, 'codeit')
actions.send_keys_to_element(pw_box, 'datascience')
actions.click(login_button)
actions.perform()

driver.quit()



- Action Chain 기능

In [None]:
# 클릭
.click(element=None) # element 생략시 현재 위치 클릭

# 오른쪽 클릭
.context_click(element=None) # element 생략시 현재 위치 클릭

# 더블 클릭
.doulble_click(element=None) # element 생략시 현재 위치 클릭

# 드래그 앤 드롭
.drag_and_drop(source, target) # source: 드래그할 요소, target: 드롭할 요소
# source를 target 위치로 드래그 앤 드롭
.drag_and_drop_by_offset(source, xoffset, yoffset) # source: 드래그할 요소, xoffset: x축 이동 거리, yoffset: y축 이동 거리


# 마우스 이동
.move_to_element(element) # element 웹 요소까지 마우스 움직임

# 키보드 입력
.send_keys(keys) # 현재 위치에 키보드 입력
.send_keys_to_element(element, keys) # element 위치에 키보드 입력

# 동작 중지
.pause(seconds) # seconds 초 만큼 동작 중지
# action Chain 에서 동작 중간에 잠시 멈추고 싶을 때 사용 (sleep 대신 pause 사용)



---

| Beautiful Soup | Selenium |
| :--- | :--- |
| `soup.select_one()` | `driver.find_element()` |
| `soup.select()` | `driver.find_elements()` |
| `Tag` | `WebElement` |
| `tag.select()` | `web_element.find_elements()` |
| `tag.get_text()` | `web_element.text` |
| `tag.strings` | - |
| `tag.stripped_strings` | - |
| `tag['attr']` | `web_element.get_attribute('attr')` |

- selenium으로 JavaScript 사용하기

In [None]:
driver = webdriver.Chrome()
driver.implicitly_wait(3)

driver.get('https://workey.codeit.kr/costagram/index')
sleep(3)

driver.execute_script('window,scrollTo(0,200);') # 200px 만큼 스크롤 내리기
scroll_height = driver.execute_script('return document.body.scrollHeight') # 현재 문서의 총 높이 구하기
print(scroll_height)

# 현재 scrollHeight 가져오기
last_height = driver.execute_script('return document.body.scrollHeight')

while True :
    # scrollHeight 만큼 스크롤 내리기
    driver.execute_script('window.scrollTo(0, document.body.scrollHeight);')
    
    # 새로운 내용 로딩때까지 기다림
    sleep(0.5)
    
    # 새로운 내용 로딩됐는지 확인
    new_height = driver.execute_script('return document.body.scrollHeight')
    if new_height == last_height :
        break
    last_height = new_height

sleep(5)
driver.quit()