In [None]:
import selenium

### Selenium vs. BeautifulSoup
- 둘 다 웹 스크래핑을 위한 파이썬 라이브러리입니다. 그러나 이들은 목적과 사용 방법이 다릅니다.
- BeautifulSoup: 웹 페이지의 HTML 코드를 파싱하고 분석하여 원하는 데이터를 추출하는 데 사용됩니다. HTML 코드를 처리하는데 최적화되어 있으며, 정적인 웹 페이지에서 사용됩니다.
- Selenium: 웹 브라우저를 자동화하고 웹 페이지 상호작용을 자동화하는 데 사용됩니다. JavaScript와 같은 동적 웹 페이지에서 데이터를 추출하고 자동화된 테스트를 실행하는 데 적합합니다.
-  웹 페이지가 정적이라면 BeautifulSoup을 사용하여 HTML 코드에서 데이터를 추출하는 것이 좋고, 웹 페이지가 동적이라면 Selenium을 사용하여 웹 페이지를 자동으로 제어하고 데이터를 추출하는 것이 좋습니다. 
- 또한 두 라이브러리는 서로 보완적으로 사용될 수 있습니다. 예를 들어 Selenium으로 웹 페이지를 열고, BeautifulSoup으로 데이터를 추출할 수 있습니다.

### Selenium
Selenium의 다양한 함수와 기능을 이용하여 웹 브라우저를 자동화하고 웹 페이지 상호작용을 자동화할 수 있습니다. 예를 들어, webdriver 모듈로 웹 드라이버를 생성한 후, get() 메서드로 웹 페이지를 로드하고, find_element_by_*() 함수로 HTML 요소를 찾아 click() 메서드로 클릭 이벤트를 발생시키거나, send_keys() 메서드로 입력 이벤트를 발생시키는 등의 작업을 수행할 수 있습니다.

selenium 모듈
- 웹 어플리케이션 테스트를 위한 프레임워크 : 홈페이지 테스트용으로 사용
- 사용자가 아닌 프로그램이 웹 브라우저를 제어할 수 있도록 지원
- 웹 브라우저마다 클라이언트 프로그램(Web Driver)이 별도로 필요(웹 브라우저 <-> 프로그램간 통신 목적)
- 크롤링 보다는 웹을 제어하는 목적이 더 큼
- pip install selenium
- web driver 설치(크롬 버전 확인) : https://chromedriver.chromium.org/downloads
- 압축 해제한 후 chromedriver.exe를 적당한 경로로 이동
- selenium 모듈 호출 후 설치한 web driver 경로를 지정

이벤트로 제어하기 : 브라우저를 직접 제어하기 때문에 직접 컨트롤하여 마우스 클릭, 키보드 입력, 자바 스크립트 이벤트 처리 가능
- 마우스 클릭 : click()
- 키보드 입력 : send_keys()
- 자바스크립트 코드 실행 : execute_script()
- 다양한 창 및 프레임을 제어 : switch_to
- 입력 양식 전송 : submit()
- 스크린샷 : screenshot(파일이름)
- 글자 지움 : clear()
- 뒤로 가기 : back()
- 앞으로 가기 : forward()

셀레니움 함수


- find_element_by_id: id 속성을 사용하여 접근
- find_element(s)_by_class_name: 클래스를 사용하여 접근
- find_element(s)_by_name: name 속성을 사용하여 접근
- find_element(s)_by_xpath: xpath 속성을 사용하여 접근
- find_element(s)_by_link_text: 앵커태그(a 태그)에 사용되는 텍스트로 접근 
- find_element(s)_by_partial_link_text: 앵커태그(a 태그)에 사용되는 일부 텍스트로 접근
- find_element(s)_by_tag_name: 태그를 사용하여 접근
- find_element(s)_by_css_selector: CSS 선택자를 사용하여 접근<br><br>
셀레니움 사용법 : https://greeksharifa.github.io/references/2020/10/30/python-selenium-usage/

#### 셀레니움 변경 - 버전4 메서드

- https://goodthings4me.tistory.com/696

- from selenium.webdriver.common.by import By : By 모듈은 요소를 찾을 때 사용되는 방법을 정의
- driver.find_element(By.CLASS_NAME, " ") : class 속성이 " "인 요소를 찾음
- driver.find_element(By.ID, " ")
- driver.find_element(By.CSS_SELECTOR, " ")
- driver.find_element(By.LINK_TEXT, " ")
- driver.find_element(By.NAME, " ")
- driver.find_element(By.PARTIAL_LINK_TEXT, " ")
- driver.find_element(By.TAG_NAME, " ")
- driver.find_element(By.XPATH, " ")
- driver.find_elements(By.CLASS_NAME, " ")
- driver.find_elements(By.ID, " ")
- driver.find_elements(By.CSS_SELECTOR, " ")
- driver.find_elements(By.LINK_TEXT, " ")
- driver.find_elements(By.NAME, " ")
- driver.find_elements(By.PARTIAL_LINK_TEXT, " ")
- driver.find_elements(By.TAG_NAME, " ")
- driver.find_elements(By.XPATH, " ")

In [16]:
# selenium 설치하기

# !pip install selenium
# !pip install selenium==4.3.0
!pip install selenium



In [4]:
# web driver 설치하기
# https://chromedriver.chromium.org/downloads

In [62]:
import selenium    # 웹 어플리케이션 테스트를 위한 프레임워크
print(selenium.__file__)

C:\app\lib\site-packages\selenium\__init__.py


In [None]:
from selenium import webdriver
from selenium import webdriver as wd

import selenium -> 이 패키지 안에 여러 모듈이 있는데, webdriver도 그 중 하나, 명시를 안해주면, 이것만으로는 webdriver 못 씀

In [5]:
# 네이버 사이트 불러오기

from selenium import webdriver    # 웹 브라우저를 제어할 수 있게 해주는 클래스

url = 'https://naver.com'
path = 'c:/tool/chromedriver.exe'
driver = webdriver.Chrome(path)    # webdriver 모듈의 Chrome() 클래스 -> 웹 브라우저 제어 위한 WebDriver 객체 생성함
driver.get(url)

  driver = webdriver.Chrome(path)    # webdriver 모듈의 Chrome() 클래스 -> 웹 브라우저 제어 위한 WebDriver 객체 생성함


In [6]:
webdriver.Chrome('c:/tool/chromedriver.exe').get('https://naver.com')

  webdriver.Chrome('c:/tool/chromedriver.exe').get('https://naver.com')


In [59]:
print(driver.current_url)

https://www.naver.com/


In [64]:
driver.close()

In [65]:
# 브라우저 창을 띄우지 않고 수행

options = webdriver.ChromeOptions()
# options.add_argument('start-maximized')
options.add_argument('headless')    # 크롬 브라우저가 시작될 때 사용할 옵션 설정 / 브라우저 창 표시하지 않고 브라우저 실행
driver = webdriver.Chrome('c:/tool/chromedriver.exe', options=options)
driver.get('https://google.com')
print(driver.current_url)
driver.close()

  driver = webdriver.Chrome('c:/tool/chromedriver.exe', options=options)


https://www.google.com/


In [68]:
type(options)

selenium.webdriver.chrome.options.Options

In [7]:
# 브라우저 최소화/최대화

from selenium import webdriver

driver = webdriver.Chrome('c:/tool/chromedriver.exe')
driver.get('https://www.google.com')
driver.minimize_window()
driver.maximize_window()

  driver = webdriver.Chrome('c:/tool/chromedriver.exe')


- driver.close() : 단일 창 또는 탭을 닫을 때 사용
- driver.quit() : WebDriver 세션을 종료할 때 사용 (쉽게, 메모리와 CPU 반환)
- 다른 세션을 시작하기 위해서는 quit을 호출해야 함

In [127]:
# Implicit Waits(암묵적 대기) : 찾으려는 element가 로드될 때까지 지정한 시간만큼 대기할 수 있도록 설정

from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

driver = webdriver.Chrome('c:/tool/chromedriver.exe')
driver.get(url='https://www.google.com')

try:
    element = WebDriverWait(driver,5).until(                       # 최대 대기 시간임
    EC.presence_of_element_located((By.CLASS_NAME, 'gLFyf'))
    )
finally:
    pass

  driver = webdriver.Chrome('c:/tool/chromedriver.exe')


driver.implicitly_wait(time_to_wait=5) 메서드는 Selenium WebDriver의 대기 기능 중 하나입니다. 이 메서드는 Selenium WebDriver에서 자주 사용되며, 일정한 시간 동안 웹 요소를 찾을 때마다 자동으로 대기하는 기능을 제공합니다.

예를 들어, driver.find_element(By.ID, 'myId')와 같은 메서드를 호출할 때, Selenium WebDriver는 지정된 ID가 있는지 확인하기 위해 웹 페이지를 검색합니다. 그러나 이 ID가 웹 페이지에 아직 표시되지 않았을 수도 있습니다. 이 경우, Selenium WebDriver는 해당 ID를 찾을 때까지 기다린 후에 에러를 반환합니다.

In [35]:
from time import sleep
import selenium
from selenium import webdriver
from selenium.webdriver.common.keys import Keys    # 키보드 입력을 처리하는 클래스와 메소드를 제공 (Key.RETURN 등)

options = webdriver.ChromeOptions()
options.add_argument('window_size=1920,1080')

driver = webdriver.Chrome('c:/tool/chromedriver.exe', options=options)
driver.maximize_window()
driver.implicitly_wait(time_to_wait=5)

driver.get(url='https://google.com')
driver.quit()

  driver = webdriver.Chrome('c:/tool/chromedriver.exe', options=options)


파이썬으로 Selenium 웹 자동화 라이브러리를 이용하여 크롬 브라우저를 조작하고, 구글에서 '빅테이터'라는 검색어로 검색

In [37]:
# By.NAME

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By

# 크롬 드라이버를 로드합니다.
driver = webdriver.Chrome('c:/tool/chromedriver.exe')

# 구글 겁색창으로 이동합니다.
driver.get('https://www.google.com/')

# 검색어 입력 요소를 찾아서 검색어를 입력합니다.
search_box = driver.find_element(By.NAME, 'q')

# 검색창에 '빅데이터'라는 검색어를 입력
search_box.send_keys('빅데이터')

# 검색어 입력 요소에서 Enter 키를 입력합니다.
search_box.send_keys(Keys.ENTER)

# 브라우저 세션을 종료합니다.
driver.quit()

  driver = webdriver.Chrome('c:/tool/chromedriver.exe')


In [40]:
# By.ID

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By

# 크롬 드라이버를 로드합니다.
driver = webdriver.Chrome('c:/tool/chromedriver.exe')

# 네이버 검색 페이지로 이동합니다.
driver.get('https://www.naver.com')

# 감색창을 찾아서 검색어를 입력합니다.
search_box = driver.find_element(By.ID, 'query')
search_box.send_keys('빅데이터')

# 검색어를 입력하고 검색을 실행합니다.
search_box.send_keys(Keys.RETURN)

# 검색 결과 페이지가 로드될 때까지 3초간 대기합니다.
driver.implicitly_wait(3)

# 웹 드라이버를 종료합니다.
driver.quit()

  driver = webdriver.Chrome('c:/tool/chromedriver.exe')


In [45]:
driver = webdriver.Chrome('c:/tool/chromedriver.exe')

driver.get('https://daum.net')

search_box = driver.find_element(By.ID, 'q')
search_box.send_keys('빅데이터')
search_box.send_keys(Keys.RETURN)

driver.implicitly_wait(3)

driver.quit()

  driver = webdriver.Chrome('c:/tool/chromedriver.exe')


In [51]:
with open('test1.txt', 'w') as f:
    f.write('test1')

In [52]:
# XPATH

driver = webdriver.Chrome('c:/tool/chromedriver.exe')

driver.get('https://daum.net')

search_box = driver.find_element(By.ID, 'q')
search_box.send_keys('빅데이터')
search_box.send_keys(Keys.RETURN)

elements = driver.find_elements(By.XPATH, '//*[@id="twaColl"]/div/c-container/c-card/div/c-doc-web/div/div/c-contents-desc/p/a')

for element in elements:
    print(element.text)
    print(element.text, file=open('test1.txt', 'a', encoding='utf-8'))


sleep(3)
driver.close()

  driver = webdriver.Chrome('c:/tool/chromedriver.exe')


빅데이터(big data)란 복잡하고 다양한 대규모 데이터세트 자체는 물론 이 데이터세트로부터 정보를 추출하고 결과를 분석하여 더 큰 가치를 창출하는 기술을 뜻한다. 수치 데이터 등 기존의 정형화된 정보뿐 아니라 텍스트 ・ 이미지 ・ 오디오 ・ 로그기...
거기에 더해 단순한 문자 데이터에서 벗어나 녹음, 사진, 동영상 등 데이터의 종류가 다양해지고 데이터의 용량 자체도 큰 폭으로 늘어났다. 이런 빅 데이터는 기존의 기술이나 도구로는 원활한 수집과 처리가 불가능할 정도로 성질이 달라졌으므로 빅 데이터에서 유용한 정보를 추합하거나 가치를 뽑아내기 위해서 고안...


#### 과제2._0502.
구글에서 '빅데이터'라는 검색어로 검색한 후 검색 결과를 가져와서 출력하고 파일로 저장
- 네이버에서 홈페이지에서 원하는 내용을 조회해서 그 결과물을 출력하고 파일에 저장

In [259]:
driver = webdriver.Chrome('c:/tool/chromedriver.exe')

driver.get('https://www.google.com')

search_box = driver.find_element(By.ID, 'APjFqb')
search_box.send_keys('빅데이터')
search_box.send_keys(Keys.RETURN)    # click() 대신 사용

elements = driver.find_elements(By.XPATH, '//*[@id="Odp5De"]/div/div[1]/div/div[1]/block-component/div/div[1]/div/div/div/div/div[1]/div/div/div/div/div[1]/div')

for element in elements:
    print(element.text)
    print(element.text, file=open('test1.txt', 'a', encoding='utf-8'))


sleep(3)
driver.close()

  driver = webdriver.Chrome('c:/tool/chromedriver.exe')


빅데이터는 단지 데이터 양 때문이 아니라 특성의 다양성과 복잡성으로 인해 "빅"으로 정의됩니다. 일반적으로 빅데이터는 데이터를 수집, 관리, 처리하는 기존 데이터베이스의 용량을 초과합니다. 또한 빅데이터는 디지털로 모니터링할 수 있는 전 세계의 모든 사물과 장소에서 생성될 수 있습니다.


In [406]:
driver = webdriver.Chrome('c:/tool/chromedriver.exe')

driver.get('https://www.naver.com')

search_box = driver.find_element(By.ID, 'query')
search_box.send_keys('인공지능 킬러 로봇')
search_box.send_keys(Keys.RETURN)

print(driver.find_element(By.XPATH, '//*[@id="sp_nws_all4"]/div/div/a').text)
print(driver.find_element(By.XPATH, '//*[@id="sp_nws_all4"]/div/div/a').text, file=open('test1.txt', 'a', encoding='utf-8'))

  driver = webdriver.Chrome('c:/tool/chromedriver.exe')


구글 떠난 AI 대부 “내 일생 후회한다…킬러로봇 탄생할 수도”


In [None]:
# 현재 웹페이지의 소스 코드를 문자열로 반환

driver.page_source

In [None]:
# 위의 내용 ID로 해보기

driver = webdriver.Chrome('c:/tool/chromedriver.exe')

driver.get('https://daum.net')

search_box = driver.find_element(By.ID, 'q')
search_box.send_keys('빅데이터')
search_box.send_keys(Keys.RETURN)

elements = driver.find_elements(By.XPATH, '//*[@id="twaColl"]/div/c-container/c-card/div/c-doc-web/div/div/c-contents-desc/p/a')

for element in elements:
    print(element.text)
    print(element.text, file=open('test1.txt', 'a', encoding='utf-8'))


sleep(3)
driver.close()

#### 도전과제1_0502.
네이버 로그인 화면으로 이동해서 ID와 PW를 입력하고 로그인을 실행하세요.

In [None]:
# !pip install pyperclip
# !pip install pyautogui

In [411]:
# Q. 네이버 로그인 화면으로 이동해서 ID와 PW를 입력하고 로그인을 실행하세요.

from selenium import webdriver

from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By

import pyautogui
import pyperclip
import time

# 크롬 드라이버를 로드합니다.
driver = webdriver.Chrome('c:/tool/chromedriver.exe')

driver.implicitly_wait(5)
driver.maximize_window()
driver.get('https://nid.naver.com/nidlogin.login?mode=form&url=https%3A%2F%2Fwww.naver.com')

# search_box = driver.find_element(By.CLASS_NAME, 'link_login')
# search_box.send_keys(Keys.RETURN)

elem_id = driver.find_element(By.ID, 'id')
elem_id.click()
pyperclip.copy('likespike')
pyautogui.hotkey('ctrl', 'v')
time.sleep(2)

elem_pw = driver.find_element(By.ID, 'pw')
elem_pw.click()
pyperclip.copy('')
pyautogui.hotkey('ctrl', 'v')
time.sleep(2)

driver.find_element(By.ID, 'log.login').click()

  driver = webdriver.Chrome('c:/tool/chromedriver.exe')


<module 'time' (built-in)>

In [99]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
import pyperclip

userid='likespike'
userpw=''

driver = webdriver.Chrome(executable_path='c:/tool/chromedriver.exe')
driver.implicitly_wait(3)

driver.get('https://nid.naver.com/nidlogin.login')

driver.find_element(By.NAME,'id').click()
pyperclip.copy(userid)
driver.find_element(By.NAME,'id').send_keys(Keys.CONTROL,'v')
                    
driver.find_element(By.NAME,'pw').click()
pyperclip.copy(userpw)
driver.find_element(By.NAME,'pw').send_keys(Keys.CONTROL,'v')
driver.find_element(By.XPATH,'//*[@id="log.login"]').click()
driver.get('https://mail.naver.com/')

  driver = webdriver.Chrome(executable_path='c:/tool/chromedriver.exe')


#### 과제3_0502.
URL = 'https://news.naver.com/main/main.naver?mode=LSD&mid=shm&sid1=102'사이트에 업로드되는 실시간 뉴스 제목을 가져와서 출력하세요. 단 사이트에 있는 뉴스와 일치해야 함

In [255]:
URL = 'https://news.naver.com/main/main.naver?mode=LSD&mid=shm&sid1=102'

import time

driver = webdriver.Chrome('C:/tool/chromedriver.exe')

driver.get('https://news.naver.com/main/main.naver?mode=LSD&mid=shm&sid1=102')

# time.sleep(1)

headlines = driver.find_elements(By.XPATH, '//*[@id="main_content"]/div/div/div/div/div/ul/li/div/a')

for headline in headlines:
    print(headline.text)

  driver = webdriver.Chrome('C:/tool/chromedriver.exe')


남해안 외국인근로자에 마약 퍼져… 해경, 15명 검거
남해안 일대 마약류 유통…외국인 일당 구속[D리포트]
마약 판매·투약 외국인 15명 검거…“남해안 일대 수사 확대”
통영·거제서 외국인 선원 상대 엑스터시 등 마약 유통한 일당 검거
총파업 계획 발표‥내일부터 부분 파업 돌입
간호법 반발…의사·간호조무사, 재논의 안되면 17일 총파업
간무협 회장의 토로 "`내년 총선도 민주당 이기니 간호법 반대 말라` 종용"
의료계 집단행동 개시…“간호법 재논의 안되면 17일 총파업”
반지하 주택서 80대 전 연인 살해 60대 男…징역 10년
"부탁에 의한 살해" 주장했지만…'전연인 살해' 60대, 징역 10년 구형
“나 좀 죽여달라더라” 80대 前여친 살해하고 돈 훔친 60대男, 덜미 잡힌 이유
‘죽여 달라고 해서…’ 80대 연인 살해 혐의 60대男 ‘징역 10년’
간호협회, 간호법 다룬 복지부 SNS 글에 "깊은 유감" 이유는?
전북간호사회 "의사협회는 간호법 마타도어와 흑색선전 멈춰라"
간협 "복지부, SNS에 '간호법 우려' 밝혀…갈등만 키워"
간호법 통과…경상남도, 의사협회 파업 대비
차츰 퍼지는 엠폭스...10명 중 6명은 걸릴 가능성 '낮다' 인식
'지역사회 감염' 엠폭스, 추가 확진자 5명 발생…총 47명
영장심사 앞두고 분신한 건설노조 간부 끝내 사망
민주노총 건설노조, 대정부 총력 투쟁 예고…"정부 탄압, 조합원 분신 야기"
부산 스쿨존 사고 초등학교 등하교 시간, 대형화물차 출입 제한 검토
부산 등굣길 참변 사고 작업자 무면허로 지게차 조작
검찰, '백현동 로비스트' 김인섭 구속기소
검찰, 백현동 개발 로비스트 김인섭 구속 기소


















#### 과제4_0502.
'https://www.naver.com/'에서 뉴스 > 사회 카테고리 클릭하고 뉴스 제목을 출력하세요.

In [253]:
import time

driver = webdriver.Chrome('C:/tool/chromedriver.exe')

driver.get('https://www.naver.com/')

news_box = driver.find_element(By.XPATH, '//*[@id="NM_FAVORITE"]/div[1]/ul[2]/li[2]/a').click() 
society_box = driver.find_element(By.XPATH, '/html/body/section/header/div[2]/div/div/div[1]/div/div/ul/li[4]/a/span').click() 

time.sleep(1)    # 꼭 주어야 함

headlines = driver.find_elements(By.XPATH, '//*[@id="main_content"]/div/div/div/div/div/ul/li/div/a')

for headline in headlines:
    print(headline.text)

  driver = webdriver.Chrome('C:/tool/chromedriver.exe')


최저임금 샅바싸움 시작...사용자측 "동결해도 어려운 상황"
최저임금 만 원 넘을까…최저임금위 첫 전원회의 개최
스타벅스 커피 2000원 오를 때, 최저임금 8000원 뛰어
비정규직 감원 우려 커지는데…"최저임금 1만2000원" 외치는 勞
야산 돌며 천막치고 도박판 벌인 일당 56명 검거 [현장영상]
‘찐 노름꾼’인지 면접까지 본 억대 산도박…56명 무더기 적발
야산에 천막 설치하고 도박장 운영한 조직폭력배 일당 검거
야산 돌아다니며 불법 도박장 운영...조직폭력배 등 56명 검거
반지하서 80대 전 연인 흉기로 살해한 60대 남성… 1심서 징역 10년
"죽여달라 했다" 80대 연인 흉기 살해한 60대男 징역 10년형, 왜
“죽여 달라고 해”…80대 전 연인 살해 60대, 징역 10년
전 연인 살해한 60대 남성 1심서 징역 10년
'돈 봉투 의혹' 송영길, 검찰 자진 출석…"나를 구속해달라"
'돈봉투' 의혹 송영길 자진 출두 시도…검찰 돌려보내 '무산'
[속보]송영길 "주변 말고 저를 구속하라"…檢, 조사 거부
[속보] ‘돈봉투 의혹’ 송영길 자진출두… 檢, 로비서 돌려보내
원전에 둘러싸여 있는데…방사능 방재 인프라 '열악'
전국원전동맹, 국회서 원자력안전교부세 신설 촉구 정책토론회
제주에서 SFTS 환자 발생...텃밭 작업하다 진드기에 물린 듯
제주서 올해 첫 ‘중증열성혈소판감소증후군’ 환자 발생
경찰, 동탄 오피스텔 전세사기 임대인 부부 소환 조사
경찰, '동탄 전세사기' 임대인 부부 소환
검찰, '백현동 로비스트' 김인섭 구속 기소…"77억 수수"
‘백현동 비리 의혹’로비스트 김인섭 구속기소


















#### 과제5_0502.
한빛출판네트워크 사이트에 로그인해서 마일리지 점수를 가져와서 출력하세요.

In [211]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
import requests

from bs4 import BeautifulSoup

driver = webdriver.Chrome('C:/tool/chromedriver.exe')

driver.get('https://www.hanbit.co.kr/')

elem = driver.find_element(By.CLASS_NAME,'login')
elem.click()

id_box = driver.find_element(By.ID,'m_id')
id_box.send_keys('likespike')
pw_box = driver.find_element(By.ID,'m_passwd')
pw_box.send_keys('Mygod710293!')
login_button = driver.find_element(By.ID, 'login_btn')
login_button.click()

driver.find_element(By.CLASS_NAME, 'myhanbit').click()

print(driver.find_elements(By.XPATH, '//*[@id="container"]/div/div[2]/dl[1]/dd/span')[0].text)    #find_element는 리스트 객체를 반홤한다

for element in driver.find_elements(By.XPATH, '//*[@id="container"]/div/div[2]/dl[1]/dd/span'):
    print(element.text)
    
type(elem)    # WebElement 객체임, 요소의 값이나 속성 등을 가져오거나 조작할 수 있음

  driver = webdriver.Chrome('C:/tool/chromedriver.exe')


2,000
2,000


selenium.webdriver.remote.webelement.WebElement

In [None]:
# 페이지 이동
from selenium import webdriver
from selenium.webdriver.common.by import By
import time

# 크롬 드라이버를 로드합니다.
driver = webdriver.Chrome('c:/tool.chromedriver.exe')

# 네이버 로그인 페이지로 이동합니다.
driver.get('http://naver.com')

elem.click()

time.sleep(1)
driver.back()
driver.forward()
driver.back()
driver.mamimize_window()
driver.refresh()
time.sleep(1)
driver.close()
# driver.quit()

In [10]:
# a 태그
# 크롬 드라이버를 로드합니다.
driver = webdriver.Chrome('c:/tool/chromedriver.exe')

# 네이버 로그인 페이지로 이동합니다.
driver.get('http://naver.com')
driver.maximize_window()

  driver = webdriver.Chrome('c:/tool/chromedriver.exe')


In [21]:
elem = driver.find_element(By.TAG_NAME, 'a')
print(elem)
print(elem.get_attribute('href'))

<selenium.webdriver.remote.webelement.WebElement (session="c341f59fb92186db5a018d7a50fdcfbf", element="cc5c1c59-9272-4318-8c6a-e0a93de139f6")>
https://www.naver.com/#newsstand


In [22]:
elems = driver.find_elements(By.TAG_NAME, 'a')

for elem in elems:
    print(elem.get_attribute('href'))

https://www.naver.com/#newsstand
https://www.naver.com/#themecast
https://www.naver.com/#timesquare
https://www.naver.com/#shopcast
https://www.naver.com/#account
https://whale.naver.com/ko/details/security/&wpid=RydDy7
https://installer-whale.pstatic.net/downloads/banner/RydDy7/WhaleSetup.exe
https://www.naver.com/
https://help.naver.com/support/welcomePage/guide.help
https://jr.naver.com/
https://happybean.naver.com/
https://www.naver.com/#
https://www.naver.com/#
https://www.naver.com/#
https://www.naver.com/#
https://www.naver.com/#
https://help.naver.com/support/alias/search/word/word_29.naver
https://help.naver.com/support/alias/search/word/word_29.naver
https://help.naver.com/support/service/main.help?serviceNo=605&categoryNo=1991
https://www.naver.com/#
https://www.naver.com/#
https://help.naver.com/support/alias/search/word/word_16.naver
https://www.naver.com/#
https://help.naver.com/support/alias/search/word/word_16.naver
https://nid.naver.com/nidlogin.login
https://help.nave

StaleElementReferenceException: Message: stale element reference: element is not attached to the page document
  (Session info: chrome=112.0.5615.138)
Stacktrace:
Backtrace:
	GetHandleVerifier [0x010ADCE3+50899]
	(No symbol) [0x0103E111]
	(No symbol) [0x00F45588]
	(No symbol) [0x00F47EDB]
	(No symbol) [0x00F47DB0]
	(No symbol) [0x00F48690]
	(No symbol) [0x00F9E98D]
	(No symbol) [0x00F8B8FC]
	(No symbol) [0x00F9E01C]
	(No symbol) [0x00F8B6F6]
	(No symbol) [0x00F67708]
	(No symbol) [0x00F6886D]
	GetHandleVerifier [0x01313EAE+2566302]
	GetHandleVerifier [0x013492B1+2784417]
	GetHandleVerifier [0x0134327C+2759788]
	GetHandleVerifier [0x01145740+672048]
	(No symbol) [0x01048872]
	(No symbol) [0x010441C8]
	(No symbol) [0x010442AB]
	(No symbol) [0x010371B7]
	BaseThreadInitThunk [0x76600099+25]
	RtlGetAppContainerNamedObjectPath [0x76EC7B6E+286]
	RtlGetAppContainerNamedObjectPath [0x76EC7B3E+238]


In [42]:
Q. daum.net에서 빅데이터를 검색해서 출력하세요(CSS_SELECTOR 사용)

from selenium.webdriver.common.keys import Keys

driver = webdriver.Chrome('c:/tool/chromedriver.exe')

driver.get('https://www.daum.net')

search_box = driver.find_element(By.ID, 'q')
search_box.send_keys('빅데이터')
search_box.send_keys(Keys.RETURN)

element = driver.find_element(By.CSS_SELECTOR, '#twaColl > div > c-container > c-card > div > c-doc-web > div > div.item-contents > c-contents-desc > p > a')

print(element.text)

driver.close()

빅데이터(big data)란 복잡하고 다양한 대규모 데이터세트 자체는 물론 이 데이터세트로부터 정보를 추출하고 결과를 분석하여 더 큰 가치를 창출하는 기술을 뜻한다. 수치 데이터 등 기존의 정형화된 정보뿐 아니라 텍스트 ・ 이미지 ・ 오디오 ・ 로그기...


In [53]:
# 뉴스 타이틀 링크 1개 가져오기

from selenium.webdriver.common.keys import Keys

driver = webdriver.Chrome('c:/tool/chromedriver.exe')

driver.get('https://news.daum.net/')

element = driver.find_element(By.CSS_SELECTOR, 'body > div.container-doc > main > section > div > div.content-article > div.box_g.box_news_issue > ul > li:nth-child(1) > div > div > strong > a')

print(element.get_attribute('href'))

# driver.close()

  driver = webdriver.Chrome('c:/tool/chromedriver.exe')


https://v.daum.net/v/20230503113359930


In [54]:
element = driver.find_element(By.CSS_SELECTOR, 'body > div.container-doc > main > section > div > div.content-article > div.box_g.box_news_issue > ul > li:nth-child(1) > div > div > strong > a')

print(element.get_attribute('href'))

https://v.daum.net/v/20230503113359930


In [None]:
# 뉴스 타이틀 링크 모두 가져오기


In [56]:
driver = webdriver.Chrome('c:/tool/chromedriver.exe')

driver.get('https://www.naver.com')

  driver = webdriver.Chrome('c:/tool/chromedriver.exe')


In [78]:
element = driver.find_element(By.XPATH, '//*[@id="NM_FAVORITE"]/div/ul')

print(element.text)

메일
카페
블로그
지식iN
쇼핑
쇼핑LIVE
Pay
TV


In [82]:
element = driver.find_element(By.CLASS_NAME, 'list_nav.type_fix')

print(element.text)

메일
카페
블로그
지식iN
쇼핑
쇼핑LIVE
Pay
TV


In [81]:
element = driver.find_element(By.CLASS_NAME, 'title')
element.text

'오늘 읽을만한 글'

In [85]:
selected_link = driver.find_element(By.PARTIAL_LINK_TEXT, '경제')
print(selected_link)
print(selected_link.tag_name)
print(selected_link.text)

<selenium.webdriver.remote.webelement.WebElement (session="489da639e7a40ab7b9bb997af8745e89", element="95d90fdf-bc85-4402-a00b-59f7489ef2d3")>
a
경제


Javascript 선택자 : https://hianna.tistory.com/485

1. getElementById()
 - 파라미터로 찾으려는 id를 전달하여, 해당 element를 찾을 수 있습니다. id는 유일한 값이므로, 하나의 element만 리턴합니다.
2. getElementsByClassName()
 - 클래스 이름으로 element를 찾아서,이 클래스 이름을 가지는 모든 element 목록을 리턴합니다.이 함수의 이름을 자세히 보면 getElementsByClassName으로 Element's'가 복수 형태인 것은 이 함수가 목록을 리턴하기 때문입니다.
3. getElementByTagName()
 - 위 코드는 'div' 태그를 가지는 모든 element 목록을 찾아줍니다.이 함수 역시, 다수의 element를 리턴하기 때문에 함수명에 복수형의 'elements'가 포함되어 있습니다.
4. querySelector()
 - DOM에서 원하는 element를 찾기 위해서 querySelector() 를 사용할 수도 있는데, 이 함수는 파라미터로 입력받은 CSS선택자를 사용해서, element를 찾아줍니다.
 - querySelector() 함수는, 파라미터로 입력받은 CSS 선택자로 찾은 여러개의 element 중 첫번째 element를 리턴합니다.
 - 태그 이름으로 element를 찾을 때는 태그명을 문자열로 넘겨줍니다.위 예제는 div태그를 가지는 element 중 첫번째 element를 리턴합니다.
5. querySelectorAll()
 - 사용법은 querySelector() 와 같습니다. 다만, querySelectorAll()은 이름에서 알수 있듯이, CSS선택자(파라미터로 넘겨준)로 찾은 모든 element 목록을 리턴합니다.

In [110]:
import time
import selenium
from selenium import webdriver
from selenium.webdriver.common.by import By

path = 'c:/tool/chromedriver.exe'
driver = webdriver.Chrome(path)
driver.get('https://www.naver.com')
driver.maximize_window()
time.sleep(1)
element = driver.find_element(By.CLASS_NAME, 'link_login')
element.click()
id = 'likespike'
pw = ''

# 'id'라는 아이디를 가진 요소의 값은, id 변수에 저장된 값으로 변경하는 자바 스크립트 코드를 실행
# execute_script 함수를 사용하면 자바스크립트 코드를 실행
# js는 getElementById('d')/value로 값을 가져올 수 있다.

driver.execute_script("document.getElementById('id').value=\'" + id + "\'")
time.sleep(1)
driver.execute_script("document.getElementById('pw').value=\'" + pw + "\'")
time.sleep(1)

element = driver.find_element(By.CLASS_NAME, 'btn_login')
element.click()
print(driver.page_source)

  driver = webdriver.Chrome(path)


<html lang="ko" data-dark="false" data-useragent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/112.0.0.0 Safari/537.36"><head><script async="" type="text/javascript" src="https://ssl.pstatic.net/tveta/libs/ndpsdk/prod/ndp-core.js"></script> <meta charset="utf-8"> <title>NAVER</title> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="width=1190"> <meta name="apple-mobile-web-app-title" content="NAVER"> <meta name="robots" content="index,nofollow"> <meta name="description" content="네이버 메인에서 다양한 정보와 유용한 컨텐츠를 만나 보세요"> <meta property="og:title" content="네이버"> <meta property="og:url" content="https://www.naver.com/"> <meta property="og:image" content="https://s.pstatic.net/static/www/mobile/edit/2016/0705/mobile_212852414260.png"> <meta property="og:description" content="네이버 메인에서 다양한 정보와 유용한 컨텐츠를 만나 보세요"> <meta name="twitter:card" content="summary"> <meta name="twitter:title" content=""> <meta name="twitter:url" co

#### 과제1_0503.
네이버 로그인 후 첫번째 메일 제목 가져와서 출력하세요.(개인정보 관련 내용은 제외)



In [122]:
import time
import selenium
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

path = 'c:/tool/chromedriver.exe'
driver = webdriver.Chrome(path)
driver.get('https://www.naver.com')
driver.maximize_window()
time.sleep(1)
element = driver.find_element(By.CLASS_NAME, 'link_login')
element.click()
id = 'likespike'
pw = 'Mygod7102938'

# 'id'라는 아이디를 가진 요소의 값은, id 변수에 저장된 값으로 변경하는 자바 스크립트 코드를 실행
# execute_script 함수를 사용하면 자바스크립트 코드를 실행
# js는 getElementById('d')/value로 값을 가져올 수 있다.

driver.execute_script("document.getElementById('id').value=\'" + id + "\'")
time.sleep(1)
driver.execute_script("document.getElementById('pw').value=\'" + pw + "\'")
time.sleep(1)

element = driver.find_element(By.CLASS_NAME, 'btn_login')
element.click()
# print(driver.page_source)


# 이메일 가져오기
driver.find_element(By.XPATH, '//*[@id="NM_FAVORITE"]/div[1]/ul[1]/li[1]/a').click()

# 요소 로딩까지 웨이트 주기
try:
    element = WebDriverWait(driver,5).until(                       # 최대 대기 시간임
    EC.presence_of_element_located((By.XPATH, '//*[@id="mail_list_wrap"]/ul/li[1]/div/div[4]/div/a/span[2]'))
    )
finally:
    pass

# 첫 번째 메일 제목 가져오기
driver.find_element(By.XPATH, '//*[@id="mail_list_wrap"]/ul/li[1]/div/div[4]/div/a/span[2]').text

'2단계 인증 기능이 해지되었습니다.'

In [None]:
# 네이버 뉴스 정치 카테고리에서 뉴스 제목 10개를 가져와서 출력하세요.(다양한 방법으로 시도)

In [None]:
https://news.naver.com/main/main.naver?mode=LSD&mid=shm&sid1=100
    
