In [2]:
import warnings
warnings.filterwarnings('ignore')

import random
import numpy as np
import pandas as pd

import matplotlib.pyplot as plt
import seaborn as sns

from scipy import stats
from scipy.stats import t, norm, chi2, chi2_contingency

from matplotlib import rc
rc('font', family='Malgun Gothic')      #한글 폰트설정
plt.rcParams['axes.unicode_minus']=False      #마이너스 부호 출력 설정

In [3]:
import math, scipy, sympy
from bs4 import BeautifulSoup as BS
import requests, re, urllib

from urllib import robotparser
from urllib.request import urlopen
import chardet

import selenium
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from time import sleep

### Selenium vs. BeautifulSoup
- 둘 다 웹 스크래핑을 위한 파이썬 라이브러리입니다. 그러나 이들은 목적과 사용 방법이 다릅니다.
- BeautifulSoup: 웹 페이지의 HTML 코드를 파싱하고 분석하여 원하는 데이터를 추출하는 데 사용됩니다. HTML 코드를 처리하는데 최적화되어 있으며, 정적인 웹 페이지에서 사용됩니다.
- Selenium: 웹 브라우저를 자동화하고 웹 페이지 상호작용을 자동화하는 데 사용됩니다. JavaScript와 같은 동적 웹 페이지에서 데이터를 추출하고 자동화된 테스트를 실행하는 데 적합합니다.
-  웹 페이지가 정적이라면 BeautifulSoup을 사용하여 HTML 코드에서 데이터를 추출하는 것이 좋고, 웹 페이지가 동적이라면 Selenium을 사용하여 웹 페이지를 자동으로 제어하고 데이터를 추출하는 것이 좋습니다. 
- 또한 두 라이브러리는 서로 보완적으로 사용될 수 있습니다. 예를 들어 Selenium으로 웹 페이지를 열고, BeautifulSoup으로 데이터를 추출할 수 있습니다.

### Selenium
Selenium의 다양한 함수와 기능을 이용하여 웹 브라우저를 자동화하고 웹 페이지 상호작용을 자동화할 수 있습니다. 예를 들어, webdriver 모듈로 웹 드라이버를 생성한 후, get() 메서드로 웹 페이지를 로드하고, find_element(By.*, ""), find_elements(By.*, "") 함수로 HTML 요소를 찾아 click() 메서드로 클릭 이벤트를 발생시키거나, send_keys() 메서드로 입력 이벤트를 발생시키는 등의 작업을 수행할 수 있습니다.

#### selenium 모듈
- 웹 어플리케이션 테스트를 위한 프레임워크 : 홈페이지 테스트용으로 사용
- 사용자가 아닌 프로그램이 웹 브라우저를 제어할 수 있도록 지원
- 웹 브라우저마다 클라이언트 프로그램(Web Driver)이 별도로 필요(웹 브라우저 <-> 프로그램간 통신 목적)
- 크롤링 보다는 웹을 제어하는 목적이 더 큼
- pip install selenium
- web driver 설치(크롬 버전 확인) : https://chromedriver.chromium.org/downloads
- 압축 해제한 후 chromedriver.exe를 적당한 경로로 이동
- selenium 모듈 호출 후 설치한 web driver 경로를 지정

이벤트로 제어하기 : 브라우저를 직접 제어하기 때문에 직접 컨트롤하여 마우스 클릭, 키보드 입력, 자바 스크립트 이벤트 처리 가능
- 마우스 클릭 : click()
- 키보드 입력 : send_keys()
- 자바스크립트 코드 실행 : execute_script()
- 다양한 창 및 프레임을 제어 : switch_to
- 입력 양식 전송 : submit()
- 스크린샷 : screenshot(파일이름)
- 글자 지움 : clear()
- 뒤로 가기 : back()
- 앞으로 가기 : forward()

### 셀레니움 함수(구버전)


- find_element_by_id: id 속성을 사용하여 접근
- find_element(s)_by_class_name: 클래스를 사용하여 접근
- find_element(s)_by_name: name 속성을 사용하여 접근
- find_element(s)_by_xpath: xpath 속성을 사용하여 접근
- find_element(s)_by_link_text: 앵커태그(a 태그)에 사용되는 텍스트로 접근 
- find_element(s)_by_partial_link_text: 앵커태그(a 태그)에 사용되는 일부 텍스트로 접근
- find_element(s)_by_tag_name: 태그를 사용하여 접근
- find_element(s)_by_css_selector: CSS 선택자를 사용하여 접근<br><br>
셀레니움 사용법 : https://greeksharifa.github.io/references/2020/10/30/python-selenium-usage/

### 셀레니움 변경 - 버전4 메서드(신버전)

- https://goodthings4me.tistory.com/696

- from selenium.webdriver.common.by import By : By 모듈은 요소를 찾을 때 사용되는 방법을 정의
- driver.find_element(By.CLASS_NAME, " ") : class 속성이 " "인 요소를 찾음
- driver.find_element(By.ID, " ")
- driver.find_element(By.CSS_SELECTOR, " ")
- driver.find_element(By.LINK_TEXT, " ")
- driver.find_element(By.NAME, " ")
- driver.find_element(By.PARTIAL_LINK_TEXT, " ")
- driver.find_element(By.TAG_NAME, " ")
- driver.find_element(By.XPATH, " ") <br><br>
- driver.find_elements(By.CLASS_NAME, " ")
- driver.find_elements(By.ID, " ")
- driver.find_elements(By.CSS_SELECTOR, " ")
- driver.find_elements(By.LINK_TEXT, " ")
- driver.find_elements(By.NAME, " ")
- driver.find_elements(By.PARTIAL_LINK_TEXT, " ")
- driver.find_elements(By.TAG_NAME, " ")
- driver.find_elements(By.XPATH, " ")

### 행동 메서드
- driver.click()
- driver.back()
- driver.forward()
- driver.maximize_window()
- driver.refresh()
- driver.close()
- driver.quit()

In [3]:
# !pip install selenium
# !pip install selenium==4.3.0    #다운그레이드
# !pip list

In [4]:
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from time import sleep

url ='https://www.naver.com'
path = r'C:\Users\h\hmkd1\chromedriver.exe'

driver = webdriver.Chrome(path)
driver.get(url)    #화면 불러오기

sleep(2)   # 2초 뒤
driver.maximize_window()   #창 확대

print(driver.current_url)   #현재 켜진 창 url 가져옴
sleep(2)
driver.close()   #창 종료

https://www.naver.com/


In [5]:
# 브라우저 창 띄우지 않고 수행
op = webdriver.ChromeOptions()
op.add_argument('headless')
# op.add_argument('start-maximized')

driver = webdriver.Chrome(path, options=op)
driver.get('https://google.com')

print(driver.current_url)
driver.close()

https://www.google.com/


In [6]:
# 브라우저 최대/최소화
driver = webdriver.Chrome(path)
driver.get('https://google.com')

driver.maximize_window()   # 창 최대화(화면 꽉 채우기)
sleep(2)
driver.minimize_window()   # 창 최소화(창 내리기)
sleep(2)
driver.close()   # 종료

In [7]:
# Implicit Waits(암묵적 대기): 찾으려는 element가 로드될 때까지 지정한 시간만큼 대기
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

driver = webdriver.Chrome(path)
driver.get('https://google.com')

try:
    element = WebDriverWait(driver, 3).until(
        EC.presence_of_element_located((By.CLASS_NAME, 'gLFyf'))
    )  # gLFyf 클래스를 가진 요소가 나타날 때까지 3초 대기
       # 나타나지 않으면 WebDriver 종료
finally:
    driver.quit()      # Selenium WebDriver 세션을 종료(모든 창 종료)

- driver.close(): 현재 창(탭) 종료
- driver.quit(): Selenium WebDriver 세션을 종료(모든 창 종료)
#### 다른 세션을 시작하기 위해서는 quit()를 호출해야 함***

In [8]:
op = webdriver.ChromeOptions()
op.add_argument('window_size=1920,1080')

driver = webdriver.Chrome(r'C:\Users\h\hmkd1\chromedriver.exe', options=op)
driver.maximize_window()
driver.implicitly_wait(time_to_wait=3)

driver.get(url='https://google.com/')
driver.quit()

In [9]:
# By.NAME
# 크롬 드라이버를 로드합니다.
driver = webdriver.Chrome(path)

# 구글 검색창으로 이동합니다.
driver.get('https://www.google.com/')

# 검색어 입력 요소를 찾아서 검색어를 입력합니다.
search_box = driver.find_element(By.NAME, 'q')
       #구글 검색창 html태그 속성: name='q (f12로 확인)

# 검색창에 '빅데이터'라는 검색어를 입력
search_box.send_keys('빅데이터')

# 검색어 입력 요소에서 Enter 키를 입력합니다.
search_box.send_keys(Keys.ENTER)

# 브라우저 세션을 종료합니다.
# driver.quit()

In [10]:
# By.ID
# 크롬 드라이버를 로드합니다.
driver = webdriver.Chrome(path)

# 구글 검색창으로 이동합니다.
driver.get('https://www.naver.com/')

# 검색창에 검색어 입력
search_box = driver.find_element(By.ID, 'query')
search_box.send_keys('빅데이터')

# 검색어 입력 요소에서 Enter 키를 입력합니다.
search_box.send_keys(Keys.RETURN)

# 검색 결과 페이지가 로드될 때까지 3초간 대기
driver.implicitly_wait(3)

# 브라우저 세션을 종료합니다.
# driver.quit()

In [11]:
# daum 사이트 에서 인공지능 검색
driver = webdriver.Chrome(path)
driver.get('https://www.daum.net/')

search_box = driver.find_element(By.ID, 'q')
search_box.send_keys('인공지능')
search_box.send_keys(Keys.RETURN)

driver.implicitly_wait(3)
# driver.quit()

- search_box.send_keys(Keys.ENTER): Enter 키를 입력한 후에도 검색 입력 상자에 초점이 유지 (일부 웹 사이트에서 검색을 더 쉽게 하기 위해 사용)
- search_box.send_keys(Keys.RETURN): Enter 키를 입력한 후에 초점이 검색 입력 상자에서 해제 (다른 요소에 대한 동작을 수행)

In [12]:
with open('test1.txt','w') as f:
    f.write('test1')

In [13]:
driver = webdriver.Chrome(path)
driver.get('https://www.daum.net/')

search_box = driver.find_element(By.NAME, 'q')
search_box.send_keys('빅데이터')
search_box.send_keys(Keys.ENTER)

# xpath로 뽑기
xpath = '//*[@id="twaColl"]/div/c-container/c-card/div/c-doc-web/div/div/c-contents-desc/p/a'
elements1 = driver.find_elements(By.XPATH, xpath)

# css셀렉터로 뽑기
css = '#twaColl > div > c-container > c-card > div > c-doc-web > div > div > c-contents-desc > p > a'
elements2 = driver.find_elements(By.CSS_SELECTOR, css)

text = '\n'.join([i.text for i in elements1])
print(text)
with open('test1.txt','w', encoding='utf-8') as f:
    f.write(text)

sleep(3)
driver.close()

빅데이터(big data)란 복잡하고 다양한 대규모 데이터세트 자체는 물론 이 데이터세트로부터 정보를 추출하고 결과를 분석하여 더 큰 가치를 창출하는 기술을 뜻한다. 수치 데이터 등 기존의 정형화된 정보뿐 아니라 텍스트 ・ 이미지 ・ 오디오 ・ 로그기...


In [14]:
driver = webdriver.Chrome(path)
driver.get('http://naver.com')

WebDriverWait(driver, 5).until(
    EC.presence_of_element_located((By.TAG_NAME, "a")) )
el = driver.find_elements(By.TAG_NAME, 'a')


for i in el:
    try:     #페이지 링크가 실시간으로 바뀌며 일부 오류 발생 -> 예외처리
        print(i.get_attribute('href'))
    except: pass
        
driver.quit()

https://www.naver.com/#newsstand
https://www.naver.com/#themecast
https://www.naver.com/#timesquare
https://www.naver.com/#shopcast
https://www.naver.com/#account
https://whale.naver.com/ko/details/security/&wpid=RydDy7
https://installer-whale.pstatic.net/downloads/banner/RydDy7/WhaleSetup.exe
https://www.naver.com/
https://help.naver.com/support/welcomePage/guide.help
https://jr.naver.com/
https://happybean.naver.com/
https://www.naver.com/#
https://www.naver.com/#
https://www.naver.com/#
https://www.naver.com/#
https://www.naver.com/#
https://help.naver.com/support/alias/search/word/word_29.naver
https://help.naver.com/support/alias/search/word/word_29.naver
https://help.naver.com/support/service/main.help?serviceNo=605&categoryNo=1991
https://www.naver.com/#
https://www.naver.com/#
https://help.naver.com/support/alias/search/word/word_16.naver
https://www.naver.com/#
https://help.naver.com/support/alias/search/word/word_16.naver
https://nid.naver.com/nidlogin.login
https://help.nave

http://newsstand.naver.com/?list=&pcode=011
https://www.naver.com/#
https://www.naver.com/#
https://www.naver.com/#
http://newsstand.naver.com/?list=&pcode=081
https://www.naver.com/#
https://www.naver.com/#
https://www.naver.com/#
http://newsstand.naver.com/?list=&pcode=964
https://www.naver.com/#
https://www.naver.com/#
https://www.naver.com/#
http://newsstand.naver.com/?list=&pcode=925
https://www.naver.com/#
https://www.naver.com/#
https://www.naver.com/#
http://newsstand.naver.com/?list=&pcode=801
https://www.naver.com/#
https://www.naver.com/#
https://www.naver.com/#
http://newsstand.naver.com/?list=&pcode=902
https://www.naver.com/#
https://www.naver.com/#
https://www.naver.com/#
http://newsstand.naver.com/?list=&pcode=917
https://www.naver.com/#
https://www.naver.com/#
https://www.naver.com/#
http://newsstand.naver.com/?list=&pcode=806
https://www.naver.com/#
https://www.naver.com/#
https://www.naver.com/#
http://newsstand.naver.com/?list=&pcode=915
https://www.naver.com/#
http

https://vibe.naver.com/artist/421339
https://vibe.naver.com/album/9554326
https://vibe.naver.com/track/63939716
https://vibe.naver.com/track/63939716
https://vibe.naver.com/track/63516893
https://vibe.naver.com/track/63516893
https://vibe.naver.com/artist/2478996
https://vibe.naver.com/album/9449661
https://vibe.naver.com/track/63516893
https://vibe.naver.com/track/63516893
https://vibe.naver.com/track/64240486
https://vibe.naver.com/track/64240486
https://vibe.naver.com/artist/5438597
https://vibe.naver.com/album/9615768
https://vibe.naver.com/track/64240486
https://vibe.naver.com/track/64240486
https://vibe.naver.com/track/63943019
https://vibe.naver.com/track/63943019
https://vibe.naver.com/artist/32030
https://vibe.naver.com/album/9555374
https://vibe.naver.com/track/63943019
https://vibe.naver.com/track/63943019
https://vibe.naver.com/track/63759956
https://vibe.naver.com/track/63759956
https://vibe.naver.com/artist/401694
https://vibe.naver.com/album/9501618
https://vibe.naver.co

In [15]:
driver = webdriver.Chrome(path)
driver.get('https://new.daum.net/')

el = driver.find_elements(By.CLASS_NAME, 'link_txt')
for i in el[:5]:
    print(i.get_attribute('href'))
driver.close()

https://v.daum.net/v/20230504082332619
https://v.daum.net/v/20230504061117794?x_imp=dG9yb3NfY2xvdWRfYWxwaGE=&x_hk=NzU1ZmVmMDU4NjZmZjJlMDdm
https://v.daum.net/v/20230504052144016?x_imp=dHJvbW0=&x_hk=NzU1ZmVmMDU4NjZmZjJlMDdm
https://v.daum.net/v/20230504030442993?x_imp=dHJvbW0=&x_hk=NzU1ZmVmMDU4NjZmZjJlMDdm
https://v.daum.net/v/20230504050306774?x_imp=dG9yb3NfY2xvdWRfYWxwaGE=&x_hk=NzU1ZmVmMDU4NjZmZjJlMDdm


In [16]:
driver = webdriver.Chrome(path)
driver.get('http://www.naver.com/')

path = '//*[@id="NM_FAVORITE"]/div/ul'
el1 = driver.find_elements(By.XPATH, path)

el2 = driver.find_elements(By.CLASS_NAME, 'list_nav.type_fix')

for i in el2:
    print(i.text)
driver.close()

메일
카페
블로그
지식iN
쇼핑
쇼핑LIVE
Pay
TV


In [17]:
driver = webdriver.Chrome(path)
driver.get('http://www.naver.com/')

path = '//*[@id="NM_FAVORITE"]/div/ul'
el1 = driver.find_elements(By.XPATH, path)

el2 = driver.find_elements(By.CLASS_NAME, 'theme_info')

for i in el2:
    print(i.text.strip())
driver.close()

책방
네모아저씨의 페이퍼 윙즈 2: 에어본
대한민국 1등 종이접기 작가 네모아저씨표 종이비행기 시즌2! 더 쉽게! 더 멀리! 더 오래! 종이비행기 역시 네모아저씨 작품이 최고임을 증명한 〈네모아저씨의 페이퍼 윙즈〉 후속작이 출간되었습니다. 이번 책에서는 몇 분 만에 뚝딱 쉽게 접으면서도 업그레이드된 성능의 작품을 선보입니다. 특별한 색종이는 필요 없어요. 흔히 구할 수 있는 15cm 정사각형 색종이 1장이면 충분합니다. 알록달록한 디자인 색종이 없이도 플라밍고처럼 우아한 날개를 펼친 비행기부터 상어처럼 무시무시한 등지느러미를 세운 비행기까지 멋지게 완성됩니다. 비행기마다 최적의 날개 각도를 제시하고, 묘기 부리는 법도 동영상으로 소개해 더욱 즐겁게 날릴 수 있답니다. 1.5그램 색종이의 특별한 비행을 지금, 가족 친구와 함께 시작해 보세요!
네모아저씨 이원표
슬로래빗
책방
나의 돈 많은 고등학교 친구
30만 베스트셀러 《서울 자가에 대기업 다니는 김 부장 이야기》 시리즈의 송희구 저자가 2년 만에 세상에 내놓은 신작. 전작과 같이 소설 형태를 빌려와 독자들에게 돈과 인생, 부와 행복에 대한 메시지를 전한다. 소설이라고 해도 좋고, 자기계발서라 해도 좋다. 누군가는 투자 마인드서라 말할지 모른다. 그만큼 읽는 사람에 따라 원하는 재미, 원하는 교훈, 원하는 메시지가 다른, 다면적인 책이다. 주인공은 올해 나이 마흔 ‘영철’과 ‘광수’이다. 대기업에 다니는 영철은 아들 손을 잡고 롯데월드를 찾았다가 우연히 고등학교 친구 광수를 만난다. 부모님과 반지하에서 살던 평범한 광수, 여전히 그는 허름하고 털털한 차림새로 영철을 반갑게 맞는다. 그런데 줄 서지 않고 놀이기구를 탈 수 있는 89,000원짜리 프리미엄 매직패스를 쓰고 있다. 그리고 걸어서 롯데월드에 왔단다. 도대체 집이 어디기에? 고개를 드니 하늘을 찌르는 시그니엘이 보인다. 아, 공부도 집안도 무엇 하나 영철보다 나을 게 없던 광수. 광수는 자산의 규모를 가늠할 수 없는 ‘찐’ 부자가 되어 있다. 이 친구에게

In [18]:
driver = webdriver.Chrome(path)
driver.get('http://www.naver.com/')

el = driver.find_element(By.PARTIAL_LINK_TEXT, '경제')
print(el.text)
driver.close()

경제


### Javascript 선택자 : https://hianna.tistory.com/485

1. getElementById()
 - 파라미터로 찾으려는 id를 전달하여, 해당 element를 찾을 수 있습니다. id는 유일한 값이므로, 하나의 element만 리턴합니다.
2. getElementsByClassName()
 - 클래스 이름으로 element를 찾아서,이 클래스 이름을 가지는 모든 element 목록을 리턴합니다.이 함수의 이름을 자세히 보면 getElementsByClassName으로 Element's'가 복수 형태인 것은 이 함수가 목록을 리턴하기 때문입니다.
3. getElementByTagName()
 - 위 코드는 'div' 태그를 가지는 모든 element 목록을 찾아줍니다.이 함수 역시, 다수의 element를 리턴하기 때문에 함수명에 복수형의 'elements'가 포함되어 있습니다.
4. querySelector()
 - DOM에서 원하는 element를 찾기 위해서 querySelector() 를 사용할 수도 있는데, 이 함수는 파라미터로 입력받은 CSS선택자를 사용해서, element를 찾아줍니다.
 - querySelector() 함수는, 파라미터로 입력받은 CSS 선택자로 찾은 여러개의 element 중 첫번째 element를 리턴합니다.
 - 태그 이름으로 element를 찾을 때는 태그명을 문자열로 넘겨줍니다.위 예제는 div태그를 가지는 element 중 첫번째 element를 리턴합니다.
5. querySelectorAll()
 - 사용법은 querySelector() 와 같습니다. 다만, querySelectorAll()은 이름에서 알수 있듯이, CSS선택자(파라미터로 넘겨준)로 찾은 모든 element 목록을 리턴합니다.

In [20]:
print(                                                                                                                                              );a='puppy05230';b='cocoa013'
# 이 위에 a=ID, b=FW

# 네이버 로그인
import pyperclip
driver = webdriver.Chrome(path)
driver.get('https://www.naver.com/')

driver.find_element(By.XPATH, '//*[@id="account"]/a').send_keys(Keys.ENTER)

uid = driver.find_element(By.ID, 'id')
uid.click()
pyperclip.copy(a)
uid.send_keys(Keys.CONTROL, 'v')
sleep(1)

fw = driver.find_element(By.ID, 'pw')
fw.click()
pyperclip.copy(b)
fw.send_keys(Keys.CONTROL, 'v')
sleep(1)

driver.find_element(By.ID,'log.login').click()
sleep(3)

driver.close()




In [None]:
print()                                                                   ;a='puppy05230';b='cocoa013'
print()                                                                   ;a = 'youth_sk'; b = 'tmfrl123'  #슬기언니거...!ㅠㅜ
# 이 위에 a=ID, b=FW

In [None]:
body > div > div > div.sc_service > div.service_wrap.MY_SERVICE > div.service_body > div > ul > li:nth-child(1) > div
body > div > div > div.sc_service > div.service_wrap.MY_SERVICE > div.service_body > div > ul > li:nth-child(2) > div

In [None]:
#NM_MY_TAB > div > div:nth-child(1) > a.tab.MY_TAB_MAIL

#### 과제(2):
- 구글에서 '빅데이터' 검색 후 결과 가져와서 출력+파일로 저장
- 네이버에서 원하는 내용 조회 후 결과 출력+파일로 저장

In [None]:
# 구글: 빅데이터(0502_2.txt 파일에 저장)
driver = webdriver.Chrome(path)
driver.get('https://www.google.com/')

search_box = driver.find_element(By.ID, 'APjFqb')
search_box.send_keys('빅데이터')
search_box.send_keys(Keys.ENTER)

xpath = '//*[@id="Odp5De"]/div/div/div/div/block-component/div/div/div/div/div/div/div/div/div/div/div/div/div/span/span'
elements = driver.find_elements(By.XPATH, xpath)

text = '\n'.join([i.text for i in elements])
print(text)
with open('0502_2.txt','w', encoding='utf-8') as f:
    f.write(text)

sleep(2)
driver.close()

In [None]:
# 네이버: 빅데이터(0502_2.txt 파일에 저장)
driver = webdriver.Chrome(path)
driver.get('https://www.naver.com/')

search_box = driver.find_element(By.ID, 'query')
search_box.send_keys('산딸기 무스')
search_box.send_keys(Keys.ENTER)

xpath = '//*[@id="main_pack"]/section/div/div/div/div/div/div'
elements = driver.find_elements(By.XPATH, xpath)

text = '\n'.join([i.text for i in elements])
print(text)
with open('0502_3.txt','w', encoding='utf-8') as f:
    f.write(text)

sleep(2)
driver.close()

#### 과제(3): 사이트에 업로드되는 실시간 뉴스 제목을 가져와서 출력
- URL = 'https://news.naver.com/main/main.naver?mode=LSD&mid=shm&sid1=102' 
- 단, 사이트에 있는 뉴스와 일치해야 함

In [None]:
driver = webdriver.Chrome(path)
driver.get('https://news.naver.com/main/main.naver?mode=LSD&mid=shm&sid1=102')

xpath = '//*[@id="main_content"]/div/div/div/div/div/ul/li/div/a'
elements = driver.find_elements(By.XPATH, xpath)

text = '\n'.join([i.text for i in elements])
print(text.strip())
driver.close()

In [None]:
driver = webdriver.Chrome(path)
driver.get('https://news.naver.com/main/main.naver?mode=LSD&mid=shm&sid1=102')
driver.maximize_window()   #전체화면 전환

xpath = '//*[@id="main_content"]/div/div/div/div/div/ul/li/div/a'
elements = driver.find_elements(By.XPATH, xpath)

text = '\n'.join([i.text for i in elements])
print(text.strip(), '\n')

sleep(3)
driver.refresh()    #새로고침

elements = driver.find_elements(By.XPATH, xpath)
text = '\n'.join([i.text for i in elements])
print(text.strip())

sleep(3)
driver.close()

#### 과제(선택): 네이버 로그인 화면으로 이동해서 ID, FW 입력 후 로그인 실행
- 로그인 방지 우회

In [None]:
print(                                                                                                                                              );a='puppy05230';b='cocoa013'
# 이 위에 a=ID, b=FW

In [None]:
print(                                                                                                                                              );a='puppy05230';b='cocoa013'
# 이 위에 a=ID, b=FW

driver = webdriver.Chrome(path)
driver.get('https://www.naver.com/')

driver.find_element(By.XPATH, '//*[@id="account"]/a').send_keys(Keys.ENTER)
driver.find_element(By.ID, 'id').send_keys(a)
driver.find_element(By.ID, 'pw').send_keys(b)

driver.find_element(By.ID,'log.login').click()
sleep(3)

# driver.close()

In [None]:
# 우회한 코드!!
import pyperclip
driver = webdriver.Chrome(path)
driver.get('https://www.naver.com/')

driver.find_element(By.XPATH, '//*[@id="account"]/a').send_keys(Keys.ENTER)

uid = driver.find_element(By.ID, 'id')
uid.click()
pyperclip.copy(a)
uid.send_keys(Keys.CONTROL, 'v')
sleep(1)

fw = driver.find_element(By.ID, 'pw')
fw.click()
pyperclip.copy(b)
fw.send_keys(Keys.CONTROL, 'v')
sleep(1)

driver.find_element(By.ID,'log.login').click()
sleep(3)

driver.close()

#### 과제(4): 네이버에서 뉴스->사회 카테고리를 클릭하고 뉴스 제목을 출력하세요
url='https://news.naver.com/'

In [None]:
url = 'https://www.naver.com/'
driver = webdriver.Chrome(path)
driver.get(url)

path = '//*[@id="NM_NEWSSTAND_HEADER"]/div[2]/a[1]'
driver.find_element(By.XPATH, path).click()

path = '/html/body/section/header/div[2]/div/div/div[1]/div/div/ul/li[4]/a/span'
driver.find_element(By.XPATH, path).click()

path = '//*[@id="main_content"]/div/div/div/div/div/ul/li/div/a'
news = driver.find_elements(By.XPATH, path)

text = '\n'.join([i.text for i in news])
print(text.strip())

driver.close()

#### 과제(5): 한빛출판네트워크 사이트에 로그인해서 마일리지 점수 출력

In [None]:
print(                                                                                                                                              );a='puppy0523';b='r9knhqe3'
# 이 위에 a=ID, b=FW

In [None]:
url = 'https://www.hanbit.co.kr/'
driver = webdriver.Chrome(path)
driver.get(url)

driver.find_element(By.XPATH, '//*[@id="wrap_nav"]/ul[2]/li[1]/a').click()

driver.find_element(By.ID, 'm_id').send_keys(a)
driver.find_element(By.ID, 'm_passwd').send_keys(b)
driver.find_element(By.ID, 'login_btn').click()

driver.find_element(By.XPATH, '//*[@id="wrap_nav"]/ul[2]/li[3]/a').click()
coin = driver.find_element(By.XPATH, '//*[@id="container"]/div/div[2]/dl[1]/dd/span')
print('마일리지:',coin.text+'점')

driver.quit()

#### 과제(1): 네이버 최신 메일 1개 가져오기

In [6]:
print()                                                                   ;a = 'youth_sk'; b = 'tmfrl123'  #슬기언니거...!ㅠㅜ
# 이 위에 a=ID, b=FW




In [10]:
# 네이버 로그인: 자바스크립트 이용
path = r'C:\Users\h\hmkd1\chromedriver.exe'
driver = webdriver.Chrome(path)
driver.get('https://www.naver.com/')

driver.find_element(By.XPATH, '//*[@id="account"]/a').send_keys(Keys.ENTER)

driver.execute_script("document.getElementById('id').value=\'"+a+"\'")
sleep(1)
driver.execute_script("document.getElementById('pw').value=\'"+b+"\'")
sleep(1)
# driver.execute_script("document.getElementById('id').value='pppppp'")
# id,fw를 변수(a,b)를 따로 안 쓰고 바로 넣어줄 수도 있음
driver.find_element(By.ID,'log.login').click()

driver.find_element(By.CLASS_NAME, 'nav').click()

#### 메일이 안긁어와짐~~~~ㅂㄷㅂㄷ ####
# path = '//*[@id="mail_list_wrap"]/ul/li/ul/li/div/div/div/a'
# mail = driver.find_elements(By.XPATH, path)

css='#mail_list_wrap > ul > li:nth-child(1) > div > div.mail_inner > div > a > span.text'
# css = '#mail_list_wrap > ul > li > ul > li > div > div.mail_inner > div > a > span.text'
mail = driver.find_element(By.CSS_SELECTOR, css)
print(mail.text)

# print(mail)
# for i in mail:
#     print(i.text)

# sleep(3)
# driver.close()

NoSuchElementException: Message: no such element: Unable to locate element: {"method":"css selector","selector":"#mail_list_wrap > ul > li:nth-child(1) > div > div.mail_inner > div > a > span.text"}
  (Session info: chrome=113.0.5672.64)
Stacktrace:
Backtrace:
	GetHandleVerifier [0x008DDCE3+50899]
	(No symbol) [0x0086E111]
	(No symbol) [0x00775588]
	(No symbol) [0x007A08F9]
	(No symbol) [0x007A0AFB]
	(No symbol) [0x007CF902]
	(No symbol) [0x007BB944]
	(No symbol) [0x007CE01C]
	(No symbol) [0x007BB6F6]
	(No symbol) [0x00797708]
	(No symbol) [0x0079886D]
	GetHandleVerifier [0x00B43EAE+2566302]
	GetHandleVerifier [0x00B792B1+2784417]
	GetHandleVerifier [0x00B7327C+2759788]
	GetHandleVerifier [0x00975740+672048]
	(No symbol) [0x00878872]
	(No symbol) [0x008741C8]
	(No symbol) [0x008742AB]
	(No symbol) [0x008671B7]
	BaseThreadInitThunk [0x76310099+25]
	RtlGetAppContainerNamedObjectPath [0x77DB7B6E+286]
	RtlGetAppContainerNamedObjectPath [0x77DB7B3E+238]


In [None]:
# 네이버 로그인: 자바스크립트 이용 (돌아가는 코드)
path = r'C:\Users\h\hmkd1\chromedriver.exe'
driver = webdriver.Chrome(path)
driver.get('https://www.naver.com/')

driver.find_element(By.XPATH, '//*[@id="account"]/a').send_keys(Keys.ENTER)

driver.execute_script("document.getElementById('id').value=\'"+a+"\'")
sleep(1)
driver.execute_script("document.getElementById('pw').value=\'"+b+"\'")
sleep(1)
# driver.execute_script("document.getElementById('id').value='pppppp'")
# id,fw를 변수(a,b)를 따로 안 쓰고 바로 넣어줄 수도 있음

driver.find_element(By.ID,'log.login').click()
driver.find_element(By.CLASS_NAME, 'nav').click()   #메일함 들어가기

sleep(5)
xp='//*[@id="mail_list_wrap"]/ul/li[2]/ul/li[1]/div/div[4]/div/a/span[2]'
on = driver.find_element(By.XPATH, xp)
print(on.text)

# sleep(3)
# driver.close()

In [None]:
# 슬기언니 코드
import time
import selenium
from selenium import webdriver
from selenium.webdriver.common.by import By

path = 'C:/tool/chromedriver.exe'
driver =  webdriver.Chrome(path)
driver.get('https://www.naver.com')
driver.maximize_window()
time.sleep(1)
element = driver.find_element (By.CLASS_NAME, 'link_login')
element.click()
id = 'youth_sk'
pw = 'tmfrl123'

driver.execute_script("document.getElementById('id').value='" + id + "\'")
time.sleep(1)
driver.execute_script("document.getElementById('pw').value='" + pw + "\'")
time.sleep(1)

element = driver.find_element(By.CLASS_NAME, 'btn_login')
element.click()
#print (driver.page_source)

mail = driver.find_element(By.XPATH,'//*[@id="NM_FAVORITE"]/div[1]/ul[1]/li[1]/a')
mail.click()

time.sleep(5)

on = driver.find_element(By.XPATH,'//*[@id="mail_list_wrap"]/ul/li[2]/ul/li[1]/div/div[4]/div/a/span[2]')
print(on.text)