# 네이버 주식정보 크롤링

- 진행기간: 2020.05.04
- 사용 언어: python3
- 사용 python-framework: <b>jupyter notebook</b>
- 사용 웹크롤러: BeautifulSoup(bs4), Selenium
- 참고 : [스파르타 코딩클럽 - 파이썬 혼자놀기 패키지](https://www.notion.so/85d77f7239f74a2e9b7de8b1ecb40bcf)

## bs4와 selenium의 차이?

- bs4
    - 웹페이지의 정적인 텍스트(html코드)를 가져온다.
    - 특정 웹페이지의 태그 (클래스, 아이디 포함)의 텍스트 정보를 추출한다.
    - 다만, 동적인 페이지에서는 html코드를 추출할 수 없다.
    
- selenium
    - 동적인 페이지에서 자동으로 눌러줘서 크롤링 할 수 있도록 도와준다.
    - 자동입력 및 자동 클릭을 할 수 있다.
    - 그런데 요즘은 이런 걸 방지하기 위해서, 봇(사람이 직접 접속하는지 확인)이 실제 웹사이트에 내장되어있다.
    - selenium은 chrome에서만 가능하단걸 주의하자.
        - 현재 내가 사용하고 있는 크롬 엔진 버젼을 확인해서 웹드라이버를 다운한다.


## 크롬 브라우저 드라이버 설치하기

1. 현재 나의 ``크롬 엔진 드라이버 버젼`` 알아보기
    - 설정 > Chrome 정보


2. OS에 맞는 드라이버 설치
    - [다운로드](https://chromedriver.chromium.org/downloads)

## selenium 예제 1

- 1개회사 현재 주식정보 크롤링

In [1]:
from selenium import webdriver
from bs4 import BeautifulSoup
import time

# 셀레니움을 실행하는데 
# 필요한 크롬드라이버 파일을 가져온다.
driver= webdriver.Chrome('chromedriver')

# 네이버 주식 페이지 url
# 삼성전자 주식이군요 ^^
url='https://m.stock.naver.com/item/main.nhn#/stocks/005930/total'

# 크롬을 통해 네이버 주식페이지에 접속
driver.get(url)

# 정보를 받아오기까지 2초를 잠시 기다린다.
time.sleep(2)

# 크롬에서 HTML 정보를 가져오고
# BeautifulSoup을 통해 검색하기 쉽도록 가공합니다.
soup = BeautifulSoup(driver.page_source, 'html.parser')
name = soup.select_one('#header > div.end_header_topinfo > div.flick-container.major_info_wrp > div > div:nth-child(2) > div > div.item_wrp > div > h2').text
current_price = soup.select_one('#header > div.end_header_topinfo > div.flick-container.major_info_wrp > div > div:nth-child(2) > div > div.stock_wrp > div.price_wrp > strong').text
rate = soup.select_one('#header > div.end_header_topinfo > div.flick-container.major_info_wrp > div > div:nth-child(2) > div > div.stock_wrp > div.price_wrp > div > span.gap_rate > span.rate').text
print(name,current_price,rate)

# 크롬 종료
driver.quit()

삼성전자 48,500 -3.00


<br>

## selenium 예제 2

- 2개 이상 회사의 주식정보 크롤링

In [2]:
from selenium import webdriver
from bs4 import BeautifulSoup
import time

# 셀레니움을 실행하는데 
# 필요한 크롬드라이버 파일을 가져온다.
driver= webdriver.Chrome('chromedriver')

# 네이버 주식 페이지 url
codes=['005930', '035420', '035720']
for code in codes:
    url='https://m.stock.naver.com/item/main.nhn#/stocks/'+code+'/total'

    # 크롬을 통해 네이버 주식페이지에 접속
    driver.get(url)

    # 정보를 받아오기까지 2초를 잠시 기다린다.
    time.sleep(2)

    # 크롬에서 HTML 정보를 가져오고
    # BeautifulSoup을 통해 검색하기 쉽도록 가공합니다.
    soup = BeautifulSoup(driver.page_source, 'html.parser')
    name = soup.select_one('#header > div.end_header_topinfo > div.flick-container.major_info_wrp > div > div:nth-child(2) > div > div.item_wrp > div > h2').text
    current_price = soup.select_one('#header > div.end_header_topinfo > div.flick-container.major_info_wrp > div > div:nth-child(2) > div > div.stock_wrp > div.price_wrp > strong').text
    rate = soup.select_one('#header > div.end_header_topinfo > div.flick-container.major_info_wrp > div > div:nth-child(2) > div > div.stock_wrp > div.price_wrp > div > span.gap_rate > span.rate').text
    print(name,current_price,rate)

# 크롬 종료
driver.quit()

삼성전자 48,500 -3.00
NAVER 199,000 +0.76
카카오 186,500 +1.36


<br>

## selenium 예제 3
- 브라우저 안뜨게 하기

In [4]:
from selenium import webdriver
from bs4 import BeautifulSoup
import time

# 셀레니움 옵션값 조절하여 브라우저 안뜨게 설정하고, 웹드라이버 실행
options=webdriver.ChromeOptions()
options.add_argument('headless')
options.add_argument('window-size=1920x1080')
options.add_argument('disable-gpu')
options.add_argument('user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36')
driver= webdriver.Chrome('chromedriver', options=options)

# 네이버 주식 페이지 url
codes=['005930', '035420', '035720']
for code in codes:
    url='https://m.stock.naver.com/item/main.nhn#/stocks/'+code+'/total'

    # 크롬을 통해 네이버 주식페이지에 접속
    driver.get(url)

    # 정보를 받아오기까지 2초를 잠시 기다린다.
    time.sleep(2)

    # 크롬에서 HTML 정보를 가져오고
    # BeautifulSoup을 통해 검색하기 쉽도록 가공합니다.
    soup = BeautifulSoup(driver.page_source, 'html.parser')
    name = soup.select_one('#header > div.end_header_topinfo > div.flick-container.major_info_wrp > div > div:nth-child(2) > div > div.item_wrp > div > h2').text
    current_price = soup.select_one('#header > div.end_header_topinfo > div.flick-container.major_info_wrp > div > div:nth-child(2) > div > div.stock_wrp > div.price_wrp > strong').text
    rate = soup.select_one('#header > div.end_header_topinfo > div.flick-container.major_info_wrp > div > div:nth-child(2) > div > div.stock_wrp > div.price_wrp > div > span.gap_rate > span.rate').text
    print(name,current_price,rate)

# 크롬 종료
driver.quit()

삼성전자 48,500 -3.00
NAVER 199,000 +0.76
카카오 186,500 +1.36


## 반복실행하기 - schedule 라이브러리 사용

In [14]:
from selenium import webdriver
from bs4 import BeautifulSoup
import time
import schedule

def get_my_stock():
    # 크롬엔진 옵션 적용.
    options=webdriver.ChromeOptions()
    options.add_argument('headless')
    options.add_argument('window-size=1920x1080')
    options.add_argument('disable-gpu')
    options.add_argument('user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36')
    driver= webdriver.Chrome('chromedriver', options=options)

    # 네이버 주식 페이지 url
    codes=['005930', '035420', '035720']
    for code in codes:
        url='https://m.stock.naver.com/item/main.nhn#/stocks/'+code+'/total'

        # 크롬을 통해 네이버 주식페이지에 접속
        driver.get(url)

        # 정보를 받아오기까지 2초를 잠시 기다린다.
        time.sleep(2)

        # 크롬에서 HTML 정보를 가져오고
        # BeautifulSoup을 통해 검색하기 쉽도록 가공합니다.
        soup = BeautifulSoup(driver.page_source, 'html.parser')
        name = soup.select_one('#header > div.end_header_topinfo > div.flick-container.major_info_wrp > div > div:nth-child(2) > div > div.item_wrp > div > h2').text
        
        current_price = soup.select_one('#header > div.end_header_topinfo > div.flick-container.major_info_wrp > div > div:nth-child(2) > div > div.stock_wrp > div.price_wrp > strong').text
        
        rate = soup.select_one('#header > div.end_header_topinfo > div.flick-container.major_info_wrp > div > div:nth-child(2) > div > div.stock_wrp > div.price_wrp > div > span.gap_rate > span.rate').text
        print(name,current_price,rate)
    print('----------------------')

    # 크롬 종료
    driver.quit()

def job():
    get_my_stock()
    
def run():
    schedule.every(15).seconds.do(job) #15초에 1번씩 실행
    while True:
        schedule.run_pending()
        
if __name__=='__main__':
    run()

삼성전자 49,200 +1.44
----------------------
NAVER 212,000 +6.53
----------------------
카카오 199,500 +6.97
----------------------
삼성전자 49,200 +1.44
----------------------
NAVER 212,000 +6.53
----------------------
카카오 199,500 +6.97
----------------------
삼성전자 49,200 +1.44
----------------------
NAVER 212,000 +6.53
----------------------
카카오 199,500 +6.97
----------------------
삼성전자 49,200 +1.44
----------------------
NAVER 212,000 +6.53
----------------------
카카오 199,500 +6.97
----------------------


Exception ignored in: <function Service.__del__ at 0x0000025A17EF86A8>
Traceback (most recent call last):
  File "C:\Users\USER\Anaconda3\lib\site-packages\selenium\webdriver\common\service.py", line 176, in __del__
    self.stop()
  File "C:\Users\USER\Anaconda3\lib\site-packages\selenium\webdriver\common\service.py", line 151, in stop
    self.send_remote_shutdown_command()
  File "C:\Users\USER\Anaconda3\lib\site-packages\selenium\webdriver\common\service.py", line 132, in send_remote_shutdown_command
    if not self.is_connectable():
  File "C:\Users\USER\Anaconda3\lib\site-packages\selenium\webdriver\common\service.py", line 115, in is_connectable
    return utils.is_connectable(self.port)
  File "C:\Users\USER\Anaconda3\lib\site-packages\selenium\webdriver\common\utils.py", line 106, in is_connectable
    socket_ = socket.create_connection((host, port), 1)
  File "C:\Users\USER\Anaconda3\lib\socket.py", line 716, in create_connection
    sock.connect(sa)
KeyboardInterrupt: 


삼성전자 49,200 +1.44
----------------------


KeyboardInterrupt: 


## G메일로 주식 정보 알리기



1.사전작업

- 구글 계정관리 -> 보안 -> 2단계 인증설정
- 구글 계정관리 -> 보안 -> 앱비밀번호

In [15]:
import smtplib
from email.mime.multipart import MIMEMultipart
from email.mime.text import MIMEText

# 송신자 이메일
# 이메일정보 입력
me= 'dmsrkd1216@gmail.com'

#이메일 비밀번호( 사전작업에서 발급받은 앱비밀번호)
mp='olgkeivnxlumcvqa'

# 수신자 이메일
#이메일 받을 상대방 주소를 입력
you='rose1216_@naver.com'

## 이메일 내용 작성 및 전송 코드##
#이메일 작성 form을 받아온다.
msg=MIMEMultipart('alternative')

#제목 입력
msg['Subject']='테스트 알림!'

#송신자 입력
msg['From']=me

#수신자 입력
msg['To']=you

#이메일 내용을 작성
html='나비보벳따우 나비보벳띠 나비보벳또~~~ 파이썬으로 이메일을 보내요~ㅎㅎ'

#이메일 내용의 타입을 지정한다.
part2=MIMEText(html, 'html')

#이메일 form에 작성 내용을 입력한다.
msg.attach(part2)


# gmail을 통해 전달할 것임을 표시한다.
s=smtplib.SMTP_SSL('smtp.gmail.com')

# 계정정보를 이용해 로그인
s.login(me, mp)

#이메일 발송
s.sendmail(me, you, msg.as_string())

#이메일 발송 프로그램 종료
s.quit()


(221, b'2.0.0 closing connection n23sm4101300pjq.18 - gsmtp')

![이메일 전송 결과](./email_result.JPG)

<br>

## G메일로 주식정보 알려보기

In [18]:
import schedule

from selenium import webdriver
from bs4 import BeautifulSoup

import time

import smtplib
from email.mime.multipart import MIMEMultipart
from email.mime.text import MIMEText

def send_mail(stock_name):
    # 내 이메일 정보를 입력합니다.
    me = 'dmsrkd1216@gmail.com'
    # 내 비밀번호를 입력합니다.
    my_password = 'ivbipntyjzlmldrb'
    # 이메일 받을 상대방의 주소를 입력합니다.
    you = 'rose1216_@naver.com'

    ## 여기서부터 코드를 작성하세요.
    # 이메일 작성 form을 받아옵니다.
    msg = MIMEMultipart('alternative')
    # 제목을 입력합니다.
    msg['Subject'] = "알림!"
    # 송신자를 입력합니다.
    msg['From'] = me
    # 수신자를 입력합니다.
    msg['To'] = you

    # 이메일 내용을 작성합니다.
    html = stock_name+' 주식을 한번 보세요!'
    # 이메일 내용의 타입을 지정합니다.
    part2 = MIMEText(html, 'html')
    # 이메일 form에 작성 내용을 입력합니다
    msg.attach(part2)
    ## 여기에서 코드 작성이 끝납니다.

    # Gmail을 통해 전달할 것임을 표시합니다.
    s = smtplib.SMTP_SSL('smtp.gmail.com')
    # 계정 정보를 이용해 로그인합니다.
    s.login(me, my_password)
    # 이메일을 발송합니다.
    s.sendmail(me, you, msg.as_string())
    # 이메일 보내기 프로그램을 종료합니다.
    s.quit()

def get_my_stock():
    ### option 적용 ###
    options = webdriver.ChromeOptions()
    options.add_argument('headless')
    options.add_argument('window-size=1920x1080')
    options.add_argument("disable-gpu")
    options.add_argument(
        "user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36")

    driver = webdriver.Chrome('chromedriver', options=options)
    ##################

    codes = ['005930', '035420', '017670', '096770', '035720']

    for code in codes:
        # 네이버 주식페이지 url을 입력합니다.
        url = 'https://m.stock.naver.com/item/main.nhn#/stocks/' + code + '/total'

        # 크롬을 통해 네이버 주식페이지에 접속합니다.
        driver.get(url)

        # 정보를 받아오기까지 2초를 잠시 기다립니다.
        time.sleep(2)

        # 크롬에서 HTML 정보를 가져오고 BeautifulSoup을 통해 검색하기 쉽도록 가공합니다.
        soup = BeautifulSoup(driver.page_source, 'html.parser')

        name = soup.select_one(
            '#header > div.end_header_topinfo > div.flick-container.major_info_wrp > div > div:nth-child(2) > div > div.item_wrp > div > h2').text

        current_price = soup.select_one(
            '#header > div.end_header_topinfo > div.flick-container.major_info_wrp > div > div:nth-child(2) > div > div.stock_wrp > div.price_wrp > strong').text

        rate = soup.select_one('#header > div.end_header_topinfo > div.flick-container.major_info_wrp > div > div:nth-child(2) > div > div.stock_wrp > div.price_wrp > div > span.gap_rate > span.rate').text

        print(name,current_price,rate)
        
        # 전일대비 4%이상 오르면 메일로 알린다.
        if (float(rate) > 4):
            print('send',name)
            send_mail(name)

    print('-------')
    # 크롬을 종료합니다.
    driver.quit()

def job():
    get_my_stock()

def run():
    schedule.every(10).seconds.do(job) #10초에 한번씩 실행
    while True:
        schedule.run_pending()

if __name__ == "__main__":
    run()

삼성전자 48,850 -0.71
NAVER 213,500 +0.71
SK텔레콤 207,000 +0.24
SK이노베이션 98,400 -1.60
카카오 198,500 -0.50
-------
삼성전자 48,900 -0.61
NAVER 213,500 +0.71
SK텔레콤 206,500 0.00
SK이노베이션 98,400 -1.60
카카오 198,500 -0.50
-------
삼성전자 48,850 -0.71
NAVER 213,500 +0.71
SK텔레콤 207,000 +0.24
SK이노베이션 98,400 -1.60
카카오 199,000 -0.25
-------
삼성전자 48,900 -0.61
NAVER 213,500 +0.71
SK텔레콤 207,000 +0.24
SK이노베이션 98,400 -1.60
카카오 199,000 -0.25
-------
삼성전자 48,850 -0.71
NAVER 213,500 +0.71
SK텔레콤 206,500 0.00
SK이노베이션 98,300 -1.70
카카오 199,500 0.00
-------
삼성전자 48,850 -0.71
NAVER 213,500 +0.71
SK텔레콤 207,000 +0.24
SK이노베이션 98,400 -1.60
카카오 199,000 -0.25
-------
삼성전자 48,850 -0.71
NAVER 213,500 +0.71
SK텔레콤 206,500 0.00
SK이노베이션 98,300 -1.70
카카오 199,500 0.00
-------
삼성전자 48,800 -0.81
NAVER 213,500 +0.71
SK텔레콤 206,500 0.00
SK이노베이션 98,200 -1.80
카카오 200,000 +0.25
-------
삼성전자 48,850 -0.71
NAVER 213,500 +0.71
SK텔레콤 206,500 0.00
SK이노베이션 98,200 -1.80
카카오 200,500 +0.50
-------
삼성전자 48,850 -0.71
NAVER 214,500 +1.18
SK텔레콤 206,000 -0.24
SK이노

KeyboardInterrupt: 