# 크롤링(Crawling) : 자동화된 방식으로 웹(web)을 탐색

# 스크래핑(Scraping) : 테이터를 수집하는 행위

## 필요한 라이브러리 : requrests, beautifulsoup
### . Requests : 파이썬에서 웹요청을 보낼 수 있게 해주는 라이브러리
###                      공식 문서 : http://docs.python-requests.org/en/master/

### . Beautifulsoup : 웹페이지 파싱 라이브러리
#### - Parsing : 언어학에서 구문 분석이라고 하며, 컴퓨터 공학에서 문서를 읽고 해석하여 태그명, 속성명, 속성값 및 엘리먼트 내용을 분리하는 것을 의미한다.
###                               공식문서 : http://www.crummy.com/software/BeautifulSoup/bs4/doc/



## 1. 간단한 금융 관련 정보 수집

In [1]:
import requests
from bs4 import BeautifulSoup

In [2]:
URL = 'https://m.stock.naver.com/index.nhn' # 네이버 증권

In [3]:
response = requests.get(url = URL) # 해당 url에 요청보냄

In [4]:
print(response) # HTTP Status Code

<Response [200]>


In [5]:
print(response.text) # 웹 페이지 확인





















<!doctype html>

<html lang="ko">
<head>
    <meta charset="utf-8">
    <meta name="viewport" content="width=device-width,initial-scale=1.0,maximum-scale=1.0,minimum-scale=1.0,user-scalable=no">

    
    
        
            <meta property="og:url" content="https://M.STOCK.NAVER.COM"/>
            <meta property="og:title" content="네이버 증권"/>
            <meta property="og:image" content="https://ssl.pstatic.net/static/m/stock/im/2016/08/og_stock-200.png"/>
            <meta property="og:description" content="관심종목의 실시간 주가를 가장 빠르게 확인하는 곳"/>
        
        
    

    <meta property="og:type" content="article"/>
    <meta property="og:article:thumbnailUrl" content=""/>
    <meta property="og:article:author" content="네이버증권"/>
    <meta property="og:article:author:url" content="https://m.stock.naver.com"/>
    

    <title>네이버 증권</title>
    <link rel="stylesheet" type="text/css" href="https://ssl.pstatic.net/imgstock/static.mobile/css/finance/min/20200214142656/mstoc

In [6]:
soup = BeautifulSoup(response.text, 'html.parser')

In [7]:
print(soup)


<!DOCTYPE doctype html>

<html lang="ko">
<head>
<meta charset="utf-8"/>
<meta content="width=device-width,initial-scale=1.0,maximum-scale=1.0,minimum-scale=1.0,user-scalable=no" name="viewport"/>
<meta content="https://M.STOCK.NAVER.COM" property="og:url">
<meta content="네이버 증권" property="og:title">
<meta content="https://ssl.pstatic.net/static/m/stock/im/2016/08/og_stock-200.png" property="og:image"/>
<meta content="관심종목의 실시간 주가를 가장 빠르게 확인하는 곳" property="og:description"/>
<meta content="article" property="og:type"/>
<meta content="" property="og:article:thumbnailUrl"/>
<meta content="네이버증권" property="og:article:author"/>
<meta content="https://m.stock.naver.com" property="og:article:author:url"/>
<title>네이버 증권</title>
<link href="https://ssl.pstatic.net/imgstock/static.mobile/css/finance/min/20200214142656/mstock.css" rel="stylesheet" type="text/css"/>
<!-- favicon -->
<link href="https://ssl.pstatic.net/imgstock/favicon.ico" rel="shortcut icon"/>
<script type="text/javascript">
   

In [8]:
print(soup.find("span"))

<span class="Ngnb_logo"><a class="Nlogo_link" href="https://m.naver.com/"><span class="Nicon_logo">NAVER</span></a></span>


In [9]:
print(soup.find_all("span"))

[<span class="Ngnb_logo"><a class="Nlogo_link" href="https://m.naver.com/"><span class="Nicon_logo">NAVER</span></a></span>, <span class="Nicon_logo">NAVER</span>, <span class="Nicon_service">증권</span>, <span class="Nicon_my">MY</span>, <span class="Nbox_text"><input class="Nbox_input_text" id="keyword_top" name="keyword_input" onblur="checkKeyword(this);" onfocus="clearKeyword(this);" placeholder="종목명 또는 종목코드" title="검색어 입력" type="text" value=""/></span>, <span class="Nbox_tool">
<button class="Nbox_button Nbox_delete" id="clearBtnTop" style="display: none;" type="button">
<span class="Nicon_delete">검색어 삭제</span>
</button>
<button class="Nbox_button Nbox_search" onclick="nclk(this, 'gnb.search', '', '');" type="submit">
<span class="Nicon_submit">검색</span>
</button>
</span>, <span class="Nicon_delete">검색어 삭제</span>, <span class="Nicon_submit">검색</span>, <span class="code">@code@</span>, <span class="code2">@market@</span>, <span class="Nitem_link_menu">홈</span>, <span class="Nitem_lin

In [10]:
print(soup.find_all("span",{"class" : "stock_price stock_dn"}))

[<span class="stock_price stock_dn">2,208.88</span>, <span class="stock_price stock_dn">682.92</span>, <span class="stock_price stock_dn">29,398.08</span>]


In [11]:
data = soup.find_all("span",{"class" : "stock_price stock_dn"})
get_kospi = data[0].text
print("KOSPI : {}".format(get_kospi))

get_kosdaq = data[1].text
print("KOSDAQ : {}".format(get_kosdaq))

KOSPI : 2,208.88
KOSDAQ : 682.92


## 2. 네이버 자동차관련 포스트 정보 수집

In [12]:
import requests
from bs4 import BeautifulSoup
URL = 'https://post.naver.com/subject/list.nhn?navigationType=push&categoryNo=57&subjectType=CATEGORY&mainMenu=CARGAME' # 네이버 포스트 자동차
response = requests.get(url = URL)
soup = BeautifulSoup(response.text, 'html.parser')

In [13]:
print(soup.find_all("div",{"class" : "spot_post_name"}))

[<div class="spot_post_name">
<span class="ell">
				나의 첫 BMW, 산 거 후회하냐고 물으신다면...</span>
</div>, <div class="spot_post_name">
<span class="ell">
				신형 쏘렌토, 2.2 디젤에 8단 습식 DCT 적용</span>
</div>, <div class="spot_post_name">
<span class="ell">
				기아차, 흥행분위기 이어갈 4세대 쏘렌토 내외장 공개</span>
</div>, <div class="spot_post_name">
<span class="ell">
				‘풀체인지급 변화’ 신형 쏘렌토 대적할 '싼타페 페이스리프트' 포착, 5월 출시 예정</span>
</div>, <div class="spot_post_name">
<span class="ell">
				BMW의 컴팩트 4도어 쿠페, 2시리즈 그란쿠페 사전계약 실시</span>
</div>, <div class="spot_post_name">
<span class="ell">
				기아자동차, 2021년 초고성능 크로스오버 전기차 공개한다</span>
</div>, <div class="spot_post_name">
<span class="ell">
				BMW 맞아? 역대급 독특한 매력 풍기는 BMW</span>
</div>, <div class="spot_post_name">
<span class="ell">
				“우리가 본 것 중 최고” 뉴 쏘렌토 외신 반응은? </span>
</div>, <div class="spot_post_name">
<span class="ell">
				편안하게 보는 현대자동차 디자인 흐름</span>
</div>, <div class="spot_post_name">
<span class="ell">
				더 뉴 그랜저 3.3 시승기</span>
</div>, <div class="spot_post_name">
<s

In [14]:
get_title_all = soup.find_all("div",{"class" : "spot_post_name"})
for i in get_title_all:
    print(i.text)



				나의 첫 BMW, 산 거 후회하냐고 물으신다면...



				신형 쏘렌토, 2.2 디젤에 8단 습식 DCT 적용



				기아차, 흥행분위기 이어갈 4세대 쏘렌토 내외장 공개



				‘풀체인지급 변화’ 신형 쏘렌토 대적할 '싼타페 페이스리프트' 포착, 5월 출시 예정



				BMW의 컴팩트 4도어 쿠페, 2시리즈 그란쿠페 사전계약 실시



				기아자동차, 2021년 초고성능 크로스오버 전기차 공개한다



				BMW 맞아? 역대급 독특한 매력 풍기는 BMW



				“우리가 본 것 중 최고” 뉴 쏘렌토 외신 반응은? 



				편안하게 보는 현대자동차 디자인 흐름



				더 뉴 그랜저 3.3 시승기



				늘려도 시원찮은 '전기차 충전기'가 철거되고 있는 황당한 이유



				람보르기니 우루스, 독일 자동차 전문지 독자가 선정한 최고의 차



				“이 집 휠 디자인 잘 뽑네” 현대차 준중형 이하 휠 디자인 중 최고는? 



				"타보면 알아요" 운전 좋아하는 사람들이 포르쉐를 선호하는 이유



				수입차 큰손 2030세대를 잡아라
…작고 예쁜차의 반격 



				트럼프 대통령 “내 차로 서킷 랩타임 재봐!” 지시



				기아(KIA)가 테슬라처럼 될 수 있을까



				포드 BEV 머스탱 마하E유럽 사양 공개



In [15]:
title = []
for i in get_title_all:
    title.append(i.text.replace('\n','').replace('\t',''))

In [16]:
for i in title:
    print(i)

나의 첫 BMW, 산 거 후회하냐고 물으신다면...
신형 쏘렌토, 2.2 디젤에 8단 습식 DCT 적용
기아차, 흥행분위기 이어갈 4세대 쏘렌토 내외장 공개
‘풀체인지급 변화’ 신형 쏘렌토 대적할 '싼타페 페이스리프트' 포착, 5월 출시 예정
BMW의 컴팩트 4도어 쿠페, 2시리즈 그란쿠페 사전계약 실시
기아자동차, 2021년 초고성능 크로스오버 전기차 공개한다
BMW 맞아? 역대급 독특한 매력 풍기는 BMW
“우리가 본 것 중 최고” 뉴 쏘렌토 외신 반응은? 
편안하게 보는 현대자동차 디자인 흐름
더 뉴 그랜저 3.3 시승기
늘려도 시원찮은 '전기차 충전기'가 철거되고 있는 황당한 이유
람보르기니 우루스, 독일 자동차 전문지 독자가 선정한 최고의 차
“이 집 휠 디자인 잘 뽑네” 현대차 준중형 이하 휠 디자인 중 최고는? 
"타보면 알아요" 운전 좋아하는 사람들이 포르쉐를 선호하는 이유
수입차 큰손 2030세대를 잡아라…작고 예쁜차의 반격 
트럼프 대통령 “내 차로 서킷 랩타임 재봐!” 지시
기아(KIA)가 테슬라처럼 될 수 있을까
포드 BEV 머스탱 마하E유럽 사양 공개


In [17]:
print(len(title))
print(title[0])
print(title[1])

18
나의 첫 BMW, 산 거 후회하냐고 물으신다면...
신형 쏘렌토, 2.2 디젤에 8단 습식 DCT 적용


## 3. 신상품 정보 수집 및 DB(SQLite3) 활용

In [18]:
import requests
from bs4 import BeautifulSoup
URL = 'https://www.eleparts.co.kr/goods_ele/main?code=VC14' # 엘레파츠 테스트/계측기/광학 카테고리
response = requests.get(url = URL)
soup = BeautifulSoup(response.text, 'html.parser')

In [19]:
print(soup.find_all("h3",{"class" : "photo_box_title"}))

[<h3 class="photo_box_title">BU-P4243-0</h3>, <h3 class="photo_box_title">H345313100</h3>, <h3 class="photo_box_title">CT2060-25-2</h3>, <h3 class="photo_box_title">66.9196-24</h3>, <h3 class="photo_box_title">S-0-D-1-G-660 S/C</h3>, <h3 class="photo_box_title">PK001</h3>, <h3 class="photo_box_title">CL681563</h3>, <h3 class="photo_box_title">BU-3110410-0</h3>, <h3 class="photo_box_title">BU-P1825-8</h3>, <h3 class="photo_box_title">BU-P3788</h3>, <h3 class="photo_box_title">BU-P72914-0</h3>, <h3 class="photo_box_title">BU-P72914-2</h3>, <h3 class="photo_box_title">6096</h3>, <h3 class="photo_box_title">T3PP300</h3>, <h3 class="photo_box_title">CT4026</h3>, <h3 class="photo_box_title">N4822A</h3>, <h3 class="photo_box_title">6245-48-02</h3>, <h3 class="photo_box_title">CT2521-100-6</h3>, <h3 class="photo_box_title">EX60-60 Switching Type Programmable DC Power Supply</h3>, <h3 class="photo_box_title">EX80-105 Switching Type Programmable DC Power Supply</h3>, <h3 class="photo_box_title">

In [20]:
get_all_title = soup.find_all("h3",{"class" : "photo_box_title"}) # 상품명
title = []
for i in get_all_title:
    title.append(i.text)
print(title)

['BU-P4243-0', 'H345313100', 'CT2060-25-2', '66.9196-24', 'S-0-D-1-G-660 S/C', 'PK001', 'CL681563', 'BU-3110410-0', 'BU-P1825-8', 'BU-P3788', 'BU-P72914-0', 'BU-P72914-2', '6096', 'T3PP300', 'CT4026', 'N4822A', '6245-48-02', 'CT2521-100-6', 'EX60-60 Switching Type Programmable DC Power Supply', 'EX80-105 Switching Type Programmable DC Power Supply', '[BE038] Coms 바나나 케이블, 1Set/악어클립 (Red/Black)', 'CT3249-9', 'S001 - 스마트폰 현미경', '[DSO Nano v3] 포켓형 컬러 오실로스코프', 'FLUKE-17B+', 'FLUKE-101(포켓테스터)', 'FLUKE-15B+', '[에프티랩] 스마트 라돈측정기 라돈아이 [RD200]', 'PCB 자 15cm', 'USB 전압/전류 측정기(USB2.0 & 3.0 호환)', 'HDS-1021M-N 핸디형 디지털 오실로스코프', '멀티메터[MAS838](MASTECH정품)', 'HiOKi 3244-60 CARD HiTester', 'MT4Y-DV-4N(표시전용)', 'MK3003D 정밀급 디지털파워서플라이', '[UW-EAA] Compact 스마트폰 장착 열화상 카메라(안드로이드)']


In [21]:
#print(soup.find_all("a",{"class" : "procBox"}))
get_all_title = soup.find_all("a",{"class" : "procBox"})

title =[]  # 상품명
exp = []  # 상품설명
price =[] # 상품 가격
img =[]   # 상품 이미지

for i in get_all_title:
    # print(i.text)
    # print(i.find('img')['src'])
    # print('*'*100)
    img.append(i.find('img')['src'])
    title.append(i.find('h3').text)
    exp.append(i.find('p').text)
    price.append(int(i.find('i').text.replace(',','').replace(' ','').replace('원','')))

In [22]:
# 수집한 데이터를 DataFrame 형태로 저장
from pandas import DataFrame

result = DataFrame()
result['TITLE'] = title
result['EXP'] = exp
result['PRICE'] = price
print(result)

                                                TITLE  \
0                                          BU-P4243-0   
1                                          H345313100   
2                                         CT2060-25-2   
3                                          66.9196-24   
4                                   S-0-D-1-G-660 S/C   
5                                               PK001   
6                                            CL681563   
7                                        BU-3110410-0   
8                                          BU-P1825-8   
9                                            BU-P3788   
10                                        BU-P72914-0   
11                                        BU-P72914-2   
12                                               6096   
13                                            T3PP300   
14                                             CT4026   
15                                             N4822A   
16                             

In [23]:
# DB에 데이터 저장
import sqlite3 
import pandas.io.sql as pd_sql

con = sqlite3.connect("Test.db")

result.to_sql('items', con, if_exists='append')

# TITLE을 기준으로 중복데이터는 제거
sql = "DELETE FROM items WHERE rowid NOT IN  (SELECT Max(rowid) FROM items GROUP BY TITLE order by TITLE)"
pd_sql.execute(sql, con)
con.commit()
con.close()

In [24]:
# DB에서 데이터 불러오기
import pandas as pd

con = sqlite3.connect("Test.db")
df = pd.read_sql('select * from items', con=con)
con.close()
print(df)

    index                                              TITLE  \
0       0                                         BU-P4243-0   
1       1                                         H345313100   
2       2                                        CT2060-25-2   
3       3                                         66.9196-24   
4       4                                  S-0-D-1-G-660 S/C   
5       5                                              PK001   
6       6                                           CL681563   
7       7                                       BU-3110410-0   
8       8                                         BU-P1825-8   
9       9                                           BU-P3788   
10     10                                        BU-P72914-0   
11     11                                        BU-P72914-2   
12     12                                               6096   
13     13                                            T3PP300   
14     14                               

## 4. 영화 예매순위

In [25]:
import requests
from bs4 import BeautifulSoup
URL = 'http://ticket2.movie.daum.net/Movie/MovieRankList.aspx' # 다음 영화 예매 / 영화 예매순위 1~20위
response = requests.get(url = URL)
soup = BeautifulSoup(response.text, 'html.parser')
print(soup)


<!DOCTYPE doctype html>

<html class="chrome pc version_48_0_2564_109" lang="ko">
<head>
<meta charset="utf-8"/>
<title>빠른예매 | 다음영화</title>
<meta content="user-scalable=no, initial-scale=1.0, maximum-scale=1.0, minimum-scale=1.0, width=device-width" name="viewport"/>
<meta content="telephone=no" name="format-detection"/>
<meta content="IE=edge" http-equiv="X-UA-Compatible">
<link href="http://t1.daumcdn.net/movie/common/favicon.ico" rel="shortcut icon"/>
<link href="http://t1.daumcdn.net/movie/common/apple-icon.png" rel="apple-touch-icon-precomposed">
<link href="//movie.daum.net/resources/css/v2/yes.css?v=20170108007" rel="stylesheet" type="text/css"/>
<link href="/css/movie.css?v=20170108007" rel="stylesheet" type="text/css"/>
<link href="/css/movie_update.css?v=2019011740" rel="stylesheet" type="text/css"/>
<script src="/Script/jquery-1.8.3.min.js" type="text/javascript"></script>
<script src="/Script/common.js?v=F" type="text/javascript"></script>
<script src="/Script/menu.js?v=20

In [26]:
# print(soup.find_all("strong",{"class" : "tit_join"}))
get_all_title = soup.find_all("strong",{"class" : "tit_join"}) # 예매 순위 영화 제목
title = []
for i in get_all_title:
    title.append(i.text.replace('\r','').replace('\n','').replace(' ',''))
print(title)

['정직한후보', '작은아씨들', '클로젯', '기생충', '수퍼소닉', '남산의부장들', '버즈오브프레이', '극장판미니특공대:공룡왕디노', '조조래빗', '히트맨', '극장판원피스스탬피드', '지푸라기라도잡고싶은짐승들', '인셉션', '1917', '타오르는여인의초상', '이멋진세계에축복을!붉은전설', '페인앤글로리', '문신을한신부님', '스파이지니어스', '하이，젝시']


In [27]:
get_all_score = soup.find_all("em",{"class" : "emph_grade"}) # 예매 순위 영화 평점
score = []
for i in get_all_score:
    score.append(i.text.replace('\r','').replace('\n','').replace(' ',''))
print(score)

['7.8', '7.7', '7.2', '7.9', '6.9', '8.4', '6.9', '7.9', '8.5', '6.8', '7.8', '8.9', '8.7', '7.3', '8.3', '7.7', '7.6', '8.5', '8.6', '8.6']


In [28]:
# 수집한 데이터를 DataFrame 형태로 저장
from pandas import DataFrame

result = DataFrame()
result['TITLE'] = title
result['SCORE'] = score
print(result)

             TITLE SCORE
0            정직한후보   7.8
1            작은아씨들   7.7
2              클로젯   7.2
3              기생충   7.9
4             수퍼소닉   6.9
5           남산의부장들   8.4
6          버즈오브프레이   6.9
7   극장판미니특공대:공룡왕디노   7.9
8             조조래빗   8.5
9              히트맨   6.8
10      극장판원피스스탬피드   7.8
11   지푸라기라도잡고싶은짐승들   8.9
12             인셉션   8.7
13            1917   7.3
14       타오르는여인의초상   8.3
15  이멋진세계에축복을!붉은전설   7.7
16          페인앤글로리   7.6
17         문신을한신부님   8.5
18         스파이지니어스   8.6
19           하이，젝시   8.6


## 5. 국내 자동차 판매 순위

In [29]:
import requests
from bs4 import BeautifulSoup
URL = 'http://auto.danawa.com/newcar/?Work=record' # 다나와 자동차
response = requests.get(url = URL)
soup = BeautifulSoup(response.text, 'html.parser')
print(soup)

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml"><head><meta content="TEXT/HTML; CHARSET=utf-8" http-equiv="CONTENT-TYPE"/><title>Error</title></head><body><h2>Error</h2><table bgcolor="#FEEE7A" border="0" cellpadding="0" cellspacing="0" summary="Error" width="400"><tr><td><table border="0" cellpadding="3" cellspacing="1" summary="Error"><tr align="left" bgcolor="#FBFFDF" valign="top"><td><strong>Error</strong></td></tr><tr bgcolor="#FFFFFF" valign="top"><td>This page can't be displayed. Contact support for additional information.<br/>The incident ID is: 6662400083992615579.</td></tr></table></td></tr></table></body></html>


#### URL은 이상이 없지만, 크롤링 시 에러가 발생했다.
#### 접속을 할 때 어느정도의 시간이 걸리는 것이 확인되어 Selenium을 이용한다.

### Selenium : 사용자 대신 프로그램이 웹 프로그램을 제어할 수 있게 해주는 라이버러리
https://www.seleniumhq.org

In [31]:
import time
import requests
from bs4 import BeautifulSoup
from selenium import webdriver

URL = 'http://auto.danawa.com/newcar/?Work=record' # 다나와 자동차

driver = webdriver.Chrome("chromedriver.exe") # 크롬드라이버를 이용해서 크롬 창을 띄운다.
driver.get(URL)
time.sleep(1) # 페이지가 완전히 오픈될 때까지 기다린다.
html = driver.page_source
soup = BeautifulSoup(html, 'lxml')
driver.quit()
print(soup)

<!DOCTYPE html>
<html lang="ko" xmlns="http://www.w3.org/1999/xhtml"><head>
<meta charset="utf-8"/>
<meta content="IE=edge" http-equiv="X-UA-Compatible"/>
<meta content="다나와자동차" name="apple-mobile-web-app-title"/>
<meta content="width=1220" name="viewport"/>
<meta content="2020년 02월  | 판매실적 | 신차 : 다나와 자동차" name="title"/>
<meta content="2020년 02월 국산차/수입차 판매량, 판매실적" name="description"/>
<meta content="2020년 02월 국산차, 수입차, 판매량, 판매실적" name="keywords"/>
<meta content="2020년 02월  | 판매실적 | 신차 : 다나와 자동차" property="og:title"/>
<meta content="http://autoimg.danawa.com/html/images/danawa_auto_sns.png" property="og:image"/>
<meta content="http://auto.danawa.com/newcar/?Work=record" property="og:url"/>
<meta content="2020년 02월 국산차/수입차 판매량, 판매실적" property="og:description"/>
<meta content="website" property="og:type"/>
<title> 2020년 02월  | 판매실적 | 신차 : 다나와 자동차 </title><meta content="9fb6d5d878fa5d2cdfe52b19f6321a44e5b5b196" name="naver-site-verification"/>
<link href="http://autoimg.danawa.com/html/ima

In [32]:
get_all_title = soup.find_all("td",{"class" : "title"}) # 국산 판매 순위별 차량명
print(get_all_title)

[<td class="title">
<a href="/newcar/?Work=record&amp;Brand=303&amp;Month=2020-01-00">
<img alt="현대" src="http://autoimg.danawa.com/photo/brand/303_40.png"/>현대
	                            </a>
</td>, <td class="title">
<a href="/newcar/?Work=record&amp;Brand=307&amp;Month=2020-01-00">
<img alt="기아" src="http://autoimg.danawa.com/photo/brand/307_40.png"/>기아
	                            </a>
</td>, <td class="title">
<a href="/newcar/?Work=record&amp;Brand=326&amp;Month=2020-01-00">
<img alt="쌍용" src="http://autoimg.danawa.com/photo/brand/326_40.png"/>쌍용
	                            </a>
</td>, <td class="title">
<a href="/newcar/?Work=record&amp;Brand=312,316&amp;Month=2020-01-00">
<img alt="쉐보레" src="http://autoimg.danawa.com/photo/brand/312_40.png"/>쉐보레
	                            </a>
</td>, <td class="title">
<a href="/newcar/?Work=record&amp;Brand=321,322&amp;Month=2020-01-00">
<img alt="르노삼성" src="http://autoimg.danawa.com/photo/brand/321_40.png"/>르노삼성
	                         

In [33]:
data = []
for i in get_all_title:
        data.append(i.text.replace('\n','').replace('\t','').replace(' ',''))
print(data)

['현대', '기아', '쌍용', '쉐보레', '르노삼성', '벤츠', 'BMW', '폭스바겐', '볼보', '포드', 'K5', '포터2', '더뉴그랜저', '쏘나타', '팰리세이드', '봉고3', 'K7', 'QM6', '셀토스', '카니발', 'E-Class', 'Arteon', 'TheNewS-Class', '5Series', 'TheNewGLC-Class', 'Explorer', 'TheNewCLS', 'Tiguan', 'New6Series', 'TheNewC-Class']


In [34]:
cars = data[-20:]
print(cars)

['K5', '포터2', '더뉴그랜저', '쏘나타', '팰리세이드', '봉고3', 'K7', 'QM6', '셀토스', '카니발', 'E-Class', 'Arteon', 'TheNewS-Class', '5Series', 'TheNewGLC-Class', 'Explorer', 'TheNewCLS', 'Tiguan', 'New6Series', 'TheNewC-Class']


In [35]:
print("<국산차량 판매순위>")
국산차량 = data[-20:-10]
print(국산차량)
print("*"*130)

print("<해외차량 판매순위>")
해외차량 = data[-10:]
print(해외차량)

<국산차량 판매순위>
['K5', '포터2', '더뉴그랜저', '쏘나타', '팰리세이드', '봉고3', 'K7', 'QM6', '셀토스', '카니발']
**********************************************************************************************************************************
<해외차량 판매순위>
['E-Class', 'Arteon', 'TheNewS-Class', '5Series', 'TheNewGLC-Class', 'Explorer', 'TheNewCLS', 'Tiguan', 'New6Series', 'TheNewC-Class']
