### 1. 웹 크롤링(crawling) 이해
- Web상에 존재하는 Contents를 수집하는 작업 (프로그래밍으로 자동화 가능)
    - HTML 페이지를 가져와서, HTML/CSS등을 파싱(구문 해석하는 것, parsing)하고, 필요한 데이터만 추출하는 기법
    - Open API(Rest API)를 제공하는 서비스에 Open API를 호출해서, 받은 데이터 중 필요한 데이터만 추출하는 기법
    - Selenium등 브라우저를 프로그래밍으로 조작해서, 필요한 데이터만 추출하는 기법

#### 2. BeautifulSoup 라이브러리
- HTML의 태그를 파싱해서 필요한 데이터만 추출하는 함수를 제공하는 라이브러리
- 참조: https://www.crummy.com/software/BeautifulSoup/bs4/doc/
- 설치: pip install bs4

In [3]:
import requests # HTML 페이지 요청하기 위해 사용하는 라이브러리
from bs4 import BeautifulSoup as bs
url='https://kin.naver.com/'

res = requests.get(url) # 데이터를 요청할 때 사용함 <-> post로 요청할 경우도 있음, 파라미터 차이가 있음.
print(res.status_code) # 200이 나오면 정상
print(res.content)

200
b'\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\t\n\n\n\n<!DOCTYPE html>\n<html lang="ko">\n<head>\n<meta name="referrer" contents="always">\n\n<meta http-equiv="X-UA-Compatible" content="IE=edge">\n<meta name="description" content="\xec\xa7\x80\xec\x8b\x9d\xeb\x82\x98\xeb\x88\x94\xea\xb3\xbc \xea\xb8\xb0\xeb\xb6\x80\xeb\xa1\x9c \xed\x95\xa8\xea\xbb\x98 \xec\x84\xb1\xec\x9e\xa5\xed\x95\x98\xeb\x8a\x94 \xec\xa7\x80\xec\x8b\x9diN\xec\x9d\x84 \xeb\xa7\x8c\xeb\x82\x98\xeb\xb3\xb4\xec\x84\xb8\xec\x9a\x94."/>\n<meta name="viewport" content="width=1024">\n\n<meta name="msapplication-config" content="none" />\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n<link rel="stylesheet" type="text/css" href="https://ssl.pstatic.net/static.kin/static/pc/20221207140750/css/min/common.css" />\n<link rel="stylesheet" type="text/css" href="https://ssl.pstatic.net/static.kin/static/pc/20221207140750/css/min/components.css" />\n\n\n\t\n\t\n\t\t<link rel="stylesheet" ty

In [7]:
# 바이너리 원문을 보여준다.
res.content[:500]

b'\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\t\n\n\n\n<!DOCTYPE html>\n<html lang="ko">\n<head>\n<meta name="referrer" contents="always">\n\n<meta http-equiv="X-UA-Compatible" content="IE=edge">\n<meta name="description" content="\xec\xa7\x80\xec\x8b\x9d\xeb\x82\x98\xeb\x88\x94\xea\xb3\xbc \xea\xb8\xb0\xeb\xb6\x80\xeb\xa1\x9c \xed\x95\xa8\xea\xbb\x98 \xec\x84\xb1\xec\x9e\xa5\xed\x95\x98\xeb\x8a\x94 \xec\xa7\x80\xec\x8b\x9diN\xec\x9d\x84 \xeb\xa7\x8c\xeb\x82\x98\xeb\xb3\xb4\xec\x84\xb8\xec\x9a\x94."/>\n<meta name="viewport" content="width=1024">\n\n<meta name="msapplication-config" content="none" />\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n<link rel="stylesheet" type="text/css" href="https://ssl.pstatic.net/static.kin/static'

In [9]:
# UTF-8로 인코딩된 문자열을 출력해준다.
res.text[:500]

'\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\t\n\n\n\n<!DOCTYPE html>\n<html lang="ko">\n<head>\n<meta name="referrer" contents="always">\n\n<meta http-equiv="X-UA-Compatible" content="IE=edge">\n<meta name="description" content="지식나눔과 기부로 함께 성장하는 지식iN을 만나보세요."/>\n<meta name="viewport" content="width=1024">\n\n<meta name="msapplication-config" content="none" />\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n<link rel="stylesheet" type="text/css" href="https://ssl.pstatic.net/static.kin/static/pc/20221207140750/css/min/common.css" />\n<l'

In [12]:
# 참고) 만약, 응답 데이터가 JSON 포멧이라면, json() 함수를 사용합니다.
# res.json()

In [13]:
# BeautifulSoup(HTML 데이터, 파싱방법)
soup = bs(res.content,'html.parser')
soup


<!DOCTYPE html>

<html lang="ko">
<head>
<meta contents="always" name="referrer"/>
<meta content="IE=edge" http-equiv="X-UA-Compatible"/>
<meta content="지식나눔과 기부로 함께 성장하는 지식iN을 만나보세요." name="description">
<meta content="width=1024" name="viewport"/>
<meta content="none" name="msapplication-config">
<link href="https://ssl.pstatic.net/static.kin/static/pc/20221207140750/css/min/common.css" rel="stylesheet" type="text/css"/>
<link href="https://ssl.pstatic.net/static.kin/static/pc/20221207140750/css/min/components.css" rel="stylesheet" type="text/css"/>
<link href="https://ssl.pstatic.net/static.kin/static/pc/20221207140750/css/min/other.css" rel="stylesheet" type="text/css"/>
<link href="https://ssl.pstatic.net/static.kin/static/pc/20221207140750/css/min/main.css" rel="stylesheet" type="text/css">
<link href="https://ssl.pstatic.net/static.kin/static/pc/20221207140750/css/min/c3p.datalab.theme.css" rel="stylesheet" type="text/css"/>
<script>
	
	var pcDomain = "kin.naver.com";
	var pcDo

In [15]:
soup.text #soup.get_text()

'\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\t\n\tvar pcDomain = "kin.naver.com";\n\tvar pcDomainWithProtocol = "https://kin.naver.com";\n\tvar pcKinServiceProtocol = "https";\n\n\tvar mobileDomain = "m.kin.naver.com";\n\tvar mobileDomainWithProtocol = "https://m.kin.naver.com";\n\tvar mobileKinServiceProtocol = "https";\n\n\tvar uploadDomain = "upload.kin.naver.com";\n\tvar uploadDomainWithProtocol = "https://upload.kin.naver.com";\n\tvar uploadKinServiceProtocol = "https";\n\n\n\n\n\n\n\n\n\n\n\n\n\t네이버 지식iN\n\n\n\nif ( typeof window.nhn  == "undefined" ) window.nhn = {};\nif ( typeof window.naver  == "undefined" ) window.naver = {};\nnhn.isLogin = false;\nnhn.isJunior = ("N"=="Y");\nnhn.isKinUser = false;\nnhn.isPortableDevice = false;\nnhn.jsDir = \'https://ssl.pstatic.net/static.kin/static/pc/20221207140750/js/min\';\n\nvar g_ssc = ("kin.home" == "") ? "kin.temp" : "kin.home";\nvar ccsrv="cc.naver.com";\n\n\nvar kinRos = {\n\tbIsNoticeDisplay : ("false" == "" || "false" == "false") ? false : t

In [19]:
title = soup.find('title') # 사용자가 지정한 태그를 찾아준다. (가장 첫번째 태그만 찾아준다.)
print(title) # title 이라는 tag를 추출해준다.
print(title.get_text()) # 데이터에서 태그를 제거하고 텍스트만 출력해준다.

<title>
	네이버 지식iN
</title>

	네이버 지식iN



In [21]:
# ul 태그 출력: 사용자가 지정한 태그의 가장 첫번째 태그만 출력
uls=soup.find('ul')
uls

<ul class="rolling-notice__list _rolling_banner" id="listNotice">
<li class="rolling-notice__item _rollingItem" data-start-time="2021-10-26 00:00:00" style="display:none;">
<a class="rolling-notice__link" href="https://expert.naver.com/expert/introduction?tab=guide#join" onclick="nhn.Kin.Utility.nClicks('STA.event', '', '', event);">
<i class="icon_new_red _newMark" style="display:none;"><span class="blind">새소식</span></i>
<span class="text-color--secondary">2023년 엑스퍼트 전문가 되자!</span>
</a>
</li>
<li class="rolling-notice__item _rollingItem" data-start-time="2022-08-31 00:00:00" style="display:none;">
<a class="rolling-notice__link" href="https://expert.naver.com/expert/introduction?tab=guide#join" onclick="nhn.Kin.Utility.nClicks('STA.event', '', '', event);">
<i class="icon_new_red _newMark" style="display:none;"><span class="blind">새소식</span></i>
<span class="text-color--secondary">지존도 이제 엑스퍼트</span>
</a>
</li>
<li class="rolling-notice__item _rollingItem" data-start-time="2022-12-06 0

In [25]:
# 여러개가 적용된 태그 찾기(리스트 형식으로 출력)
uls=soup.find_all('ul') # 페이지의 모든 ul 태그값 출력
uls[1]

<ul class="nav_list" id="au_lnb" role="menubar">
<li class="menu" role="presentation">
<a class="item" href="/index.naver" id="au_lnb_home" onclick="nhn.Kin.Utility.nClicks('LNB.home', '', '', event);" role="menuitem" tabindex="0"><em>홈</em></a>
</li>
<li class="menu" role="presentation">
<a aria-expanded="false" aria-haspopup="true" class="item" href="/qna/list.naver" onclick="nhn.Kin.Utility.nClicks('LNB.qna', '', '', event);" role="menuitem" tabindex="-1"><em>Q&amp;A</em></a>
<ul class="nav_sub_list _lnbSubMenu" role="menu">
<li class="sub_menu" role="presentation"><a class="item" href="/qna/list.naver?dirId=11" onclick="nhn.Kin.Utility.nClicks('LNB.kinlayer', '11', '1', event);" role="menuitem" tabindex="-1">교육, 학문</a></li>
<li class="sub_menu" role="presentation"><a class="item" href="/qna/list.naver?dirId=1" onclick="nhn.Kin.Utility.nClicks('LNB.kinlayer', '1', '2', event);" role="menuitem" tabindex="-1">컴퓨터통신</a></li>
<li class="sub_menu" role="presentation"><a class="item" href

In [30]:
ul=soup.find_all('ul',class_="ranking_list")
ul[1]

<ul class="ranking_list">
<li class="ranking_item _item_4">
<span class="no">4</span>
<a class="ranking_title" href="/qna/detail.naver?d1id=4&amp;dirId=4020202&amp;docId=437125718" onclick="nhn.Kin.Utility.nClicks('hrk.list', '', '', event);" target="_blank">임대차법 질문</a>
<a class="text" href="/qna/detail.naver?d1id=4&amp;dirId=4020202&amp;docId=437125718" onclick="nhn.Kin.Utility.nClicks('hrk.list', '', '', event);" target="_blank">예를들어서 제가 집을 매매했는데 그 집에 전주인이 1년월세로계약해서 살고있는 세입자가있는상황에서 세...</a>
<span class="recommend_num">조회수 31</span><span class="reply_num">답변수 3</span>
</li>
<li class="ranking_item _item_5">
<span class="no">5</span>
<a class="ranking_title" href="/qna/detail.naver?d1id=8&amp;dirId=81302&amp;docId=437154274" onclick="nhn.Kin.Utility.nClicks('hrk.list', '', '', event);" target="_blank">편의점 택배 얼마나 걸릴까요</a>
<a class="text" href="/qna/detail.naver?d1id=8&amp;dirId=81302&amp;docId=437154274" onclick="nhn.Kin.Utility.nClicks('hrk.list', '', '', event);" target="_blank">편의점 택

In [45]:
divs=soup.find('div', class_="ranking_list_area")
lis=divs.find_all('li')
print(lis[0].get_text())


1
대학교 순위 알려주세요
대학교 순위 알려주세요 수원대학교,계명대학교,용인대학교,성결대학교,협성대학교,강남대학교,안양대학교,...
조회수 46답변수 20



In [54]:
print(lis[0].find_all('span')[0].get_text()) # 순위 

print(lis[0].find_all('a')[0].get_text()) # 제목
print(lis[0].find_all('a')[1].get_text()) # 요약 내용

print(lis[0].find_all('span')[1].get_text())
print(lis[0].find_all('span')[2].get_text())


1
대학교 순위 알려주세요
대학교 순위 알려주세요 수원대학교,계명대학교,용인대학교,성결대학교,협성대학교,강남대학교,안양대학교,...
조회수 46
답변수 20


#### 3. CSS Selector를 사용한 크롤링
- select 함수 사용

In [59]:
import requests
from bs4 import BeautifulSoup as bs

url='https://kin.naver.com/'

res=requests.get(url)

# 데이터를 가져오지 못하면 메세지 출력후 강제 종료한다.
if res.status_code != 200:
    exit('데이터를 가져오기 못했습니다.')

soup = bs(res.content, 'html.parser')

In [64]:
# 태그를 이용한 검색이다.
soup.find('title')

# select 함수를 이용한 태그 검색이다. -> 결과는 !!!리스트!!! 형태로 반환해준다.
# select함수는 find_all()과 동일한 결과값 반환해준다.

soup.select('title')[0]

<title>
	네이버 지식iN
</title>

In [72]:
soup.select('html title')[0] # soup.select('html head title')[0]

<title>
	네이버 지식iN
</title>

In [76]:
lis=soup.select('div.ranking_list_area li')
lis[0]

<li class="ranking_item _item_1">
<span class="no">1</span>
<a class="ranking_title" href="/qna/detail.naver?d1id=11&amp;dirId=110408&amp;docId=437036038" onclick="nhn.Kin.Utility.nClicks('hrk.list', '', '', event);" target="_blank">대학교 순위 알려주세요</a>
<a class="text" href="/qna/detail.naver?d1id=11&amp;dirId=110408&amp;docId=437036038" onclick="nhn.Kin.Utility.nClicks('hrk.list', '', '', event);" target="_blank">대학교 순위 알려주세요 수원대학교,계명대학교,용인대학교,성결대학교,협성대학교,강남대학교,안양대학교,...</a>
<span class="recommend_num">조회수 46</span><span class="reply_num">답변수 22</span>
</li>

In [77]:
print(lis[0].find_all('span')[0].get_text())
print(lis[0].find_all('a')[0].get_text())
print(lis[0].find_all('a')[1].get_text())
print(lis[0].find_all('span')[1].get_text())
print(lis[0].find_all('span')[2].get_text())

1
대학교 순위 알려주세요
대학교 순위 알려주세요 수원대학교,계명대학교,용인대학교,성결대학교,협성대학교,강남대학교,안양대학교,...
조회수 46
답변수 22


In [85]:
# select를 쓰는 이유가 아래 출력처럼 클래스를 찾아줄 수 있다.
lis=soup.select('div.ranking_list_area li span.no')
lis[0].text

'1'

#### [정리] 네이버 지식인의 '많이 본 Q&A' 데이터 크롤링
1. 9개의 데이터 크롤링
2. 결과는 Pandas의 DataFrame으로 저장
3. columns: ['no','title', 'doct', 'view','answer']



In [127]:
import requests
import pandas as pd
from urllib.request import urlopen
from bs4 import BeautifulSoup as bs

url='https://kin.naver.com/'

html= requests.get(url) # 지식인에 내용 요청
if html.status_code != 200: # 데이터를 받았는지 확인
  exit() # 데이터가 정상이 아니면 프로그램 강제종료

# 가져온 데이터를 폅집하기 좋게 정보만 추출
soup = bs(html.content,'html.parser') 

# 정보가 있는 li 태그 모두 검색
lis=soup.select('div.ranking_list_area li') 
print(f'li 태그 갯수: {len(lis)}')

# 각 텍스트를 가져와 DataFrame으로 출력
df_list=[]

# 검색된 li 태그를 순차적으로 가져와 각각의 값 추출해준다.
for li in lis:
  no=li.find_all('span')[0].get_text() # 순위 값 추출
  title=li.find_all('a')[0].text # 제목 추출
  doct=li.find_all('a')[1].getText() # 요약내용 추출
  view=li.find_all('span')[1].text # 조회 건수 추출
  view=view.split(" ")[1]
  answer=li.find_all('span')[2].text # 답변 건수 추출
  answer=answer.split(" ")[1]

# df로 바꾸기 위해 df_list에 추가
  df_list.append({'no':no, 'title':title,'doct':doct,'view':view,'answer':answer})

df=pd.DataFrame(df_list)
df

li 태그 갯수: 9


Unnamed: 0,no,title,doct,view,answer
0,1,대학교 순위 알려주세요,"대학교 순위 알려주세요 수원대학교,계명대학교,용인대학교,성결대학교,협성대학교,강남대...",46,23
1,2,과학자와 수학자의 차이는 무엇인가요?,과학자와 수학자의 차이는 무엇인가요?,40,1
2,3,(중딩)리만가설이 무엇인가요?? 말,(중딩)리만가설이 무엇인가요?? 말 그자체로 소수인가요??? 모르겠어요ㅠㅠ..,39,3
3,7,6명의 키를 구해주세요,"키가 큰 순서는 민찬>민하>나은>채은>호영>소이 이며, 여섯명의 평균키는 151.5...",26,1
4,8,지구과학 문제,ㄴ에서 북서쪽으로 간다는데 제 긂으로 보면 부샤 동남 두쪽으로가는거아닌가요? 어ㅐ ...,24,1
5,9,대학 유급 국가장학금,혹시 1학년 2학기를 유급하면 국가장학금은 1학년 1학기 성적으로 2학기를 다시 다...,21,1
6,4,임대차법 질문,예를들어서 제가 집을 매매했는데 그 집에 전주인이 1년월세로계약해서 살고있는 세입자...,31,3
7,5,편의점 택배 얼마나 걸릴까요,편의점 택배 받으려하는데 며칠동안 계속 멈춰있는데 이럴때는 어떻게 해야하나요 ??운...,27,1
8,6,유치원 정교사 자격증 2급,아동보육과로 2년제 졸업 후 어린이집에 2년차 근무 중입니다. 유치원으로 근무를 희...,26,20


#### [미션] 네이버 지식인에서 '부산 서면 맛집' 검색후 크롤링
- 크롤링 항목: 등록일, 제목, 요약내용, 답변수, 추천수
- 결과는 DataFrame로 출력

In [300]:
import requests
import pandas as pd
from bs4 import BeautifulSoup as bs
# url 생성
sch=input('검색어 입력:')
url='https://kin.naver.com/search/list.naver?query=' + sch

#https://kin.naver.com/search/list.naver?query=검색어&page=2

# 정보 요청
html = requests.get(url)
if html.status_code != 200:exit()  # 정보 오류 여부 확인

# 정부 추출
soup = bs(html.text, 'html.parser') 
lis = soup.select('ul.basic1 li')

# 추출한 정보를 이용해 DF 생성
df_list = []

for li in lis:
    dt = li.select('dd.txt_inline')[0].text    # 입력일
    title = li.select('a')[0].text   # 제목
    doct = li.select('dd')[1].text   # 내용 요약
    ans = li.select('span.hit')[0].text.replace('답변수 ',"") # 답변수
    
    # 추천수
    tmp = li.select('dd.txt_block')[0].text
    tmp = tmp.replace('\n',"").replace('\t',"").split()
    rec = tmp[tmp.index('추천수')+1].replace('|답변',"")
    df_list.append({'indate':dt,
                    'title':title,
                    'doct':doct,
                    'answer':ans,
                    'recommend':rec})
    
df=pd.DataFrame(df_list)
df

검색어 입력:서면 맛집


Unnamed: 0,indate,title,doct,answer,recommend
0,2023.01.06.,,... 그런걸로 지역이 나뉜다는데 어느쪽에 서면맛집이 많은가요? 그것도 궁금해요~!...,1,4
1,2022.01.27.,,부산 서면 맛집 분위기 좋은 곳 알려주세요. 곧 다가오는 기념일에 여자친구랑 데이트...,1,3
2,2022.11.15.,서면 맛집 고기집 추천해주세요!,서면 맛집 중에 고기집있나요! 고기가 먹고 싶어서 ㅋㅋ 서면 맛집 중에 맛있는 고깃...,1,0
3,2022.12.25.,서면 맛집이 궁금합니다.,먹었을때 가격대비 후회없는 맛집 위치와 맛있게 먹었던 메뉴+가격 알려주시면 감사해요...,1,0
4,2022.03.23.,,... #부산서면맛집 #서면수제버거 #서면로위버거 #수제버거맛집 #로위버거 *광고 ...,1,0
5,2022.08.29.,서면 맛집 고기집 추천해주세요!,안녕하세여 서면 맛집 중에 고기집있나요! 고기가 먹고 싶어서 ㅋㅋ 서면 맛집 중에 ...,2,0
6,2022.05.10.,부산 서면 맛집,부산 서면 맛집 추천해주세요 저녁 먹고 술집으로 갈꺼라서 거하게는 못 먹을듯해요~ ...,6,0
7,2022.12.20.,부산 서면/광안리 맛집 알려주세요,부산 서면 친구들7명 정도 놀러 갈 건데 인스타 피드 채울 싸고 맛있는 맛집 추천 ...,2,0
8,2022.06.21.,부산 서면 맛집,안녕하세요 이번 주말에 서면에 가기로 했는데 맛집 추천좀 해주세요 1인분 당 가격이...,3,0
9,2022.09.23.,서면 놀거리 맛집 추천 해주세요,친구랑 오늘 서면에서 놀기로 했는데 서면 맛집 추천해주세요 막 엄청 흔하고 그런 곳...,3,0


In [301]:
tmp

['지역&플레이스', '>', '서면|답변수', '3', '추천수', '0']

#### url 추출 및 내부 정보 크롤링

In [329]:
import requests
import pandas as pd
from bs4 import BeautifulSoup as bs

# url 생성
sch=input('검색어 입력:')
page=1
url='https://kin.naver.com/search/list.naver?query=' + sch + "&page=" + str(page)

# 정보 요청
html = requests.get(url)
if html.status_code != 200:exit()  # 정보 오류 여부 확인

# 정보 추출
soup = bs(html.text, 'html.parser') 
lis = soup.select('ul.basic1 li')

# 추출한 정보를 이용해 DF 생성
df_list = []

for li in lis:
    dt = li.select('dd.txt_inline')[0].text    # 입력일
    acnt = li.select('span.hit')[0].text.replace('답변수 ',"") # 답변수
    links=li.find('a')['href']

    df_list.append({'indate':dt,
                    'answer_cnt':acnt,
                    'lints':links})
    
df=pd.DataFrame(df_list)
df

검색어 입력:부산 서면 맛집


Unnamed: 0,indate,answer_cnt,lints
0,2022.01.27.,1,https://kin.naver.com/qna/detail.naver?d1id=8&...
1,2022.12.26.,1,https://kin.naver.com/qna/detail.naver?d1id=12...
2,2022.03.23.,1,https://kin.naver.com/qna/detail.naver?d1id=12...
3,2022.12.20.,2,https://kin.naver.com/qna/detail.naver?d1id=12...
4,2022.05.10.,6,https://kin.naver.com/qna/detail.naver?d1id=12...
5,2022.06.21.,3,https://kin.naver.com/qna/detail.naver?d1id=12...
6,2022.07.04.,2,https://kin.naver.com/qna/detail.naver?d1id=9&...
7,2023.01.02.,1,https://kin.naver.com/qna/detail.naver?d1id=12...
8,2023.01.06.,1,https://kin.naver.com/qna/detail.naver?d1id=8&...
9,2022.12.05.,2,https://kin.naver.com/qna/detail.naver?d1id=8&...


#### 답변 데이터 가져오기

In [330]:
df_list=[]
for link in df['lints']:
    # 정보 요청
    html = requests.get(link)
    if html.status_code != 200: # 정보 오류 여부 확인
        continue
    
    # 정보 추출
    soup = bs(html.text, 'html.parser') 
    anscnt=soup.find('em', class_="_answerCount num").text

    if int(anscnt) < 1:
      continue
    #print(anscnt)

    # 답변 텍스트 추출
    divs=soup.select('div.answer-content div.se-main-container')
    #print(len(divs))

    # 데이터 추가
    for div in divs:
      df_list.append({'검색어':sch,
                      '답변내용':div.text})
df=pd.DataFrame(df_list)
df

Unnamed: 0,검색어,답변내용
0,부산 서면 맛집,서면은 워낙 번화가다 보니까 확실히 저도 맛집을 찾는게 어렵긴 하더라구요저...
1,부산 서면 맛집,부산 서면 보신탕맛집답변드릴게요!서면집이라고 하는 영양탕 집이 있는데​부산...
2,부산 서면 맛집,안녕하세요:) 플래너 다다입니다.삼보게임랜드 근처 맛집을 찾으시군요~학생이...
3,부산 서면 맛집,싸고 맛있는은 모르겠지만..기장 우대갈비집 맛있었어요
4,부산 서면 맛집,친구들끼리 부산 놀러가시는군요!​부산에는 워낙 맛집들이 많아 일일히 다 말...
5,부산 서면 맛집,애주당서면 골목오뎅빠술고당취향인지 검색해보세요
6,부산 서면 맛집,제 아이디 들어가셔서 프로필 바로 오른쪽에 보시면 야식코너 있는데제 블로그...
7,부산 서면 맛집,안녕하세요 맛집을 알아보시는 것 같은데요맛집 알아보실 때 네이버 검색창에서...
8,부산 서면 맛집,서면은 술집이죠.그 다음 해장할수있는 집.제가 자주가는 코스는 1차는 해물...
9,부산 서면 맛집,~~ 서면 아래 추천합니다 간단하게 칼국수 간단하게 먹고 가세요 ~~고요스...


####[미션] 여러 page 데이터 가져오기
- 사용자로부터 검색어, 페이지 입력
- 검색어/답변 => DataFrame로 출력