### 크롤링해서 엑셀 파일로 만들기

* openpyxl 라이브러리 활용
  - xlsx 파일 읽고, 저장 모두 가능
  - 설치: 터미널 모드에서 다음 명령 실행

    ```
    pip install openpyxl
    ```

- 라이브러리 임포트

In [1]:
import openpyxl

- Workbook() 으로 엑셀 파일 생성

In [2]:
excel_file = openpyxl.Workbook()

- 엑셀 파일이 생성되면 디폴트 쉬트가 생성되며, 엑셀파일변수.active 로 해당 쉬트를 선택할 수 있음
  - 해당 쉬트 이름을 변경하려면 title 변수값을 변경해주면 됨
    ```
    excel_sheet = excel_file.active
    excel_sheet.title = '리포트'
    ```

In [3]:
excel_sheet = excel_file.active

- 데이터 추가하기 
  - 가장 간단한 방법으로 엑셀파일변수.append(리스트 형태의 하나의 행 데이터) 를 사용하여, 한 줄의 데이터 묶음을 쓸 수 있음

In [4]:
excel_sheet.append(['data1', 'data2', 'data3', 'data4'])

- 엑셀 파일 저장 

In [5]:
excel_file.save('temp.xlsx')

- 엑셀 파일 닫기

In [6]:
excel_file.close()

### 엑셀 파일 만들기
- 함수로 작성해보면서, 함수 작성법과 활용법 이해하기

In [30]:
import openpyxl

def write_excel_template(filename, sheetname, listdata):
    excel_file = openpyxl.Workbook()
    excel_sheet = excel_file.active
    excel_sheet.column_dimensions['A'].width = 100    # A Column width = 100
    excel_sheet.column_dimensions['B'].width = 12
    
    if sheetname != "":
        excel_sheet.title = sheetname
        
    for item in listdata:
        excel_sheet.append(item)
        
    excel_file.save(filename)
    excel_file.close()

### 크롤링해서 엑셀 파일까지 만들기
- 리스트 안에 리스트(각 행을 나타냄)가 들어가야 함

In [31]:
import requests
from bs4 import BeautifulSoup

url = "https://davelee-fun.github.io/"
product_lists = list()

for page_num in range(10):
    if page_num == 0:
        res = requests.get(url)
    else:
        res = requests.get(url + "page" + str(page_num+1))

    soup = BeautifulSoup(res.content, 'html.parser')
    data = soup.select('div.card')
    
    for item in data:
        product = item.select_one('div.card-body > h4').get_text().split(":")[1].strip()
        date = item.select_one('span.post-date').get_text().strip()
        info = [product, date]
        product_lists.append(info)        

In [32]:
write_excel_template('product_info.xlsx', 'Product_Info', product_lists)

### 엑셀 파일 읽기

- 라이브러리 임포트

In [33]:
import openpyxl

- 엑셀 파일 오픈 (load_workbook() 함수)

In [34]:
excel_file = openpyxl.load_workbook('product_info.xlsx')

- 해당 엑셀 파일 안에 있는 쉬트 이름 확인하기

In [35]:
excel_file.sheetnames

['Product_Info']

- 해당 엑셀 파일 안에 있는 특정 쉬트 선택하기

In [36]:
excel_sheet = excel_file['Product_Info']

- 쉬트 안에 있는 데이터 읽기
  - item 에는 한 라인의 각 셀에 있는 데이터를 가져옴
  - 각 데이터는 각 리스트 아이템의 value 변수로부터 실제 데이터를 가져올 수 있음

In [37]:
for item in excel_sheet.rows:
    print(item[0].value, item[1].value)

보몽드 순면스퀘어 솔리드 누빔매트커버, 다크블루 05 Jun 2020
슈에뜨룸 선인장 리플 침구 세트, 베이지 05 Jun 2020
선우랜드 레인보우 2단 문걸이용 옷걸이 _중형, 화이트, 상세페이지참조 05 Jun 2020
보드래 헬로우 누빔 매트리스커버, 핑크 05 Jun 2020
보드래 퍼펙트 누빔 매트리스커버, 차콜 05 Jun 2020
피아블 클래식 방수 매트리스커버, 화이트 05 Jun 2020
더자리 에코항균 마이크로 매트리스커버, 밀키차콜그레이 05 Jun 2020
더자리 프레쉬 퓨어 매트리스 커버, 퓨어 차콜그레이 05 Jun 2020
몽쉐어 알러스킨 항균 매트리스 커버, 카키그레이 05 Jun 2020
쿠팡 브랜드 - 코멧 홈 40수 트윌 순면 100% 홑겹 매트리스커버, 그레이 05 Jun 2020
패브릭아트 항균 마이크로 원단 매트리스 커버, 아이보리 05 Jun 2020
바숨 순면 누빔 침대 매트리스커버, 차콜 05 Jun 2020
WEMAX 다용도 문옷걸이, 화이트, 1개 05 Jun 2020
타카타카 프리미엄 나노 화이바 누빔 매트리스 커버, 젠틀핑핑 05 Jun 2020
보몽드 순면스퀘어 누빔매트커버, 다크그레이 05 Jun 2020
보드래 국내산 순면 60수 누빔 매트리스커버, 그레이 05 Jun 2020
보드래 퍼펙트 누빔 매트리스커버, 베이지핑크 05 Jun 2020
쿠팡 브랜드 - 코멧 홈 40수 순면 누빔 매트리스커버, 챠콜 05 Jun 2020
바숨 순면 누빔 침대 매트리스커버, 화이트 05 Jun 2020
프랑떼 항균 방수 매트리스커버, 화이트 05 Jun 2020
보몽드 순면스퀘어 솔리드 누빔매트커버, 다크블루 05 Jun 2020
네이쳐리빙 피아블 클래식 방수 매트리스커버, 그레이 05 Jun 2020
쿠팡 브랜드 - 코멧 홈 순면 매트리스커버, 베이지 05 Jun 2020
타카타카 프리미엄 나노 화이바 누빔 매트리스 커버, 프렌치불독 05 Jun 2020
더자리 에코항균 마이크로 매트리스커버, 밀키그레이 05 Ju

- 오픈한 엑셀 파일 닫기

In [38]:
excel_file.close()

### 엑셀 파일 읽기 전체 코드

In [41]:
import openpyxl

def read_excel_template(filename):
    excel_file = openpyxl.load_workbook(filename + ".xlsx")
    excel_sheet = excel_file.active
    
    for item in excel_sheet.rows:
        print(item[0].value, item[1].value)
        
    excel_file.close()

In [42]:
read_excel_template("product_info")

보몽드 순면스퀘어 솔리드 누빔매트커버, 다크블루 05 Jun 2020
슈에뜨룸 선인장 리플 침구 세트, 베이지 05 Jun 2020
선우랜드 레인보우 2단 문걸이용 옷걸이 _중형, 화이트, 상세페이지참조 05 Jun 2020
보드래 헬로우 누빔 매트리스커버, 핑크 05 Jun 2020
보드래 퍼펙트 누빔 매트리스커버, 차콜 05 Jun 2020
피아블 클래식 방수 매트리스커버, 화이트 05 Jun 2020
더자리 에코항균 마이크로 매트리스커버, 밀키차콜그레이 05 Jun 2020
더자리 프레쉬 퓨어 매트리스 커버, 퓨어 차콜그레이 05 Jun 2020
몽쉐어 알러스킨 항균 매트리스 커버, 카키그레이 05 Jun 2020
쿠팡 브랜드 - 코멧 홈 40수 트윌 순면 100% 홑겹 매트리스커버, 그레이 05 Jun 2020
패브릭아트 항균 마이크로 원단 매트리스 커버, 아이보리 05 Jun 2020
바숨 순면 누빔 침대 매트리스커버, 차콜 05 Jun 2020
WEMAX 다용도 문옷걸이, 화이트, 1개 05 Jun 2020
타카타카 프리미엄 나노 화이바 누빔 매트리스 커버, 젠틀핑핑 05 Jun 2020
보몽드 순면스퀘어 누빔매트커버, 다크그레이 05 Jun 2020
보드래 국내산 순면 60수 누빔 매트리스커버, 그레이 05 Jun 2020
보드래 퍼펙트 누빔 매트리스커버, 베이지핑크 05 Jun 2020
쿠팡 브랜드 - 코멧 홈 40수 순면 누빔 매트리스커버, 챠콜 05 Jun 2020
바숨 순면 누빔 침대 매트리스커버, 화이트 05 Jun 2020
프랑떼 항균 방수 매트리스커버, 화이트 05 Jun 2020
보몽드 순면스퀘어 솔리드 누빔매트커버, 다크블루 05 Jun 2020
네이쳐리빙 피아블 클래식 방수 매트리스커버, 그레이 05 Jun 2020
쿠팡 브랜드 - 코멧 홈 순면 매트리스커버, 베이지 05 Jun 2020
타카타카 프리미엄 나노 화이바 누빔 매트리스 커버, 프렌치불독 05 Jun 2020
더자리 에코항균 마이크로 매트리스커버, 밀키그레이 05 Ju