# 크롤링 해서 엑셀 파일로 저장

## openpyxl 이용

In [2]:
import openpyxl

### 엑셀 객체 생성 & 시트 선택 & 이름 변경

In [3]:
excel_file = openpyxl.Workbook() # 엑셀 파일 생성 후 객체에 저장

In [4]:
activate_sheet = excel_file.active # 만들어진 엑셀 객체에 활성화된 시트 선택

In [5]:
activate_sheet.titel = 'practice' # 활성화된 시트 이름 practice로 변경

### append를 통한 값 삽입

In [7]:
# 한 번 append가 실행될 때마다 각 행에 column 순으로 리스트 값들이 삽입
activate_sheet.append(['data1', 'data2', 'data3'])

### 엑셀 파일 저장

In [8]:
excel_file.save('practice.xlsx') # 해당 이름으로 엑셀파일 저장

### 엑셀 파일 닫기

In [9]:
excel_file.close()

---

## 함수를 통해 엑셀 파일 생성

In [10]:
def create_excel(filename, sheetname, listdata : list):
    excel_file = openpyxl.Workbook()
    excel_sheet = excel_file.active
    # 엑셀의 A열의 넓이를 100으로 지정
    excel_sheet.column_dimensions['A'].width = 100
    # 받는 sheetname 인자가 빈칸이 아니면 활성화된 시트를 sheetname으로 변경
    if sheetname != '':
        excel_sheet.title = sheetname
    
    for item in listdata:
        excel_sheet.append(item)
    excel_file.save(filename)
    excel_file.close()

In [12]:
# 크롤링 코드를 통해 상품이름과 날짜를 담고 있는 2차원 리스트 생성
import requests
from bs4 import BeautifulSoup
product_lists = list()

for page_num in range(10):
    if page_num == 0:
        res = requests.get('https://davelee-fun.github.io/')
    else:
        res = requests.get('https://davelee-fun.github.io/page' + str(page_num + 1))
    soup = BeautifulSoup(res.content, 'html.parser')

    data = soup.select('div.card')
    for item in data:
        product_name = item.select_one('div.card-body h4.card-text')
        product_date = item.select_one('div.wrapfooter span.post-date')
        product_info = [product_name.get_text().strip(), product_date.get_text()]
        product_lists.append(product_info)

In [13]:
# 2차원 리스트에서 하나씩 접근해 하나의 행 생성
create_excel('practice_product_info.xlsx', '상품정보', product_lists)

## 엑셀파일 값 읽어오기

### 1. pandas 이용

In [17]:
import pandas as pd
load_excel = pd.read_excel('practice_product_info.xlsx')
load_excel

Unnamed: 0,"상품명: 보몽드 순면스퀘어 솔리드 누빔매트커버, 다크블루",05 Jun 2020
0,"상품명: 슈에뜨룸 선인장 리플 침구 세트, 베이지",05 Jun 2020
1,"상품명: 선우랜드 레인보우 2단 문걸이용 옷걸이 _중형, 화이트, 상세페이지참조",05 Jun 2020
2,"상품명: 보드래 헬로우 누빔 매트리스커버, 핑크",05 Jun 2020
3,"상품명: 보드래 퍼펙트 누빔 매트리스커버, 차콜",05 Jun 2020
4,"상품명: 피아블 클래식 방수 매트리스커버, 화이트",05 Jun 2020
...,...,...
88,"상품명: 보몽드 순면스퀘어 솔리드 누빔매트커버, 아이보리",05 Jun 2020
89,"상품명: 더자리 에코항균 마이크로 매트리스커버, 밀키핑크",05 Jun 2020
90,"상품명: 타카타카 프리미엄 나노 화이바 누빔 매트리스 커버, 미스밍고",05 Jun 2020
91,"상품명: 네이쳐리빙 피아블 클래식 방수 매트리스커버, 그레이",05 Jun 2020


### 2. openpyxl.load_workbook() 이용

In [18]:
# 엑셀 파일 불러와 객채로 저장
load_excel_openpyxl = openpyxl.load_workbook('practice_product_info.xlsx')


In [19]:
# 해당 파일의 시트이름 리스트로 보여줌
load_excel_openpyxl.sheetnames

['상품정보']

In [22]:
# 해당 시트 선택해서 객체에 저장
excel_sheet_name = load_excel_openpyxl['상품정보']

In [24]:
# 데이터 불러오기
for item in excel_sheet_name.rows: #시트에서 각 행씩 뽑아온다
    print(item[0].value, item[1].value) #각 행의 1,2번째 col의 value값 뽑아옴

상품명: 보몽드 순면스퀘어 솔리드 누빔매트커버, 다크블루 05 Jun 2020
상품명: 슈에뜨룸 선인장 리플 침구 세트, 베이지 05 Jun 2020
상품명: 선우랜드 레인보우 2단 문걸이용 옷걸이 _중형, 화이트, 상세페이지참조 05 Jun 2020
상품명: 보드래 헬로우 누빔 매트리스커버, 핑크 05 Jun 2020
상품명: 보드래 퍼펙트 누빔 매트리스커버, 차콜 05 Jun 2020
상품명: 피아블 클래식 방수 매트리스커버, 화이트 05 Jun 2020
상품명: 더자리 에코항균 마이크로 매트리스커버, 밀키차콜그레이 05 Jun 2020
상품명: 더자리 프레쉬 퓨어 매트리스 커버, 퓨어 차콜그레이 05 Jun 2020
상품명: 몽쉐어 알러스킨 항균 매트리스 커버, 카키그레이 05 Jun 2020
상품명: 쿠팡 브랜드 - 코멧 홈 40수 트윌 순면 100% 홑겹 매트리스커버, 그레이 05 Jun 2020
상품명: 패브릭아트 항균 마이크로 원단 매트리스 커버, 아이보리 05 Jun 2020
상품명: 바숨 순면 누빔 침대 매트리스커버, 차콜 05 Jun 2020
상품명: WEMAX 다용도 문옷걸이, 화이트, 1개 05 Jun 2020
상품명: 타카타카 프리미엄 나노 화이바 누빔 매트리스 커버, 젠틀핑핑 05 Jun 2020
상품명: 보몽드 순면스퀘어 누빔매트커버, 다크그레이 05 Jun 2020
상품명: 보드래 국내산 순면 60수 누빔 매트리스커버, 그레이 05 Jun 2020
상품명: 보드래 퍼펙트 누빔 매트리스커버, 베이지핑크 05 Jun 2020
상품명: 쿠팡 브랜드 - 코멧 홈 40수 순면 누빔 매트리스커버, 챠콜 05 Jun 2020
상품명: 바숨 순면 누빔 침대 매트리스커버, 화이트 05 Jun 2020
상품명: 프랑떼 항균 방수 매트리스커버, 화이트 05 Jun 2020
상품명: 보몽드 순면스퀘어 솔리드 누빔매트커버, 다크블루 05 Jun 2020
상품명: 네이쳐리빙 피아블 클래식 방수 매트리스커버, 그레이 05 Jun 2020
상품명: 쿠팡 브랜드

In [25]:
# 불러온 파일 닫기
load_excel_openpyxl.close()