## OpenPyXL 페키지로 엑셀파일 만들기

OpenpyXL은 파이썬을 활용해 엑셀파일을 읽고 쓸 수 있는 파이썬 오픈소스 페키지입니다.

### 엑셀의 구조
- Workbook  엑셀파일 전체 작업공간, 엑셀파일 자체
- Worksheet : 엑셀파일에서 단일 작업공간, 하나의 큰 표
- Cell : 엑셀에서 데이터가 저장되어있는 가장 작은 공간

### 엑셀 파일 만들기/저장하기
1. openpyxl을 가져옵니다.
```python
import openpyxl
```

2. 워크북(엑셀파일)을 새로 만듭니다.
```python
wb = openpyxl.Workbook()
```

3. 워크북(엑셀파일)을 원하는 이름으로 저장합니다.
```python
wb.save('test.xlsx')
```

### 시트 선택하기/데이터 쓰기
1. 우선, 현재 활성화된 시트를 선택합니다.
```python
sheet = wb.active
```

2. 데이터를 입력합니다.
    - 셀을 직접 지정하여 데이터를 입력
```python
sheet['A1'] = 'hello world'
```

    - 가장 마지막 줄에 데이터를 입력
```python
sheet.append(['손\n흥민','이청,용','기성..용'])
```

    - m행 n열에 데이터를 입력
```python
sheet.cell(row=4,column=5).value='어렵다'
```

### 참고 함수
1. 새로운 시트를 원하는 이름으로 만드는 함수
```python
sheet = wb.create_sheet('시트이름')
```

2. 특정 시트를 선택하는 함수
```python
wb['시트이름']
```

3. 시트의 이름을 바꾸는 함수
```python
sheet.title = '시트이름'
```

### 예시
```python
import openpyxl
wb = openpyxl.Workbook()
sheet1 = wb.active
sheet1.title = '1st sheet'
sheet2 = wb.create_sheet('2st sheet')
for i in range(1, 10):
    sheet1.cell(row=i,column=1).value=i
    sheet2.cell(row=1,column=i).value=i
wb.save('test.xlsx')
```

## 단계
1. 워크북 만들고 헤더 추가하기
2. 파일에 데이터 입력하기
3. 워크북 저장하기

### ex1. 네이버 tv

In [1]:
import requests
from bs4 import BeautifulSoup

# 준비단계. openpyxl 가져오기
import openpyxl
# 1단계
# 1-1. 새로운 워크북 만들기
wb = openpyxl.Workbook()
# 1-2. 현재 시트 선택
sheet = wb.active
# 1-3. 헤더 추가하기
sheet.append(['제목','채널명','조회수','좋아요수'])

raw = requests.get('http://tv.naver.com/r')
html = BeautifulSoup(raw.text, 'html.parser')

container = html.select('dl.cds_info')

for clip in container:
    title = clip.select_one('dt.title').text.strip()
    chn = clip.select_one('dd.chn').text.strip()
    hit = clip.select_one('span.hit').text.strip()
    like = clip.select_one('span.like').text.strip()
    # 2단계. 워크북에 데이터를 추가하기
    # append 함수는 리스트 형식으로 데이터를 넣어준다.
    sheet.append([title, chn, hit, like])
    
# cf. 다음에서도 데이터를 가져오고 싶다면!
sheet2 = wb.create_sheet('다음 Top100')
sheet2['b2'] = '나중에 긁어오기'

# 3단계. 데이터 수집결과를 저장하기
wb.save('naver_tv100.xlsx')

### ex2. 네이버 news

In [2]:
import requests
from bs4 import BeautifulSoup
import openpyxl
wb = openpyxl.Workbook()
sheet = wb.active
sheet.append(['제목','언론사'])

keyword = input('검색어를 입력하세요: ')

for n in range(1, 100, 10):
    raw = requests.get("https://search.naver.com/search.naver?where=news&sm=tab_jum&query="+keyword+"&start="+str(n),
                   headers={'User-Agent' : 'Morzilla/5.0'})
    html = BeautifulSoup(raw.text, "html.parser")
    
    articles = html.select("ul.type01>li")
    
    for ar in articles:
        title = ar.select_one("a._sp_each_title").text.strip().replace(',','_')
        source = ar.select_one("span._sp_each_source").text.strip().replace(',','_')
        print(title, source)
        sheet.append([title, source])
        
wb.save('naver_news.xlsx')

검색어를 입력하세요: 코로나
[속보] 코로나 210명 늘었다…총 확진자 3736명_ 사망 18명 중앙일보언론사 선정
文대통령 "코로나 이겨내고 위축된 경제 되살릴 수 있어"[전문] 파이낸셜뉴스언론사 선정
여야 "코로나 추경 '2월국회' 처리"…당정_ 내일 추경 협의(종합) 뉴시스
신천지 "오늘 이만희 총회장 코로나 진단검사"(종합) 연합뉴스언론사 선정
청하 스태프 2명 코로나19 확진…청하는 '음성'[전문] 이데일리
[속보] 코로나19 신규 환자 210명…확진자 3736명으로 늘어 한겨레언론사 선정
경북 경산서 생후 45일 아기 코로나19 확진…전국 최연소(종합) 연합뉴스언론사 선정
청하 측 "코로나 19 음성 판정_ 자가격리 진행 중"[공식] 스포츠서울
[단독]이만희 신천지 총회장_ 코로나 19 검사 받는다 채널A언론사 선정
경북 경산서 생후 45일 아기 코로나19 확진판정 오마이뉴스언론사 선정
[단독] 코로나 진단키트 만든 씨젠 "적자 각오_ 다른건 접었다" 중앙일보언론사 선정
[속보] 우한 코로나 국내 확진자 210명 추가…총 3736명 조선일보언론사 선정
청하 스태프 2명 코로나19 확진…청하는 '음성'[전문] 이데일리
경북 경산서 생후 45일 아기 코로나19 확진…전국 최연소(종합) 연합뉴스언론사 선정
[속보] 코로나19 국내 확진자 210명 증가…누적 3_736명 KBS언론사 선정
경북 경산서 생후 45일 아기 코로나19 확진판정 오마이뉴스언론사 선정
대통령 "3·1정신으로 코로나 이겨야…TK 외롭지 않아" 미디어오늘언론사 선정
코로나 해외여행 취소 '대란'…위약금 분쟁 3배로 MBC언론사 선정
현대시티몰 가든파이브점_ 코로나 19 확진자 방문에 임시 휴점 조선비즈언론사 선정
청하와 밀라노 동행 스태프 2명 코로나 확진…청하는 음성(종합) 연합뉴스
[단독] 황치열_ 코로나19 성금 5천만원 기부…따뜻한 선행 엑스포츠뉴스
"코로나19 증상별 환자 분류·치료 필요…경증은 시설 격리치료"(종합) 연합뉴스
코로나 여파 對 중국 수출 6% 감소…2월 수출 1

### ex2. 네이버 ebook

In [3]:
import requests
from bs4 import BeautifulSoup
import openpyxl
wb = openpyxl.Workbook()
sheet = wb.active
sheet.append(['제목','저자'])

for i in range(1,6):
    raw= requests.get("https://series.naver.com/ebook/top100List.nhn?page="+str(i),
                 headers = {'User-Agent': 'Morzilla/5.0'})
    html = BeautifulSoup(raw.text,'html.parser')

    container = html.select("ul.lst_thum.v1>li")

    for cont in container:
        title = cont.select_one("a strong").text.strip()
        author = cont.select_one("span.writer").text.strip()
        sheet.append([title, author])

wb.save('naver_ebook.xlsx')

### 기존 파일 불러오기

- load_workbook()을 활용하면 새로운 파일을 만들지 않고 기존에 저장한 엑셀파일을 가져와서 데이터를 추가할 수 있습니다. 

```python
wb = openpyxl.Workbook()
```

```python
wb = openpyxl.load_workbook('naver_news.xlsx')
```

- 이 때 불러올 파일이 없다면 에러를 발생시킵니다. 따라서 파일이 없는 경우에는 새로운 엑셀파일을 만들고, 파일이 있는 경우에는 기존 엑셀파일을 불러와서 데이터를 수집할 수 있습니다.

```python
try:
    실행문1
except:
    실행문2
```

In [5]:
import requests
from bs4 import BeautifulSoup
import openpyxl

# 1단계. 파일 불러오기를 시도합니다.
try:
    # 워크북 불러오기, 현재 활성화된 시트 선택하기
    wb = openpyxl.load_workbook('naver_keyword_news.xlsx')
    sheet = wb.active
    print('불러오기 완료')

# 2단계. 파일 불러오기에 실패하면, 새로운 워크북(엑셀파일)을 만듭니다.
except:
    # 워크북 새로 만들기, 현재 활성화된 시트 선택하기
    wb = openpyxl.Workbook()
    sheet = wb.active
    # 헤더 행 추가하기. 이 때, 검색여 열도 추가
    sheet.append(['검색어', '제목', '신문사'])
    print('새로운 파일을 만들었습니다.')

keyword = input('검색어를 입력하세요: ')

for n in range(1, 100, 10):
    raw = requests.get("https://search.naver.com/search.naver?where=news&sm=tab_jum&query="+keyword+"&start="+str(n),
                   headers={'User-Agent' : 'Morzilla/5.0'})
    html = BeautifulSoup(raw.text, "html.parser")
    
    articles = html.select("ul.type01>li")
    
    for ar in articles:
        title = ar.select_one("a._sp_each_title").text.strip().replace(',','_')
        source = ar.select_one("span._sp_each_source").text.strip().replace(',','_')
        # 출력 및 파일 지정 양식에 검색어 추가
        print(keyword, ':', title, source)
        sheet.append([keyword, title, source])
        
wb.save('naver_keyword_news.xlsx')

불러오기 완료
검색어를 입력하세요: 아이유
아이유 : 서초구_ 아이유 등 지역 주민들 방역물품 기부 뉴시스
아이유 : 아이유_ 코로나19 취약계층 감영 예방 위해 1억 쾌척 스포츠서울
아이유 : 아이유_ 서초구에 3천만원 전달…코로나 극복 주민 기부 이어져 연합뉴스
아이유 : 아이유_ 코로나19 성금으로 2억 원 쾌척...'기부 영웅' 영향력 ing YTN
아이유 : 가수 아이유_ 1억 상당 의료용 방호복 3000벌 의협에 기증 중앙일보
아이유 : "아이유도 참석" 패션업계 밀라노發 '코로나 패닉' 머니투데이언론사 선정
아이유 : 방탄소년단(BTS) 슈가·아이유 등 스타들 코로나19 확산 막기 위한 기부 동참... 스포츠경향
아이유 : 아이유_ 코로나19 확산 방지에 1억원 기부 일간스포츠
아이유 : 아이유_ 다정한 '일상 코치'로 변신…셀럽 알람 4차 버전 공개 스포츠조선
아이유 : [팩플]아이유 목소리 내게 말건다는데···'악당' 걱정은 커졌다 중앙일보언론사 선정
아이유 : 정려원·아이유_ 굿네이버스에 각각 1억원 기부…"코로나 극복" 연합뉴스
아이유 : 아이유_ 코로나19 확산 방지에 1억원 기부 일간스포츠
아이유 : 이서진-아이유_ 성실납세 홍보 나선다…국세청 홍보대사 위촉 뉴데일리
아이유 : 가수 아이유_ 코로나19 성금 2억 기부…˝방역 물품 및 방호복 지원˝ 경북신문
아이유 : 리사X아이유X로운X조이_ 세계 패션위크 빛낸 스타들 일간스포츠
아이유 : 아이유_ 다정한 '일상 코치'로 변신…셀럽 알람 4차 버전 공개 스포츠조선
아이유 : '77억의 사랑' 유인나 "아이유 때문에 결혼 못 할지도 모른다"... 이유는? 헤럴드POP
아이유 : 정우성부터 아이유까지... 끊임없는 코로나19 기부행렬 오마이뉴스
아이유 : 박주원 기타 이야기 #집시 #속주 #아이유[윤상근의 맥락] 스타뉴스
아이유 : [Y이슈] "코로나19 극복하자"...아이유·박명수·손예진·서장훈 등 기부 릴레... YTN
아이유 : 아이유 2억_ 봉준호 1억 ‘힘내요 대구’ 응원 쏟아진다 