# [ 4-1. 엑셀데이터 DB에 INSERT하기 ]

## 1. 엑셀파일 읽기 기초
### 1-1. openpyxl 라이브러리
* openpyxl 라이브러리는 파이썬에서 엑셀 파일을 다루는 데 사용되는 라이브러리로, 엑셀 파일을 열고, 수정하고, 저장할 수 있습니다.

* 아니콘다 네비게이터 - Environments에서 설치 가능합니다.

### 1-2. 엑셀 파일 데이터 읽어오기
* openpyxl 라이브러리의 load_workbook 모듈을 사용하여 데이터를 읽어들일 수 있습니다.

* 기존 사용했던 샘플 파일 'excel_data.xlsx' 파일을 복사하여 현재 폴더에 저장한 후 라이브러시 사용 예시를 들어보겠습니다.

In [1]:
from openpyxl import load_workbook

# 엑셀 파일 열기
workbook = load_workbook('excel_data.xlsx')

# 데이터가 있는 Sheet 선택
sheet = workbook['Sheet']

# 엑셀 파일의 각 행을 출력
for row in sheet.iter_rows(values_only=True):
    print(row)

('Name', 'Age', 'Gender')
('John', 25, 'male')
('Emily', 30, 'female')
('Michael', 35, 'male')
('Celine', 24, 'female')
('David', 27, 'male')


## 2. 엑셀 파일 데이터를 읽어서 데이터베이스에 입력하기

### 2-1. 엑셀 파일 데이터 읽어오기
#### 2-1-1. openpyxl을 이용한 데이터 로딩

In [5]:
from openpyxl import load_workbook
import pandas as pd

workbook = load_workbook('FCHotel_cashflow_mar.xlsx')
sheet = workbook['Sheet1']

# 첫번째 행(컬럼 이름) 가져오기 
columns = [
    cell.value for cell 
    in next(sheet.iter_rows(min_row=1, max_row=1))
]

# 데이터를 딕셔너리 리스트로 변환 
data = [] 
for row in sheet.iter_rows(min_row=2):
    record = {
        columns[i]: cell.value 
        for i, cell in enumerate(row)
    } 
    data.append(record)

# 딕셔너리 리스트를 DataFrame으로 변환 
df = pd.DataFrame(data)

In [6]:
df

Unnamed: 0,account_id,dw_date,category,client,deposit,withdrawal,description
0,shhn4567,2024-03-02,이자수입,신한은행,4246575,0,정기예금 이자
1,hana1234,2024-03-01,객실수입,호텔스닷컴,40000000,0,객실 매출
2,hana1234,2024-03-02,객실수입,호텔스넷,29000000,0,객실 매출
3,hana1234,2024-03-03,객실수입,호텔스닷컴,40000000,0,객실 매출
4,hana1234,2024-03-04,객실수입,호텔스넷,30000000,0,객실 매출
5,hana1234,2024-03-05,객실수입,호텔스닷컴,40000000,0,객실 매출
6,hana1234,2024-03-06,객실수입,호텔스넷,27000000,0,객실 매출
7,hana1234,2024-03-07,객실수입,호텔스닷컴,34000000,0,객실 매출
8,hana1234,2024-03-08,객실수입,호텔스넷,31000000,0,객실 매출
9,hana1234,2024-03-09,객실수입,호텔스닷컴,28000000,0,객실 매출


#### 2-1-2. 엑셀파일 읽는 방법 ChatGPT에 질의하기
![openpyxl 질의](./image/openpyxl_엑셀데이터읽기1.png)

![openpyxl 질의](./image/openpyxl_엑셀데이터읽기2.png)

![openpyxl 질의](./image/openpyxl_엑셀데이터읽기3.png)

#### 2-1-3. pandas 라이브러리를 이용하여 엑셀파일 로딩하기

In [7]:
df = pd.read_excel('FCHotel_cashflow_mar.xlsx')

In [8]:
df

Unnamed: 0,account_id,dw_date,category,client,deposit,withdrawal,description
0,shhn4567,2024-03-02,이자수입,신한은행,4246575,0,정기예금 이자
1,hana1234,2024-03-01,객실수입,호텔스닷컴,40000000,0,객실 매출
2,hana1234,2024-03-02,객실수입,호텔스넷,29000000,0,객실 매출
3,hana1234,2024-03-03,객실수입,호텔스닷컴,40000000,0,객실 매출
4,hana1234,2024-03-04,객실수입,호텔스넷,30000000,0,객실 매출
5,hana1234,2024-03-05,객실수입,호텔스닷컴,40000000,0,객실 매출
6,hana1234,2024-03-06,객실수입,호텔스넷,27000000,0,객실 매출
7,hana1234,2024-03-07,객실수입,호텔스닷컴,34000000,0,객실 매출
8,hana1234,2024-03-08,객실수입,호텔스넷,31000000,0,객실 매출
9,hana1234,2024-03-09,객실수입,호텔스닷컴,28000000,0,객실 매출


![openpyxl 질의](./image/openpyxl_엑셀데이터읽기4.png)

![openpyxl 질의](./image/openpyxl_엑셀데이터읽기5.png)

![openpyxl 질의](./image/openpyxl_엑셀데이터읽기6.png)

### 2-2. 데이터베이스에 입력하기

In [14]:
from connector import Connector
with Connector() as conn:
    query = """
        INSERT INTO cashflow_tbl (
            account_id, dw_date, category, client, 
            deposit, withdrawal, description
        )						
        VALUES (%s, %s, %s, %s, %s, %s, %s);				
    """
    for index, row in df.iterrows():
        val = (
            row['account_id'], row['dw_date'], row['category'], 
            row['client'], row['deposit'], row['withdrawal'], 
            row['description']
        )
        conn.cursor.execute(query, val)
    # 변경사항 커밋
    conn.connection.commit()

In [None]:
with Connector() as conn:
    query = """
        SELECT * FROM cashflow_tbl 
        WHERE dw_date BETWEEN '2024-03-01' AND '2024-03-31';
    """
    conn.cursor.execute(query)
    result = conn.cursor.fetchall()
    print(result)

[{'id': 167, 'account_id': 'shhn4567', 'dw_date': datetime.date(2024, 3, 2), 'category': '이자수입', 'client': '신한은행', 'deposit': 4246575, 'withdrawal': 0, 'description': '정기예금 이자', 'created_at': datetime.datetime(2024, 4, 15, 10, 27, 23), 'deleted_at': None}, {'id': 168, 'account_id': 'hana1234', 'dw_date': datetime.date(2024, 3, 1), 'category': '객실수입', 'client': '호텔스닷컴', 'deposit': 40000000, 'withdrawal': 0, 'description': '객실 매출', 'created_at': datetime.datetime(2024, 4, 15, 10, 27, 23), 'deleted_at': None}, {'id': 169, 'account_id': 'hana1234', 'dw_date': datetime.date(2024, 3, 2), 'category': '객실수입', 'client': '호텔스넷', 'deposit': 29000000, 'withdrawal': 0, 'description': '객실 매출', 'created_at': datetime.datetime(2024, 4, 15, 10, 27, 23), 'deleted_at': None}, {'id': 170, 'account_id': 'hana1234', 'dw_date': datetime.date(2024, 3, 3), 'category': '객실수입', 'client': '호텔스닷컴', 'deposit': 40000000, 'withdrawal': 0, 'description': '객실 매출', 'created_at': datetime.datetime(2024, 4, 15, 10, 27, 23

### 2-3. ChatGPT 활용하기

![openpyxl 질의](./image/openpyxl_엑셀데이터읽기7.png)

![openpyxl 질의](./image/openpyxl_엑셀데이터읽기8.png)

![openpyxl 질의](./image/openpyxl_엑셀데이터읽기9.png)