# **1장. 파이썬 기본 문법을 익히자**

# 도표 2-46. 엑셀과 csv파일 읽고 첫 다섯 행 확인하기 파이썬 코드

In [5]:
# pandas 라이브러리를 pd라는 약칭으로 임포트합니다.
# pandas는 데이터 처리 및 분석을 위해 사용되는 라이브러리입니다.
import pandas as pd

# Excel 파일을 읽어서 DataFrame 객체로 변환합니다. 해당 파일에는 제품의 상세 정보가 들어 있습니다.
product_master = pd.read_excel('/content/sample_data/제품정보 마스터.xlsx')

# CSV 파일을 읽어서 DataFrame 객체로 변환합니다.
# 이 파일은 제품의 물동량(입고, 출고, 재고)에 관한 정보를 포함하고 있습니다.
cargo_psi = pd.read_csv("/content/sample_data/물동량 PSI.csv")

# 각 데이터셋의 첫 다섯 행을 출력합니다.
# 이는 데이터의 구조를 파악하고 분석 계획을 세우는 데 도움을 줍니다.
product_master.head(), cargo_psi.head()

(     모델코드             모델명  제품군   가로    세로    높이
 0  W_M001  탑형 세탁기 10kg 용량  세탁기  710  1050  1130
 1  W_M002   탑형 세탁기 8kg 용량  세탁기  630  1000  1070
 2  W_M003   드럼 세탁기 8kg 용량  세탁기  640   845   960
 3  R_M001    냉장고 양문형 4도어   냉장고  910  1800   750
 4  R_M002        냉장고 650L  냉장고  800  1800   750,
            일자    모델코드     입고     출고     재고
 0  2022-01-01  W_M002  14922  12950  41972
 1  2022-01-02  W_M002  13183  15781  39374
 2  2022-01-03  W_M002  13127  13901  38600
 3  2022-01-04  W_M002  12742  17022  34320
 4  2022-01-05  W_M002  14604  11937  36987)

# 도표 2-47. 물동량 정보를 기준으로 제품정보 마스터와 결합하기 파이썬 코드

In [6]:
# 물동량 PSI 데이터와 제품정보 마스터 데이터를 '모델코드'를 기준으로 결합합니다.
merged_data = cargo_psi.merge(product_master, on="모델코드", how="left")
# 'merge' 함수를 사용하여 'cargo_psi' 데이터와 'product_master' 데이터를 결합합니다.
# 'on' 파라미터는 결합 기준이 되는 열 이름을 지정합니다.
# 'how="left"' 옵션은 왼쪽 데이터셋('cargo_psi')의 모든 행을 포함하고,
# 오른쪽 데이터셋('product_master')에서 일치하는 행을 결합합니다.
# 일치하는 '모델코드'가 없는 경우, 해당 필드는 NaN 값으로 채워집니다.

merged_data.head()

Unnamed: 0,일자,모델코드,입고,출고,재고,모델명,제품군,가로,세로,높이
0,2022-01-01,W_M002,14922,12950,41972,탑형 세탁기 8kg 용량,세탁기,630,1000,1070
1,2022-01-02,W_M002,13183,15781,39374,탑형 세탁기 8kg 용량,세탁기,630,1000,1070
2,2022-01-03,W_M002,13127,13901,38600,탑형 세탁기 8kg 용량,세탁기,630,1000,1070
3,2022-01-04,W_M002,12742,17022,34320,탑형 세탁기 8kg 용량,세탁기,630,1000,1070
4,2022-01-05,W_M002,14604,11937,36987,탑형 세탁기 8kg 용량,세탁기,630,1000,1070


# 도표 2-48. 새로운 칼럼 CBM을 만들기 파이썬 코드

In [7]:
# CBM(세제곱미터)을 계산하고 이를 새로운 칼럼으로 추가합니다.
merged_data['CBM'] = (merged_data['가로'] / 1000) * (merged_data['세로'] / 1000) * (merged_data['높이'] / 1000)
# '가로', '세로', '높이' 열의 값을 1000으로 나누어 미터 단위로 변환한 후,
# 이 세 값의 곱을 계산하여 'CBM'이라는 새 칼럼에 저장합니다.

merged_data.head()

Unnamed: 0,일자,모델코드,입고,출고,재고,모델명,제품군,가로,세로,높이,CBM
0,2022-01-01,W_M002,14922,12950,41972,탑형 세탁기 8kg 용량,세탁기,630,1000,1070,0.6741
1,2022-01-02,W_M002,13183,15781,39374,탑형 세탁기 8kg 용량,세탁기,630,1000,1070,0.6741
2,2022-01-03,W_M002,13127,13901,38600,탑형 세탁기 8kg 용량,세탁기,630,1000,1070,0.6741
3,2022-01-04,W_M002,12742,17022,34320,탑형 세탁기 8kg 용량,세탁기,630,1000,1070,0.6741
4,2022-01-05,W_M002,14604,11937,36987,탑형 세탁기 8kg 용량,세탁기,630,1000,1070,0.6741


# 도표 2-50. 조건을 만족한 데이터의 월별 모델별 출고 CBM을 합산하여 표시

In [8]:
# 2023년도와 '냉장고' 제품군에 해당하는 데이터만 필터링합니다.
fridge_data_2023 = merged_data[(merged_data['일자'].str.startswith('2023')) & (merged_data['제품군'] == '냉장고')]
# 'merged_data' 데이터셋에서 '일자'가 '2023'으로 시작하는 행과 '제품군'이 '냉장고'인 행을 찾아 'fridge_data_2023'에 저장합니다.


# 날짜에서 월 정보를 추출하여 새로운 칼럼 '월'을 추가합니다.
fridge_data_2023['월'] = fridge_data_2023['일자'].str.slice(0, 7)
# '일자' 칼럼에서 문자열 슬라이싱을 사용하여 연도와 월만 포함하는 형태로 변환하여 '월' 칼럼을 생성합니다.

# 월별, 모델별로 출고된 제품의 총 CBM을 계산합니다.
monthly_model_cbm = fridge_data_2023.groupby(['월', '모델명']).apply(lambda x: (x['출고'] * x['CBM']).sum()).reset_index()
# 'fridge_data_2023' 데이터를 '월'과 '모델명'으로 그룹화하고, 각 그룹에 대해 출고량('출고')과 CBM을 곱한 후 합계를 계산합니다.
# apply(lambda x: (x['출고'] * x['CBM']).sum())는 각 그룹에 대해 출고된 제품의 총 CBM을 계산한다.
#

# 데이터프레임의 열 이름을 보다 이해하기 쉽게 변경하여, 각 열이 무엇을 나타내는지 명확히 합니다.
monthly_model_cbm.columns = ['월', '모델명', '출고 CBM 합계']

# 최종적으로 계산된 월별, 모델별 출고 CBM 합계를 포함하는 데이터프레임을 출력합니다.
monthly_model_cbm

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  fridge_data_2023['월'] = fridge_data_2023['일자'].str.slice(0, 7)


Unnamed: 0,월,모델명,출고 CBM 합계
0,2023-01,냉장고 250L,181075.8348
1,2023-01,냉장고 650L,389566.8
2,2023-01,냉장고 양문형 4도어,640702.062
3,2023-02,냉장고 250L,125657.4816
4,2023-02,냉장고 650L,300261.6
5,2023-02,냉장고 양문형 4도어,518236.5825
6,2023-03,냉장고 250L,68203.6416
7,2023-03,냉장고 650L,236143.08
8,2023-03,냉장고 양문형 4도어,418665.429
9,2023-04,냉장고 250L,44690.2596


# 도표 2-51. 날짜와 시간관련 연산하고 월별 기발 재고 CBM 구하기

In [9]:
# '일자' 열을 datetime 타입으로 변환합니다.
fridge_data_2023['일자'] = pd.to_datetime(fridge_data_2023['일자'])
# 'to_datetime' 함수를 사용하여 '일자' 열의 데이터 타입을 datetime 으로 변환합니다.
# 이는 날짜와 시간 관련 연산을 용이하게 하기 위함입니다.

# 각 월의 마지막 날짜를 구합니다.
last_dates = fridge_data_2023.groupby('월')['일자'].max()
# 'groupby'를 통해 '월' 별로 그룹화하고, 'max' 함수를 사용하여 각 그룹의 최대 날짜(즉, 각 월의 마지막 날짜)를 찾습니다.

# 각 월의 마지막 날짜에 해당하는 데이터를 필터링합니다.
last_day_data = fridge_data_2023[fridge_data_2023['일자'].isin(last_dates)]
# 'isin' 함수를 사용하여 '일자'가 'last_dates'에 포함되는 행만 선택합니다.
# 이는 각 월의 마지막 날에 해당하는 데이터만 추출하기 위함입니다.

# 월별 기말 재고 CBM을 계산합니다.
monthly_inventory_cbm = last_day_data.groupby('월').apply(lambda x: (x['재고'] * x['CBM']).sum()).reset_index(name='월말 재고 CBM 합계')
# 'groupby'로 '월' 별로 그룹화한 후 'apply' 함수를 사용하여 각 그룹에 대해 재고('재고')와 CBM을 곱한 후 합계를 계산합니다.
# 'reset_index'를 통해 결과를 정리하고, 계산된 합계를 '월말 재고 CBM 합계'라는 새로운 열로 이름을 지정합니다.

# 최종적으로 계산된 월별 기말 재고 CBM을 포함하는 데이터프레임을 출력합니다.
monthly_inventory_cbm

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  fridge_data_2023['일자'] = pd.to_datetime(fridge_data_2023['일자'])


Unnamed: 0,월,월말 재고 CBM 합계
0,2023-01,143722.4121
1,2023-02,94808.5371
2,2023-03,114411.1419
3,2023-04,125389.8522
4,2023-05,147093.1272
5,2023-06,114236.9919
6,2023-07,111697.6635
7,2023-08,104131.4967
8,2023-09,94307.3577
9,2023-10,90592.6248


# 도표 2-52. 반복문 파이썬 코드 예시

In [None]:
# 숫자 리스트를 정의합니다.
numbers = [1, 2, 3, 4, 5]

# for 문을 사용하여 리스트의 각 요소를 출력합니다.
for number in numbers:
    print(number)

1
2
3
4
5


# 도표 2-53. 조건문 파이썬 코드 예시

In [None]:
# 사용자의 나이를 입력받습니다.
age = int(input("당신의 나이를 입력하세요: "))

# if 문을 사용하여 조건을 확인합니다.
if age < 18:
    print("당신은 미성년자입니다.")
elif age >= 18 and age < 65:
    print("당신은 성인입니다.")
else:
    print("당신은 노인입니다.")

당신의 나이를 입력하세요: 19
당신은 성인입니다.


# 도표 2-53. 조건문 파이썬 코드 예시

In [None]:
# 두 수를 더하는 함수를 정의합니다.
def add_numbers(number1, number2):
    result = number1 + number2
    return result

# 사용자로부터 두 수를 입력받습니다.
num1 = int(input("첫 번째 숫자를 입력하세요: "))
num2 = int(input("두 번째 숫자를 입력하세요: "))

# 함수를 호출하여 두 수를 더하고 결과를 출력합니다.
sum_result = add_numbers(num1, num2)
print("두 수의 합은", sum_result, "입니다.")

첫 번째 숫자를 입력하세요: 1
두 번째 숫자를 입력하세요: 2
두 수의 합은 3 입니다.


# [별첨] 교재에 포함하지 않은 문장

In [None]:
# Pivot the data to make months columns and the inventory CBM as values
monthly_inventory_pivot = monthly_inventory_cbm.pivot_table(
    values='월말 재고 CBM 합계',
    index=[],
    columns='월',
    fill_value=0
)

# Rename the columns to '01월', '02월', ..., '12월'
monthly_inventory_pivot.columns = [f"{str(int(month[-2:]))}월" for month in monthly_inventory_pivot.columns]

# Transpose for display as a single row with month columns
monthly_inventory_pivot = monthly_inventory_pivot.T.reset_index()
monthly_inventory_pivot.columns = ['월', '월말 재고 CBM 합계']
monthly_inventory_pivot.T

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,10,11
월,1월,2월,3월,4월,5월,6월,7월,8월,9월,10월,11월,12월
월말 재고 CBM 합계,143722.4121,94808.5371,114411.1419,125389.8522,147093.1272,114236.9919,111697.6635,104131.4967,94307.3577,90592.6248,74305.6632,61665.4512
