In [32]:
# 1. pd.merge(): 두 개의 다른 데이터에서 공동된 정도(Key)를 찾아, 그 정보를 기준으로 두 데이터를 하나로 합치는 방식.
# how = 'inner': 두 데이터프레임에 모두 공통으로 존재하는 KEY를 가진 데이너만 남김.
# how = 'left': 먼저 오는 왼쪽 데이터프레임의 모든 데이터를 기준으로 삼고, 오른쪽 데이터에 일치하는 정보가 있으면 가져오고, 없으면 NaN으로 채움
# how = 'right': 나중에 오는 오른쪽 데이터프레임의 모든 데이터를 기준으로 삼음. left 반대.
# how = 'outer': 어느 한 쪽에라도 존재하는 모든 Key의 데이터를ㄹ 남김, 양쪽 데이터를 모두 보존 하고 싶을 때 사용함.

# 2. pd.concat (): 여러 개의 데이터를 단순히 위아래로 쌓거나, 양옆으로 나란히 붙이는 방식.
# 2-1. 수직 결합 (위아래로 이어 붙이기), 기본값: axis=0
# 2-2. 수평 결합 (양옆으로 이어 붙이기), axis=1

In [49]:
import pandas as pd

# 1. 고객 정보
df_customers = pd.DataFrame({
    'CustomerID': [1, 2, 3, 4],
    'Name': ['Alice', 'Bob', 'Charlie', 'David'],
    'City': ['Seoul', 'Busan', 'Seoul', 'Incheon']
})

# 2. 주문 내역 (CustomerID 2번 고객은 주문 X, 5번 고객은 비회원 주문)
df_orders = pd.DataFrame({
    'OrderID': ['O1', 'O2', 'O3', 'O4'],
    'CustomerID': [1, 3, 1, 5],
    'ProductID': ['P101', 'P102', 'P103', 'P101']
})

# 3. 상품 정보 (P104 상품은 주문된 적 없음)
df_products = pd.DataFrame({
    'ProductID': ['P101', 'P102', 'P103', 'P104'],
    'ProductName': ['Keyboard', 'Mouse', 'Monitor', 'Webcam'],
    'Price': [50, 25, 200, 60]
})

df_inner_join = pd.merge(df_customers, df_orders, how='inner', on='CustomerID')
print(df_inner_join[['Name', 'City', 'OrderID']])

df_left_join = pd.merge(df_customers, df_orders, how='left', on='CustomerID')
print(df_left_join[['Name', 'OrderID']])

df_right_join = pd.merge(df_customers, df_orders, how='right', on='CustomerID')
print(df_right_join[['OrderID', 'Name']])

df_order_customer = pd.merge(df_orders, df_customers, on='CustomerID', how='inner')
df_final_details = pd.merge(df_order_customer, df_products, on='ProductID', how='inner')

print(df_final_details[['Name', 'ProductName', 'Price']])

      Name   City OrderID
0    Alice  Seoul      O1
1    Alice  Seoul      O3
2  Charlie  Seoul      O2
      Name OrderID
0    Alice      O1
1    Alice      O3
2      Bob     NaN
3  Charlie      O2
4    David     NaN
  OrderID     Name
0      O1    Alice
1      O2  Charlie
2      O3    Alice
3      O4      NaN
      Name ProductName  Price
0    Alice    Keyboard     50
1  Charlie       Mouse     25
2    Alice     Monitor    200


In [50]:
import pandas as pd

# 온라인 판매 기록
df_online = pd.DataFrame({
    'Date': ['2025-10-01', '2025-10-01', '2025-10-02'],
    'Product_ID': ['P101', 'P102', 'P103'],
    'Amount': [150, 220, 180]
})

# 오프라인 매장 판매 기록
df_offline = pd.DataFrame({
    'Date': ['2025-10-01', '2025-10-02', '2025-10-02'],
    'Product_ID': ['P103', 'P101', 'P102'],
    'Amount': [200, 160, 210]
})

df_total_sales = pd.concat([df_online, df_offline], ignore_index=True)

print(df_total_sales)

         Date Product_ID  Amount
0  2025-10-01       P101     150
1  2025-10-01       P102     220
2  2025-10-02       P103     180
3  2025-10-01       P103     200
4  2025-10-02       P101     160
5  2025-10-02       P102     210
