In [2]:
import numpy as np
import pandas as pd
import copy

### 데이터프레임의 데이터 재가공

In [None]:
# pandas 의 apply함수를 이용해서 데이터의 재가공 
# 예제 데이터프레임
df = pd.DataFrame({
    'A': [1, 2, 3, 4],
    'B': [10, 20, 30, 40]
})

# 각 값에 10을 더하기
df['A_plus_10'] = df['A'].apply(lambda x: x + 10)

# 두 열을 더해 새로운 열 C 생성
# applay에 들어갈 함수 정의 tip : 
# 입력param은 데이터프레임이 아니라, 데이터프레임에 저장된 개별 데이터. 
df['C'] = df.apply(lambda row: row['A'] + row['B'], axis=1)

print("데이터 재가공 결과:\n", df)

데이터 재가공 결과:
    A   B  A_plus_10   C
0  1  10         11  11
1  2  20         12  22
2  3  30         13  33
3  4  40         14  44


### 데이터프레임 합치기 및 쪼개기

In [6]:
# pandas 에서 하나의 데이터프레임에서 여러개로 분리 및 여러 판다스를 하나로 합치기.
# 예제 데이터프레임
df = pd.DataFrame({
    'A': ['foo', 'bar', 'foo', 'bar'],
    'B': [1, 2, 3, 4]
})

# 'A' 열의 값에 따라 그룹으로 분리
dfs = dict(tuple(df.groupby('A')))
print("foo 데이터프레임:\n", dfs['foo'])
print("bar 데이터프레임:\n", dfs['bar'])

# 예제 데이터프레임 생성
df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})
df2 = pd.DataFrame({'A': [5, 6], 'B': [7, 8]})

# 데이터프레임 덧붙이기.
df[['A_','B_']] = df1
print("기존 데이터프레임에 다른 데이터프레임 덧붙이기\n", df)

# 행 방향으로 합치기
df_concat_rows = pd.concat([df1, df2], axis=0)
print("행 방향으로 합친 데이터프레임:\n", df_concat_rows)

# 열 방향으로 합치기
df_concat_cols = pd.concat([df1, df2], axis=1)
print("열 방향으로 합친 데이터프레임:\n", df_concat_cols)


foo 데이터프레임:
      A  B
0  foo  1
2  foo  3
bar 데이터프레임:
      A  B
1  bar  2
3  bar  4
기존 데이터프레임에 다른 데이터프레임 덧붙이기
      A  B   A_   B_
0  foo  1  1.0  3.0
1  bar  2  2.0  4.0
2  foo  3  NaN  NaN
3  bar  4  NaN  NaN
행 방향으로 합친 데이터프레임:
    A  B
0  1  3
1  2  4
0  5  7
1  6  8
열 방향으로 합친 데이터프레임:
    A  B  A  B
0  1  3  5  7
1  2  4  6  8


#### 데이터 쪼개기!!

In [None]:
# 예제 데이터프레임 생성
df = pd.DataFrame({
    'A': [1, 2, 3, 4],          # 수치형 데이터
    'B': ['foo', 'bar', 'baz', 'qux'],  # 문자열 데이터 (비수치형)
    'C': [1.5, 2.5, 3.5, 4.5],  # 수치형 데이터
    'D': ['apple', 'banana', 'cherry', 'date']  # 문자열 데이터 (비수치형)
})

# 수치형 데이터만 선택
numeric_df = df.select_dtypes(include=['number'])
print("수치형 데이터프레임:\n", numeric_df)

df_c = copy.copy(df['C'])

# 비수치형 데이터만 선택
non_numeric_df = df.select_dtypes(exclude=['number'])
print("\n비수치형 데이터프레임:\n", non_numeric_df)

수치형 데이터프레임:
    A    C
0  1  1.5
1  2  2.5
2  3  3.5
3  4  4.5

비수치형 데이터프레임:
      B       D
0  foo   apple
1  bar  banana
2  baz  cherry
3  qux    date


### 배열 - 넘파이 - 데이터프레임 

In [8]:
# 넘파이나, 배열을 데이터프레임으로 만들기, 또는 데이터 프레임을 배열이나, 넘파이로 만들기.

# 넘파이 배열 생성
array = np.array([[1, 2, 3], [4, 5, 6]])

# 데이터프레임으로 변환
df_from_array = pd.DataFrame(array, columns=['A', 'B', 'C'])

# 데이터프레임을 넘파이 배열로 변환
array_from_df = df_from_array.to_numpy()