In [86]:
# pandas load
import pandas as pds
import numpy as nps

#### 판다스 객체 종류

-   1차원 : Series 시리즈 ( 인덱스 + 값 )
-   2차원 : DataFrame ( 데이터 프레임 ) : ( 행, 열 + 값 / 표 형태)


#### 판다스 객체 다루기


In [87]:
# 1차원 Series 생성 1 : list 에 value 을 입력하여 생성할 수 있다.
num_series = pds.Series([3, 4, 5], index=["Son", "Kim", "Park"])
num_series

Son     3
Kim     4
Park    5
dtype: int64

In [88]:
# 1차원 Series 생성 2 : dictionary 에 index, value 입력하여 생성
num_series2 = pds.Series({"Son": 3, "Kim": 4, "Park": 5})
num_series2

Son     3
Kim     4
Park    5
dtype: int64

In [89]:
# 1차원 시리즈 속성 확인
# numpy : 배열크기 (.shape), 차원수 (.ndim), 데이터타입 (.dtype), 전체요소 (.size)
# pandas : 배열크기 (.shape) 값 (.values), 인덱스 (.index), 데이터타입 (.dtype), 전체요소 (.size)
num_series2.shape
num_series2.values
num_series2.index
num_series2.dtype
num_series2.size

3

In [90]:
# 1차원 시리즈 이름 지정
num_series2.name = "name_cnt"
num_series2

Son     3
Kim     4
Park    5
Name: name_cnt, dtype: int64

In [91]:
num_series2  # name 출력됨

Son     3
Kim     4
Park    5
Name: name_cnt, dtype: int64

![image.png](attachment:image.png)


In [92]:
population = pds.Series({'서울': 9602000, '부산': 3344000, '광주': 1488000, '대구': 2419000})
population.index.name = '도시'
population.name = 2020
population

도시
서울    9602000
부산    3344000
광주    1488000
대구    2419000
Name: 2020, dtype: int64

In [93]:
population['부산'] = 3500000

population['대전'] = 1500000

# 삭제
# population = population('key')
# key 에 해당하는 값을 삭제하고 원본 데이터에 삭제한 결과 초기화
# del population['key]
# key 에 해당하는 값을 삭제 (알아서 초기화한다)

population.drop('대전')
del population['서울']

population


도시
부산    3500000
광주    1488000
대구    2419000
대전    1500000
Name: 2020, dtype: int64

- 2차원 DataFrame 생성하기

In [94]:
# 2차원 DataFrame 생성하는 방법 ( List )
# 단일 리스트에 값 입력하여 생성

num = [1,1,3]

num_df = pds.DataFrame(num)

# 이중 리스트에 값 입력하여 생성

num2 = [ ['iot', 1], ['big', 1], ['ai', 3] ]

num2_df = pds.DataFrame(num2)

# 컬럼명 추가
# Class, Join

num2_df = pds.DataFrame(num2, columns=['Class', 'Join'])

num2_df


Unnamed: 0,Class,Join
0,iot,1
1,big,1
2,ai,3


In [95]:
# 2차원 DataFrame 생성 방법 2 ( Dictionary )

num2_df = pds.DataFrame({'Class' : ['iot','big','ai'], 'Join' : [ 1, 1, 3 ]})

num2_df

# 1차원 series 생성시 key 값은 index
# 2차원 dataframe 생성시 key 가 column
# pds.DataFrame 함수 안에서 index 를 설정하는 키워드도 있다.
# class DataFrame(
#     data: ListLikeU | DataFrame | dict[Any, Any] | Iterable[ListLikeU | tuple[Hashable, ListLikeU] | dict[Any, Any]] | None = ...,
#     index: Axes | None = ...,
#     columns: Axes | None = ...,
#     dtype: ... = ...,
#     copy: _bool = ...
# )

Unnamed: 0,Class,Join
0,iot,1
1,big,1
2,ai,3


In [96]:
# 2차원 dataframe 속성 확인
# 값 : .values
num2_df.values
# array([['iot', 1],
#        ['big', 1],
#        ['ai', 3]], dtype=object)

# 인덱스 : .index
num2_df.index
# RangeIndex(start=0, stop=3, step=1)

# 컬럼명 : .columns
num2_df.columns
# Index(['Class', 'Join'], dtype='object')

# 데이터타입 : .dtypes
num2_df.dtypes
# Class    object
# Join      int64
# dtype: object

Class    object
Join      int64
dtype: object

![image.png](attachment:image.png)

In [97]:
person_info = pds.DataFrame({'키' : [ 175.3, 180.2, 178.6], '몸무게' : [ 66.2, 78.9, 55.1 ], '나이' : [ 27, 49, 35 ]}, index = ['son', 'kim', 'park'])

print(person_info)

# .T : The transpose of the DataFrame.
# Examples
# >>> df = pd.DataFrame({'col1': [1, 2], 'col2': [3, 4]})
# >>> df
#    col1  col2
# 0     1     3
# 1     2     4
# >>> df.T
#       0  1
# col1  1  2
# col2  3  4
#print(person_info.T)

          키   몸무게  나이
son   175.3  66.2  27
kim   180.2  78.9  49
park  178.6  55.1  35


![image.png](attachment:image.png)

In [98]:
display(person_info.values)
# array([[175.3,  66.2,  27. ],
#        [180.2,  78.9,  49. ],
#        [178.6,  55.1,  35. ]])

display(person_info.dtypes)
# 키      float64
# 몸무게    float64
# 나이       int64
# dtype: object

display(person_info.index)
# Index(['son', 'kim', 'park'], dtype='object')

display(person_info.columns)
# Index(['키', '몸무게', '나이'], dtype='object')

array([[175.3,  66.2,  27. ],
       [180.2,  78.9,  49. ],
       [178.6,  55.1,  35. ]])

키      float64
몸무게    float64
나이       int64
dtype: object

Index(['son', 'kim', 'park'], dtype='object')

Index(['키', '몸무게', '나이'], dtype='object')

- 2차원 데이터 접근

In [99]:
# 데이터 프레임 열(컬럼, 특성) 접근

# class 컬럼 접근 --> df('column')

display(num2_df['Class'])

# join 컬럼 접근

display(num2_df['Join'])

# Series 의 name 은 데이터 프레임의 컬럼명이랑 연결됨 !

# 여러개 한꺼번에 접근

display(num2_df[['Join', 'Class']])

0    iot
1    big
2     ai
Name: Class, dtype: object

0    1
1    1
2    3
Name: Join, dtype: int64

Unnamed: 0,Join,Class
0,1,iot
1,1,big
2,3,ai


In [100]:
# # 2차원 데이터프레임 행 접근
# num2_df = num2_df.set_index('Class')
# num2_df

# 컬럼 인덱스 번호로 접근  num2_df[0] -> 에러 발생
# 행 번호로 접근 -> 슬라이싱을 써야 하는 상황
display(num2_df[0:1])
display(num2_df[1:2])

# 인덱스 값으로 접근 -> 슬라이싱을 써야 하는 상황


Unnamed: 0,Class,Join
0,iot,1


Unnamed: 0,Class,Join
1,big,1


- 데이터 접근 인덱서
    - df.loc[row, col] : 인덱스 값(눈에 보여지는 값)으로 접근
    - df.iloc[row, col] : 인덱스 번호 ( 0,1,2,.....) 로 접근
    - numpy : array2[row] , array2[row, col] = array2[row][col] = array2[row:row, col:col]

In [101]:
# indexer 활용하여 num_df 'iot' 행에 접근하기

# index 값

# num3_df.loc['big']

# index 번호

num2_df.iloc[0]

# 여러 행에 접근하기
# iot, ai 행 접근

display(num2_df.iloc[[0,2]])

Unnamed: 0,Class,Join
0,iot,1
2,ai,3


In [102]:
#num2_df.loc['iot', 'Join']
num2_df.iloc[0][1]

1

![image.png](attachment:image.png)

In [103]:
display(person_info.loc['son','나이'])
display(person_info.iloc[0][2])
display(person_info.iloc[0,2])

27

27.0

27

![image.png](attachment:image.png)

In [117]:
display(person_info)

display(
    person_info.loc['son',::2]    
)

display(
    person_info.iloc[0,::2]    
)

Unnamed: 0,키,몸무게,나이
son,175.3,66.2,27
kim,180.2,78.9,49
park,178.6,55.1,35


키     175.3
나이     27.0
Name: son, dtype: float64

키     175.3
나이     27.0
Name: son, dtype: float64

![image.png](attachment:image.png)

In [136]:
display(person_info)
display(
    person_info.loc[['kim','park'],['몸무게', '키']]
)

display(
    person_info.iloc[1::, [1, 0]]
)

Unnamed: 0,키,몸무게,나이
son,175.3,66.2,27
kim,180.2,78.9,49
park,178.6,55.1,35


Unnamed: 0,몸무게,키
kim,78.9,180.2
park,55.1,178.6


Unnamed: 0,몸무게,키
kim,78.9,180.2
park,55.1,178.6
