# 05_데이터 추가 및 삭제
### 1. 데이터프레임의 요소 삭제
- **drop() 함수** : 데이터프레임에서 행 또는 열의 이름을 이용해서 데이터 삭제
        DataFrame.drop(labels=None, axis=0, inplace=False
    - **labels** : 삭제할 행 또는 열의 이름을 지정.  
    - **axis** : int 유형 또는 축의 이름. (0 또는 ‘index’) 와 (1 또는 ‘columns’) 중 하나를 가짐. 1이면 열을 삭제  
    - **inplace** : bool 유형, False(기본값)이면 삭제된 결과 데이터프레임을 리턴하며, True 이면 현재 데이터프레임에서 데이터를 삭제하고 None을 반환함

### 2. 단일 행 삭제하기
- **axis=0** : axis=0 속성은 행의 이름을 이용해서 삭제

In [1]:
import seaborn as sns

In [2]:
iris = sns.load_dataset('iris')

In [3]:
iris.drop(0)  # 삭제한 결과를 반환됨. 현재 객체가 변경된 것은 아님

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species
1,4.9,3.0,1.4,0.2,setosa
2,4.7,3.2,1.3,0.2,setosa
3,4.6,3.1,1.5,0.2,setosa
4,5.0,3.6,1.4,0.2,setosa
5,5.4,3.9,1.7,0.4,setosa
...,...,...,...,...,...
145,6.7,3.0,5.2,2.3,virginica
146,6.3,2.5,5.0,1.9,virginica
147,6.5,3.0,5.2,2.0,virginica
148,6.2,3.4,5.4,2.3,virginica


- 만일 현재 객체에 행을 삭제한 결과가 반영되도록 하려면 inplace=True를 추가

In [4]:
iris.drop(0, inplace=True)  # 현재 객체에 반영함. 변경후 아무것도 출력하지 않음.

In [5]:
iris.head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species
1,4.9,3.0,1.4,0.2,setosa
2,4.7,3.2,1.3,0.2,setosa
3,4.6,3.1,1.5,0.2,setosa
4,5.0,3.6,1.4,0.2,setosa
5,5.4,3.9,1.7,0.4,setosa


In [6]:
iris.drop(0, axis=0, inplace=True)  # 행이름이 0인 행은 이미 삭제되어 오류 출력됨

KeyError: '[0] not found in axis'

### 3. 단일 열 삭제하기
-  **axis=1** : axis=1 속성은 열의 이름을 이용해서 삭제

In [7]:
iris.drop('species', axis=1).head()  # axis=1 이면 열의 이름으로 삭제

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width
1,4.9,3.0,1.4,0.2
2,4.7,3.2,1.3,0.2
3,4.6,3.1,1.5,0.2
4,5.0,3.6,1.4,0.2
5,5.4,3.9,1.7,0.4


### 4. 열 추가
    데이터프레임["새로운_열_이름"] = 값

In [8]:
iris = sns.load_dataset('iris')

In [9]:
iris.species

Unnamed: 0,species
0,setosa
1,setosa
2,setosa
3,setosa
4,setosa
...,...
145,virginica
146,virginica
147,virginica
148,virginica


In [10]:
iris['species']

Unnamed: 0,species
0,setosa
1,setosa
2,setosa
3,setosa
4,setosa
...,...
145,virginica
146,virginica
147,virginica
148,virginica


In [11]:
iris.year = 2025

In [12]:
iris.head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species
0,5.1,3.5,1.4,0.2,setosa
1,4.9,3.0,1.4,0.2,setosa
2,4.7,3.2,1.3,0.2,setosa
3,4.6,3.1,1.5,0.2,setosa
4,5.0,3.6,1.4,0.2,setosa


In [13]:
iris.year  # iris객체에 속성으로 추가됨

2025

In [14]:
# 열을 추가하려면 [ ]를 이용
iris['year'] = 2025

In [15]:
iris.head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species,year
0,5.1,3.5,1.4,0.2,setosa,2025
1,4.9,3.0,1.4,0.2,setosa,2025
2,4.7,3.2,1.3,0.2,setosa,2025
3,4.6,3.1,1.5,0.2,setosa,2025
4,5.0,3.6,1.4,0.2,setosa,2025


- 열을 추가할 때 행 별로 다른 값을 지정할 수 있음.   
  그러나 이 경우에 추가해야할 값의 개수가 데이터프레임의 행의 수와 같아야함

In [16]:
iris['no1'] = [1,2,3] # ValueError

ValueError: Length of values (3) does not match length of index (150)

In [17]:
iris['no2'] = [10,20,30] + [None]*147

In [18]:
iris.head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species,year,no2
0,5.1,3.5,1.4,0.2,setosa,2025,10.0
1,4.9,3.0,1.4,0.2,setosa,2025,20.0
2,4.7,3.2,1.3,0.2,setosa,2025,30.0
3,4.6,3.1,1.5,0.2,setosa,2025,
4,5.0,3.6,1.4,0.2,setosa,2025,


In [19]:
iris['no3'] = None

In [20]:
iris.head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species,year,no2,no3
0,5.1,3.5,1.4,0.2,setosa,2025,10.0,
1,4.9,3.0,1.4,0.2,setosa,2025,20.0,
2,4.7,3.2,1.3,0.2,setosa,2025,30.0,
3,4.6,3.1,1.5,0.2,setosa,2025,,
4,5.0,3.6,1.4,0.2,setosa,2025,,


In [21]:
iris.loc[0:2, 'no3'] = [10,20,30]

In [22]:
iris.head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species,year,no2,no3
0,5.1,3.5,1.4,0.2,setosa,2025,10.0,10.0
1,4.9,3.0,1.4,0.2,setosa,2025,20.0,20.0
2,4.7,3.2,1.3,0.2,setosa,2025,30.0,30.0
3,4.6,3.1,1.5,0.2,setosa,2025,,
4,5.0,3.6,1.4,0.2,setosa,2025,,


### 5. 시리즈를 이용한 열 추가
- 인덱스를 포함하는 시리즈 객체를 이용해 추가

In [23]:
import pandas as pd

In [24]:
new_data = pd.Series([10,20,30], index=[0,1,2])  # Series 객체는 1차원

In [25]:
new_data

Unnamed: 0,0
0,10
1,20
2,30


In [26]:
iris['no4'] = new_data

In [27]:
iris.head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species,year,no2,no3,no4
0,5.1,3.5,1.4,0.2,setosa,2025,10.0,10.0,10.0
1,4.9,3.0,1.4,0.2,setosa,2025,20.0,20.0,20.0
2,4.7,3.2,1.3,0.2,setosa,2025,30.0,30.0,30.0
3,4.6,3.1,1.5,0.2,setosa,2025,,,
4,5.0,3.6,1.4,0.2,setosa,2025,,,


### 6. 딕셔너리로 행 추가
- 딕셔너리로 추가 시 ignore_index=True 파라미터 지정해야 함  
  ignore_index=True는 기존 인덱스를 무시하고, 새로운 인덱스를 부여하고 싶을 때 필요함

In [28]:
iris = sns.load_dataset('iris')

In [29]:
row1 = {'sepal_length': 10, 'sepal_width': 5,
        "petal_length": 20, "petal_width": 10,
        'species': 'setosa'}

In [30]:
row1

{'sepal_length': 10,
 'sepal_width': 5,
 'petal_length': 20,
 'petal_width': 10,
 'species': 'setosa'}

In [31]:
pd.DataFrame([row1])

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species
0,10,5,20,10,setosa


In [32]:
iris = pd.concat([iris, pd.DataFrame([row1])], ignore_index=True)

In [33]:
iris

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species
0,5.1,3.5,1.4,0.2,setosa
1,4.9,3.0,1.4,0.2,setosa
2,4.7,3.2,1.3,0.2,setosa
3,4.6,3.1,1.5,0.2,setosa
4,5.0,3.6,1.4,0.2,setosa
...,...,...,...,...,...
146,6.3,2.5,5.0,1.9,virginica
147,6.5,3.0,5.2,2.0,virginica
148,6.2,3.4,5.4,2.3,virginica
149,5.9,3.0,5.1,1.8,virginica


### 7. 시리즈를 이용한 리스트 데이터의 행 추가
- 리스트는 시리즈 객체로 만들어 행 단위로 추가

In [34]:
new_row = pd.Series([1,2,3,4,'versicolor'], index=iris.columns)

In [35]:
pd.DataFrame([new_row])

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species
0,1,2,3,4,versicolor


In [36]:
new_iris = pd.concat([iris, pd.DataFrame([new_row])], ignore_index=True)

In [37]:
new_iris.tail()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species
147,6.5,3.0,5.2,2.0,virginica
148,6.2,3.4,5.4,2.3,virginica
149,5.9,3.0,5.1,1.8,virginica
150,10.0,5.0,20.0,10.0,setosa
151,1.0,2.0,3.0,4.0,versicolor
