# **[7-1] 데이터프레임(DataFrame)에 행과 열 추가하기**

## **🎯 학습 목표**
**데이터프레임(DataFrame)에 행과 열을 추가해봅시다.**

---

데이터를 다루다 보면 새로운 데이터가 필요해 추가해야 하는 경우가 생깁니다.   
행이나 열을 기준으로 데이터를 추가하는 방법을 배워봅시다. 

## 데이터프레임에 열 추가하기

데이터프레임에 열을 추가하기 위해서는 추가하고 싶은 이름의 열을 인덱싱하고 그 열에 같은 사이즈의 데이터를 넣어주면 됩니다.  
이렇게 하면 가장 마지막 순서에 지정한 열이 추가됩니다.

`DataFrame['추가하고싶은_열이름'] = 리스트_또는_시리즈`

> **⚠️ 주의(WARNING):**
>
> 추가하고싶은 열이름이 이미 존재하면 기존에 존재하는 열에 덮어쓰기 됩니다.

> **⚠️ 주의(WARNING):**
>
> 데이터프레임에 열을 추가하면 원본 데이터가 수정됩니다.

> **⛔️ 오류(ERROR):**
>
> 추가하고 싶은 리스트, 시리즈의 길이와 데이터프레임의 행의 수가 다르면 오류가 발생합니다.

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_07_10.gif" width="750"></th>
</tr>
<tr>
    <th>데이터프레임에 새로운 열 추가하기</th>
</tr>
</table>
  
마찬가지로 브로드캐스팅을 적용할 수 있습니다.

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_07_11.gif" width="750"></th>
</tr>
<tr>
    <th>브로드캐스팅 이용해 데이터프레임에 새로운 열 추가하기</th>
</tr>
</table>

시리즈를 사용해 데이터프레임에 열을 추가하면 행 인덱스와 동일한 인덱스를 가진 데이터만 데이터프레임에 추가된다.

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_07_12.gif" width="750"></th>
</tr>
<tr>
    <th>인덱스가 다른 시리즈를 이용해 데이터프레임에 새로운 열 추가하기</th>
</tr>
</table>

In [None]:
# 예제_1_데이터프레임의_새로운_열_추가하기

import pandas as pd
import random

score = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')
score.index = score['이름']
score = score.iloc[:,1:]
new_score = [random.randint(0,100) for i in range(30)]

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('#'*30, f"{'new_score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(new_score)
print('\n','#'*30, "{:^15s}".format('score["사회"] = new_score') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
score["사회"] = new_score
print(score)

In [None]:
# 예제_2_새로운_열을_브로드캐스팅을_이용해_추가하기

import pandas as pd
import random

score = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')
score.index = score['이름']
score = score.iloc[:,1:]
new_score = pd.Series([10,20,30,40,50])

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('#'*30, f"{'new_score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(new_score)
print('\n','#'*30, "{:^15s}".format('score["사회"] = 75') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
score["사회"] = 75
print(score)

In [None]:
# 예제_3_새로운_열을_인덱스가_다른_시리즈를_이용해_추가하기

import pandas as pd
import random

score = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')
score.index = score['이름']
score = score.iloc[:,1:]
new_score = pd.Series([random.randint(0,100) for i in range(15)], list(score.index)[:15])

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('#'*30, f"{'new_score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(new_score)
print('\n','#'*30, "{:^15s}".format('score["사회"] = new_score') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
score["사회"] = new_score
print(score)

## 데이터프레임에 행 추가하기

데이터프레임에 행을 추가하기 위해서는 추가하고 싶은 행을 인덱싱하고 그 행에 같은 사이즈의 데이터를 넣어주면 됩니다.  
이렇게 하면 가장 마지막 순서에 지정한 행이 추가됩니다.

`DataFrame.loc['추가하고싶은_행_인덱스'] = 리스트_또는_시리즈`

> **⚠️ 주의(WARNING):**
>
> 추가하고싶은 행의 인덱스가 이미 존재하면 기존에 존재하는 행에 덮어쓰기 됩니다.

> **⚠️ 주의(WARNING):**
>
> 데이터프레임에 행을 추가하면 원본 데이터가 수정됩니다.

> **⛔️ 오류(ERROR):**
>
> 추가하고 싶은 리스트, 시리즈의 길이와 데이터프레임의 열의 수가 다르면 오류가 발생합니다.

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_07_13.gif" width="750"></th>
</tr>
<tr>
    <th>데이터프레임에 새로운 행 추가하기</th>
</tr>
</table>
  
마찬가지로 브로드캐스팅을 적용할 수 있습니다.

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_07_14.gif" width="750"></th>
</tr>
<tr>
    <th>브로드캐스팅 이용해 데이터프레임에 새로운 행 추가하기</th>
</tr>
</table>
  

시리즈를 사용해 데이터프레임에 행을 추가하면 열이름과 동일한 인덱스를 가진 데이터만 데이터프레임에 추가된다.

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_07_15.gif" width="750"></th>
</tr>
<tr>
    <th>인덱스가 다른 시리즈를 이용해 데이터프레임에 새로운 행 추가하기</th>
</tr>
</table>
  

In [None]:
# 예제_4_데이터프레임에_새로운_행_추가하기

import pandas as pd
import random

score = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')
score.index = score['이름']
score = score.iloc[:,1:]
new_score = [100,100,100,100,100]

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('#'*30, f"{'new_score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(new_score)
print('\n','#'*30, "{:^15s}".format('score.loc["최창호"] = new_score') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
score.loc["최창호"] = new_score
print(score)

In [None]:
# 예제_5_데이터프레임에_새로운_행을_브로드캐스팅을_이용해_추가하기

import pandas as pd
import random

score = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')
score.index = score['이름']
score = score.iloc[:,1:]

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('#'*30, f"{'new_score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(new_score)
print('\n','#'*30, "{:^15s}".format('score.loc["최창호"] = 75') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
score.loc["최창호"] = 75
print(score)

In [None]:
# 예제_6_데이터프레임에_새로운_행을_열과_인덱스가_다른_시리즈를_이용해_추가하기

import pandas as pd
import random

score = pd.read_csv('https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/data/midterm_exam_result.csv')
score.index = score['이름']
score = score.iloc[:,1:]
new_score = pd.Series({'사회':100, '과학':100, '영어':100, '국어':100})

print('#'*30, f"{'score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(score)
print('#'*30, f"{'new_score':^15s}" , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(new_score)
print('\n','#'*30, "{:^15s}".format('score.loc["최창호"] = new_score') , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
score.loc["최창호"] = new_score
print(score)

### **💯 연습문제를 풀어봅시다**



1. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="LIBoGXNmeUo" href='#jce-judge/open/LIBoGXNmeUo' target='_self'><span>판다스 - 데이터 추가 - 열 추가 (2)</span></a>

2. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="vjh20azyC30" href='#jce-judge/open/vjh20azyC30' target='_self'><span>그룹 추가 (2)</span></a>


2. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="zyaZmyhT5Nk" href='#jce-judge/open/zyaZmyhT5Nk' target='_self'><span>판다스 - 데이터 추가 - 행 추가</span></a>

1. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="GISIRUm0KbQ" href='#jce-judge/open/GISIRUm0KbQ' target='_self'><span>친구들 반 정보 추가</span></a>

2. <a class="jcecodle-mk jcecodle-mk__problem-chip" data-problem-id="qVixOeC6aio" href='#jce-judge/open/qVixOeC6aio' target='_self'><span>직무스트레스 조사 추가</span></a>

