In [None]:
import pandas as pd

# data/gapminder.tsv 를 읽어 데이터 프레임 만들기

In [1]:
import pandas as pd

# tab으로 구분된 gapminder.tsv 파일을 읽어서 데이터프레임 생성
df = pd.read_csv("data/gapminder.tsv", sep="\t")

# 데이터프레임 상위 5개 행 출력
print(df.head())


       country continent  year  lifeExp       pop   gdpPercap
0  Afghanistan      Asia  1952   28.801   8425333  779.445314
1  Afghanistan      Asia  1957   30.332   9240934  820.853030
2  Afghanistan      Asia  1962   31.997  10267083  853.100710
3  Afghanistan      Asia  1967   34.020  11537966  836.197138
4  Afghanistan      Asia  1972   36.088  13079460  739.981106


# 미리보기

### 데이터프레임 사용

**미리보기 기능 :** 데이터프레임에서 먼저 데이터의 구조와 내용을 빠르게 파악하기 위한 기능

- head(): 데이터프레임의 처음 5개 행을 보여준다 (매개변수로 다른 숫자 지정 가능)
- tail(): 데이터프레임의 마지막 5개 행을 보여준다
- info(): 데이터프레임의 기본 정보 (행/열 개수, 데이터 타입, 메모리 사용량 등)를 표시
- describe(): 수치형 열에 대한 요약 통계량 (평균, 표준편차, 최소/최대값 등)을 계산

In [2]:
import pandas as pd

df = pd.read_csv("data/gapminder.tsv", sep="\t")

# 1. 상위 5개 행 미리보기
print(df.head())

# 2. 하위 5개 행 미리보기
print(df.tail())

# 3. 전체 shape(행/열 수) 확인
print(df.shape)  # (행 개수, 열 개수)

# 4. 열 이름만 보기
print(df.columns)

# 5. 간단한 통계 요약
print(df.describe())


       country continent  year  lifeExp       pop   gdpPercap
0  Afghanistan      Asia  1952   28.801   8425333  779.445314
1  Afghanistan      Asia  1957   30.332   9240934  820.853030
2  Afghanistan      Asia  1962   31.997  10267083  853.100710
3  Afghanistan      Asia  1967   34.020  11537966  836.197138
4  Afghanistan      Asia  1972   36.088  13079460  739.981106
       country continent  year  lifeExp       pop   gdpPercap
1699  Zimbabwe    Africa  1987   62.351   9216418  706.157306
1700  Zimbabwe    Africa  1992   60.377  10704340  693.420786
1701  Zimbabwe    Africa  1997   46.809  11404948  792.449960
1702  Zimbabwe    Africa  2002   39.989  11926563  672.038623
1703  Zimbabwe    Africa  2007   43.487  12311143  469.709298
(1704, 6)
Index(['country', 'continent', 'year', 'lifeExp', 'pop', 'gdpPercap'], dtype='object')
             year      lifeExp           pop      gdpPercap
count  1704.00000  1704.000000  1.704000e+03    1704.000000
mean   1979.50000    59.474439  2.96012

# country 열 추출하기

In [5]:
type(df["country"])  # pandas.core.series.Series


pandas.core.series.Series

In [4]:
df.loc[:,'country']
# 나중에 조건 지정이 많아지면 df.loc[row, col] 형태로 넘어가게 돼.


0       Afghanistan
1       Afghanistan
2       Afghanistan
3       Afghanistan
4       Afghanistan
           ...     
1699       Zimbabwe
1700       Zimbabwe
1701       Zimbabwe
1702       Zimbabwe
1703       Zimbabwe
Name: country, Length: 1704, dtype: object

# 'country', 'continent', 'year' 열 추출하기

In [7]:
# 방법 1: df[["열1", "열2", "열3"]] 방식 (가장 많이 씀)
df[["country", "continent", "year"]]

print(df[["country", "continent", "year"]].head())

       country continent  year
0  Afghanistan      Asia  1952
1  Afghanistan      Asia  1957
2  Afghanistan      Asia  1962
3  Afghanistan      Asia  1967
4  Afghanistan      Asia  1972


In [8]:
# 방법 2: .loc 사용
df.loc[:, ["country", "continent", "year"]]
# .loc는 행과 열을 동시에 다룰 수 있으니까, 조건 추가하고 싶을 때 유용해.

print(df[["country", "continent", "year"]].head())

       country continent  year
0  Afghanistan      Asia  1952
1  Afghanistan      Asia  1957
2  Afghanistan      Asia  1962
3  Afghanistan      Asia  1967
4  Afghanistan      Asia  1972


# [0], [99] , [-1] 행을 각각 추출하기

In [9]:
# ✅ 특정 행 추출: .iloc[] 사용

# 0번째 행
print(df.iloc[0])

# 99번째 행
print(df.iloc[99])

# 마지막 행
print(df.iloc[-1])


country      Afghanistan
continent           Asia
year                1952
lifeExp           28.801
pop              8425333
gdpPercap     779.445314
Name: 0, dtype: object
country      Bangladesh
continent          Asia
year               1967
lifeExp          43.453
pop            62821884
gdpPercap    721.186086
Name: 99, dtype: object
country        Zimbabwe
continent        Africa
year               2007
lifeExp          43.487
pop            12311143
gdpPercap    469.709298
Name: 1703, dtype: object


In [12]:
# ✅ 여러 행을 동시에 추출하려면?

print(df.iloc[[0, 99, -1]])


          country continent  year  lifeExp       pop   gdpPercap
0     Afghanistan      Asia  1952   28.801   8425333  779.445314
99     Bangladesh      Asia  1967   43.453  62821884  721.186086
1703     Zimbabwe    Africa  2007   43.487  12311143  469.709298
