In [12]:
import pandas as pd
import numpy as np

s = pd.Series([1, 2, 3, np.nan, np.nan, np.nan, 7, 8, np.nan, np.nan])
s

0    1.0
1    2.0
2    3.0
3    NaN
4    NaN
5    NaN
6    7.0
7    8.0
8    NaN
9    NaN
dtype: float64

In [13]:
# interpolation 메서드를 이용한 결측치 내삽
# 용도: 결측치 앞뒤 값을 직선으로 연결하여 추정값을 계산합니다.
# 장점: 간단하고 빠르게 적용 가능합니다.
# 단점: 데이터 분포가 비선형이거나 급격한 변화가 있는 경우 부적합할 수 있습니다.
# 적용 예시: 시간에 따라 일정하게 변화하는 센서 데이터 등
s.interpolate(
    method="spline", order=1, limit_direction="forward", limit=2
)

0     1.0
1     2.0
2     3.0
3     4.0
4     5.0
5     NaN
6     7.0
7     8.0
8     9.0
9    10.0
dtype: float64

In [8]:
# interpolation 메서드를 이용한 결측치 삽
# 용도: 구간별로 다항식 곡선을 피팅하고, 곡선들이 부드럽게 연결되도록 하여 추정값을 계산합니다.
# 장점: 곡선의 급격한 변화를 완화하며, 자연스러운 연결을 통해 부드러운 추정값을 생성합니다.
# 단점: 계산 복잡도가 높고, 매듭점(knot) 설정에 주의해야 합니다.
# 적용 예시: 부드러운 곡선 형태를 갖는 데이터, 이미지 처리 등
s.interpolate(
    method="slinear", limit_direction="forward", limit=2
)

0    1.0
1    2.0
2    3.0
3    4.0
4    5.0
5    6.0
6    7.0
7    NaN
8    NaN
dtype: float64

In [15]:
# interpolation 메서드를 이용한 결측치 내삽
# 용도: 결측치 주변 값들을 이용하여 다항식 곡선을 피팅하고, 해당 곡선을 통해 추정값을 계산합니다.
# 장점: 비선형 데이터에도 적용 가능하며, 곡선의 차수를 조절하여 유연하게 모델링할 수 있습니다.
# 단점: 과적합 위험이 있으며, 차수 설정에 주의해야 합니다.
# 적용 예시: 부드럽게 변화하는 시계열 데이터, 특정 패턴을 따르는 데이터 등
s.interpolate(
    method="polynomial", order=2,limit_direction="forward", limit=2
)
#order=2로 2차 다항식을 사용하여 결측치 주변 값들을 기반으로 곡선을 피팅하고, 해당 곡선을 통해 결측치를 추정합니다.
#order 값을 조절하여 곡선의 복잡도를 조절할 수 있습니다. (값이 클수록 복잡한 곡선)

0    1.0
1    2.0
2    3.0
3    4.0
4    5.0
5    NaN
6    7.0
7    8.0
8    NaN
9    NaN
dtype: float64

In [16]:
# interpolation 메서드를 이용한 결측치 내삽
# 용도: 결측치와 가장 가까운 값으로 추정값을 대체합니다.
# 장점: 매우 간단하고 빠르게 적용 가능합니다.
# 단점: 데이터 분포를 고려하지 않아 부정확한 추정값이 생성될 수 있습니다.
# 적용 예시: 범주형 데이터, 띄엄띄엄 측정된 데이터 등
s.interpolate(
    method="nearest", limit_direction="forward", limit=2
)

0    1.0
1    2.0
2    3.0
3    3.0
4    3.0
5    NaN
6    7.0
7    8.0
8    NaN
9    NaN
dtype: float64

In [None]:
# interpolate 함수는 다양한 다른 내삽 방법들도 지원합니다. (예: spline, time, index, values, pad, bfill, ffill 등)
# limit 매개변수를 사용하여 추정값의 변화량을 제한할 수 있습니다.
# limit_direction 매개변수를 사용하여 제한 방향을 설정할 수 있습니다. (forward, backward, both)