## Autocorrelation in time series data
In the field of time series analysis, autocorrelation refers to the correlation of a time series with a lagged version of itself. For example, an autocorrelation of order 3 returns the correlation between a time series and its own values lagged by 3 time points.

It is common to use the autocorrelation (ACF) plot, also known as self-autocorrelation, to visualize the autocorrelation of a time-series. The plot_acf() function in the statsmodels library can be used to measure and plot the autocorrelation of a time series.

시계열 데이터의 자기 상관
시계열 분석 분야에서 자기 상관은 시간 계열과 그 자체의 느린 버전의 상관 관계를 나타냅니다. 예를 들어 차수 3의 자동 상관 관계는 시계열과 자체 시간의 상관 관계를 3 개의 시간 지점에 비해 뒤떨어지게합니다.

일반적으로 자체 자기 상관 (autocorrelation)이라고도하는 자기 상관 (autocorrelation) 플롯을 사용하여 시계열의 자기 상관을 시각화합니다. statsmodels 라이브러리의 plot_acf () 함수를 사용하여 시계열의 자기 상관을 측정하고 그릴 수 있습니다.

In [None]:
Autocorrelation in time series data
In the field of time series analysis, autocorrelation refers to the correlation of a time series with a lagged version of itself. For example, an autocorrelation of order 3 returns the correlation between a time series and its own values lagged by 3 time points.

It is common to use the autocorrelation (ACF) plot, also known as self-autocorrelation, to visualize the autocorrelation of a time-series. The plot_acf() function in the statsmodels library can be used to measure and plot the autocorrelation of a time series.

In [None]:
# Import required libraries
import matplotlib.pyplot as plt
plt.style.use('fivethirtyeight')
from statsmodels.graphics import tsaplots

# Display the autocorrelation plot of your time series
fig = tsaplots.plot_acf(co2_levels['co2'], lags=24)

# Show plot
plt.show()

![image.png](attachment:image.png)

### QUIZ
Interpret autocorrelation plots
If autocorrelation values are close to 0, then values between consecutive observations are not correlated with one another. Inversely, autocorrelations values close to 1 or -1 indicate that there exists strong positive or negative correlations between consecutive observations, respectively.

In order to help you asses how trustworthy these autocorrelation values are, the plot_acf() function also returns confidence intervals (represented as blue shaded regions). If an autocorrelation value goes beyond the confidence interval region, you can assume that the observed autocorrelation value is statistically significant.

In the autocorrelation plot below, are consecutive observations highly correlated (i.e superior to 0.5) and statistically significant?

### 퀴즈
자기 상관 플롯 해석
자기 상관 값이 0에 가까울 경우 연속적인 관측 값은 서로 상관되지 않습니다. 역으로, 1 또는 -1에 가까운 자기 상관 값은 연속적인 관측 사이에 강한 양의 상관 관계 또는 음의 상관 관계가 각각 있음을 나타냅니다.

이러한 autocorrelation 값이 얼마나 신뢰할 수 있는지 확인하는 데 도움이되도록 plot_acf () 함수는 신뢰 구간 (파란색 음영 영역으로 표시)도 반환합니다. 자기 상관 값이 신뢰 구간 영역을 초과하면 관찰 된 자기 상관 값이 통계적으로 유의하다고 가정 할 수 있습니다.

아래의 자기 상관 그래프에서 연속 관찰은 높은 상관 관계 (즉, 0.5보다 우수)와 통계적으로 유의합니까?

![image.png](attachment:image.png)

정답: 매우 높은 상관관계를 가지며 / 통계적으로 유의하다.


### Partial autocorrelation in time series data
Like autocorrelation, the partial autocorrelation function (PACF) measures the correlation coefficient between a time-series and lagged versions of itself. 

However, it extends upon this idea by also removing the effect of previous time points. For example, a partial autocorrelation function of order 3 returns the correlation between our time series (t_1, t_2, t_3, ...) and its own values lagged by 3 time points (t_4, t_5, t_6, ...), but only after removing all effects attributable to lags 1 and 2.

The plot_pacf() function in the statsmodels library can be used to measure and plot the partial autocorrelation of a time series.

INSTRUCTIONS
100 XP
- Import tsaplots from statsmodels.graphics.
- Use the plot_pacf() function from tsaplots to plot the partial autocorrelation of the 'co2' column in co2_levels.
- Specify a maximum lag of 24.


### 시계열 데이터의 부분 자기 상관
자기 상관과 마찬가지로 부분 자기 상관 함수 (partial autocorrelation function, PACF)는 시계열과 지연 버전 간의 상관 계수를 측정합니다.

그러나 이전의 시점의 효과를 제거하여이 아이디어를 확장합니다. 예를 들어 차수 3의 부분 자기 상관 함수는 우리의 시계열 (t 1, t 2, t 3, ...)과 3 개의 시간 지점 t4, t5, t6, ...), 래그 1 및 2에 기인하는 모든 효과를 제거한 후에 만 ​​수행된다.

statsmodels 라이브러리의 플롯 _pacf () 함수를 사용하여 시계열의 부분 자기 상관을 측정하고 플롯 할 수 있습니다.

명령
100XP
- statsmodels.graphics에서 tsaplots을 가져옵니다.
- tsaplots의 플롯_ pacf () 함수를 사용하여 co2_levels의 'co2'열의 부분 자기 상관을 플로팅합니다.
- 최대 지연 시간을 24로 지정하십시오.

In [None]:
# Import required libraries
import matplotlib.pyplot as plt
plt.style.use('fivethirtyeight')
from statsmodels.graphics import tsaplots

# Display the partial autocorrelation plot of your time series
fig = tsaplots.plot_pacf(co2_levels['co2'], lags=24)

# Show plot
plt.show()

![image.png](attachment:image.png)

## QUIZ

`Interpret partial autocorrelation plots`

If partial autocorrelation values are close to 0, then values between observations and lagged observations are not correlated with one another. Inversely, partial autocorrelations with values close to 1 or -1 indicate that there exists strong positive or negative correlations between the lagged observations of the time series.

The .plot_pacf() function also returns confidence intervals, which are represented as blue shaded regions. If partial autocorrelation values are beyond this confidence interval regions, then you can assume that the observed partial autocorrelation values are statistically significant.

In the partial autocorrelation plot below, at which lag values do we have statistically significant partial autocorrelations?

## 퀴즈

`부분 자기 상관 플롯 해석`

부분 자기 상관 값이 0에 가까울 경우 관측치와 지연된 관측치 간의 값은 서로 상관되지 않습니다. 역으로, 1 또는 -1에 가까운 값을 갖는 부분 자기 상관은 시계열의 느린 관찰 사이에 강한 양의 상관 관계 또는 음의 상관 관계가 있음을 나타냅니다.

또한 .plot_pacf () 함수는 파란색 간격 영역으로 표시되는 신뢰 구간을 반환합니다. 부분 자기 상관 값이이 신뢰 구간 영역을 벗어나는 경우 관찰 된 부분 자기 상관 값이 통계적으로 유의하다고 가정 할 수 있습니다.

아래의 부분 자기 상관 그래프에서 래그 값은 통계적으로 중요한 부분 자기 상관을 나타내는가

![image.png](attachment:image.png)

정답 : 0, 1, 4, 5 and 6

##  Time series decomposition

When visualizing time series data, you should look out for some distinguishable patterns:

- seasonality: does the data display a clear periodic pattern?
- trend: does the data follow a consistent upwards or downward slope?
- noise: are there any outlier points or missing values that are not consistent with the rest of the data?

You can rely on a method known as time-series decomposition to automatically extract and quantify the structure of time-series data. The statsmodels library provides the seasonal_decompose() function to perform time series decomposition out of the box.

`decomposition = sm.tsa.seasonal_decompose(time_series)`

You can extract a specific component, for example seasonality, by accessing the seasonal attribute of the decomposition object.

INSTRUCTIONS
100 XP
- Import statsmodels.api using the alias sm.
- Perform time series decomposition on the co2_levels DataFrame into a variable called decomposition.
- Print the seasonality component of your time series decomposition

## 시계열 분해

시계열 데이터를 시각화 할 때 몇 가지 구별 가능한 패턴을 찾아야합니다.

- 계절성 : 데이터에 명확한 주기적 패턴이 표시됩니까?
- 추세 : 데이터가 일정한 상승 또는 하강 기울기를 따르는가?
- 소음 : 다른 데이터와 일치하지 않는 이상 값이나 누락 된 값이 있습니까?

시계열 분해로 알려진 방법을 사용하여 시계열 데이터의 구조를 자동으로 추출하고 정량화 할 수 있습니다. statsmodels 라이브러리는 계절별 _decompose () 함수를 제공하여 시계열 분해를 즉시 수행합니다.

`decomposition = sm.tsa.seasonal_ 분해 (시간 _시리즈)`

분해 오브젝트의 계절 속성에 액세스하여 계절성과 같은 특정 구성 요소를 추출 할 수 있습니다.

명령
100XP
- 별칭 sm을 사용하여 statsmodels.api를 가져옵니다.
- co2_ 수준의 DataFrame에서 시계열 분해를 분해라는 변수로 수행합니다.
- 시계열 분해의 계절성 구성 요소 인쇄

In [None]:
# Import statsmodels.api as sm
import statsmodels.api as sm

# Perform time series decompositon
decomposition = sm.tsa.seasonal_decompose(co2_levels)

# Print the seasonality component
print(decomposition.seasonal)

In [None]:
print(decomposition.seasonal)
                 co2
datestamp           
1958-03-29  1.028042
1958-04-05  1.235242
1958-04-12  1.412344
1958-04-19  1.701186
1958-04-26  1.950694

## Plot individual components

It is also possible to extract other inferred quantities from your time-series decomposition object. The following code shows you how to extract the observed, trend and noise (or residual, resid) components.

- observed = decomposition.observed
- trend = decomposition.trend
- residuals = decomposition.resid
You can then use the extracted components and plot them individually.

The decomposition object you created in the last exercise is available in your workspace.

INSTRUCTIONS
100 XP
- Extract the trend component from the decomposition object.
- Plot this trend component.

## 개별 구성 요소 플롯

또한 시계열 분해 오브젝트에서 다른 추론 된 양을 추출 할 수도 있습니다. 다음 코드는 관측, 추세 및 노이즈 (또는 잔여, 잔유) 구성 요소를 추출하는 방법을 보여줍니다.

- 관찰 된 = decomposition.observed
- 트렌드 = 분해. 트렌드
- 잔여 = 분해. 수지
그런 다음 추출 된 구성 요소를 사용하여 개별적으로 그릴 수 있습니다.

마지막 연습에서 작성한 분해 오브젝트는 작업 공간에서 사용할 수 있습니다.

명령
100XP
- 분해 오브젝트에서 추세 성분을 추출하십시오.
-이 트렌드 구성 요소를 플롯합니다.

In [None]:
# Extract the trend component
trend = decomposition.trend

# Plot the values of the trend
ax = trend.plot(figsize=(12, 6), fontsize=6)

# Specify axis labels
ax.set_xlabel('Date', fontsize=10)
ax.set_title('Seasonal component the CO2 time-series', fontsize=10)
plt.show()

![image.png](attachment:image.png)

## Visualize the airline dataset

You will now review the contents of chapter 1. You will have the opportunity to work with a new dataset that contains the monthly number of passengers who took a commercial flight between January 1949 and December 1960.

We have printed the first 5 and the last 5 rows of the airline DataFrame for you to review.

INSTRUCTIONS
100 XP
- Plot the time series of airline using a "blue" line plot.
- Add a vertical line on this plot at December 1, 1955.
- Specify the x-axis label on your plot: 'Date'.
- Specify the title of your plot: 'Number of Monthly Airline Passengers'.
