   ![실습파일 표지로고(최종).png](attachment:d9b7c567-72ec-430c-b775-dfbe0f1875f4.png)

# Part 2: 파이썬 생태계(Python's Ecosystem) 구축

# Chapter 1. 필요한 라이브러리 설치 

## 파이썬의 설치
* 아나콘다(Anaconda) 혹은 윈도우 파이썬(WinPython)
* https://www.anaconda.com
* https://www.python.org

## 다양한 라이브러리의 설치 또는 갱신(update)
* 아래 라이브러리 리스트 참조
* 예) ! pip install package_name
## Jupyter Notebook 파일(.ipynb)과 파이썬 파일(.py)의 상호 변환 
* ! pip install ipynb-py-convert
* ipynb-py-convert test.ipynb test.py 

In [1]:
# 연습: 계량경제학 예제로 많이 쓰이는 Wooldridge의 데이터세트 설치
!pip install wooldridge   



In [2]:
# 나의 Python Ecosystem에 어떤 Libraries가 설치되어 있는지 확인
!conda list

# packages in environment at C:\Users\PARKSeungRok\anaconda3:
#
# Name                           Version              Build               Channel
_anaconda_depends                2025.06              py313_mkl_2
aiobotocore                      2.19.0               py313haa95532_0
aiohappyeyeballs                 2.4.4                py313haa95532_0
aiohttp                          3.11.10              py313h827c3e9_0
aioitertools                     0.7.1                pyhd3eb1b0_0
aiosignal                        1.2.0                pyhd3eb1b0_0
alabaster                        0.7.16               py313haa95532_0
altair                           5.5.0                py313haa95532_0
anaconda-anon-usage              0.7.1                py313hfc23b7f_100
anaconda-auth                    0.8.6                py313haa95532_0
anaconda-catalogs                0.2.0                py313haa95532_2
anaconda-cli-base                0.5.2                py313haa95532_0
anaconda-client       

## 현재 작업공간(Present Working Directory) 확인 및 바꾸기

In [3]:
# 작업공간(working directory)지정  
import os  
os.chdir("X:\Econometrics_with_ML")

# 현재 작업공간(working directory)확인  
os.getcwd() 

'X:\\Econometrics_with_ML'

## 나만의 작업 디렉터리(Working Directory)를 만들자!
* D:/My Project/내에 Data, Functions, Figures, Jupyter, Output와 같은 Sub-directory를 만듬
* 프로젝트 코딩 파일은 D:/My Project/내, 혹은 Jupyter에 위치시킴
* Data 디렉터리에는 자료 
* Functions 디렉터리에는 사용자가 만든 함수 
* Figures 디렉터리에는 그래프
* Output 디렉터리에는 결과물(데이터)을 CSV, Excel, Stata, SAS자료로 출력 보관

In [4]:
# 메모리 정리
for v in dir():
     del globals()[v]

## 필요한 라이브러리(모듈) 불러오기

In [5]:
# 매번 필요한 라이브러리를 설치하면 최근 버전으로 업데이트 되면서 기존 코드에 에러(Error) 발생 가능성이 있어서 특별한 경우 선별적으로 설치
# 한꺼번에 아래 라이브러리를 설치할 때 에러가 발생할 수 있으므로 개별적으로 설치 권장
# !pip install numpy pandas scipy math patsy matplotlib seaborn stargazer statsmodels linearmodels arch wooldridge wbdata warnings random scikit-learn pmdarima wbdata imfpy lazypredict joblib pickle pycaret 

In [6]:
!pip install stargazer



In [7]:
!pip install linearmodels



In [8]:
!pip install wbdata



In [9]:
!pip install arch



In [10]:
# 전통적 계량경제학에서 자주 사용되는 라이브러리(Libraries for the Analysis of Traditional Econometrics)
# Call this file 
# "exec(open('Functions/Traditional_Econometrics_Lib.py').read())"
# "%run –i Functions/Traditional_Econometrics_Lib.py"
# "from Functions.Traditional_Econometrics_Lib import * "

import os
import numpy as np                                       # Numerical calculations
import pandas as pd                                      # Data handling
import math as someAlias
import matplotlib.dates as mdates                        # Turn dates into numbers
import matplotlib.pyplot as plt                          # Lower-level graphics
import patsy as pt
import seaborn as sns
import stargazer as sg
import statsmodels.api as sm
import statsmodels.formula.api as smf                    # Econometrics
import statsmodels.stats.api as sms
import statsmodels.stats.diagnostic as dg
import statsmodels.stats.outliers_influence as smo
import linearmodels as lm                                # Panel model, Simultaneous Eq. Model
import scipy.stats as stats                              # Statistics
import random

from scipy.optimize import Bounds
from scipy.optimize import curve_fit                    # Nonlinear regression
from scipy.optimize import minimize
from scipy.stats import norm
from statsmodels.graphics import tsaplots               # Time series
from statsmodels.iolib.summary2 import summary_col
from statsmodels.stats.anova import anova_lm
from statsmodels.stats.stattools import durbin_watson
from statsmodels.tsa.api import VAR
from statsmodels.tsa.ar_model import AutoReg, ar_select_order
from statsmodels.tsa.arima.model import ARIMA
from statsmodels.tsa.stattools import adfuller          # ADF test
from statsmodels.tsa.stattools import coint             # Cointegration
from statsmodels.tsa.vector_ar.vecm import VECM
from arch import arch_model

import wooldridge as woo
import wbdata


import warnings
warnings.filterwarnings("ignore")

In [11]:
# 주로 사용하는 에디터
# Spyder : 선별적으로 사용
# Jupyter Notebook : 주로 사용
# Google Colab : ML, DL 등 계산량이 많은 작업 수행때 사용

In [None]:
# Python, py 파일을 Jupyter Notebook, ipynb 파일로 변환하기 
# !pip install ipynb-py-convert
# !ipynb-py-convert test.py test.ipynb

## 설명문(comment) 입력
* 샤프(#)로 시작하면 입력된 내용은 파이썬의 실행과 무관한 설명문이 됨.
* 여러 line을 설명문으로 지정하기 위해서는 """     """ 사용
* 설명문을 체계적으로 작성하면 차후 이해나 다른 사람과의 공유에 도움

In [None]:
# 이하  선형회귀식 추정

""" 
이하 선형회귀 추정과 가설검정
예측을 위한 부분임
"""

# 2. 간단한 연산 및 출력방법

In [15]:
# print문의 괄호()내에 수식 기술
print((4 + 6) * 10)

100


In [16]:
# 수식만 기술
from IPython import get_ipython; get_ipython().user_ns.setdefault('_oh', {})
(4 + 6) * 10

100

## 출력(print)방법 3가지 
### 1) print문 사용(머신러닝 부분에서 자주 사용)
* 괄호()내에 f'xxxxxxxxxxxxxxx {var})형식을 이용하여 설명을 위한 텍스트 삽입
* 빈줄 삽입시 /n 사용
### 2) 객체(object)만 사용
* Jupiter Notebook에서 사용
### 3) display문 사용
* Jupiter Notebook에서 사용
* 보다 세련된 형식으로 출력 가능

In [17]:
result1 = 1 + 1
print(f'result1: {result1}\n')

result1: 2



In [18]:
display(result1)

2

In [19]:
result2 = 5 * (4 - 1) ** 2
print(f'result2: {result2}\n')

result2: 45



In [21]:
result3 = [result1, result2]
print(f'result3: \n{result3}\n')

result3: 
[2, 45]



# 3. 모듈의 이해

In [22]:
from IPython import get_ipython; get_ipython().user_ns.setdefault('_oh', {})

import math as someAlias
dir(someAlias)

['__doc__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'acos',
 'acosh',
 'asin',
 'asinh',
 'atan',
 'atan2',
 'atanh',
 'cbrt',
 'ceil',
 'comb',
 'copysign',
 'cos',
 'cosh',
 'degrees',
 'dist',
 'e',
 'erf',
 'erfc',
 'exp',
 'exp2',
 'expm1',
 'fabs',
 'factorial',
 'floor',
 'fma',
 'fmod',
 'frexp',
 'fsum',
 'gamma',
 'gcd',
 'hypot',
 'inf',
 'isclose',
 'isfinite',
 'isinf',
 'isnan',
 'isqrt',
 'lcm',
 'ldexp',
 'lgamma',
 'log',
 'log10',
 'log1p',
 'log2',
 'modf',
 'nan',
 'nextafter',
 'perm',
 'pi',
 'pow',
 'prod',
 'radians',
 'remainder',
 'sin',
 'sinh',
 'sqrt',
 'sumprod',
 'tan',
 'tanh',
 'tau',
 'trunc',
 'ulp']

In [23]:
result1 = someAlias.log(100)
print(f'result1: {result1}\n')

result2 = someAlias.sqrt(36)
print(f'result1: {result2}\n')

result3 = someAlias.pi
print(f'Pi: {result3}\n')

result4 = someAlias.e
print(f'Eulers number: {result4}\n')

result1: 4.605170185988092

result1: 6.0

Pi: 3.141592653589793

Eulers number: 2.718281828459045

