In [1]:
%matplotlib inline
%load_ext autoreload
%autoreload 2

# Scipy

Numpy의 기능을 사용하여 구축된 다양한 **과학 기술 컴퓨팅 알고리즘(scientific algorithm)을 제공**하는 패키지.  
`ndarray`나 `ufunc`와 같이 Python에 확장기능을 제공하지는 않지만, **Fortran으로 작성된 코드를 Python에서** 사용할 수 있도록 제공.  

현재 Scipy에 포함된 대부분의 함수는 Fortran으로 작성되었음. 더불어 **BLAS나 LAPACK의 함수를 사용하기 위한 저수준 함수**도 갖추어져 있음.  

Scipy를 통해 Python이 MATLAB, IDL(Interactive Data Language), Octave, Scilab등에 필적할 수 있는 시스템으로 발전.  

더불어 Scipy는 **Numpy의 모든 함수를 지원하며, 추가적인 서브 패키지를 지원.**  
때문에 Numpy를 import하지 않아도, **Scipy를 통해 Numpy의 모든 함수를 동일하게 사용 가능.**  
공식 [documentation](https://docs.scipy.org/doc/)과 Scipy의 docstring을 통해 자세한 내용을 확인 가능하며, 내역은 아래와 같음.  

In [11]:
print(sp.__doc__)


SciPy: A scientific computing package for Python

Documentation is available in the docstrings and
online at https://docs.scipy.org.

Contents
--------
SciPy imports all the functions from the NumPy namespace, and in
addition provides:

Subpackages
-----------
Using any of these subpackages requires an explicit import.  For example,
``import scipy.cluster``.

::

 cluster                      --- Vector Quantization / Kmeans
 fftpack                      --- Discrete Fourier Transform algorithms
 integrate                    --- Integration routines
 interpolate                  --- Interpolation Tools
 io                           --- Data input and output
 linalg                       --- Linear algebra routines
 linalg.blas                  --- Wrappers to BLAS library
 linalg.lapack                --- Wrappers to LAPACK library
 misc                         --- Various utilities that don't have
                                  another home.
 ndimage                      --- n-dim

## Scipy의 최적화

Scipy에만 존재하는 함수는 Numpy에 있는 함수보다 더 최적화되어 있거나, 기능이 확장된 경우가 존재.  

아래의 이산 푸리에 변환을 통해 확인 가능.  

In [3]:
y = sp.randn(2**16)

In [4]:
# Numpy
%timeit Y = np.fft.fft(y)

2.47 ms ± 56.4 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [9]:
# Scipy
from scipy import fftpack
%timeit Y = fftpack.fft(y)

1.14 ms ± 2.49 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


## Scipy의 통계 패키지

Python에서 통계처리를 하는데는 아래의 5가지가 주로 사용
- Pyhon 기본 라이브러리 Statistics
- Numpy의 통계처리 함수
- Pandas의 통계처리 함수
- **Scipy의 stats 패키지**
- **Statsmodels**

앞의 세가지는 평균, 분산, 중앙값 등 극히 기초적인 기능만 제공.  
뒤의 두가지는 통계분석이 가능한 기능들을 제공.  

Statsmodels는 원래 scipy.stats의 model 모듈이었으나, 분리되어 별도의 패키지로 공개.  
(Scipy의 stats 서브 패키지와 상호보완적인 관계를 갖음.)  

**Python에서 통계분석을 할 때에는 Scipy나 Statsmodel을 이용**하여 하는 것이 바람직.  

# Conclusion

Scipy는 Python에 C와 Fortran기반의 과학 기술 컴퓨팅 알고리즘 제공이 목적.  
**알고리즘들은 Numpy를 기반으로하여 확장 및 최적화** 되었음.  

따라서 Numpy가 아닌 **Scipy를 이용하여 과학 기술 컴퓨팅 알고리즘에 익숙해 지는것이 바람직.**  

# References

1. [엔지니어를 위한 파이썬](http://www.yes24.com/24/goods/56900453)