# SciPy
- [SciPy](https://scipy.org/)
- 과학 계산용 함수를 모아놓은 파이썬 패키지
- 고성능 선형 대수, 함수 최적화, 신호 처리, 특수한 수학 함수와 통계 분포
- scikit-learn은 알고리즘을 구현할 때 SciPy의 여러 함수를 사용한다.
- 그 중 가장 중요한 기능은 scipy.sparse
    - 해당 모듈은 scikit-learn에서 데이터를 표현하는 또 하나의 방법인 희소 행렬 기능을 제공
    - 희소 행렬은 0을 많이 포함한 2차원 배열을 저장할 때 사용한다.

In [8]:
import numpy as np
from scipy import sparse

eye = np.eye(4)*2 #4x4 단위 행렬 
print("Numpy 배열:\n", eye)

Numpy 배열:
 [[2. 0. 0. 0.]
 [0. 2. 0. 0.]
 [0. 0. 2. 0.]
 [0. 0. 0. 2.]]


In [9]:
#numpy 배열을 CSR 포맷의 SciPy 희박 행렬로 변환합니다.
#0이 아닌 원소만 저장됩니다. 0이 많은 행렬에서 0이 아닌 원소만 저장 : 효율적임.

#scipy.sparse.csr_matrix(ndarray) :: ndarry를 csr포맷으로 저장한다. 0이 많은 다차원 배열을 효율적으로 관리
sparse_matrix = sparse.csr_matrix(eye)
print("\nSciPy의 CSR 행렬:\n",sparse_matrix)

#0이 아닌 원소의 위치 (행,열) 과 그 곳에서의 값


SciPy의 CSR 행렬:
   (0, 0)	2.0
  (1, 1)	2.0
  (2, 2)	2.0
  (3, 3)	2.0


In [42]:
#COO포맷을 이용해서 앞서와 동일한 희소 행렬을 만드는 예제

data = np.ones(4) #모든 원소가 1로 채워진 다차원 배열, np.ones(shape) :: ex) np.shape((4,5))

#행, 열의 인덱스를 다차원배열[np.arange()]를 이용해서 지정
row_indices = np.array([0,1,2,3]) 
col_indices = np.array([1,2,0,3]) 

#해당 data의 원소를 차례대로 0행1열, 1행2열, 2행0열, 3행3열에 배치한 행렬을 만들라.
eye_coo = sparse.coo_matrix((data, (row_indices, col_indices)))
print("COO 표현: \n", eye_coo)




COO 표현: 
   (0, 1)	1.0
  (1, 2)	1.0
  (2, 0)	1.0
  (3, 3)	1.0
