# Numpy Tutorial

In [1]:
!pip install numpy



## 1. 넘파이 소개

In [2]:
import numpy as np
import time

### Numpy 속도 테스트

In [3]:
#test speed
def sum_trad():
    start = time.time()
    X = range(10000000)
    Y = range(10000000)
    Z = []
    for i in range(len(X)):
        Z.append(X[i] + Y[i])
    return time.time() - start
    
def sum_numpy():
    start = time.time()
    X = np.arange(10000000) 
    Y = np.arange(10000000) 
    Z=X+Y
    return time.time() - start

print ('time sum:',sum_trad(),'  time sum numpy:',sum_numpy())

time sum: 8.752399921417236   time sum numpy: 0.12499189376831055


## 2. 배열 생성

### 2.1 단일 값으로 초기화

In [4]:
# 단일 값으로 초기화된 배열 생성
print(np.full((3, 3), np.inf))
print(np.full((3, 3), 10.1))

[[inf inf inf]
 [inf inf inf]
 [inf inf inf]]
[[10.1 10.1 10.1]
 [10.1 10.1 10.1]
 [10.1 10.1 10.1]]


In [5]:
# 배열을 단일 값으로 리셋
arr = np.array([10, 20, 33], float)
print(arr)

[10. 20. 33.]


In [6]:
arr.fill(1)
print(arr)

[1. 1. 1.]


### 2.2 랜덤 초기화

In [7]:
# 정수 순열로 초기화된 배열 생성
np.random.permutation(3)

array([1, 0, 2])

In [8]:
# 균등분포로 초기화된 배열 생성
np.random.random(5)

array([0.49268642, 0.73910484, 0.29046511, 0.03140259, 0.13389864])

In [9]:
# 균등분포로 초기화된 2차원 배열 생성
np.random.rand(2,3)

array([[0.05621246, 0.26423437, 0.52018664],
       [0.96686911, 0.84310316, 0.0886853 ]])

In [10]:
# 정규분포로 초기화된 배열 생성
np.random.normal(0,1,5) # 평균, 표준 편차

array([ 0.46859293,  2.81061461,  0.78674686,  0.62688269, -1.82745497])

In [11]:
# 다변량 정규분포로 초기화된 2차원 배열 생성
np.random.multivariate_normal([10, 0], [[3, 1], [1, 4]], size=[5,]) # 평균, 공분산, 배열 형태

array([[ 7.48487466, -0.57755571],
       [11.33813017, -0.23236418],
       [10.6453999 , -0.65072269],
       [ 6.16884455, -1.61783138],
       [12.02430554,  0.26126015]])

### 2.3 리스트에서 생성

In [12]:
#리스트에서 배열 생성
arr = np.array([2, 6, 5, 9], float)
print (arr)
print (type(arr))

[2. 6. 5. 9.]
<class 'numpy.ndarray'>


In [13]:
# 배열에서 리스트로 변환
arr = np.array([1, 2, 3], float)
print (arr.tolist())
print (list(arr))

[1.0, 2.0, 3.0]
[1.0, 2.0, 3.0]


### 2.4 배열 복사

In [14]:
arr = np.array([1, 2, 3], float)
arr1 = arr
arr2 = arr.copy()
arr[0] = 0
print (arr)
print (arr1)
print (arr2)

[0. 2. 3.]
[0. 2. 3.]
[1. 2. 3.]


### 2.5 단위 행렬

In [15]:
np.identity(3, dtype=int)

array([[1, 0, 0],
       [0, 1, 0],
       [0, 0, 1]])

In [16]:
np.identity(3)

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

### 2.6 영행렬, 1행렬

In [17]:
np.zeros(6, dtype=int)

array([0, 0, 0, 0, 0, 0])

In [18]:
np.ones((2,3), dtype=float)

array([[1., 1., 1.],
       [1., 1., 1.]])

In [19]:
# 주어진 배열과 동일한 차원의 영행렬, 1행렬 생성
arr = np.array([[13, 32, 31], [64, 25, 76]], float)
np.zeros_like(arr)

array([[0., 0., 0.],
       [0., 0., 0.]])

In [20]:
np.ones_like(arr)

array([[1., 1., 1.],
       [1., 1., 1.]])

## 3. 배열 관리

### 3.1 배열의 크기와 데이터 타입

In [21]:
# 배열의 모양 확인
arr.shape

(2, 3)

In [22]:
# 1차원의 길이
arr = np.array([[ 4., 5., 6.], [ 2., 3., 6.]], float)
len(arr)

2

In [23]:
# 데이터 타입 확인
arr.dtype

dtype('float64')

In [24]:
# 데이터 타입 변환
int_arr = matrix.astype(np.int32)
int_arr

NameError: name 'matrix' is not defined

### 3.2 배열 읽기/쓰기

In [None]:
arr = np.array([2., 6., 5., 5.])
print(arr[:3])
print(arr[3])
arr[0] = 5.
print(arr)

### 3.3 배열 슬라이싱

In [None]:
# 슬라이싱
matrix = np.array([[ 4., 5., 6.], [2, 3, 6]], float)
print(matrix)

In [None]:
arr = np.array([[ 4., 5., 6.], [ 2., 3., 6.]], float)
print(arr[1:2,2:3])
print(arr[1,:])
print(arr[:,2])
print(arr[-1:,-2:])

### 3.4 배열 쿼리

In [None]:
# 인덱스 배열로 쿼리
arr1 = np.array([1, 4, 5, 9], float)
arr2 = np.array([0, 1, 1, 3, 1, 1, 1], int)
print(arr1[arr2])

In [None]:
# 다차원 배열 인덱스 배열로 쿼리
arr1 = np.array([[1, 2], [5, 13]], float)
arr2 = np.array([1, 0, 0, 1], int)
arr3 = np.array([1, 1, 0, 1], int)
print(arr1[arr2,arr3])

In [None]:
# 논리 행렬로 쿼리
arr = np.arange(25).reshape(5,5)
print(arr % 2 == 0)
arr[arr % 2 == 0] = 0
print(arr)

In [None]:
# where 조건으로 쿼리
a = np.arange(10)
print(a)
np.where(a < 5, a, 10*a)

### 3.5 중복 제거

In [None]:
arr = np.array([2., 6., 5., 5.])
print(np.unique(arr))

### 3.6 정렬/섞기

In [None]:
# 정렬
np.sort(arr)

In [None]:
# 정렬해서 인덱스 배열 생성
np.argsort(arr)

In [None]:
# 랜덤하게 섞기
np.random.shuffle(arr)
arr

In [None]:
# 배열 비교
np.array_equal(arr,np.array([1,3,2]))

### 3.7 1차원 배열로 펴기

In [None]:
# Flattening
arr = np.array([[10, 29, 23], [24, 25, 46]], float)
print(arr)
print(arr.flatten())

### 3.8 재배열

In [None]:
# 배열의 재배열
arr = np.array(range(8), float)
print(arr)
arr = arr.reshape((4,2))
print(arr)
print(arr.shape)

### 3.9 전치 행렬

In [None]:
arr = np.array(range(6), float).reshape((2, 3))
print(arr)
print(arr.transpose())

In [None]:
# 행렬의 T 속성으로 전치하기
matrix = np.arange(15).reshape((3, 5))
print(matrix)
print(matrix .T)

### 3.10 차원 늘리기

In [None]:
# newaxis로 차원 늘리기
arr = np.array([14, 32, 13], float)
print(arr)
print(arr[:,np.newaxis])
print(arr[:,np.newaxis].shape)
print(arr[np.newaxis,:])
print(arr[np.newaxis,:].shape)

### 3.11 배열 결합

In [None]:
arr1 = np.array([[11, 12], [32, 42]], float)
arr2 = np.array([[54, 26], [27, 28]], float)
print(np.concatenate((arr1,arr2)))

# 1차원 방향으로 결합
print(np.concatenate((arr1,arr2), axis=0))

# 2차원 방향으로 결합
print(np.concatenate((arr1,arr2), axis=1))

### 3.12 배열 쌓기

In [None]:
x = np.array([2, 3, 4]) 
y = np.array([3, 4, 5])

In [None]:
# 1차원으로 쌓기 (행으로 쌓기)
np.stack((x, y))

In [None]:
# 2차원으로 쌓기 (열로 쌓기)
np.stack((x, y), axis=-1)

## 4. 배열 연산

### 4.1 산술연산

In [None]:
#array operations
arr1 = np.array([1,2,3], float)
arr2 = np.array([1,2,3], float)
print(arr1+arr2)
print(arr1-arr2)
print(arr1 * arr2)
print(arr2 / arr1)
print(arr1 % arr2)
print(arr2**arr1)

### 4.2 브로드캐스팅

In [None]:
arr1 = np.zeros((2,2), float)
arr2 = np.array([1., 2.], float)

print(arr1)
print(arr2)
print(arr1 + arr2)

In [None]:
# 배열의 브로드캐스팅 방식을 명시하고 싶다면 newaxis 상수를 이용해서 확장해야 할 축을 지정
arr1 = np.zeros((2,2), float)
arr2 = np.array([1., 2.], float)
print( arr1 + arr2[np.newaxis,:])
print(arr1 + arr2[:,np.newaxis])

### 4.3 논리 연산

In [None]:
arr = np.array([[1, 2, 3],
                [4, 5, 6]])
X1 = arr%2 == 0
print(X1)

In [None]:
X2 = arr >= 4
print(X2)

In [None]:
X3 = X1*1
print(X3)

In [None]:
np.logical_and(X1, X2)

## 5. 선형대수 연산

### 5.1 벡터의 곱

In [None]:
arr1 = np.array([12, 43, 10], float)
arr2 = np.array([21, 42, 14], float)

In [None]:
# Inner Product
np.inner(arr1, arr2)

In [None]:
# outer Product 
np.outer(arr1, arr2)

In [None]:
# Cross Product
np.cross(arr1, arr2)

### 5.2 행렬곱

In [None]:
#linear algebra operations
X = np.arange(15).reshape((3, 5))
print(X)
print(X.T)

In [None]:
np.dot(X.T, X)

### 5.3 행렬식, 역행렬

In [None]:
# 행렬식
matrix = np.array([[74, 22, 10], [92, 31, 17], [21, 22, 12]], float)
print(matrix)
print(np.linalg.det(matrix))

In [None]:
# 역행렬
inv_matrix = np.linalg.inv(matrix)
print(inv_matrix)
print(np.dot(inv_matrix,matrix))

### 5.4 고윳값, 고유벡터

In [None]:
matrix = np.array([[74, 22, 10], [92, 31, 17], [21, 22, 12]], float)
# 고윳값, 고유벡터
vals, vecs = np.linalg.eig(matrix)
print(vals)

In [None]:
print(vecs)

### 5.5 통계 함수

In [None]:
arr = np.random.rand(8, 4)
arr.mean() # 평균

In [None]:
np.mean(arr) # 평균

In [None]:
arr.std() # 표준 편차

In [None]:
arr.var() # 분산

In [None]:
arr.sum() # 합산

In [None]:
arr.min() # 최소

In [None]:
arr.max() # 최대

In [None]:
arr.argmin() # 최소 값의 인덱스

In [None]:
arr.argmax() # 최대 값의 인덱스