### 일반 List는 메모리가 비효율 적이기 때문에
### numpy 모듈을 이용하여 Matrix를 표현하고 계산함.

#### numpy 모듈의 호출

In [1]:
import numpy as np

#### array의 생성

In [2]:
a = [1, 2, 3, 4, 5]
b = [5, 4, 3, 2, 1]
a = np.array(a, int)
a

array([1, 2, 3, 4, 5])

In [4]:
test_array = np.array(['1','4', 5.0, 8], float)
# String Type의 데이터를 입력해도 자동으로 형변환을 실시
test_array

array([1., 4., 5., 8.])

In [6]:
print(type(test_array))
print(type(test_array[3]))

<class 'numpy.ndarray'>
<class 'numpy.float64'>


![image.png](attachment:image.png)

In [7]:
a = [1, 2, 3, 4, 5]
b = [5, 4, 3, 2, 1]
a[0] is b[-1]

True

In [8]:
a = np.array(a)
b = np.array(a)
a[0] is b[-1] # numpy로 변환하면 값이 같더라도 다른 메모리 주소를 할당.

False

#### shape

In [9]:
a = [[1, 2, 3], [4, 5, 6], [4, 5, 6]]
np.array(a).shape

(3, 3)

![image.png](attachment:image.png)

![image-2.png](attachment:image-2.png)

#### numpy는 한 가지의 dtype만 담을 수 있다.

#### array shape

In [12]:
vector = [1,2,3,4]
np.array(vector, int).shape

(4,)

In [13]:
matrix = [[1,2,5,8], [1,2,4,8], [1,2,5,8]]
np.array(matrix, int).shape

(3, 4)

In [16]:
tensor = [
    [[1,2,5,8], [1,2,5,8], [1,2,5,8]],
    [[1,2,5,8], [1,2,5,8], [1,2,5,8]],
    [[1,2,5,8], [1,2,5,8], [1,2,5,8]],
    [[1,2,5,8], [1,2,5,8], [1,2,5,8]]
]
np.array(tensor ,int).shape

(4, 3, 4)

In [17]:
np.array(tensor, int).ndim

3

#### numpy dtype

In [18]:
a = np.array([[1,2,3], [4.5,5,6]], dtype=np.int8)
a.dtype

dtype('int8')

In [19]:
np.array([[1,2,3], [4.5,5,6]], dtype=np.float32).nbytes

24

In [20]:
np.array([[1,2,3], [4.5,5,6]], dtype=np.int8).nbytes

6

In [21]:
np.array([[1,2,3], [4.5,5,6]], dtype=np.float64).nbytes

48

#### numpy reshape
#### reshape : Array의 shape의 크기를 변경함. element의 갯수는 동일

In [23]:
test_matrix = [[1,2,3,4], [1,2,5,8]]
np.array(test_matrix).shape

(2, 4)

In [24]:
np.array(test_matrix).reshape(4, 2)

array([[1, 2],
       [3, 4],
       [1, 2],
       [5, 8]])

In [25]:
np.array(test_matrix).reshape(2, 2, 2)

array([[[1, 2],
        [3, 4]],

       [[1, 2],
        [5, 8]]])

In [26]:
np.array(test_matrix).reshape(8, 1)

array([[1],
       [2],
       [3],
       [4],
       [1],
       [2],
       [5],
       [8]])

In [27]:
np.array(test_matrix).reshape(1, -1)

array([[1, 2, 3, 4, 1, 2, 5, 8]])

#### flatten : 다차원의 array를 1차원 array로 변환

In [28]:
test_matrix = [[1,2,3,4], [1,2,5,8], [1,2,3,4], [1,2,5,8]]
np.array(test_matrix)

array([[1, 2, 3, 4],
       [1, 2, 5, 8],
       [1, 2, 3, 4],
       [1, 2, 5, 8]])

In [29]:
test_matrix = np.array(test_matrix)
test_matrix.shape

(4, 4)

In [30]:
np.array(test_matrix).flatten()

array([1, 2, 3, 4, 1, 2, 5, 8, 1, 2, 3, 4, 1, 2, 5, 8])

In [31]:
np.array(test_matrix).flatten().shape

(16,)

### indexing & slicing
1. indexing
>- list와 달리 이차원 배열에서 [0, 0] 표기법을 제공
>- matrix일 경우 앞은 row 뒤는 col을 의미

In [32]:
test_example = np.array([[1,2,3], [4.5, 5, 6]], int)
test_example

array([[1, 2, 3],
       [4, 5, 6]])

In [33]:
test_example[0][2]

3

In [34]:
test_example[0,2]

3

2. slicing
>- list와 달리 행과 열 부분을 나눠서 slicing이 가능함
>- matrix의 부분 집합을 추출할 때 유용함

![image.png](attachment:image.png)

#### arange : array의 범위를 지정하여, 값의 list를 생성하는 명령어

In [35]:
list(range(0, 10, 3))

[0, 3, 6, 9]

In [37]:
type(list(range(30)))

list

In [38]:
np.arange(0, 10, 0.5)

array([0. , 0.5, 1. , 1.5, 2. , 2.5, 3. , 3.5, 4. , 4.5, 5. , 5.5, 6. ,
       6.5, 7. , 7.5, 8. , 8.5, 9. , 9.5])

#### ones, zeros and empty

- zeros : 0으로 가득찬 ndarray 생성

In [41]:
np.zeros(10, dtype=np.int8)

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0], dtype=int8)

- ones : 1로 가득한 ndarray 생성

In [42]:
np.ones(10, dtype=np.int8)

array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1], dtype=int8)

- empty : shpae만 주어지고 비어있는 ndarray 생성(memory initialization이 되지 않음)

In [149]:
np.empty(10, dtype=np.int8)

array([ 48, 105, 114, -64, -78,   1,   0,   0, 112,  21], dtype=int8)

#### identity : 단위 행렬(i 행렬)을 생성함

In [61]:
np.identity(3, dtype=np.int8)

array([[1, 0, 0],
       [0, 1, 0],
       [0, 0, 1]], dtype=int8)

#### eye : 대각선이 1인 행렬, k값의 시작 index의 변경이 가능

In [62]:
np.eye(3, dtype=np.int8)

array([[1, 0, 0],
       [0, 1, 0],
       [0, 0, 1]], dtype=int8)

In [65]:
np.eye(3, 5,k=2, dtype=np.int8)

array([[0, 0, 1, 0, 0],
       [0, 0, 0, 1, 0],
       [0, 0, 0, 0, 1]], dtype=int8)

#### diag : 대각 행렬의 값을 추출함

In [66]:
matrix = np.arange(12).reshape(3,4)
matrix

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

In [69]:
np.diag(matrix, k=0)

array([ 0,  5, 10])

#### random sampling : 데이터 분포에 따른 sampling으로 array를 생성

In [71]:
print(np.random.__dir__())

['__name__', '__doc__', '__package__', '__loader__', '__spec__', '__path__', '__file__', '__cached__', '__builtins__', '__all__', '_common', 'bit_generator', '_bounded_integers', '_mt19937', 'mtrand', '_philox', '_pcg64', '_sfc64', '_generator', '_pickle', 'Generator', 'default_rng', 'SeedSequence', 'BitGenerator', 'MT19937', 'PCG64', 'Philox', 'SFC64', 'beta', 'binomial', 'bytes', 'chisquare', 'choice', 'dirichlet', 'exponential', 'f', 'gamma', 'geometric', 'get_state', 'gumbel', 'hypergeometric', 'laplace', 'logistic', 'lognormal', 'logseries', 'multinomial', 'multivariate_normal', 'negative_binomial', 'noncentral_chisquare', 'noncentral_f', 'normal', 'pareto', 'permutation', 'poisson', 'power', 'rand', 'randint', 'randn', 'random', 'random_integers', 'random_sample', 'ranf', 'rayleigh', 'sample', 'seed', 'set_state', 'shuffle', 'standard_cauchy', 'standard_exponential', 'standard_gamma', 'standard_normal', 'standard_t', 'triangular', 'uniform', 'vonmises', 'wald', 'weibull', 'zipf',

In [72]:
np.random.normal(0, 1, 10).reshape(2, 5)

array([[-1.70449649, -0.30951842,  0.71593487, -0.15798194,  0.27167972],
       [-1.55038982,  0.46800805,  0.23347406,  0.46562842, -1.25823094]])

#### sum : ndarray의 element들 간의 합을 구함. list의 sum 기능과 동일

In [74]:
test_array = np.arange(1, 11)
test_array

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [75]:
test_array.sum()

55

#### axis : 모든 operation function을 실행할 때 기준이 되는 dimension 축

![image.png](attachment:image.png)

![image.png](attachment:image.png)

In [79]:
print(np.__dir__())



#### concatenate : numpy array를 합치는(붙이는) 함수

![image.png](attachment:image.png)
![image-2.png](attachment:image-2.png)

In [82]:
a = np.array([[1, 2], [3, 4]])
b = np.array([5, 6])

b

array([5, 6])

In [81]:
b[np.newaxis, :]

array([[5, 6]])

In [83]:
b = b[np.newaxis, :]
np.concatenate((a, b.T), axis=1)

array([[1, 2, 5],
       [3, 4, 6]])

#### Operationgs b/t arrays : numpy는 array간의 기본적인 사칙 연산을 지원함
> Element-wise operations
>- Array간 shape이 같을 때 일어나는 연산

In [85]:
test_a = np.array([[1,2,3], [4,5,6]], float)
test_a

array([[1., 2., 3.],
       [4., 5., 6.]])

In [86]:
test_a + test_a

array([[ 2.,  4.,  6.],
       [ 8., 10., 12.]])

In [88]:
test_a - test_a

array([[0., 0., 0.],
       [0., 0., 0.]])

In [89]:
test_a * test_a

array([[ 1.,  4.,  9.],
       [16., 25., 36.]])

> Dot product
>- Matrix의 기본 연산, dot 함수 사용

In [92]:
test_a = np.arange(1, 7).reshape(2, 3)
test_b = np.arange(7, 13).reshape(3, 2)

In [93]:
test_a.dot(test_b) # 행렬곱

array([[ 58,  64],
       [139, 154]])

#### transpose : tranpose 또는 T attribute 사용

In [94]:
test_a

array([[1, 2, 3],
       [4, 5, 6]])

In [96]:
test_a.transpose()

array([[1, 4],
       [2, 5],
       [3, 6]])

In [97]:
test_a.T

array([[1, 4],
       [2, 5],
       [3, 6]])

#### broadcasting : Shape이 다른 배열 간 연산을 지원하는 기능

![image.png](attachment:image.png)

![image.png](attachment:image.png)

 #### numpy performance - timeit : jupyter 환경에서 코드의 퍼포먼스를 체크하는 함수

In [104]:
def scalar_vector_product(scalar, vector):
    result = []
    for value in vector:
        result.append(scalar * value)
    return result

iternation_max = 10000000

vector = list(range(iternation_max))
scalar = 2

%timeit scalar_vector_product(scalar, vector) # for loop을 이용한 성능

1.2 s ± 26.3 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [105]:
%timeit [scalar * value for value in range(iternation_max)] # list comprhension

1.12 s ± 32.4 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [106]:
%timeit np.arange(iternation_max) * scalar # numpy

30.3 ms ± 787 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


![image.png](attachment:image.png)

#### All & Any : Array의 데이터 전부(and) 또는 (or)가 조건에 만족 여부 반환

In [107]:
a = np.arange(10)
a

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [108]:
a < 4

array([ True,  True,  True,  True, False, False, False, False, False,
       False])

In [109]:
a < 1

array([ True, False, False, False, False, False, False, False, False,
       False])

In [110]:
np.all(a < 10)

True

In [111]:
np.all(a < 5)

False

numpy는 배열의 크기가 동일할 때 element간 비교의 결과를 Boolean type으로 반환

In [112]:
a = np.array([1, 3, 0], float)
np.logical_and(a>0, a<3)

array([ True, False, False])

In [113]:
b = np.array([True, False, True], bool)
np.logical_not(b)

array([False,  True, False])

In [114]:
c = np.array([False, True, False], bool)
np.logical_or(b, c)

array([ True,  True,  True])

#### np.where

In [115]:
a

array([1., 3., 0.])

In [116]:
np.where(a > 2)

(array([1], dtype=int64),)

In [119]:
np.where(a < 3)[0]

array([0, 2], dtype=int64)

In [120]:
np.where(a<3, 3, 2) # where(condition, TRUE, FALSE)

array([3, 2, 3])

In [121]:
a = np.arange(5, 15)
a

array([ 5,  6,  7,  8,  9, 10, 11, 12, 13, 14])

In [122]:
np.where(a > 10)

(array([6, 7, 8, 9], dtype=int64),)

In [123]:
a = np.array([1, np.NaN, np.Inf], float)
np.isnan(a)

array([False,  True, False])

In [124]:
np.isfinite(a)

array([ True, False, False])

#### argmax & argmin : array내 최대값 또는 최소값의 index를 반환함

![image.png](attachment:image.png)

In [125]:
a = np.array([1, 2, 4, 5, 8, 78, 23, 3])
a

array([ 1,  2,  4,  5,  8, 78, 23,  3])

In [127]:
a.argsort() # 인덱스 값

array([0, 1, 7, 2, 3, 4, 6, 5], dtype=int64)

#### boolean index : 특정 조건에 따른 값을 배열 형태로 추출, Comparison operation 함수들도 모두 사용가능

In [128]:
test_array = np.array([1, 4, 0, 2, 3, 8, 9, 7], float)
test_array > 3

array([False,  True, False, False, False,  True,  True,  True])

In [129]:
test_array.shape

(8,)

In [130]:
test_array[test_array > 3]

array([4., 8., 9., 7.])

#### fancy index : numpy는 array를 index value로 사용해서 값 추출

In [131]:
a = np.array([2, 4, 6, 7], float)
cond = np.array([1,1,1,2,1,1,1,3])

In [132]:
a[cond]

array([4., 4., 4., 6., 4., 4., 4., 7.])

In [133]:
a.take(cond)

array([4., 4., 4., 6., 4., 4., 4., 7.])

In [134]:
a[a>4]

array([6., 7.])

#### loadtxt & savetxt

![image.png](attachment:image.png)