# *__Numpy__

의미 : **N**umerical **P**ython의 줄임말<br />
    1. 빠르고 메모리를 효율적으로 사용하며 벡터 산술연산과 세련된 브로드캐스팅 기능을 제공하는 다차원 배열인 ndarray
    2. 데이터 배열에 대해 빠른 연산을 제공하는 표준 수학 함수
    3. 선형대수, 난수 발생기, 푸리에 변환 기능

### numpy는 다음과 같은 유용한 기능들이 있다
    1. 벡터 배열상에서 데이터 개조, 정제, 부분 집합, 필터링 변형, 다른 종류 연산의 빠른 수행
    2. 정렬, 유일 원소 찾기, 집합연산 같은 일반적인 배열 처리 알고리즘
    3. 통계의 효과적인 표현과 데이터의 수집/요약
    4. 다른 종류의 데이터 묶음을 병합하고 엮기 위한 데이터 정렬과 데이터 간의 관계 조작
    5. if-elif-else를 포함하는 반복문 대신 사용할 수 있는 조건절을 표현할 수 있는 배열 표현
    6. 데이터 그룹 전체에 적용할 수 있는 수집, 변형, 함수 적용같은 데이터 처리

## __Numpy ndarray__ : 다차원 배열 객체

python 내장 객체인 리스트의 경우 다양한 장점이 있지만 다음과 같은 단점들이 존재한다

__list와 같은 sequence형 객체들은 우리가 쓰는 연산(+, x)을 값에대한 연산으로 인식하지 않는다__

In [1]:
list_data = [[0.1, 0.01, 0.001],
             [0.5, 0.05, 0.005]]

In [5]:
print(list_data * 5)

[[0.1, 0.01, 0.001], [0.5, 0.05, 0.005], [0.1, 0.01, 0.001], [0.5, 0.05, 0.005], [0.1, 0.01, 0.001], [0.5, 0.05, 0.005], [0.1, 0.01, 0.001], [0.5, 0.05, 0.005], [0.1, 0.01, 0.001], [0.5, 0.05, 0.005]]


In [6]:
print(list_data + list_data)

[[0.1, 0.01, 0.001], [0.5, 0.05, 0.005], [0.1, 0.01, 0.001], [0.5, 0.05, 0.005]]


__반면에 numpy array는 위와 같은 연산이 가능하다__

In [7]:
import numpy as np # numpy 불러오기

In [16]:
array_data = np.array([[0.1, 0.01, 0.001],
                       [0.5, 0.05, 0.005]]) # array 생성

print(array_data, type(array_data))

[[0.1   0.01  0.001]
 [0.5   0.05  0.005]] <class 'numpy.ndarray'>


__list와는 다르게 array는 연산을 elementwise로 진행한다__

In [11]:
print(array_data * 5)

[[0.5   0.05  0.005]
 [2.5   0.25  0.025]]


In [12]:
print(array_data + 5)

[[5.1   5.01  5.001]
 [5.5   5.05  5.005]]


In [13]:
print(array_data + array_data)

[[0.2   0.02  0.002]
 [1.    0.1   0.01 ]]


__또한 shape와 dtype이라는 유용한 함수를 제공한다__

In [14]:
print(array_data.shape)

(2, 3)


In [15]:
print(array_data.dtype)

float64


__dtype은 numpy가 적절하게 알아서 맞춰준다__

In [20]:
array_dtype1 = np.array([1, 0.5, 23])
array_dtype2 = np.array([1, 2, 3])

In [21]:
print(array_dtype1.dtype)

float64


In [22]:
print(array_dtype2.dtype)

int64


In [28]:
array_string = np.array([1, 2, 'string'])
print(array_string.dtype) # U는 unicode를 의미

<U21


In [30]:
print(array_string[0]) # 분명 숫자처럼 보이지만

1


In [31]:
print(array_string[0] + 3) # 연산이 불가능 합니다 

TypeError: must be str, not int

In [33]:
print(array_string[0] + "은 String이기 때문이죠")

1은 String이기 때문이죠


### __array 선언하기__

1. __random하게 array 선언하기__ <br>
    - numpy.empty()

In [39]:
np.empty((2,3))

array([[0.1  , 0.01 , 0.001],
       [0.5  , 0.05 , 0.005]])

In [35]:
np.empty((2,3,4))

array([[[2.62480398e-316, 6.93169304e-310, 6.93169304e-310,
         6.93169304e-310],
        [6.93169304e-310, 6.93169304e-310, 6.93169304e-310,
         6.93169304e-310],
        [6.93169304e-310, 6.93169304e-310, 6.93169304e-310,
         6.93169304e-310]],

       [[6.93169304e-310, 6.93169304e-310, 6.93169304e-310,
         6.93169304e-310],
        [6.93169304e-310, 6.93169304e-310, 6.93169304e-310,
         6.93169304e-310],
        [6.93169304e-310, 6.93169304e-310, 6.93169304e-310,
         6.93169304e-310]]])

2. __특정 값을 채운 array 선언하기__ <br>
    - numpy.ones()
    - numpy.zeros()

In [40]:
np.ones(10)

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

In [41]:
np.ones((10, 2))

array([[1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.]])

In [42]:
np.zeros(5)

array([0., 0., 0., 0., 0.])

In [43]:
np.zeros((5, 5))

array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

3. __단위행렬 생성__ <br>
    - numpy.eye()
    - numpy.identity()

In [44]:
np.eye(3)

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

In [45]:
np.identity(6)

array([[1., 0., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0., 0.],
       [0., 0., 1., 0., 0., 0.],
       [0., 0., 0., 1., 0., 0.],
       [0., 0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 0., 1.]])

### __numpy dtype 활용하기__

In [51]:
arr1 = np.array([1, 2, 3], dtype=np.int)

In [52]:
print(arr1.dtype, arr1)

int64 [1 2 3]


In [53]:
arr2 = np.array([1, 2, 3], dtype=np.float)

In [54]:
print(arr2.dtype, arr2) # 소숫점 생김(float)

float64 [1. 2. 3.]


astype을 활용하여 dtype을 변형할 수 있다

In [55]:
arr = np.array([1, 2, 3])
print(arr.dtype, arr)

int64 [1 2 3]


In [56]:
arr_float = arr.astype(np.float)

In [57]:
print(arr_float.dtype, arr_float)

float64 [1. 2. 3.]


In [58]:
arr = np.array([1.4, 2.2, -3.8])
print(arr.dtype, arr)

float64 [ 1.4  2.2 -3.8]


In [59]:
arr_int = arr.astype(np.int)

In [61]:
print(arr_float.dtype, arr_float)

float64 [1. 2. 3.]


### __array 연산__

In [64]:
arr = np.array([[1, 2, 3],
                [0.5, 1.7, 3]])

In [65]:
arr

array([[1. , 2. , 3. ],
       [0.5, 1.7, 3. ]])

In [66]:
arr * arr

array([[1.  , 4.  , 9.  ],
       [0.25, 2.89, 9.  ]])

In [68]:
1 / arr

array([[1.        , 0.5       , 0.33333333],
       [2.        , 0.58823529, 0.33333333]])

In [69]:
arr ** 5

array([[1.000000e+00, 3.200000e+01, 2.430000e+02],
       [3.125000e-02, 1.419857e+01, 2.430000e+02]])

In [70]:
arr + 30

array([[31. , 32. , 33. ],
       [30.5, 31.7, 33. ]])