# Numpy

## 개요

- 벡터 및 행렬 연산 특화 기능 제공 
- 아나콘다 설치 → 자동 설치

## 배열 생성하기

- 배열 - (1) 순서가 의미 있는 (2) 같은 종류의 데이터가 저장된 집합
- 숫자와 문자가 같이 들어 있는 경우 - 문자 우선 인식

```python
import numpy as np
```

### 시퀀스 데이터로부터 배열 생성

- 시퀀스 데이터(`seq_data`)를 인자로 받아 배열 객체(`arr_object`) 생성
- 리스트와 튜플 중 주로 리스트 데이터를 이용함

```python
import numpy as np
arr_object = np.array(seq_data)
```

In [1]:
import numpy as np
data1=[0,1,2,3,4,5,6,7,8]
a1=np.array(data1) # array module
a1

array([0, 1, 2, 3, 4, 5, 6, 7, 8])

In [2]:
data2 = [0.1, 3, 5, 10, 0.25]
a2 = np.array(data2)
a2 # 모든 값들이 실수 형태로 

array([ 0.1 ,  3.  ,  5.  , 10.  ,  0.25])

In [3]:
a1.dtype # dtype('int32')

dtype('int32')

In [4]:
a2.dtype # dtype('float64')

dtype('float64')

In [5]:
np.array([0.5, 2, 6, 0.01])

array([0.5 , 2.  , 6.  , 0.01])

In [6]:
np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

### 범위를 지정해 배열 생성

- `arange()` 이용하여 배열 생성

  - `start` 와 `stop` 문구를 이용해 범위 지정하여 배열 생성

    - `start` 는 기본값 0

  - `step` 몇 칸 씩 건너뛰는지

    - 기본값 1

    ```python
    arr_object = np.arange(start, stop, step)
    ```

    

- `linspace()` 이용하여 배열 생성

  - `start`, `stop` 와 데이터 개수(`num`) 지정하여 배열 생성

  - `stop` **이하** 임에 주의 (`arange` 는 **미만**)
  
    ```python
  arr_object = np.linspace(start, stop, num)
    ```

In [7]:
np.arange(0, 10, 2)

array([0, 2, 4, 6, 8])

In [8]:
np.arange(1, 10)

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

In [9]:
np.arange(5)

array([0, 1, 2, 3, 4])

In [10]:
# reshape 모듈 사용하여 2차원 배열

np.arange(12).reshape(4, 3)

array([[ 0,  1,  2],
       [ 3,  4,  5],
       [ 6,  7,  8],
       [ 9, 10, 11]])

In [11]:
b1 = np.arange(12).reshape(4, 3)
b1.shape # (4, 3)

(4, 3)

In [12]:
# Object 로 표현

b2 = np.arange(5)
b2
b2.shape # (5,)

(5,)

In [13]:
np.linspace(1, 10, 10)

array([ 1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10.])

In [14]:
np.linspace(0, np.pi, 20)

array([0.        , 0.16534698, 0.33069396, 0.49604095, 0.66138793,
       0.82673491, 0.99208189, 1.15742887, 1.32277585, 1.48812284,
       1.65346982, 1.8188168 , 1.98416378, 2.14951076, 2.31485774,
       2.48020473, 2.64555171, 2.81089869, 2.97624567, 3.14159265])

### 특별한 형태의 배열 생성

### 특별한 형태의 배열 생성

- `zeros()` 모듈 - 모든 원소가 0인 1차원 / 다차원 배열 생성
- `ones()` - 모든 원소가 1인 1차원 / 다차원 배열 생성
- `eye(n)` - n차원 단위 행렬 생성

|   기호   |       내용       |
|--|--|
|    b     |       bool       |
|    i     | 기호가 있는 정수 |
|    u     | 기호가 없는 정수 |
|    f     |       실수       |
|    c     |      복소수      |
|    M     |       날짜       |
|    O     |   파이썬 객체    |
| S 혹은 a |  바이트 문자열   |
|    U     |     유니코드     |

In [15]:
np.zeros(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [16]:
np.zeros((3, 4))

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

In [17]:
np.ones(10)

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

In [18]:
np.ones((3, 3))

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

In [19]:
np.eye(4)

array([[1., 0., 0., 0.],
       [0., 1., 0., 0.],
       [0., 0., 1., 0.],
       [0., 0., 0., 1.]])

### 배열의 데이터 타입 변환

In [20]:
np.array(['0.5', '0.24', '2', '3.14', '3.141592']) # dtype='<U8'

array(['0.5', '0.24', '2', '3.14', '3.141592'], dtype='<U8')

In [21]:
str1=np.array(['0.5', '0.24', '2', '3.14', '3.141592'])
num1=str1.astype(float)
num1

array([0.5     , 0.24    , 2.      , 3.14    , 3.141592])

In [22]:
str1.dtype

dtype('<U8')

In [23]:
num1.dtype

dtype('float64')

In [24]:
str2=np.array(['1', '2', '3', '4', '5'])
num2=str2.astype(int)
num2

array([1, 2, 3, 4, 5])

In [25]:
num_f3 = np.array([10, 20, 0.543, 5.67, 9.87])
num_i3 = num_f3.astype(int)
num_i3

array([10, 20,  0,  5,  9])

### 난수 배열의 생성

In [26]:
np.random.randint(10, size=(4, 4))

array([[6, 1, 3, 9],
       [1, 8, 9, 9],
       [3, 7, 5, 2],
       [9, 5, 5, 2]])

In [27]:
np.random.randint(10, size=(4, 4))

array([[5, 2, 5, 9],
       [2, 9, 1, 4],
       [7, 8, 5, 1],
       [9, 2, 9, 6]])

In [28]:
np.random.randint(1, 40)

14

## 배열 연산

### 기본연산

- 배열의 형태가 같은 경우 덧셈, 뺄셈, 곱셈, 나눗셈 가능

In [29]:
import numpy as np

In [30]:
arr1 = np.array([10, 20, 30, 40])
arr2 = np.array([1, 2, 3, 4])

In [31]:
arr1 + arr2

array([11, 22, 33, 44])

In [32]:
arr1 - arr2    

array([ 9, 18, 27, 36])

In [33]:
arr1 * arr2 # 같은 위치 곱한다.

array([ 10,  40,  90, 160])

In [34]:
arr2 * 2

array([2, 4, 6, 8])

In [35]:
arr2 ** 2

array([ 1,  4,  9, 16], dtype=int32)

In [36]:
arr1 / arr2 # 나누면 값이 float 으로 바뀐다.

array([10., 10., 10., 10.])

In [37]:
arr1 / (arr2 ** 2)

array([10.        ,  5.        ,  3.33333333,  2.5       ])

In [38]:
arr1 > 20

array([False, False,  True,  True])

### 통계를 위한 연산

|           |          |
| -- | -- |
| sum()     | 합       |
| mean()    | 평균     |
| std()     | 표준편차 |
| var()     | 분산     |
| min()     | 최솟값   |
| max()     | 최대값   |
| cumsum()  | 누적합   |
| cumprod() | 누적곱   |

In [39]:
arr3 = np.arange(5)
arr3

array([0, 1, 2, 3, 4])

In [40]:
[arr3.sum(), arr3.mean()]

[10, 2.0]

In [41]:
[arr3.std(), arr3.var()]

[1.4142135623730951, 2.0]

In [42]:
[arr3.min(), arr3.max()]

[0, 4]

In [43]:
[arr3.cumsum(), arr3.cumprod()]

[array([ 0,  1,  3,  6, 10], dtype=int32), array([0, 0, 0, 0, 0], dtype=int32)]

### 행렬연산

| 사용 예                             | 내용                       |
| ----------------------------------- | -------------------------- |
| A.dot(B) / np.dot(A, B)             | 행렬곱(matrix product)     |
| A.transpose()  / np.transpose(A, B) | 전치행렬(transpose matrix) |
| np.linalg.inv(A)                    | 역행렬(inverse matrix)     |
| np.linalg.det(A)                    | 행렬식(determinant)        |

In [44]:
A = np.array([1, 2, 3, 4]).reshape(2, 2)
B = np.array([9, 8, 7, 6]).reshape(2, 2)

In [45]:
A

array([[1, 2],
       [3, 4]])

In [46]:
B

array([[9, 8],
       [7, 6]])

In [47]:
A + B

array([[10, 10],
       [10, 10]])

In [48]:
B - A

array([[8, 6],
       [4, 2]])

In [49]:
A.dot(B)

array([[23, 20],
       [55, 48]])

In [50]:
np.dot(A, B)

array([[23, 20],
       [55, 48]])

In [51]:
np.dot(B, A)

array([[33, 50],
       [25, 38]])

In [52]:
np.transpose(A)

array([[1, 3],
       [2, 4]])

In [53]:
np.linalg.inv(A)

array([[-2. ,  1. ],
       [ 1.5, -0.5]])

In [54]:
np.linalg.det(A)

-2.0000000000000004

## 배열의 인덱싱과 슬라이싱

### 배열의 인덱싱

- 배열의 위치나 조건을 지정해 배열의 원소를 선택하는 것

In [55]:
index1 = np.array([0, 10, 20, 30, 40, 50])
index1

array([ 0, 10, 20, 30, 40, 50])

In [56]:
index1[0]

0

In [57]:
index1[4]

40

In [58]:
index1[5] = 100
index1

array([  0,  10,  20,  30,  40, 100])

In [59]:
index1[[0, 2, 4]]

array([ 0, 20, 40])

In [60]:
index2 = np.arange(10, 100, 10).reshape(3, 3)
index2

array([[10, 20, 30],
       [40, 50, 60],
       [70, 80, 90]])

In [61]:
index2[0, 2]

30

In [62]:
index2[2, 2] = 99
index2

array([[10, 20, 30],
       [40, 50, 60],
       [70, 80, 99]])

In [63]:
# 행을 통째로 바꾸고 싶을 때
index2[1] = [44, 55, 66]
index2

array([[10, 20, 30],
       [44, 55, 66],
       [70, 80, 99]])

In [64]:
index2[[0, 2], [0, 1]]

array([10, 80])

In [65]:
index2[[0, 2, 2], [2, 1, 2]] # [행, 행, 행], [열, 열, 열] 나란히

array([30, 80, 99])

In [66]:
index = np.array([1, 2, 3, 4, 5, 6])

In [67]:
index[index > 3] # 참인 값들만

array([4, 5, 6])

In [68]:
index[(index % 2) == 0]

array([2, 4, 6])

###  배열의 슬라이싱

- 범위를 지정해 배열의 일부분을 선택하는 방법

In [69]:
slice1 = np.arange(0, 60, 10)
slice1

array([ 0, 10, 20, 30, 40, 50])

In [70]:
slice1[1:5]

array([10, 20, 30, 40])

In [71]:
slice1[2:]

array([20, 30, 40, 50])

In [72]:
slice1[2:5] = np.array([25, 35, 45])

In [73]:
slice1

array([ 0, 10, 25, 35, 45, 50])

In [74]:
slice1[3:6] = 60 # 하나의 값으로 여러 index 바꿀 때

In [75]:
slice1

array([ 0, 10, 25, 60, 60, 60])

In [76]:
slice2 = np.arange(10, 100, 10).reshape(3, 3)
slice2

array([[10, 20, 30],
       [40, 50, 60],
       [70, 80, 90]])

In [77]:
slice2[1:3, 1:3]

array([[50, 60],
       [80, 90]])

In [78]:
slice2[:3, 1:]

array([[20, 30],
       [50, 60],
       [80, 90]])

In [79]:
slice2[0:2, 1:3] = np.array([[25, 35], [55, 65]])
slice2

array([[10, 25, 35],
       [40, 55, 65],
       [70, 80, 90]])

## 실습테스트

### 1번

In [80]:
x = np.random.rand(5, 6)

In [81]:
x = x.round(3) * 100

In [82]:
x

array([[51.3, 58.8, 35.3, 11.4, 75.8,  0.9],
       [28.4, 54.1, 98.9, 36.1, 48.5, 68.8],
       [14.1, 55.9, 12.3,  1.4, 59.6, 75.7],
       [27.6, 75.4, 73.5, 77.9, 74.6, 41.3],
       [89.8,  2.2, 73.6, 12.6, 84.8, 93.2]])

In [83]:
x.max()

98.9

In [84]:
x.min()

0.8999999999999999

In [85]:
x.mean()

50.46

In [86]:
x.std()

29.55141959365066

### 2번

In [87]:
arr1 = np.array([[0, 1, 2, 3, 4], [5, 6, 7, 8, 9], [10, 11, 12, 13, 14]])
arr1

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

In [88]:
arr1[1, 2]

7

In [89]:
arr1[2, 4]

14

In [90]:
arr1[1:2, 1:3]

array([[6, 7]])

In [91]:
arr1[1:3, 2:3]

array([[ 7],
       [12]])

In [92]:
arr1[0:2, 3:5]

array([[3, 4],
       [8, 9]])

### 3번

In [93]:
def intersection(a, b):
    c = []
    for i in a:
        if i in b:
            c.append(c)
        c.sort()
    return c

In [94]:
def random_exclusive(low, high, how_many):
    number = []
    while how_many > 0:
        a = np.random.randint(low, high)
        if a not in number:
            number.append(a)
            how_many -= 1
        else:
            pass
#             how_many += 1
    return number

random_exclusive(1, 31, 10)

[5, 26, 3, 27, 15, 8, 21, 17, 14, 30]

In [95]:
A = random_exclusive(1, 31, 10)
B = random_exclusive(1, 31, 10)
C = intersection(A, B)

In [96]:
A

[4, 21, 27, 1, 19, 7, 15, 13, 22, 2]

In [97]:
B

[22, 15, 19, 2, 14, 5, 3, 25, 18, 28]

In [98]:
C = intersection(A, B)

In [99]:
print(C)

[[...], [...], [...], [...]]
