### 1. Numpy 라이브러리 Import

In [1]:
import numpy as np

In [2]:
np.__version__

'1.19.2'

### 2. `ndarray` 생성

In [3]:
myList = [1,2,3,4]
type(myList)

list

In [4]:
arr = np.array(myList)
print(type(arr))
print(arr)

<class 'numpy.ndarray'>
[1 2 3 4]


##### 리스트(list)로 부터 생성하기

In [5]:
# 4행

myList1 = [1,2,3,4]
myList2 = [[1,2,3,4],
          [5,6,7,8]]

In [6]:
arr1 = np.array(myList1)
arr2 = np.array(myList2)

In [7]:
print(arr1.shape)
print(arr2.shape)

(4,)
(2, 4)


### 3. `Array`에서의 `데이터타입`
- array에서는 list와 다르게 1개의 단일 데이터 타입만 허용

In [8]:
myList_p = [1, 3.14, 'hello', '1234']
myList_p

[1, 3.14, 'hello', '1234']

In [9]:
myList_p[1]

3.14

##### array에서 data 타입이 혼재된 경우

(1) int, str이 혼재된 경우
: 자동으로 문자열로 바꿔줌

In [10]:
arr = np.array([1, 3.14, 'abc', '1234'])

In [11]:
arr

array(['1', '3.14', 'abc', '1234'], dtype='<U32')

(2) int와 str이 혼재된 경우 : int로 dtype을 지정한 경우

In [12]:
arr = np.array([1, 3.14, '1234'], dtype=int)
arr

array([   1,    3, 1234])

(3) int와 float와 str 타입의 혼재

In [13]:
arr = np.array([1, 3.14, 'abc', '1234'])
arr

array(['1', '3.14', 'abc', '1234'], dtype='<U32')

In [14]:
arr[0] + arr[1]

'13.14'

(4) int와 str 타입이 혼재된 경우, int로 dtype을 지정한 경우

In [15]:
arr = np.array([1, 3.14, '1234'], dtype=int)
arr

array([   1,    3, 1234])

In [16]:
type(int('1234'))

int

### 4. `슬라이싱(Slicing)`

In [17]:
arr = np.array([0,1,2,3,4,5,6,7,8,9])
arr.shape

(10,)

#### 4-1. index 지정하여 색인

In [18]:
arr[0]

0

In [19]:
arr[5]

5

In [20]:
arr[10]

IndexError: index 10 is out of bounds for axis 0 with size 10

In [21]:
arr[-1]

9

In [22]:
# 2차원 array

arr2d = np.array([[1,2,3,4],
                [5,6,7,8],
                [9,10,11,12]])

arr2d.shape

(3, 4)

In [23]:
arr2d[0,2]

3

In [24]:
arr2d[2,1]

10

#### 4-2. 범위 지정하여 색인

In [25]:
# index 1 이상 끝까지

arr[1:]

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

In [27]:
# index 5 미만까지

arr[:5]

array([0, 1, 2, 3, 4])

In [28]:
# index 1 이상 5 미만

arr[1:5]

array([1, 2, 3, 4])

In [29]:
# 2차원 row(행) 모두 가져올 때 

arr2d[0,:]

array([1, 2, 3, 4])

In [30]:
arr2d[0, :].shape

(4,)

In [31]:
# 2차원 column(열)을 모두 가져올 때

arr2d[:, 2]

array([ 3,  7, 11])

In [32]:
# 부분적 가져올 때

arr2d[:2, :]

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

In [33]:
arr2d[:2, 2:]

array([[3, 4],
       [7, 8]])

#### 4-3. `fancy` 인덱싱

- 범위가 아닌 특정 index의 집합의 값을 선택하여 추출하고 싶을 때

In [35]:
arr = np.array([10,23,2,7,90,65,32,66,70])

In [36]:
idx= [1,3,5]

In [37]:
arr[idx]

array([23,  7, 65])

In [38]:
arr[[2,5,7]]

array([ 2, 65, 66])

In [39]:
arr2d[[0,1],:]

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

#### 4-4. `boolean` 인덱싱

- 조건 필터링을 통하여 Boolean 값을 이용한 색인

In [44]:
arr = np.array([1, 2, 3, 4, 5, 6, 7])

In [45]:
myTrueFalse = [True, False, True]

In [46]:
arr[myTrueFalse]

IndexError: boolean index did not match indexed array along dimension 0; dimension is 7 but corresponding boolean dimension is 3

In [47]:
myTrueFalse = [True, False, True, False, True, False, True]

In [48]:
arr[myTrueFalse]

array([1, 3, 5, 7])

#### 4-5. `조건필터`

- 조건 연산자를 활용하여 필터 생성 가능

In [49]:
arr2d > 2

array([[False, False,  True,  True],
       [ True,  True,  True,  True],
       [ True,  True,  True,  True]])

In [50]:
arr2d[arr2d>2]

array([ 3,  4,  5,  6,  7,  8,  9, 10, 11, 12])

In [51]:
arr2d[arr2d<5]

array([1, 2, 3, 4])

### 4. `arange`

array + range = arange
- 첫번째 인자에는 **start 이상**, 두번째 인자에는 **stop의 미만** 이 들어갑니다. (option 세번째 인자 step) 

In [52]:
arr = np.arange(1,11)
arr

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

##### `keyword` 인자

- 파라미터(인자)의 keyword를 지정하여 순서 없이 지정 가능

In [56]:
arr = np.arange(start=1, stop=11)
arr

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

#### `step` 키워드 활용

In [60]:
# 1~10 사이의 홀수 값 생성

arr = np.arange(1,11,2)
arr

array([1, 3, 5, 7, 9])

In [61]:
arr = np.arange(start=1, stop=11, step=2)
arr

array([1, 3, 5, 7, 9])

###### * 참고용 range(범위지정)

In [62]:
for i in arr:
    print(i)

1
3
5
7
9


In [63]:
test = range(1,11)
print(test)
print(type(test))

range(1, 11)
<class 'range'>


In [64]:
# range 메소드는 range 만으로 실행되는 것이 아니라, for문과 같이 반복문을 만났을 때 실행

for i in range(1,11):
    print(i)

1
2
3
4
5
6
7
8
9
10


In [66]:
a = 3
b = 4
c = np.dot(a,b)
print(c)

12


### 5. `정렬`

In [67]:
arr = np.array([1, 10, 5, 8, 2, 4, 3, 6, 8, 7, 9])

In [68]:
np.sort(arr)

array([ 1,  2,  3,  4,  5,  6,  7,  8,  8,  9, 10])

In [69]:
np.sort(arr)[::-1]

array([10,  9,  8,  8,  7,  6,  5,  4,  3,  2,  1])

In [70]:
arr = np.sort(arr)
arr

array([ 1,  2,  3,  4,  5,  6,  7,  8,  8,  9, 10])

In [71]:
arr2 = np.sort(arr)[::-1]
arr2

array([10,  9,  8,  8,  7,  6,  5,  4,  3,  2,  1])

#### 5-1. N차원 정렬

In [72]:
arr2d = np.array([[5, 6, 7, 8], 
                  [4, 3, 2, 1],
                  [10, 9, 12, 11]])

In [73]:
arr2d.shape

(3, 4)

##### 열정렬 ( 왼쪽에서 오른쪽)

In [75]:
np.sort(arr2d, axis=1)

array([[ 5,  6,  7,  8],
       [ 1,  2,  3,  4],
       [ 9, 10, 11, 12]])

##### 행정렬(위에서 아래로)

In [77]:
np.sort(arr2d, axis=0)

array([[ 4,  3,  2,  1],
       [ 5,  6,  7,  8],
       [10,  9, 12, 11]])

### 6. Index를 반환하는 `argsort`
- 정렬된 값을 반환하는 것이 아닌 index를 반환

#####  행정렬

In [78]:
np.argsort(arr2d, axis=1)

array([[0, 1, 2, 3],
       [3, 2, 1, 0],
       [1, 0, 3, 2]], dtype=int64)

##### 열정렬

In [79]:
np.argsort(arr2d, axis=0)

array([[1, 1, 1, 1],
       [0, 0, 0, 0],
       [2, 2, 2, 2]], dtype=int64)

### 7. 행렬의 연산

#### 7-1. 덧셈

In [80]:
a = np.array([[1,2,3],
             [2,3,4]])

b = np.array([[3,4,5],
             [1,2,3]])

In [82]:
print(a.shape, b.shape)

(2, 3) (2, 3)


In [81]:
a+b

array([[4, 6, 8],
       [3, 5, 7]])

In [83]:
a = np.array([[1, 2, 3], 
              [2, 3, 4]])

b = np.array([[1, 2],
              [3, 4],  
              [5, 6]])

In [84]:
print(a.shape, b.shape)

(2, 3) (3, 2)


In [85]:
a+b

ValueError: operands could not be broadcast together with shapes (2,3) (3,2) 

In [86]:
a = np.array([[1, 2, 3], 
              [2, 3, 4]])

In [87]:
np.sum(a, axis=0)

array([3, 5, 7])

In [88]:
np.sum(a, axis=1)

array([6, 9])

#### 7-2. 뺄셈

In [90]:
a = np.array([[1, 2, 3], 
              [2, 3, 4]])

b = np.array([[3, 4, 5], 
              [1, 2, 3]])

In [91]:
a-b

array([[-2, -2, -2],
       [ 1,  1,  1]])

In [92]:
a = np.array([[1, 2, 3], 
              [2, 3, 4]])

b = np.array([[1, 2],
              [3, 4],  
              [5, 6]])

In [93]:
a-b

ValueError: operands could not be broadcast together with shapes (2,3) (3,2) 

#### 7-3. `곱셈` vs `행렬곱`

In [94]:
a = np.array([[1, 2, 3], 
              [2, 3, 4]])

b = np.array([[3, 4, 5], 
              [1, 2, 3]])

In [95]:
a*b

array([[ 3,  8, 15],
       [ 2,  6, 12]])

- 단순 곱셈과 dot product 다름

`단순곱셈`

In [103]:
a = np.array([[1, 2, 3], 
              [2, 3, 4]])

b = np.array([[3, 4, 5], 
              [1, 2, 3]])

In [104]:
a.shape, b.shape

((2, 3), (2, 3))

In [105]:
a*b

array([[ 3,  8, 15],
       [ 2,  6, 12]])

`행렬곱`

In [106]:
# 행렬곱을 할때 dot메소드 사용
np.dot(a, b)

ValueError: shapes (2,3) and (2,3) not aligned: 3 (dim 1) != 2 (dim 0)

In [107]:
a = np.array([[1, 2, 3],
              [1, 2, 3], 
              [2, 3, 4]])

In [108]:
b = np.array([[1, 2],
              [3, 4],  
              [5, 6]])

In [109]:
a.shape, b.shape

((3, 3), (3, 2))

In [111]:
np.dot(a, b)

array([[22, 28],
       [22, 28],
       [31, 40]])

In [110]:
a.dot(b)

array([[22, 28],
       [22, 28],
       [31, 40]])

### 8. `BroadCasting`

![image.png](attachment:image.png)

![image-2.png](attachment:image-2.png)

#### 8-1. 숫자의 연산(단일)

In [114]:
a = np.array([[1,2,3],
            [4,5,6]])

b = np.array([[3,3,3],
             [3,3,3]])

In [115]:
a+b

array([[4, 5, 6],
       [7, 8, 9]])

In [116]:
a+3

array([[4, 5, 6],
       [7, 8, 9]])

In [117]:
a-3

array([[-2, -1,  0],
       [ 1,  2,  3]])

In [118]:
a*3

array([[ 3,  6,  9],
       [12, 15, 18]])

In [119]:
a/3

array([[0.33333333, 0.66666667, 1.        ],
       [1.33333333, 1.66666667, 2.        ]])

#### 8.2 array(배열)의 BroadCasting

: 오리지널 array의 shape가 유지됨

In [120]:
a = np.array([[1,2,3],
             [2,3,4]])

b = np.array([[1],
             [2]])

In [121]:
a.shape, b.shape

((2, 3), (2, 1))

In [122]:
b*a

array([[1, 2, 3],
       [4, 6, 8]])

In [126]:
print((b*a).shape)

(2, 3)


In [123]:
a = np.array([[1,2,3,],
             [2,3,4]])

b = np.array([1,2,3])

In [124]:
a*b

array([[ 1,  4,  9],
       [ 2,  6, 12]])

In [125]:
print((a*b).shape)

(2, 3)
