### Numpy
- 복잡한 빅데이터의 수학적/과학적 계산을 위해 만들어진 라이브러리
- 반복문 없이, 전체 데이터 배열 연산이 가능한 수학 함수를 제공
- 배열 : 동일한 자료형의 원소들이 연속적인 형태로 구성된 자료구조

In [3]:
import numpy as np # numpy 라이브러리를 불러오고, 앞으로 np라고 부르겠다

In [5]:
arr = np.array([4,3,2,1]) # np에서 array 함수를 사용
# array함수는 리스트나 튜플을 배열로 변환
# 그리고 반환값을 arr변수에 저장

arr

array([4, 3, 2, 1])

In [11]:
list1 = [1,2,3,4]
arr = np.array(list1)
arr

array([1, 2, 3, 4])

In [9]:
type(arr)

numpy.ndarray

In [16]:
arr + [1,1,1,1] 
# [1]로도 가능하지만 
# 원소 구조를 맞춰주어야한다. (배열, 리스트 끼리 연산가능, 배열로 값이 반환)

array([2, 3, 4, 5])

In [17]:
arr+[1,2,3,4]

array([2, 4, 6, 8])

In [18]:
arr -1

array([0, 1, 2, 3])

In [19]:
arr * 3

array([ 3,  6,  9, 12])

In [20]:
arr /3

array([0.33333333, 0.66666667, 1.        , 1.33333333])

#### 배열끼리의 사칙 연산

In [22]:
arr1 = np.array([1,2,3])
arr2 = np.array([4,5,6])
arr3 = np.array([7,8,9,10])

In [23]:
arr1 + arr2

array([5, 7, 9])

In [25]:
arr1+ arr3 # 원소 구조가 동일하지 않아 오류

ValueError: operands could not be broadcast together with shapes (3,) (4,) 

In [26]:
print(arr2 + arr1)
print(arr2 - arr1)
print(arr2 * arr1)
print(arr2 / arr1)
print(arr2 // arr1)
print(arr2 % arr1)

[5 7 9]
[3 3 3]
[ 4 10 18]
[4.  2.5 2. ]
[4 2 2]
[0 1 0]


In [29]:
# 정수와 실수를 같이 넣었을 때
# 자동적으로 더 상위 표현 방식으로 표현
# 배열은 모두 동일한 자료형이어야함

arr_f = np.array([4,2.5,2]) # 전부 실수로 변함
arr_f 

array([4. , 2.5, 2. ])

In [32]:
# 문자형 자료가 담겨있는 배열
arr_str = np.array(['a','b','c','de'])
arr_str
# 글자수가 많은 타입으로 변경 U2 -> 2글자라는 뜻
# 그렇지만 문자열만 담겨있는 배열은 잘 사용하지 않음

array(['a', 'b', 'c', 'de'], dtype='<U2')

In [34]:
arr_str2 = np.array(['a','b',3,4])
arr_str2

array(['a', 'b', '3', '4'], dtype='<U11')

### 2차원 배열

In [35]:
arr2 = np.array([[1,2,3],[4,5,6]]) # 2차원

In [36]:
# ndim : 배열의 차원을 확인해주는 함수
arr2. ndim

2

In [37]:
# shape : 배열의 형태(행, 열)
arr2.shape

(2, 3)

In [38]:
# size : 배열의 가장 작은 단위 요소 개수
arr2.size

6

In [39]:
# dtype : 배열 내 데이터 타입(자료형)
arr2.dtype

dtype('int32')

![image.png](attachment:51f094cd-aff4-4bcb-9520-c20da7f9d3bd.png)

In [45]:
# 차원, 형태, 전체 요소수, 데이터타입
arr3 = np.array([[[1,2,3], [4,5,6]]
                 ,[[7,8,9],[10,11,12]]])
print('차원 :', arr3.ndim)
print('형태 :', arr3.shape)
print('전체 요소 수 :', arr3.size)
print('데이터 타입:',arr3.dtype)

차원 : 3
형태 : (2, 2, 3)
전체 요소 수 : 12
데이터 타입: int32


## 편리한 배열 생성 함수

In [48]:
# 0으로 배열 생성
# zeros((형태))

arr_0 = np.zeros((3,2))
arr_0

array([[0., 0.],
       [0., 0.],
       [0., 0.]])

In [50]:
# 1로 배열 생성
# ones
arr_1 = np.ones((3,2), dtype=np.int32)
arr_1

array([[1, 1],
       [1, 1],
       [1, 1]])

In [52]:
# 특정 값으로 배열 생성
# full
# np.full((형태),값)
arr_f = np.full((2,3,2),1.0)
arr_f

array([[[1., 1.],
        [1., 1.],
        [1., 1.]],

       [[1., 1.],
        [1., 1.],
        [1., 1.]]])

In [59]:
# np.arange():range() 시퀀스로 배열 생성, 사용법은 range() 함수와 유사
# np.arange(시작할 값, 끝값(포함하지 않음, 증감량))

arr_a = np.arange(1,13,1)
print(arr_a)

arr_a = np.arange(13) # 0부터 12까지
print(arr_a)

[ 1  2  3  4  5  6  7  8  9 10 11 12]
[ 0  1  2  3  4  5  6  7  8  9 10 11 12]


In [63]:
arr_a = np.arange(12)
print(arr_a)

# reshape : 배열의 형태(shape) 변경
arr_a.reshape(3,4) # 3행 4열의 새로운 배열로 0부터 11까지 생성

[ 0  1  2  3  4  5  6  7  8  9 10 11]


array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

### array의 데이터에 접근 방법
- array는 리스트와 마찬가지로 인덱싱, 슬라이싱 지원

In [64]:
arr1 = np.array([[1,2,3],[4,5,6]])
arr1

array([[1, 2, 3],
       [4, 5, 6]])

In [65]:
arr1[0]

array([1, 2, 3])

In [66]:
# 2 인덱싱
arr1[0][1]

2

In [68]:
# 5 인덱싱
arr1[1][1]

5

In [76]:
# 인덱싱하여 값 변경
arr1 = np.array([[1,2,3],[4,5,6]])
print('변경 전 \n',arr1)
# 값 변경
# arr1[0] [13,53,43]
arr1[0] = 11
print('변경 후 \n', arr1)

변경 전 
 [[1 2 3]
 [4 5 6]]
변경 후 
 [[11 11 11]
 [ 4  5  6]]


In [75]:
list1 = [[1,2,3],[4,5,6]]
print(list1)

# 값 변경
list1[0] = 11

print(list1)

[[1, 2, 3], [4, 5, 6]]
[11, [4, 5, 6]]


### 슬라이싱

In [78]:
arr2 = np.arange(9).reshape(3,3)
arr2

array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

In [79]:
arr2[:2]

array([[0, 1, 2],
       [3, 4, 5]])

In [80]:
print('인덱싱 : ', arr2[0])
print('슬라이싱 :', arr2[:1]) # 배열 안에 담아온다.
arr2[:1]

인덱싱 :  [0 1 2]
슬라이싱 : [[0 1 2]]


array([[0, 1, 2]])

In [83]:
# [4,5]
arr2[1][1:]

array([4, 5])

In [85]:
# 값 변경
arr2[1][1:] = [47]
arr2

array([[ 0,  1,  2],
       [ 3, 47, 47],
       [ 6,  7,  8]])

### 2차원 배열에서의 데이터 접근

In [87]:
# 2차원 배열
arr3 = np.arange(50).reshape(5,10)
# reshape : 생성된 배열의 shape를 재설정
arr3

array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
       [20, 21, 22, 23, 24, 25, 26, 27, 28, 29],
       [30, 31, 32, 33, 34, 35, 36, 37, 38, 39],
       [40, 41, 42, 43, 44, 45, 46, 47, 48, 49]])

![image.png](attachment:9638c0d3-82d8-49a5-9fb6-d36acd0d6163.png)

In [89]:
# arr[ 행의 범위 , 열의 범위 ] 
# ','로 행의 범위와 열의 범위를 구분

# 0~1번 행 인덱스, 0~5번 열 인덱스
arr3[0:2,0:6]

array([[ 0,  1,  2,  3,  4,  5],
       [10, 11, 12, 13, 14, 15]])

![image.png](attachment:64b27994-dd01-4298-8b1b-ee4cf24e7c38.png)

In [90]:
arr3[0:6,:1]

array([[ 0],
       [10],
       [20],
       [30],
       [40]])

In [94]:
arr3[0:5:2,0] # 2 증감량으로 설정해서 2씩 띄워 가져오기도 가능하다.
arr3[::2,0] #맨 처음 값, 맨 마지막 값 생략하여 표현

array([ 0, 20, 40])

### 실습

In [95]:
arr4 = np.arange(18).reshape(3,6)
arr4

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17]])

![image.png](attachment:20f7131f-2070-4d3f-a4a2-982d2abe8068.png)

In [122]:
# 방법1
arr4[1:,1::2]

[[ 7  9 11]
 [13 15 17]]


In [123]:
# 방법2
arr4[1:,[1,3,5]]

array([[ 7,  9, 11],
       [13, 15, 17]])

In [125]:
# 방법3
arr4[1:, range(1,6,2)] # 1,3,5 숫자 열 만듬

array([[ 7,  9, 11],
       [13, 15, 17]])

In [127]:
arr4[[0,1,2], [1,3,5]]

array([ 1,  9, 17])

In [129]:
# 전치
arr4
# 3행 6열

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17]])

In [131]:
# 6행 3열
arr4.T

array([[ 0,  6, 12],
       [ 1,  7, 13],
       [ 2,  8, 14],
       [ 3,  9, 15],
       [ 4, 10, 16],
       [ 5, 11, 17]])

In [132]:
arr4

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17]])

In [146]:
# 랜덤수로 배열만들기
# np.random.radint(시작값, 끝값(미포함), size = 크기)
# 정수 -> 실수로 만들고 싶다면 radint -> uniform 사용

arr5 = np.random.randint(50, 100, size= 8)
# 50에서 , 99까지 8개의 값을 가지는 정수 난수 배열 생성
arr5

array([64, 54, 82, 96, 65, 76, 95, 68])

### Boolean 인덱싱
- 특정 조건에 맞는 값들을 찾아내고 싶을 때
- 사용법 : 인덱스 번호 대신, '조건식' 입력

In [147]:
# 조건식
a = 5

a > 3

True

In [148]:
type(a<3)

bool

In [149]:
arr5

array([64, 54, 82, 96, 65, 76, 95, 68])

In [150]:
arr5 >= 70

array([False, False,  True,  True, False,  True,  True, False])

In [151]:
type(arr5 >= 70)

numpy.ndarray

In [159]:
# 다중조건
# 65 이상이고, 90이하

# numpy에서는 and or 사용 불가
# numpy에서는 &, |를 사용, numpy 배열의 내부코드가 비트연산을 기반으로 만들어져있음
# & : and | : or 연산자   

# arr5 >= 65 and arr5 <= 90
(arr5 >= 65) & (arr5 <= 90)

array([False, False,  True, False,  True,  True, False,  True])

In [161]:
# 짝수 값 판단 조건식
arr5 % 2 == 0 

# 불리언 인덱싱을 위한 재료

array([ True,  True,  True,  True, False,  True, False,  True])

In [162]:
# 실제 값을 가져와보자
# True에 해당하는 값들을 가져와보자
# 인덱스 번호대신, '조건식' 입력

In [164]:
arr5[arr5 % 2 == 0]

array([64, 54, 82, 96, 76, 68])

In [165]:
arr6 = np.array([[6,9,6,8,7],
                 [2,3,5,4,1]])
arr6

array([[6, 9, 6, 8, 7],
       [2, 3, 5, 4, 1]])

In [176]:
# 짝수일 경우, 0으로 변경하는 코드를 작성
# 불리언 인덱싱으로 값에 접근해서, 0을 대입
arr6[arr6 % 2 == 0] = 0
arr6

array([[0, 9, 0, 0, 7],
       [0, 3, 5, 0, 1]])

In [177]:
# 조건식
arr6 % 2 ==0

array([[ True, False,  True,  True, False],
       [ True, False, False,  True, False]])

### 평균과 합계를 구하는 함수

In [178]:
arr7 = np.array([[1,2,3],[4,5,6]])
arr7

array([[1, 2, 3],
       [4, 5, 6]])

In [180]:
# 합계
# arr.sum()
arr7.sum()
# 배열이라는 객체에 속한 메서드

21

In [184]:
sum(arr7) # 내장함수 sum : 같은 배열끼리만 더함

array([5, 7, 9])

In [183]:
sum(sum(arr7)) # 배열 내 모든 수를 또 더함

21

In [186]:
# numpy 라이브러리 속 sum 함수
# np.sum(시퀀스형 자료구조)
print(np.sum(arr7))
print(np.sum([1,2,3,4,5,6]))
print(np.sum(range(1,7)))

21
21
21


In [187]:
# 평균
# arr.mean()
arr7.mean()

3.5

In [188]:
# numpy 라이브러리 속 mean 함수
# np.mean(시퀀스형 자료구조)
print(np.mean(arr7))
print(np.mean([1,2,3,4,5,6]))
print(np.mean(range(1,7)))

3.5
3.5
3.5
