### 다차원 배열 제공(ndarray 클래스)
- 배열의 특징
    - 동일한 자료형을 가지는 값들이 배열 형태로 존재함
    - n차원의 형태로 구성이 가능함
    - 데이터 접근을 최적화 하기위해 색인(index)를 부여

### numpy 데이터타입(형태) 종류

![image.png](attachment:image.png)

### 배열 생성
- 1차원 배열 생성

In [1]:
list1 = [1,2,3,4,5]
list1

[1, 2, 3, 4, 5]

In [2]:
import numpy as np

In [3]:
arr = np.array(list1) # np.array() 배열 생성하는 함수
arr # 배열

array([1, 2, 3, 4, 5])

- 2차원 배열 생성

In [4]:
arr2 = np.array([[1,2,3],[4,5,6]])
arr2

array([[1, 2, 3],
       [4, 5, 6]])

- 타입을 지정하여 배열 생성

In [5]:
arr_type = np.array([1.2,2.3,3.4], dtype = np.int64)
arr_type

array([1, 2, 3], dtype=int64)

- 타입 변경하기

In [6]:
arr_ftype = arr_type.astype(np.float64)
arr_ftype

array([1., 2., 3.])

In [7]:
arr_ftype.dtype

dtype('float64')

### 배열 변수 사용해보기
- 배열의 크기 확인 : shape
- 배열의 차원 확인 : ndim
- 배열 전체 요소의 개수 확인 : size
- 배열 데이터 타입 확인 : dtype

In [8]:
# shape
print('배열의 크기 : ', arr.shape)
print('배열의 크기 : ', arr2.shape)

배열의 크기 :  (5,)
배열의 크기 :  (2, 3)


In [9]:
# ndim
print(arr)
print('배열의 차원 : ', arr.ndim)

[1 2 3 4 5]
배열의 차원 :  1


In [10]:
print(arr2)
print('배열의 차원 : ',arr2.ndim)

[[1 2 3]
 [4 5 6]]
배열의 차원 :  2


In [11]:
# size
print(arr)
print('전체 요소의 크기 : ',arr.size)

[1 2 3 4 5]
전체 요소의 크기 :  5


In [12]:
# size
print(arr)
print('전체 요소의 크기 : ',arr2.size)

[1 2 3 4 5]
전체 요소의 크기 :  6


In [13]:
# dtype
print(arr)
print('타입 : ',arr2.dtype)

[1 2 3 4 5]
타입 :  int32


- 1 ~ 50 숫자가 담긴 배열의 생성

In [14]:
# 파이썬 기초였을떄 for
list2 = []
for i in range(1,51):
    list2.append(i)
print(list2)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50]


In [15]:
np.array(list2)

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
       18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34,
       35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50])

- np.arange(시작,끝,증감값)
    - 1차원으로만 생성

In [16]:
range1 = np.arange(1,51)
range1

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
       18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34,
       35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50])

In [17]:
# 1 ~ 50 숫자중 10씩 증가한 값의 배열 만들기
range2 = np.arange(0,51,10)
range2

array([ 0, 10, 20, 30, 40, 50])

In [18]:
# 1 ~ 50을 담은 2차원 배열 생성
range22 = np.arange(1,51).reshape(5,10) # 행 , 열의 개수 지정
range22

array([[ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10],
       [11, 12, 13, 14, 15, 16, 17, 18, 19, 20],
       [21, 22, 23, 24, 25, 26, 27, 28, 29, 30],
       [31, 32, 33, 34, 35, 36, 37, 38, 39, 40],
       [41, 42, 43, 44, 45, 46, 47, 48, 49, 50]])

- 랜덤 값 배열 생성

In [19]:
np.random.rand(2,3)

array([[0.17267314, 0.33508682, 0.38819168],
       [0.99802795, 0.67332552, 0.71931262]])

In [20]:
np.random.randint(2,10)

9

In [21]:
np.random.randint(2,10,size = (2,3))

array([[4, 7, 5],
       [2, 2, 2]])

### 배열의 연산

#### 배열 요소별 연산

In [22]:
arr1 = np.arange(2,10,2)
print(arr1)
print(arr1 / 2)

[2 4 6 8]
[1. 2. 3. 4.]


In [23]:
# list 였을때
[2,4,6,8] + [2]

[2, 4, 6, 8, 2]

In [24]:
# 2 ~ 10 담은 1차원 배열 생성
arr_n = np.arange(2,10)
arr_n +2 # 차원이 다른 연산이 가능하도록 하는 것 --> Broadcasting

array([ 4,  5,  6,  7,  8,  9, 10, 11])

#### 배열 간 연산

In [25]:
arr

array([1, 2, 3, 4, 5])

In [26]:
arr + arr # 위치적으로 대응된 데이터에 대해 연산 수행

array([ 2,  4,  6,  8, 10])

In [27]:
arr * arr

array([ 1,  4,  9, 16, 25])

- 1차원 배열 연산

In [28]:
arr_a = np.array([1,2,3])
arr_b = np.array([4,5,6])

In [29]:
arr_a + arr_b

array([5, 7, 9])

- 2차원 배열 연산

In [30]:
arr2_a = np.array([[7,8,9],[10,11,12]])

In [31]:
arr2_b = np.array([[13,14,15],[16,17,18]])

In [32]:
arr2_b - arr2_a

array([[6, 6, 6],
       [6, 6, 6]])

In [33]:
arr2_a + 3

array([[10, 11, 12],
       [13, 14, 15]])

### 데이터 접근
- indexing, slicing : 인덱스 기반으로 데이터 접근

- 1차원 배열의 인덱싱

In [34]:
arr1 = np.arange(10)
arr1

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [35]:
# 4 데이터 접근
arr1[4]

4

In [36]:
# 2, 7 데이터 접근
arr1[[2,7,9]]

array([2, 7, 9])

In [37]:
# 3 ~ 6 데이터 접근
arr1[3:7]

array([3, 4, 5, 6])

In [38]:
arr1[3:7] = 4

In [39]:
arr1

array([0, 1, 2, 4, 4, 4, 4, 7, 8, 9])

- 2차원 배열의 인덱싱

In [40]:
# 5행 6열의 2차원 배열 생성
arr2 = np.arange(30).reshape(5,6)
arr2

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23],
       [24, 25, 26, 27, 28, 29]])

In [41]:
# 2행에 접근
arr2[2]

array([12, 13, 14, 15, 16, 17])

In [42]:
# 9 데이터 접근
arr2[1][3]

9

In [43]:
# 2 차원 데이터 접근
# 배열명 [행][열]
# 배열명 [행,열]
# 배열명 [시작행:끝행, 시작열:끝열]
# 배열명 [행,[0,3,5 열 값]]
arr2[1,3]

9

In [44]:
arr2

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23],
       [24, 25, 26, 27, 28, 29]])

In [45]:
# 2차원 슬라이싱 2번째 행까지 열 1~4 까지
arr2[:2,1:5]

array([[ 1,  2,  3,  4],
       [ 7,  8,  9, 10]])

In [46]:
# 24, 28에 접근해보기
arr2[4,3:5]

array([27, 28])

In [47]:
arr2[2:4]
arr2[2:4,[0,1,2,3,4,5]] #둘다 같음

array([[12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23]])

In [48]:
# 3행 6열 배열을 부분 슬라이싱

arr3 = np.arange(18).reshape(3,6)

In [49]:
arr3[1:,1::2]

array([[ 7,  9, 11],
       [13, 15, 17]])

### Boolean 인덱싱(색인)
- 논리연산자를 활용하여 True, False 결과를 출력
- True에 해당하는 데이터에 접근
- 특정 기준에 의해 접근하는 방식

In [50]:
# 8개의 난수 값을 1차원 배열 생성
# 시간의 의미로 랜덤 값을 생성하기 때문에 값을 고정하고 싶을때 사용
np.random.seed(3) # 숫자는 0 부터 가능, seed 값이 같으면 랜덤수도 동일
score = np.array(np.random.randint(50,100,size = 8))
score

array([92, 74, 53, 58, 50, 71, 69, 60])

In [51]:
# 70점 이상인 성적을 확인
score >= 70
# 논리값을 반환

array([ True,  True, False, False, False,  True, False, False])

In [52]:
# 논리값으로 마스킹하고 원하는 값만 출력
score[score >= 70]

array([92, 74, 71])

In [53]:
# 70점 미만인 데이터는 몇 개일까?
score[score < 70].size
    

5

In [54]:
name = np.array(['준연','효창','희원','경진','시우','종현','서연','연경'])
name

array(['준연', '효창', '희원', '경진', '시우', '종현', '서연', '연경'], dtype='<U2')

In [55]:
name[score > 70]

array(['준연', '효창', '종현'], dtype='<U2')

In [56]:
name[score <70]

array(['희원', '경진', '시우', '서연', '연경'], dtype='<U2')

![image.png](attachment:image.png)

-Numpy 연산, 인덱싱 기법을 이용한 BMI 지수 구하기
1. BMI 연산
2. boolean 인덱싱 --> 과체중 데이터 접근

In [58]:
data = np.loadtxt('data/height_weight.txt', delimiter=',') 
data


array([[175.2, 180.3, 175. , 169.2, 185.2, 188. , 177.6, 178.2, 177. ,
        179. ],
       [ 65.6,  88. ,  79.2,  69.3,  55. ,  71.2,  73. ,  68.9,  74. ,
         82. ]])

In [117]:
# 배열 데이터 확인
print(data.shape) # 2행 10열 (2,10)
# 데이터 타입
print(data.dtype) # float64
# 차원확인
print(data.ndim) # 2차원


(2, 10)
float64
2


In [125]:
# 1. 키 변수에 키 배열 데이터를 담아주기
h=data[0]
# 2. 몸무게 변수에 몸무게 배열 데이터를 담아주기
w=data[1]
# 3. 키 데이터 단위 변경하기 cm-> m (요소 연산 활용)
m_h=(h/100)*(h/100)
# 4. 배열간 연산을 통하여 bmi 지수 구하기 (공식적용)
bmi=w/m_h
# 5. boolean 인덱싱을 활용하여 과체중 이상 데이터에 접근하기
# 비트연산자 : & - and (두 값 모두 True일때 True 반환)
#             | - or  (두 값 중 하나만 True여도 True 반환)
bmi[(23 <= bmi) & (bmi <= 25)]

# 6. 과체중인 사람수(데이터 갯수)
bmi[(23 <= bmi) & (bmi <= 25)].size

3

### 데이터 수정

In [126]:
arr3

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17]])

In [127]:
arr3[:,::2] =24

In [128]:
arr3

array([[24,  1, 24,  3, 24,  5],
       [24,  7, 24,  9, 24, 11],
       [24, 13, 24, 15, 24, 17]])

### 유용한 함수

#### sum : 합계 구하는 함수

In [130]:
arr4 = np.arange(1,30)
arr4

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
       18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29])

In [135]:
print(arr4.sum())
print(np.sum(arr4))

435
435


#### mean : 평균 구하는 함수

In [137]:
print(arr4.mean())
print(np.mean(arr4))

15.0
15.0


#### sqrt  :  제곱근 구하는 함수

In [138]:
np.sqrt(arr4)

array([1.        , 1.41421356, 1.73205081, 2.        , 2.23606798,
       2.44948974, 2.64575131, 2.82842712, 3.        , 3.16227766,
       3.31662479, 3.46410162, 3.60555128, 3.74165739, 3.87298335,
       4.        , 4.12310563, 4.24264069, 4.35889894, 4.47213595,
       4.58257569, 4.69041576, 4.79583152, 4.89897949, 5.        ,
       5.09901951, 5.19615242, 5.29150262, 5.38516481])

#### abs : 절대값 구하는 함수

In [174]:
arr5 = np.array([-1,2,-3,4,-5])
arr5

array([-1,  2, -3,  4, -5])

In [175]:
np.abs(arr5)

array([1, 2, 3, 4, 5])

In [176]:
import random

In [238]:
random.randint(1,25)

9

3