#### 다차원 배열 제공 (ndarray 클래스)
- 배열의 특징
    - 동일한 자료형을 가지는 값들이 배열 형태로 존재함
    - n차원의 형태로 구성이 가능함
    - 데이터 접근을 최적화 하기위해 색인(index)을 부여

#### numpy 데이터타입(형태) 종류

![image.png](attachment:image.png)

#### 배열 생성
- 1차원 배열 생성

In [1]:
list1  =[1, 2, 3, 4, 5] # 리스트
list1

[1, 2, 3, 4, 5]

In [2]:
import numpy as np

In [3]:
arr = np.array(list1)  # np.array() 배열 생성하는 함수
arr # 배열

array([1, 2, 3, 4, 5])

- 이차원 배열 생성

In [4]:
arr1 = np.array([[1,2,3], [4,5,6]])
arr1

array([[1, 2, 3],
       [4, 5, 6]])

- 타입을 지정하여 배열 생성

In [5]:
arr_type = np.array([1.2, 2.3, 3.4],dtype = np.int64)
arr_type

array([1, 2, 3], dtype=int64)

- 타입 변경하기


In [6]:
arr_ftype = arr_type.astype(np.float64)
arr_ftype

array([1., 2., 3.])

In [7]:
arr_ftype.dtype

dtype('float64')

#### 배열 변수 사용해보기
- 배열의 크기 확인 : shape
- 배열의 차원 확인 : ndim
- 배열의 전체 요소의 개수 확인 : size
- 배열 데이터 타입 확인 : dtype

In [8]:
# shape
print('배열의 크기 : ',arr.shape)
print('배열의 크기 : ',arr1.shape)

배열의 크기 :  (5,)
배열의 크기 :  (2, 3)


In [9]:
# ndim (number of dimension)
print(arr)
print('배열의 차원 : ',arr.ndim)

[1 2 3 4 5]
배열의 차원 :  1


In [10]:
print(arr1)
print('배열의 차원 : ',arr1.ndim)

[[1 2 3]
 [4 5 6]]
배열의 차원 :  2


In [11]:
# size
print(arr)
print('전체 요소의 갯수 :',arr.size)

[1 2 3 4 5]
전체 요소의 갯수 : 5


In [12]:
print(arr1)
print('전체 요소의 갯수 : ',arr1.size)

[[1 2 3]
 [4 5 6]]
전체 요소의 갯수 :  6


In [13]:
# dtype
print(arr)
print('배열의 타입 : ',arr.dtype)

[1 2 3 4 5]
배열의 타입 :  int32


In [14]:
print(arr1)
print('배열의 타입 : ',arr1.dtype)

[[1 2 3]
 [4 5 6]]
배열의 타입 :  int32


![image.png](attachment:image.png)

- 1 ~ 50 숫자가 담긴 배열의 생성 

In [15]:
# 파이썬 기초였을때... for
list2 = []
for i in range(1,51):
    list2.append(i)
print(list2)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50]


- np.arange(시작, 끝, 증감값)
    - 1차원으로만 생성

In [16]:
range1 = np.arange(1,51)
range1

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
       18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34,
       35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50])

In [17]:
# 1 ~ 50 숫자 중에 10씩 증가한 값의 배열

In [18]:
range2 = np.arange(1,51,10)
range2

array([ 1, 11, 21, 31, 41])

In [19]:
# 1 ~ 50 을 담은 2차원 배열 생성
range22 = np.arange(1,51).reshape(5,10) # 행, 열의 개수 지정
range22

array([[ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10],
       [11, 12, 13, 14, 15, 16, 17, 18, 19, 20],
       [21, 22, 23, 24, 25, 26, 27, 28, 29, 30],
       [31, 32, 33, 34, 35, 36, 37, 38, 39, 40],
       [41, 42, 43, 44, 45, 46, 47, 48, 49, 50]])

- 랜덤 값 배열 생성

In [20]:
np.random.rand(2, 3)

array([[0.02635317, 0.64212742, 0.52583231],
       [0.84174792, 0.29794257, 0.49318073]])

In [21]:
np.random.randint(2, 10, 5)

array([5, 9, 5, 2, 4])

In [22]:
arr_ran1 = np.random.randint(2, 10, size = (2, 3))
arr_ran1

array([[4, 3, 2],
       [7, 8, 3]])

#### 배열의 연산

##### 배열 요소별 연산

In [23]:
arr2 = np.arange(2, 10, 2)
print(arr2)
print(arr2 / 2)

[2 4 6 8]
[1. 2. 3. 4.]


In [24]:
# list였을때
[2, 4, 6, 8] + [2]

[2, 4, 6, 8, 2]

In [25]:
# 2 ~ 10 담은 1차원 배열 생성
arr3 = np.arange(2, 10)
arr3 + 2 # 차원이 다른 연산이 가능하도록 하는 것 -- > Broadcasting

array([ 4,  5,  6,  7,  8,  9, 10, 11])

##### 배열 간 연산

In [26]:
arr

array([1, 2, 3, 4, 5])

In [27]:
arr + arr  # 위치적으로 대응된 데이터에 대한 연산 수행

array([ 2,  4,  6,  8, 10])

In [28]:
arr * arr

array([ 1,  4,  9, 16, 25])

- 1차원 배열 연산

In [29]:
arr_a = np.array([1,2,3])
arr_b = np.array([4,5,6])

In [30]:
arr_a + arr_b

array([5, 7, 9])

- 2차원 배열 연산

In [31]:
arr2_a = np.array([[7,8,9],[10,11,12]])

In [32]:
arr2_b = np.array([[13,14,15],[16,17,18]])

In [33]:
arr2_b- arr2_a

array([[6, 6, 6],
       [6, 6, 6]])

####  데이터 접근
- indexing, slicing : 인덱스 기반으로 데이터 접근

- 1차원 배열의 인덱싱

In [34]:
arr1 = np.arange(10)
arr1

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [35]:
# 4 데이터 접근
arr1[4]

4

In [36]:
# 2, 7  데이터 접근
arr1[[2, 7, 9]]

array([2, 7, 9])

In [37]:
# 3 ~ 6 데이터 접근
arr1 [3:7]

array([3, 4, 5, 6])

In [38]:
arr1[3 : 7 ] = 4
arr1

array([0, 1, 2, 4, 4, 4, 4, 7, 8, 9])

- 2차원 배열의 인덱싱

In [39]:
# 5행 6열의 2차원 배열 생성
arr2 = np.arange(30).reshape(5, 6)
arr2

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23],
       [24, 25, 26, 27, 28, 29]])

In [40]:
# 2행에 접근
arr2[2]

array([12, 13, 14, 15, 16, 17])

In [41]:
# 9데이터 접근
arr2[1][3]

9

In [42]:
# 2차원 데이터 접근
# 배열명 [행] [열]
# 배열명 [행, 열]
# 배열명 [ 시작행 : 끝행, 시작열 : 끝열]
# 배열명 [행, [0, 3, 5]]

In [43]:
arr2 = np.arange(30).reshape(5, 6)
arr2

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23],
       [24, 25, 26, 27, 28, 29]])

In [44]:
# 2차원 슬라이싱 행 : 2번째 행까지, 열 : 1 ~ 4까지 출력
arr2[:2,1:5]



array([[ 1,  2,  3,  4],
       [ 7,  8,  9, 10]])

In [45]:
arr2[[2,3],[2,3]]

array([14, 21])

In [46]:
arr2[2,2]

14

In [47]:
# 27, 28에 접근해보기
arr2[4: ,3:5]

array([[27, 28]])

In [48]:
arr2

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23],
       [24, 25, 26, 27, 28, 29]])

In [49]:
arr2[2:4,]

array([[12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23]])

In [50]:
arr2[2:4, ::3]

array([[12, 15],
       [18, 21]])

![image.png](attachment:image.png)

In [51]:
array = np.arange(18).reshape(3,6)
array

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17]])

In [52]:
print(array[1:,1::2])
print(array[1:, [1, 3, 5]])

[[ 7  9 11]
 [13 15 17]]
[[ 7  9 11]
 [13 15 17]]


####  Boolean  인덱싱(색인)
- 논리연산자를 활용하여 True, False 결과를 출력
- True에 해당하는 데이터에 접근
- 특정 기준에 의해 접근하는 방식

In [53]:
# 8개의 난수 값을 1차원 배열 생성
# 시간의 의미로 랜덤 값을 생성하기 때문에 값을 고정하고 싶을때 사용
np.random.seed(3) # 숫자는 0 ~ 가능, seed값이 같으면 랜덤수도 동일
score = np.array(np.random.randint(50,100, size = 8))
score

array([92, 74, 53, 58, 50, 71, 69, 60])

In [54]:
# 70점 이상인 성적을 확인
score >= 70
# 논리값을 반환

array([ True,  True, False, False, False,  True, False, False])

In [55]:
# 논리값으로 마스킹하고 원하는 값만 출력
score[score >= 70]

array([92, 74, 71])

In [56]:
# 70점 미만인 데이터는 몇 개일까?
score[score < 70].size


5

In [57]:
name = np.array(['준영','효창','희원','경진','시우','종현','서연','연경'])
name

array(['준영', '효창', '희원', '경진', '시우', '종현', '서연', '연경'], dtype='<U2')

In [58]:
name[score >= 70]

array(['준영', '효창', '종현'], dtype='<U2')

In [59]:
name[score < 70]

array(['희원', '경진', '시우', '서연', '연경'], dtype='<U2')

![image.png](attachment:image.png)

- Numpy 연산, 인덱싱 기법을 이용한 BMI 지수 구학
1. BMI 연산
2. boolean 인덱싱 --> 과체중 데이터 접근

In [63]:
data = np.loadtxt('data/height_weight.txt',delimiter=',')
data


array([[175.2, 180.3, 175. , 169.2, 185.2, 188. , 177.6, 178.2, 177. ,
        179. ],
       [ 65.6,  88. ,  79.2,  69.3,  55. ,  71.2,  73. ,  68.9,  74. ,
         82. ]])

![image.png](attachment:image.png)

In [89]:
# 배열 데이터 확인
data.shape # 2행 10열 (2,10)

# 데이터 타입
data.dtype # float64

# 차원 확인
data.ndim # 2차원


2

In [92]:
data[0][2:5]

array([175. , 169.2, 185.2])

In [91]:
# 1. 키 변수에 키 배열 데이터를 담아주기
h = np.array(data[0])
print(h)
# 2. 몸무게 변수에 몸무게 배열 데이터를 담아주기
w = np.array(data[1])
print(w)
# 3. 키 데이터 단위 변경하기 cm --> m (요소 연산)
m_h = h * 0.01 
print(m_h)
# 4. 배열간 연산을 통해서 BMI 지수 구하기(공식적용)
bmi = w / (m_h * m_h)
print (bmi)
# 5. boolean 인덱싱을 활용하여 과체중이상인 데이터에 접근하기
# 비트연산자 : & - and (두 값 모두 True일대 True 반환)
#             | - or (두 값 중 하나만  True 여도 True 반환)
a = bmi[(bmi >= 23) & (bmi <= 25)]
# 6. 과체중인 사람수(데이터 갯수)
a.size 

[175.2 180.3 175.  169.2 185.2 188.  177.6 178.2 177.  179. ]
[65.6 88.  79.2 69.3 55.  71.2 73.  68.9 74.  82. ]
[1.752 1.803 1.75  1.692 1.852 1.88  1.776 1.782 1.77  1.79 ]
[21.37153104 27.07018468 25.86122449 24.20652885 16.03543423 20.14486193
 23.14392095 21.69720651 23.62028791 25.59220998]


3

####  데이터 수정

In [96]:
array

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17]])

In [99]:
array[:, ::2] = 24
# 위치 접근 -- > 값을 대입(초기화)
array

array([[24,  1, 24,  3, 24,  5],
       [24,  7, 24,  9, 24, 11],
       [24, 13, 24, 15, 24, 17]])

####  넘파이 유용한 함수

##### sum : 합계 구하는 함수

In [100]:
arr4 = np.arange(1, 30)
arr4

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
       18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29])

In [102]:
print(arr4.sum())
print(np.sum(arr4))

435
435


#####  mean : 평균 구하는 함수

In [105]:
print(arr4.mean())
print(np.mean(arr4))

15.0
15.0


#####  sqrt : 제곱근 구하는 함수


In [110]:
print(np.sqrt(arr4)) # 제곱근은 np파일로만 있음
np.sqrt(arr4[3])

[1.         1.41421356 1.73205081 2.         2.23606798 2.44948974
 2.64575131 2.82842712 3.         3.16227766 3.31662479 3.46410162
 3.60555128 3.74165739 3.87298335 4.         4.12310563 4.24264069
 4.35889894 4.47213595 4.58257569 4.69041576 4.79583152 4.89897949
 5.         5.09901951 5.19615242 5.29150262 5.38516481]


2.0

#####  abs : 절대값 구하는 함수

In [112]:
arr5 = np.array([-1, 2, -3, 4, -5])
arr5

array([-1,  2, -3,  4, -5])

In [113]:
np.abs(arr5)

array([1, 2, 3, 4, 5])