### numpy의 특징
- 파이썬 자료형 list와 비슷한 형태
- 굉장히 빠르고 효율적인 산술연산을 제공
- 다차원 배열 제공
- 반복문 없이 전체 데이터 배열 연산이 가능하다.✨✨

In [197]:
# numpy 라이브러리 로딩
import numpy as np
# as : alias --> 별칭, 통칭

#### 리스트와 array의 차이점
- 리스트
    - 여러가지 자료형을 가질 수 있다.
    - 메모리 용량이 크고 속도가 느리다
- array
    - 동일한 자료형을 가지는 값들이 배열형태로 존재
    - 메모리 최적화, 계산 속도가 빠르다
    - n차원 형태로 구성이 가능

In [198]:
list1 = [1,2,3,4,5]

arr = np.array(list1)
arr

array([1, 2, 3, 4, 5])

In [199]:
# 2차원 array 생성
arr2 = np.array([[1,2,3],
                [4,5,6]])
arr2

array([[1, 2, 3],
       [4, 5, 6]])

### ndarray클래스 속성들을 활용해서 자료구조 파악하기


In [200]:
# 배열의 크기(모양) 확인 => (2,3) => .shape
# 배열의 요소 개수 확인 : .size  != len()
# 배열의 차원 확인 : .ndim
# 배열이 가진 데이터의 타입 확인 : .dtype

In [201]:
print(arr2.size) # -> 요소의 개수
print(len(arr2)) # -> 리스트의 개수
arr2

6
2


array([[1, 2, 3],
       [4, 5, 6]])

### array 연산
- numpy는 기본적으로 array 요소간 사칙연산을 지원한다
- 행과 열이 같은 배열을 연산하면 인덱스에 있는 값들끼리 연산이 된다

In [202]:
lst1 = [1,2,3]
lst2 = [5,6,7]
lst1+lst2

[1, 2, 3, 5, 6, 7]

In [203]:
arr1 = np.array(lst1)
arr2 = np.array(lst2)
arr1+arr2

array([ 6,  8, 10])

In [204]:
# 2차원 배열 연산
arr3 = np.array([[1,2,3],[4,5,6]])
arr3

array([[1, 2, 3],
       [4, 5, 6]])

In [205]:
print(arr3.shape)
print(arr2.shape)
arr4 = np.array([1,2,3,4,5])
print(arr4.shape)
# 생각해봅시다
# arr2+arr4 # --> 오류가 난다
#shape(크기)가 다른 배열끼리 연산은 불가능

(2, 3)
(3,)
(5,)


In [206]:
arr2+arr3

array([[ 6,  8, 10],
       [ 9, 11, 13]])

### numpy 인덱싱 & 슬라이싱
- 인덱싱 : 무언가를 '가리킨다'
- 슬라이싱: 무엇인가를 '잘라낸다'

In [207]:
# 인덱싱
arr1 = np.array([1,2,3,4,5])
arr1

array([1, 2, 3, 4, 5])

In [208]:
# 숫자 2를 인덱싱
arr[1]

2

In [209]:
#슬라이싱
# 숫자 2,3 슬라이싱
arr1[1:3]

array([2, 3])

In [210]:
arr2= np.arange(1,51).reshape(5,10) #(행/열)
arr2

array([[ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10],
       [11, 12, 13, 14, 15, 16, 17, 18, 19, 20],
       [21, 22, 23, 24, 25, 26, 27, 28, 29, 30],
       [31, 32, 33, 34, 35, 36, 37, 38, 39, 40],
       [41, 42, 43, 44, 45, 46, 47, 48, 49, 50]])

In [211]:
#숫자 22 가져오기
arr2[2][1]

22

In [212]:
arr2[2,1]

22

In [213]:
arr2[[2],[1]] # -> array 형태로 출력

array([22])

- 슬라이싱 예제 : 22,33을 인덱싱 해보자

In [214]:
arr2[[2,3] , [1,2]] #행끼리 열끼리

array([22, 33])

![image.png](attachment:image.png)

In [215]:
import numpy as np
import pandas as pd

data = np.loadtxt('height_weight(p).txt',delimiter=',')
data

array([[175.2   , 180.3   , 175.    , 169.2   , 185.2   , 188.    ,
        177.6   , 178.2   , 177.    , 179.    ],
       [144.5824, 193.952 , 174.5568, 152.7372, 121.22  , 156.9248,
        160.892 , 151.8556, 163.096 , 180.728 ]])

#### 데이터설명
- 0행은 키 정보 데이터
- 키 데이터는 cm 단위로 되어있다
- 1행은 몸무게 정보 데이터
- 몸무게 데이터는 pound단위로 되어있다
- 키는 m단위, 몸무게는 kg단위로 단위변환이 필요

In [216]:
# 데이터의 크기(모양), 차원확인
print(data.shape)
print(data.ndim)

(2, 10)
2


In [217]:
# 1. 키 데이터 인덱싱으로 가져오기 -> h변수에 담아주기
# 2. 몸무게 데이터 인덱싱으로 가져오기 -> w변수에 담아주기
# 3. 키 데이터는 cm -> m 단위변환
#    cm * 0.01
# 4. 몸무게 데이터 pound -> kg 단위변환
#    pound / 2.204
# 5. bmi지수 구하기 공식 -> 몸무게(kg) / 키(m) * 키(m)

In [218]:
h = data[0] # 1. 키 데이터 인덱싱으로 가져오기 -> h변수에 담아주기
w = data[1] # 2. 몸무게 데이터 인덱싱으로 가져오기 -> w변수에 담아주기
h *= 0.01 # 3. 키 데이터는 cm -> m 단위변환
w /= 2.204 # 4. 몸무게 데이터 pound -> kg 단위변환
bmi = w / (h * h) # 5. bmi지수 구하기 공식 -> 몸무게(kg) / 키(m) * 키(m)
bmi

array([21.37153104, 27.07018468, 25.86122449, 24.20652885, 16.03543423,
       20.14486193, 23.14392095, 21.69720651, 23.62028791, 25.59220998])