### numpy 기본

In [1]:
# ! : 외부 명령 실행
# pip : 파이썬 패키지 관리 명령
# list : pip 명령에서 사용하여 매개변수. 설치된 패지지 목록 확인
#
# pip install numpy

# 라이브러리 불러오기
import numpy as np

In [2]:
def asprint( arr ):
    # NumPy ndarray 객체 속성( attribute )
    #
    # arr 인수 : ndarray 객체( array ) 
    #
    # shape : array 구조
    # ndim : array 차원
    # dtype : array 자료형
    #
    print( f'type : {type( arr )}' )
    print( f'shape : {arr.shape}\tdimension = {arr.ndim}' )
    print( f'dtype : {arr.dtype}' )
    print( f"Array's data : \n{ arr }" )

## 1. ndarray
- np.array() 함수는 리스트, 튜플, 배열붙 ndarray를 생성하면 인덱스가 항상 0으로 시작
- 데이터 유형은 dtype
- 넘파이 배열의 특징은 크기가 고정되어 있어 리스트 처럼 크기를 늘리거나 줄일 수 없다.

In [3]:
# 1차원 배열
arr = np.array([1, 2, 3, 4, 5])
asprint(arr)

type : <class 'numpy.ndarray'>
shape : (5,)	dimension = 1
dtype : int32
Array's data : 
[1 2 3 4 5]


In [5]:
# 2차원 배열
arr2 = np.array([[1, 2, 3, 4, 5], [6, 7, 8, 9, 10]])
asprint(arr2)

type : <class 'numpy.ndarray'>
shape : (2, 5)	dimension = 2
dtype : int32
Array's data : 
[[ 1  2  3  4  5]
 [ 6  7  8  9 10]]


### 1-2. 배열 생성
- array() 함수는 리스트 외에도 튜플을 사용해서 배열을 생성할 수 있다.

In [8]:
# 튜플을 이용한 2차원 배열 생성
arr3 = np.array(((1, 2, 3, 4), (5, 6, 7, 8)))
asprint(arr3)
print('---------------------------------------')

arr4 = np.array([(1, 2, 3, 4,), (5, 6, 7, 8), (9, 10, 11, 12)])
asprint(arr4)

type : <class 'numpy.ndarray'>
shape : (2, 4)	dimension = 2
dtype : int32
Array's data : 
[[1 2 3 4]
 [5 6 7 8]]
---------------------------------------
type : <class 'numpy.ndarray'>
shape : (3, 4)	dimension = 2
dtype : int32
Array's data : 
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]


### 1-3. 함수를 이용한 배열의 생성
- zeros() : 배열을 모두 0으로 초기화 한다.
- ones() : 배열을 모두 1으로 초기화 한다.
- full() : 배열에 사용자가 지정한 값으로 초기화 한다.
- eye() : 대각선으로는 1이고 나머지는 0인 2차원 배열을 생성한다.
- linspace() : 균일 간격의 값을 갖는 배열

In [14]:
a = np.zeros( ( 3, 4 ) ) # 0으로 초기화된 배열 생성
asprint(a)

type : <class 'numpy.ndarray'>
shape : (3, 4)	dimension = 2
dtype : float64
Array's data : 
[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]


In [15]:
# 1로 초기화된 배열 생성
a = np.ones( (3, 4) )
asprint(a)

type : <class 'numpy.ndarray'>
shape : (3, 4)	dimension = 2
dtype : float64
Array's data : 
[[1. 1. 1. 1.]
 [1. 1. 1. 1.]
 [1. 1. 1. 1.]]


In [16]:
# 임의의 값으로 초기화된 배열 생성
a = np.full((3, 4), 7)
asprint(a)

type : <class 'numpy.ndarray'>
shape : (3, 4)	dimension = 2
dtype : int32
Array's data : 
[[7 7 7 7]
 [7 7 7 7]
 [7 7 7 7]]


In [17]:
# (N, N) 구조의 단위 행렬 생성
a = np.eye(4)
asprint(a)

type : <class 'numpy.ndarray'>
shape : (4, 4)	dimension = 2
dtype : float64
Array's data : 
[[1. 0. 0. 0.]
 [0. 1. 0. 0.]
 [0. 0. 1. 0.]
 [0. 0. 0. 1.]]


In [18]:
# 0~1까지 5개의 균일 간격의 값을 갖는 배열 생성
a = np.linspace(0,1,5)
asprint(a)

type : <class 'numpy.ndarray'>
shape : (5,)	dimension = 1
dtype : float64
Array's data : 
[0.   0.25 0.5  0.75 1.  ]


## 2. 인덱싱, 슬라이싱

### 2-1. 인덱싱
- 인덱싱은 대활호[]를 사용하여 값을 추출하거나, 항목을 선택하는 등 다양한 기능을 수행한다.

In [22]:
# 1차원 배열 생성
a = np.arange(3, 30, 2)
asprint(a)

# 요소 선택
print(f'6번째 요소 : {a[5]}')
print(f'배열의 마지막 요소 : {a[-1]}')
print(f'뒤에서 3번째요소 : {a[-3]}')
print(f'여러 요소 선택 : {a[[1, 3, 5,]]}')


type : <class 'numpy.ndarray'>
shape : (14,)	dimension = 1
dtype : int32
Array's data : 
[ 3  5  7  9 11 13 15 17 19 21 23 25 27 29]
6번째 요소 : 13
배열의 마지막 요소 : 29
뒤에서 3번째요소 : 25
여러 요소 선택 : [ 5  9 13]


In [26]:
# 2차원 배열 생성
a = np.arange(10, 19).reshape((3,3))
asprint(a)

# 마지막 요소 선택
print(a[2, 2])

type : <class 'numpy.ndarray'>
shape : (3, 3)	dimension = 2
dtype : int32
Array's data : 
[[10 11 12]
 [13 14 15]
 [16 17 18]]
18


![image.png](attachment:image.png)


### 2-2. 슬라이싱
- 인덱싱과 같이 배열 일부를 추출할 수 있다.
- 대괄호 안에 콜론(:)으로 구분하여 사용한다.
- 시작요소의 인덱스와 마지막 요소의 인덱스를 명시해준다.
- 세 번째 인수를 전달하게 되면 값을 건너뛰면서 배열 일부를 추출할 수 있다.

In [34]:
# 슬라이싱 예제
arr1 = np.arange(2, 30, 2)
asprint(arr1)

# 배열 일부를 슬라이싱
print('일부배열: ', arr1[2:6])

# 세번 째 인수 사용의 예
print("예시 : ", arr1[1:7:2])

type : <class 'numpy.ndarray'>
shape : (14,)	dimension = 1
dtype : int32
Array's data : 
[ 2  4  6  8 10 12 14 16 18 20 22 24 26 28]
일부배열:  [ 6  8 10 12]
예시 :  [ 4  8 12]


In [39]:
# 첨부터 2개씩 건너 뛰면서 출력
print(arr1[::2])

# 처음부터 3번째 요소까지 2개씩 건너 뛰면서 출력
print(arr1[:4:2])

# 처음부터 3번째 요소까지 출력
print(arr1[:4])

[ 2  6 10 14 18 22 26]
[2 6]
[2 4 6 8]


In [49]:
# 2차원 배열에서는 행과 열에 대해 별도로 정의해야 슬라이싱이 적용된다.
arr2 = np.arange(1, 13).reshape((3,4))
asprint(arr2)
print()
# 3번째 행만 추출하는 경우
print('3번째 행만 추출하는 경우')
print(arr2[2, :])

print('배열 일부 추출')
print(arr2[0:2, 0:1])

type : <class 'numpy.ndarray'>
shape : (3, 4)	dimension = 2
dtype : int32
Array's data : 
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]

3번째 행만 추출하는 경우
[ 9 10 11 12]
배열 일부 추출
[[1]
 [5]]


- arr2에 대해 arr2[[row1, row2], [col1, col2]]과 같이 표현
![image.png](attachment:image.png)

### 2-3. 배열의 반복
- 배열의 내부요소를 반복적으로 사용하기 위해서는 for루프를 많이 사용한다.
- for 루프보다 더 유용한 기능 -> apply_alog_axis() 함수 사용
- 이 함수는 단일 열이나 모든 행에 대해 집계 함수를 실행할 때 반복해서 배열의 내부요소에 접근하도록 해준다.
- 사용할 함수, 반복을 적용할 축, 사용할 배열과 관련한 정보를 인수로 전달
- 축의 값이 0이면 행을 기준으로 반복하며 축이 1이면 열을 기준으로 반복

In [58]:
# 2차원 배열에 대한 슬라이싱
arr3 = np.arange(0,20).reshape((4,5))
asprint(arr3)
print('-------------------')

# 열을 기준으로 반복
print('열을 기준으로 반복')
print(np.apply_along_axis(np.mean, 0, arr3)) # (함수, 축, 배열)
print()
# 행을 기준으로 반복
print('행을 기준으로 반복')
print(np.apply_along_axis(np.mean, 1, arr3))

type : <class 'numpy.ndarray'>
shape : (4, 5)	dimension = 2
dtype : int32
Array's data : 
[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]
 [15 16 17 18 19]]
-------------------
열을 기준으로 반복
[ 7.5  8.5  9.5 10.5 11.5]

행을 기준으로 반복
[ 2.  7. 12. 17.]


## 3. 조건 및 부울연산을 통한 배열 추출

In [60]:
arr4 = np.random.random((3, 5))
asprint(arr4)

type : <class 'numpy.ndarray'>
shape : (3, 5)	dimension = 2
dtype : float64
Array's data : 
[[0.77927751 0.49287579 0.845626   0.97693291 0.51436787]
 [0.73686488 0.73184572 0.42856357 0.46745184 0.399344  ]
 [0.50416125 0.80885847 0.05389069 0.2193617  0.33638742]]


In [61]:
# 0.5보다 작은 값을 참, 거짓 형태로 확인
print(arr4 < 0.5)

[[False  True False False False]
 [False False  True  True  True]
 [False False  True  True  True]]


In [63]:
# 해당되는 실제 값을 반환
print(arr4[arr4 < 0.5])

[0.49287579 0.42856357 0.46745184 0.399344   0.05389069 0.2193617
 0.33638742]
