In [1]:
import numpy as np

## numpy array 기본 자료

In [2]:
array = np.array([2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31])
print(array)
print(type(array))  # ndarray: n-dimensional array의 줄임말
print(array.shape)  # (11,), 이는 11 x 1 행렬
print(array.size)  # 11, 몇 가지 요소가 있는지 알려줌

[ 2  3  5  7 11 13 17 19 23 29 31]
<class 'numpy.ndarray'>
(11,)
11


In [3]:
array = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
print(array)
print(type(array))
print(array.shape)  # (3, 4), 이는 3 x 4의 2차원 행렬을 의미
print(array.size)  # 12, 3 x 4 행렬이기에 12개의 요소가 들어가 있음

[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]
<class 'numpy.ndarray'>
(3, 4)
12


## 동일한 값을 가진 numpy array 생성

In [4]:
array = np.full(6, 7)  # 7을 6개 가진 numpy array 생성
array

array([7, 7, 7, 7, 7, 7])

In [5]:
array = np.zeros(6, dtype=int)  # 0을 6개 가진 numpy array 생성
array

array([0, 0, 0, 0, 0, 0])

In [6]:
array = np.ones(6, dtype=int)  # 1을 6개 가진 numpy array 생성
# dtype을 float으로 하거나 입력하지 않으면 실수로 생성
array

array([1, 1, 1, 1, 1, 1])

## 무작위 값들로 numpy array 생성
numpy 안에 random 모듈 존재

In [7]:
array = np.random.random(6)  # 0 ~ 1 사이의 수 6개를 가진 numpy array 생성
array

array([0.5025081 , 0.95092083, 0.35309085, 0.22088785, 0.33393036,
       0.78461754])

## 연속된 값들이 담긴 numpy array 생성

In [8]:
# 파라미터 1개
array = np.arange(6)  # 0 ~ 5(6-1)까지의 값들이 담긴 numpy array 생성
array

array([0, 1, 2, 3, 4, 5])

In [9]:
# 파라미터 2개
array = np.arange(2, 7)  # 2 ~6(7-1)까지의 값들이 담긴 numpy array 생성
array

array([2, 3, 4, 5, 6])

In [10]:
# 파라미터 3개
array = np.arange(3, 17, 3)  # 3 ~ 16까지의 값들 중 간격이 3인 값들이 담긴 numpy array 생성
array

array([ 3,  6,  9, 12, 15])

## 인덱싱

In [11]:
arr = np.arange(1, 13)
arr

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12])

In [12]:
arr[2]  # 파이썬 인덱싱과 기본 기능은 동일

3

In [13]:
arr[[1, 3, 4]] # 인덱스 안의 들어있는 값들로 array 생성

array([2, 4, 5])

In [14]:
arr[[2, 10, 5]]

array([ 3, 11,  6])

In [15]:
arr2 = np.array(arr[[2, 10, 3, 5]])
arr2

array([ 3, 11,  4,  6])

In [16]:
arr[arr2]  # arr2 안 값들이 인덱스 역할을 하여 출력

array([ 4, 12,  5,  7])

## 슬라이싱

In [17]:
arr[1:7:2]  # 파이썬 리스트와 기본 기능은 동일

array([2, 4, 6])

## 기본 연산

In [18]:
arr1 = np.arange(10)
arr2 = np.arange(10, 20)

In [19]:
arr1

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [20]:
arr2

array([10, 11, 12, 13, 14, 15, 16, 17, 18, 19])

In [21]:
arr1 * 2 # arr1에 저장되지는 않음, 저장하려면 따로 지정해야함

array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18])

In [22]:
arr1 / 2

array([0. , 0.5, 1. , 1.5, 2. , 2.5, 3. , 3.5, 4. , 4.5])

In [23]:
arr1 + 2

array([ 2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

In [24]:
arr1 ** 2

array([ 0,  1,  4,  9, 16, 25, 36, 49, 64, 81], dtype=int32)

In [25]:
arr1 + arr2  # 기본 연산과 마찬가지로 +, -, /, *, ** 등 사용 가능

array([10, 12, 14, 16, 18, 20, 22, 24, 26, 28])

## 불린 연산

In [26]:
arr = np.array([2, 3, 6, 7, 98, 6, 32, 12, 4, 5, 6])
arr

array([ 2,  3,  6,  7, 98,  6, 32, 12,  4,  5,  6])

In [27]:
arr > 6  # array 값들을 확인하여 불린으로 리턴

array([False, False, False,  True,  True, False,  True,  True, False,
       False, False])

In [28]:
booleans = np.array([True, False, True, False, False, False, True, True, False, True, True, True])

In [29]:
np.where(booleans)  # True를 가진 인덱스를 가진 array 생성

(array([ 0,  2,  6,  7,  9, 10, 11], dtype=int64),)

In [30]:
filter = np.where(arr > 6)  # filter에 조건을 만족하는 값들의 인덱스를 넣음
filter

(array([3, 4, 6, 7], dtype=int64),)

In [31]:
arr[filter] # filter에 담긴 인덱스 정보를 이용하여 조건을 만족하는 arr 값을 리턴

array([ 7, 98, 32, 12])

## 기본 통계

In [32]:
arr.max()  # 최댓값

98

In [33]:
arr.min()  # 최솟값

2

In [34]:
arr.mean()  # 평균값

16.454545454545453

In [36]:
np.median(arr)  # 중앙값

6.0

In [37]:
arr.std()  # 표준편차

26.975961138369897

In [38]:
arr.var()  # 분산

727.702479338843