## ndarray 선언

In [1]:
import numpy as np

# 아래 A와 B는 결과적으로 같은 ndarray 객체를 생성합니다. 
A = np.arange(5)
B = np.array([0,1,2,3,4])  # 파이썬 리스트를 numpy ndarray로 변환

# 하지만 C는 좀 다를 것입니다. 
C = np.array([0,1,2,3,'4'])

# D도 A, B와 같은 결과를 내겠지만, B의 방법을 권합니다. 
D = np.ndarray((5,), np.int64, np.array([0,1,2,3,4]))
E = np.ndarray((5,), np.int64, np.array([0,1,2,3,5]))

print(A)
print(type(A))
print(B)
print(type(B))
print(C)
print(type(C))
print(D)
print(type(D))
print(E)
print(type(E))

[0 1 2 3 4]
<class 'numpy.ndarray'>
[0 1 2 3 4]
<class 'numpy.ndarray'>
['0' '1' '2' '3' '4']
<class 'numpy.ndarray'>
[0 1 2 3 4]
<class 'numpy.ndarray'>
[0 1 2 3 5]
<class 'numpy.ndarray'>


## 행렬 크기(size, shape, ndim)

In [2]:
A = np.arange(10).reshape(2,5)   # 길이 10의 1차원 행렬을 2X5 2차원 행렬로 바꿔봅니다.

print(A.shape)
print(A.ndim)
print(A.size)

(2, 5)
2
10


In [4]:
A = np.arange(10)
print('A: ', A)
B = np.arange(10).reshape(2,5)
print('B: ', B)
C = np.arange(10).reshape(3,3)  # 이 줄에서 에러가 날 것입니다.
print('C: ', C)

A:  [0 1 2 3 4 5 6 7 8 9]
B:  [[0 1 2 3 4]
 [5 6 7 8 9]]


ValueError: cannot reshape array of size 10 into shape (3,3)

#### reshape은 반드시 행렬의 크기를 맞춰야함

In [5]:
A= np.arange(6).reshape(2,3)
print(A)
print(A.dtype)
print(type(A))

B = np.array([0,1,2,3,4,5])  
print(B)
print(B.dtype)
print(type(B))

C = np.array([0,1,2,3,'4',5])
print(C)
print(C.dtype)
print(type(C))

D = np.array([0,1,2,3,[4,5],6])  # 이런 ndarray도 만들어질까요?
print(D)
print(D.dtype)
print(type(D))

[[0 1 2]
 [3 4 5]]
int64
<class 'numpy.ndarray'>
[0 1 2 3 4 5]
int64
<class 'numpy.ndarray'>
['0' '1' '2' '3' '4' '5']
<U21
<class 'numpy.ndarray'>
[0 1 2 3 list([4, 5]) 6]
object
<class 'numpy.ndarray'>


#### .dtype = ndarray의 데이터타입을 반환
#### type() = ndarray의 특정한 요소의 타입을 반환
#### 원소 중 하나가 list로 삽입하면, dtype = object
#### object 클래스는 최상위 클래스이므로 가능

In [6]:
C = np.array([0,1,2,3,'4',5])
print(C[0])
print(type(C[0]))
print(C[4])
print(type(C[4]))

D = np.array([0,1,2,3,[4,5],6])
print(D[0])
print(type(D[0]))
print(D[4])
print(type(D[4]))

0
<class 'numpy.str_'>
4
<class 'numpy.str_'>
0
<class 'int'>
[4, 5]
<class 'list'>


## 특수행렬

In [7]:
# 단위행렬
np.eye(3)

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

In [8]:
# 0행렬
np.zeros([2,3])

array([[0., 0., 0.],
       [0., 0., 0.]])

In [9]:
# 1행렬
np.ones([3,3])

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

## 브로드캐스트

In [10]:
A = np.arange(9).reshape(3,3)
A

array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

In [11]:
# ndarray A에 2를 상수배 했을 때,
A * 2

array([[ 0,  2,  4],
       [ 6,  8, 10],
       [12, 14, 16]])

In [12]:
# ndarray A에 2를 더했을 때,
A + 2

array([[ 2,  3,  4],
       [ 5,  6,  7],
       [ 8,  9, 10]])

In [13]:
# 3 X 3 행렬에 1 X 3 행렬을 더했을 때
A = np.arange(9).reshape(3,3)
B = np.array([1, 2, 3])
print('A : ', A)
print('B : ', B)
A+B

A :  [[0 1 2]
 [3 4 5]
 [6 7 8]]
B :  [1 2 3]


array([[ 1,  3,  5],
       [ 4,  6,  8],
       [ 7,  9, 11]])

In [14]:
# 3 X 3 행렬에 3 X 1 행렬을 더했을 때
A = np.arange(9).reshape(3,3)
C = np.array([[1], [2], [3]])
print(A)
print(C)
A+C

[[0 1 2]
 [3 4 5]
 [6 7 8]]
[[1]
 [2]
 [3]]


array([[ 1,  2,  3],
       [ 5,  6,  7],
       [ 9, 10, 11]])

In [15]:
# 3 X 3 행렬에 3 X 1 행렬을 더했을 때
# [1,2,3] 배열을 생성한 후, reshape해도 동작함
A = np.arange(9).reshape(3,3)
D = np.array([1,2,3]).reshape(3,1)
print(A)
print(D)
A+D

[[0 1 2]
 [3 4 5]
 [6 7 8]]
[[1]
 [2]
 [3]]


array([[ 1,  2,  3],
       [ 5,  6,  7],
       [ 9, 10, 11]])

In [16]:
# 3 X 3 행렬에 1 X 2 행렬을 더하는 것은 허용되지 않습니다. 
A = np.arange(9).reshape(3,3)
D = np.array([1, 2])
print(A)
print(D)
A+D

[[0 1 2]
 [3 4 5]
 [6 7 8]]
[1 2]


ValueError: operands could not be broadcast together with shapes (3,3) (2,) 

## 슬라이드와 인덱싱

In [17]:
# 3 X 3 행렬의 첫번째 행을 구해 봅시다. 
A = np.arange(9).reshape(3,3)
print(A)
B = A[0]
print(B)

[[0 1 2]
 [3 4 5]
 [6 7 8]]
[0 1 2]


In [18]:
# 0, 1을 인덱싱 하면 A의 첫번째 행에서 두번째 값을 참조합니다.
# 아래 두 결과는 정확히 같습니다.
print(A[0, 1])
print(B[1])

1
1


In [19]:
# 슬라이싱도 비슷합니다.
A[:-1]

array([[0, 1, 2],
       [3, 4, 5]])

In [20]:
# 이 슬라이싱의 결과는 
print(A[:,2:])
print(A[:,1:])
print(A[:,:])

# 이 슬라이싱의 결과와 동일합니다.
print(A[:,-1:])
print(A[:,-2:])
print(A[:,-3:])

# 위 그림과 비교해서 이해해 보세요.

[[2]
 [5]
 [8]]
[[1 2]
 [4 5]
 [7 8]]
[[0 1 2]
 [3 4 5]
 [6 7 8]]
[[2]
 [5]
 [8]]
[[1 2]
 [4 5]
 [7 8]]
[[0 1 2]
 [3 4 5]
 [6 7 8]]


In [21]:
A[1,:2]

array([3, 4])

In [22]:
A[:2, 1:]

array([[1, 2],
       [4, 5]])

In [23]:
A[:,-1]

array([2, 5, 8])

## 난수(랜덤 수) 생성

In [24]:
# 의사 난수를 생성하는 예제입니다. 여러번 실행해 보세요.

print(np.random.random())   
# 0에서 1사이의 실수형 난수 하나를 생성합니다. 

print(np.random.randint(0,10))   
# 0~9 사이 1개 정수형 난수 하나를 생성합니다. 

print(np.random.choice([0,1,2,3,4,5,6,7,8,9]))   
# 리스트에 주어진 값 중 하나를 랜덤하게 골라줍니다.

0.21712674533337029
0
6


In [25]:
# 아래 2가지는 기능면에서 동일합니다. 원소의 순서를 임의로 뒤바꾸어 줍니다. 

print(np.random.permutation(10))   
print(np.random.permutation([0,1,2,3,4,5,6,7,8,9]))

[6 5 1 9 2 4 7 8 0 3]
[1 2 7 8 0 4 3 9 6 5]


In [26]:
# 아래 기능들은 어떤 분포를 따르는 변수를 임의로 표본추출해 줍니다. 

# 이것은 정규분포를 따릅니다.
# 평균(loc), 표준편차(scale), 추출개수(size)를 조절해 보세요.
print(np.random.normal(loc=0, scale=1, size=5))    

# 이것은 균등분포를 따릅니다. 
# 최소(low), 최대(high), 추출개수(size)를 조절해 보세요.
print(np.random.uniform(low=-1, high=1, size=5))  

[-0.30956238 -0.23898964  2.50038639 -0.83819666  0.61613586]
[-0.58868403  0.9884221   0.59089329  0.17274914 -0.55047782]


## 전치행렬

In [27]:
A = np.arange(24).reshape(2,3,4)
print(A)               # A는 (2,3,4)의 shape를 가진 행렬입니다. 
print(A.T)            # 이것은 A의 전치행렬입니다. 
print(A.T.shape) # A의 전치행렬은 (4,3,2)의 shape를 가진 행렬입니다.

[[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]]
[[[ 0 12]
  [ 4 16]
  [ 8 20]]

 [[ 1 13]
  [ 5 17]
  [ 9 21]]

 [[ 2 14]
  [ 6 18]
  [10 22]]

 [[ 3 15]
  [ 7 19]
  [11 23]]]
(4, 3, 2)


In [28]:
# np.transpose는 행렬의 축을 어떻게 변환해 줄지 임의로 지정해 줄 수 있는 일반적인 행렬 전치 함수입니다. 
# np.transpose(A, (2,1,0)) 은 A.T와 정확히 같습니다.

B = np.transpose(A, (2,0,1))
print(A)             # A는 (2,3,4)의 shape를 가진 행렬입니다. 
print(B)             # B는 A의 3, 1, 2번째 축을 자신의 1, 2, 3번째 축으로 가진 행렬입니다.
print(B.shape)  # B는 (4,2,3)의 shape를 가진 행렬입니다.

[[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]]
[[[ 0  4  8]
  [12 16 20]]

 [[ 1  5  9]
  [13 17 21]]

 [[ 2  6 10]
  [14 18 22]]

 [[ 3  7 11]
  [15 19 23]]]
(4, 2, 3)


## numpy로 통계데이터 계산(종합)

In [30]:
import numpy as np

# 6-3 스텝에서 사용하였던 함수입니다. 
def numbers():
    X = []
    number = input("Enter a number (<Enter key> to quit)") 
    # 하지만 2개 이상의 숫자를 받아야 한다는 제약조건을 제외하였습니다.
    while number != "":
        try:
            x = float(number)
            X.append(x)
        except ValueError:
            print('>>> NOT a number! Ignored..')
        number = input("Enter a number (<Enter key> to quit)")
    return X

def main():
    nums = numbers()       # 이것은 파이썬 리스트입니다. 
    num = np.array(nums)   # 리스트를 Numpy ndarray로 변환합니다.
    print("합", num.sum())
    print("평균값",num.mean())
    print("표준편차",num.std())
    print("중앙값",np.median(num))   # num.median() 이 아님에 유의해 주세요.

main()

Enter a number (<Enter key> to quit)1
Enter a number (<Enter key> to quit)3
Enter a number (<Enter key> to quit)5
Enter a number (<Enter key> to quit)7
Enter a number (<Enter key> to quit)9
Enter a number (<Enter key> to quit)11
Enter a number (<Enter key> to quit)13
Enter a number (<Enter key> to quit)15
Enter a number (<Enter key> to quit)17
Enter a number (<Enter key> to quit)19
Enter a number (<Enter key> to quit)1
Enter a number (<Enter key> to quit)3
Enter a number (<Enter key> to quit)5
Enter a number (<Enter key> to quit)2
Enter a number (<Enter key> to quit)
합 111.0
평균값 7.928571428571429
표준편차 5.909608226249444
중앙값 6.0
