# What is numpy?
NumPy is designed for efficiency on large arrays of data, exhibiting
much better performance than built-in Python objects

In [1]:
from time import time
import numpy as np
start_time = time()
my_arr = np.arange(1000000)
end_time = time()
print("Time elapsed: ", end_time - start_time) # 더 빠르다

Time elapsed:  0.0


In [2]:
from time import time
start_time = time()
my_list = list(range(1000000))
end_time = time()
print("Time elapsed: ", end_time - start_time)

Time elapsed:  0.013547897338867188


## Ndarray

- homogeneous data -> all of elements must be same type

In [3]:
data = np.random.randn(2, 3)
data

array([[-0.79160321,  1.26085802,  1.31395667],
       [-0.51089489, -2.26999757,  1.01323665]])

In [4]:
data * 10

array([[ -7.91603209,  12.60858017,  13.13956674],
       [ -5.10894888, -22.6999757 ,  10.13236647]])

In [5]:
print(data.shape) # 배열의 크기 튜플로 표현
print(data.dtype) # 데이터 타입
print(data.ndim) # 차원의 개수

(2, 3)
float64
2


![image.png](attachment:image.png)

In [17]:
print(np.array({1, 2, 3, 4, 5}), '\n') # 배열 생성
print(np.empty((2, 3)), '\n') # garbage 값으로 초기화
print(np.full((2, 3), 7), '\n') # 7로 초기화
print(np.identity(3), '\n') # 단위 행렬

{1, 2, 3, 4, 5} 

[[1. 1. 1.]
 [1. 1. 1.]] 

[[7 7 7]
 [7 7 7]] 

[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]] 



In [6]:
ary = np.ones((5, 4)) # 5x4 배열 생성(튜플로 크기 지정)
for i in range(5):
    ary[i] = i
ary[-3:]

array([[2., 2., 2., 2.],
       [3., 3., 3., 3.],
       [4., 4., 4., 4.]])

In [18]:
ary.astype(np.int64) # 데이터 타입 변경

array([[0, 0, 0, 0],
       [1, 1, 1, 1],
       [2, 2, 2, 2],
       [3, 3, 3, 3],
       [4, 4, 4, 4]], dtype=int64)

In [26]:
ary3d = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])
print(ary3d[0], '\n\n') # 가장 바깥쪽 차원부터 접근
ary3d[1][1] = 0 # 위와 같은 방법
print(ary3d)

[[1 2 3]
 [4 5 6]] 


[[[1 2 3]
  [4 5 6]]

 [[7 8 9]
  [0 0 0]]]


In [29]:
sqare = np.full((3, 3), 5)
print(sqare[2].shape, '\n', sqare[2], '\n') # 1차원 배열
print(sqare[2:,:].shape, '\n', sqare[2:,:]) # 2차원 배열

(3,) 
 [5 5 5] 

(1, 3) 
 [[5 5 5]]


In [32]:
names = np.array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'])
data = np.random.randn(7, 4)
print(data, '\n')
print(names == 'Bob', '\n')
print(data[names == 'Bob'], '\n') # True인 행만 추출

[[-0.76124444 -0.98034641  0.74372287  0.43859445]
 [ 0.10257914 -2.42587812  1.34063031 -0.67816994]
 [-1.67234615 -0.1384589  -1.2451105  -0.52973683]
 [ 1.54824712 -1.51975941 -0.53009977 -1.06447077]
 [ 0.37926828 -0.38650396 -1.37126693 -1.49968752]
 [ 0.01181473  0.9032717   1.17709918 -1.89098001]
 [-0.2059349   0.78684184  0.48965112 -0.76511146]] 

[ True False False  True False False False] 

[[-0.76124444 -0.98034641  0.74372287  0.43859445]
 [ 1.54824712 -1.51975941 -0.53009977 -1.06447077]] 



In [33]:
arr = np.arange(32).reshape((8, 4))
arr[[1, 5, 7, 2], [0, 3, 1, 2]] # (1, 0), (5, 3), (7, 1), (2, 2)의 값

array([ 4, 23, 29, 10])

![image.png](attachment:image.png)

In [36]:
ary = ary[:3,:3]
print(ary * ary, '\n') # 원소별 곱셈
print(ary**0.5, '\n') # 제곱근
print(np.exp(ary), '\n') # 지수 함수(exp(x) = e^x)
print(np.log(ary), '\n') # 로그 함수 (자연로그)
print(np.sign(ary), '\n') # 부호 함수
print(np.ceil(ary), '\n') # 올림 함수(소수점 이하 올림)

[[0. 0. 0.]
 [1. 1. 1.]
 [4. 4. 4.]] 

[[0.         0.         0.        ]
 [1.         1.         1.        ]
 [1.41421356 1.41421356 1.41421356]] 

[[1.         1.         1.        ]
 [2.71828183 2.71828183 2.71828183]
 [7.3890561  7.3890561  7.3890561 ]] 

[[      -inf       -inf       -inf]
 [0.         0.         0.        ]
 [0.69314718 0.69314718 0.69314718]] 

[[0. 0. 0.]
 [1. 1. 1.]
 [1. 1. 1.]] 

[[0. 0. 0.]
 [1. 1. 1.]
 [2. 2. 2.]] 



  print(np.log(ary), '\n') # 로그 함수 (자연로그)


![image.png](attachment:image.png)

In [49]:
x = np.random.randint(-10, 10, 4)
y = np.random.randint(-10, 10, 4)
print('x:',x, '\n', 'y:',y, '\n')
print(np.add(x, y), '\n') # 두 배열의 원소별 합
print(np.subtract(x, y), '\n') # 두 배열의 원소별 차
print(np.multiply(x, y), '\n') # 두 배열의 원소별 곱
print(np.divide(x, y), '\n') # 두 배열의 원소별 나눗셈, floor_divide는 몫만 반환
print(np.power(x, y), '\n') # x의 y승
print(np.maximum(x, y), '\n') # 두 배열의 원소별 최대값
print(np.minimum(x, y), '\n') # 두 배열의 원소별 최소값
print(np.mod(x, y), '\n') # 나머지(remainder)
print(np.copysign(x, y), '\n') # y의 부호를 x에 복사

x: [-1 -7  0 -1] 
 y: [0 3 7 4] 

[-1 -4  7  3] 

[ -1 -10  -7  -5] 

[  0 -21   0  -4] 

[       -inf -2.33333333  0.         -0.25      ] 

[   1 -343    0    1] 

[0 3 7 4] 

[-1 -7  0 -1] 

[0 2 0 3] 

[1. 7. 0. 1.] 



  print(np.divide(x, y), '\n') # 두 배열의 원소별 나눗셈, floor_divide는 몫만 반환
  print(np.mod(x, y), '\n') # 나머지
