# 파이썬 기초
## 데이터 사이언스 스쿨(https://datascienceschool.net) 을 기초로 합니다.
---------- 
### 배열의 연산
   * 벡터화 연산(Vetorized operation)
   * 반복문을 사용하지 않아도 반복연산 가능
   * 선형 대수 공식 작성 가능

![image.png](attachment:image.png)

In [1]:
import numpy as np
import datetime
import time
x = np.arange(1,10001)
y = np.arange(10001, 20001)

In [2]:
start_time = time.time() 
z = np.zeros_like(x)
for i in range(10000):
    z[i] = x[i] + y[i]
print("--- %.6s seconds ---" %(time.time() - start_time))

--- 0.0059 seconds ---


In [3]:
%time
z = np.zeros_like(x)
for i in range(10000):
    z[i] = x[i] + y[i]

Wall time: 0 ns


In [4]:
print(len(z[:10]))
z[:10]

10


array([10002, 10004, 10006, 10008, 10010, 10012, 10014, 10016, 10018,
       10020])

In [5]:
a = np.array([1, 2, 3, 4])
b = np.array([4, 2, 2, 4])

In [6]:
a == b

array([False,  True, False,  True])

In [7]:
a >= b

array([False,  True,  True,  True])

   * all : 전체 원소가 같은지 확인

In [8]:
a = np.array([1, 2, 3, 4])
b = np.array([4, 2, 2, 4])
c = np.array([1, 2, 3, 4])

In [9]:
np.all(a==b)

False

In [10]:
np.all(a==c)

True

   * 지수 함수
   * 로그 함수

In [11]:
a = np.arange(5)
a

array([0, 1, 2, 3, 4])

In [12]:
np.exp(a, dtype = "float64")

array([ 1.        ,  2.71828183,  7.3890561 , 20.08553692, 54.59815003])

In [13]:
10 ** a

array([    1,    10,   100,  1000, 10000], dtype=int32)

In [14]:
np.log(a + 1)

array([0.        , 0.69314718, 1.09861229, 1.38629436, 1.60943791])

### Scalar & Vector/Matrix 의 곱

In [15]:
x = np.arange(10)
x

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [16]:
100 * x

array([  0, 100, 200, 300, 400, 500, 600, 700, 800, 900])

In [17]:
x = np.arange(12).reshape(3,-1)

In [18]:
100 * x

array([[   0,  100,  200,  300],
       [ 400,  500,  600,  700],
       [ 800,  900, 1000, 1100]])

## 브로드캐스팅
   * 다른 두 배열의 사칙 연산 가능
   * 자동 반복으로 확장

![image.png](attachment:image.png)

In [19]:
x = np.arange(5)
x

array([0, 1, 2, 3, 4])

In [20]:
y = np.ones_like(x)
y

array([1, 1, 1, 1, 1])

In [21]:
x + y

array([1, 2, 3, 4, 5])

In [22]:
x + 1

array([1, 2, 3, 4, 5])

![image.png](attachment:image.png)

In [23]:
[range(i,i+5) for i in range(3)]

[range(0, 5), range(1, 6), range(2, 7)]

In [24]:
y = np.arange(5)[:,np.newaxis]
y

array([[0],
       [1],
       [2],
       [3],
       [4]])

In [25]:
x = np.array([[[1],[2],[3]], [[4],[5],[6]]])
print(x)
x.shape

[[[1]
  [2]
  [3]]

 [[4]
  [5]
  [6]]]


(2, 3, 1)

In [26]:
x[:,np.newaxis,:,:].shape

(2, 1, 3, 1)

In [27]:
np.stack([range(i,i+5) for i in range(3)]).T + y

array([[ 0,  1,  2],
       [ 2,  3,  4],
       [ 4,  5,  6],
       [ 6,  7,  8],
       [ 8,  9, 10]])

## 차원 축소 연산

![image.png](attachment:image.png)

   *  전체 array의 연산 - 차원 축소 연산
     * argmin() : 최솟값의 위치
     * argmax() : 최eot값의 위치
     

In [28]:
x = np.array([1, 2, 3, 4])
x

array([1, 2, 3, 4])

In [29]:
print(np.sum(x)) # 
print(x.sum()) # 함수형 가능

10
10


In [30]:
print(x.min())
print(x.max())

1
4


In [31]:
x.argmax()

3

In [32]:
x.argmin()

0

In [33]:
print(x.mean())
print(x.std()**2)
print(x.var())

2.5
1.2500000000000002
1.25


In [34]:
np.all([True, True, False])

False

In [35]:
np.any([True, True, False])

True

In [36]:
a = np.zeros((100, 100), dtype=np.int)
a

array([[0, 0, 0, ..., 0, 0, 0],
       [0, 0, 0, ..., 0, 0, 0],
       [0, 0, 0, ..., 0, 0, 0],
       ...,
       [0, 0, 0, ..., 0, 0, 0],
       [0, 0, 0, ..., 0, 0, 0],
       [0, 0, 0, ..., 0, 0, 0]])

In [37]:
np.any(a)

False

In [38]:
np.all(a == 0)

True

In [39]:
a = np.array([1, 2, 3, 2])
b = np.array([2, 2, 3, 2])
c = np.array([6, 4, 4, 5])

In [40]:
((a <= b) & (b <= c))

array([ True,  True,  True,  True])

In [41]:
((a <= b) & (b <= c)).all()

True

In [42]:
x = np.array([[1, 1], [2, 2]])
x

array([[1, 1],
       [2, 2]])

In [43]:
x.sum()

6

In [44]:
x.sum(axis=0) # 열 연산

array([3, 3])

In [45]:
x.sum(axis=1) # 행 연산

array([2, 4])

![image.png](attachment:image.png)

In [46]:
x = np.array([list(range(2*i,2*i+6)) for i in range(5)])
x

array([[ 0,  1,  2,  3,  4,  5],
       [ 2,  3,  4,  5,  6,  7],
       [ 4,  5,  6,  7,  8,  9],
       [ 6,  7,  8,  9, 10, 11],
       [ 8,  9, 10, 11, 12, 13]])

In [47]:
x.max()

13

In [48]:
x.sum(axis=1)

array([15, 27, 39, 51, 63])

In [49]:
x.mean(axis=0, dtype="f")

array([4., 5., 6., 7., 8., 9.], dtype=float32)

## 정렬

![image.png](attachment:image.png)


   * axis = 0 : 행
   * axis = 1 : 열
   * axis = -1(디폴트) : 가장 마지막 차원

In [50]:
a = np.array([[4,  3,  5,  7],
              [1, 12, 11,  9],
              [2, 15,  1, 14]])
a

array([[ 4,  3,  5,  7],
       [ 1, 12, 11,  9],
       [ 2, 15,  1, 14]])

In [51]:
np.sort(a)  # axis=-1 또는 axis=1 과 동일

array([[ 3,  4,  5,  7],
       [ 1,  9, 11, 12],
       [ 1,  2, 14, 15]])

In [52]:
np.sort(a, axis=0) # 행

array([[ 1,  3,  1,  7],
       [ 2, 12,  5,  9],
       [ 4, 15, 11, 14]])

## **주의**
   * sort는 자료 자체가 변화하는 **in-place** method 임

In [53]:
a.sort(axis=1)
a

array([[ 3,  4,  5,  7],
       [ 1,  9, 11, 12],
       [ 1,  2, 14, 15]])

###  순서의 위치 파악
   * argsort 

In [54]:
a = np.array([42, 38, 12, 25])
j = np.argsort(a)
j

array([2, 3, 1, 0], dtype=int64)

In [55]:
a[j]

array([12, 25, 38, 42])

In [56]:
np.sort(a)

array([12, 25, 38, 42])

In [57]:
a # np.sort는 in-place 함수가 아님

array([42, 38, 12, 25])

![image.png](attachment:image.png)

In [58]:
a = np.array([[  1,    2,    3,    4],
       [ 46,   99,  100,   71],
       [ 81,   59,   90,  100]])

In [59]:
a

array([[  1,   2,   3,   4],
       [ 46,  99, 100,  71],
       [ 81,  59,  90, 100]])

In [60]:
[np.argsort(a[2])]

[array([1, 0, 2, 3], dtype=int64)]

In [61]:
np.vstack([a[i][np.argsort(a[2])] for i in range(len(a))])

array([[  2,   1,   3,   4],
       [ 99,  46, 100,  71],
       [ 59,  81,  90, 100]])