# Numpy

## I. ndarray class
### 1. ndarray vs. list
- Ndarray와 list는 내부 구조부터 다름, ndarray가 월등히 빠름
![ndarray&list.png](attachment:ndarray&list.png)- 구성
    + Ndarray : 데이터 관리
    + data-type : 값 관리
    + array scalar : 위치 관리
![ndarray1.png](attachment:ndarray1.png)
![ndarray2.png](attachment:ndarray2.png)

- ndarray는 동일한 데이터타입으로 원소들을 처리

In [2]:
# np.array([element1, element2, element3], dtype)
# 저장 시 dtype을 통해 input value 지정 가능

import numpy as np

l = [1,2,3,4]
a = np.array(l, np.int)
print(a)

a = np.array(l, np.float)
print(a)

a = np.array(l, np.str)
print(a)

[1 2 3 4]
[ 1.  2.  3.  4.]
['1' '2' '3' '4']


- dimensions
    + 0dim : np.array 생성시 scalar value는 array 타입이 아닌 일반 타입으로 생성
    + 1d : 배열의 특징, 차원, 형태, 요소를 가지고 있음

In [5]:
# .ndim을 통해 dimension 확인 가능

a = np.array(10)
print(a)
print(a.ndim)

a = np.array([1,2,3,4])
print(a)
print(a.ndim)

10
0
[1 2 3 4]
1


In [5]:
# 2-d arrary

a = np.array([[1,2], [3,4]])
print(a)
print(a.ndim)

[[1 2]
 [3 4]]
2


In [9]:
# 할당은 참조만 전달

l = [1,2,3,4]
a = np.array(l)
s = a[:2]
ss = a[:2].copy()
print(s.size)
print(ss.size)
s[0] = 9
print(a)
print(s)
print(ss)

2
2
[9 2 3 4]
[9 2]
[1 2]


In [11]:
cvalues = [25.3, 24.8, 26.9, 23.9]

# Celcius ndarray

C = np.array(cvalues)
print(C)
F = C * 9/5 + 32 # 자동 순환 계산후 ndarray로 반환
print(type(F), F)

F1 = [x*9/5 + 32 for x in cvalues]
print(type(F1), F1)

[ 25.3  24.8  26.9  23.9]
<class 'numpy.ndarray'> [ 77.54  76.64  80.42  75.02]
<class 'list'> [77.54, 76.64, 80.42, 75.02]


In [16]:
import numpy as np
import time
size_of_vec = 10000000

def pure_python_version():
  t1 = time.time()
  X = range(size_of_vec)
  Y = range(size_of_vec)
  Z = []
  for i in range(len(X)):
    Z.append(X[i] + Y[i])
  print(t1)
  return time.time() - t1

def numpy_version():
  t2 = time.time()
  X = np.arange(size_of_vec)
  Y = np.arange(size_of_vec)
  Z = X + Y
  print(t2)
  return time.time() - t2

t1 = pure_python_version()
t2 = numpy_version()
print(t1, t2)
print("numpy is in this exampe " + str(t1/t2) + " faster!")

1505479373.6657422
1505479378.8152761
4.942030668258667 0.15279483795166016
numpy is in this exampe 32.34422533189362 faster!


## ndarray 주요 변수
- ndarray.ndim : 차원
- ndarray.shape : 다차원 모습
- ndarray.size : 원소 갯수
- ndarray.dtype : 원소 타입
- ndarray.itemsize : 원소 사이즈(int63, int32)
- ndarray.data : itemsize 크기의 hex 값으로 표현
- ndarray.real : 복소수에서 실수값
- ndarray.imag : 허수값
- ndarray.strides : 원소의 크기
- ndarray.base : original source에 대한 정보
- ndarray.flat : 차원을 가질 경우 하나로 연계, index로 처리
- ndarray.T = 역행렬(transpose)

In [19]:
import numpy as np
l = [1,2,3,4]
a = np.array(l)
print(a)
print(type(a))
print(a.ndim)
print(a.shape)
print(a.size)
print(a.dtype)
print(a.itemsize)
print(a.data)
print(a.real)
print(a.imag)
print(a.strides)
print(a.base)
print(a.flat)
print(a.T)

[1 2 3 4]
<class 'numpy.ndarray'>
1
(4,)
4
int64
8
<memory at 0x1129ed588>
[1 2 3 4]
[0 0 0 0]
(8,)
None
<numpy.flatiter object at 0x7f85048eac00>
[1 2 3 4]
