# ndarray를 생성 및 확인
- [참고](http://rfriend.tistory.com/283)
- 연산자(operators)와 methods, attributes 확인은 [여기](http://rfriend.tistory.com/285)하단 참고

## 생성


### 기본 생성

In [1]:
import numpy as np

#NumPy의 array() 로 ndarray 를 만들어보겠습니다.
arr1 = np.array([1, 2, 3, 4, 5])
arr1

array([1, 2, 3, 4, 5])

In [4]:
# list 객체를 먼저 만들고 np.array() 를 사용해서 배열로 변환해도 됩니다.
data_list = [[1, 2, 3, 4, 5], [6, 7, 8, 9, 10]]# a list
arr2 = np.array(data_list) # converting a list into an array
arr2

array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10]])

In [32]:
# 데이터 형태를 지정하여 생성 할수 있음 
np.array([1.4, 2.6, 3.0, 4.9, 5.32], dtype=np.float64)

# np.float64([1.4, 2.6, 3.0, 4.9, 5.32]) 도 가능

array([ 1.4 ,  2.6 ,  3.  ,  4.9 ,  5.32])

### 형변환으로 생성

In [31]:
#astpye를 이용한 형변환 
a = [1, 2, 3, 4, 5] # a list
aa = np.asarray(a)

#  np.int64(x_float64) 도 가능

### 그외 생성 
- np.zeros(), np.ones(), np.empty() 함수는 괄호 안에 쓴 숫자 개수만큼의 '0', '1', '비어있는 배열' 공간
- np.zeros((2, 5)), np.ones((5, 3)), np.empty((4, 3)) 처럼 괄호 안에 tuple을 넣어주면 다차원 배열(multi-dimensional array)
- np.arange() 는 Python의 range() 함수처럼 0부터 괄호안의 숫자 만큼의 정수 배열 값을 '배열'로 반환, f = np.arange(10)
- np.zeros_like(), np.ones_like(), np.empty_like() 함수는 이미 있는 array와 동일한 모양과 데이터 형태를 유지한 상태에서 각 각 '0', '1', '빈 배열'을 반환
- np.identity() 혹은 np.eye() 함수를 사용하면 대각성분은 '1'이고 나머지 성분은 '0'으로 구성된 정방행렬인 항등행렬(identity matrix) 혹은 단위행렬(unit matrix)


### 난수 생성

In [23]:
# random.normal이용한 정규 분포의 난수 생성 
np.random.normal(size=5)

array([ 0.51421884,  0.22117967, -1.07004333, -0.18949583,  0.25500144])

In [25]:
## Seed값을 이용하여 변화지 않는 난수 생성 가능 
np.random.seed(seed=100)
np.random.normal(size=5) 

array([-1.74976547,  0.3426804 ,  1.1530358 , -0.25243604,  0.98132079])

In [26]:
## size 조정으로 Array Shape지정 가능
np.random.normal(size=(2, 3))

array([[ 0.51421884,  0.22117967, -1.07004333],
       [-0.18949583,  0.25500144, -0.45802699]])

## 확인

In [5]:
# dtype 함수를 사용해서 데이터 유형을 확인
arr2.dtype

dtype('int64')

In [6]:
# 원소들의 크기를 확인할 때 array.shape 함수
arr2.shape

(2, 5)

In [3]:
# 타입 확인(type)
a = [1, 2, 3, 4, 5] # a list
aa = np.asarray(a)
print type(a), type(aa)

<type 'list'> <type 'numpy.ndarray'>


In [4]:
# 차원수 확인
np.ndim(a)

1

# Indexing and slicing an ndarray
![](http://cfile9.uf.tistory.com/image/24037B3958B18FD907C784)

출처 : [R Friend](http://rfriend.tistory.com/290)

## 1차 배열 인데싱 

In [33]:
# a[from : to]
a = np.arange(10)
a[0:5]

array([0, 1, 2, 3, 4])

## 2차 배열 인데싱
- 행과 열의 구분은 콤마(comma) ',' 를 사용
- 연속된 위치 값의 경우 '0:2' 처럼 콜론(colon) ':' 를 사용
    - 대괄호(square bracket)을 두개 '[ ][ ]' 처럼 사용할 수도 있음

In [37]:
d= np.arange(20).reshape(4, 5)
d

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])

In [38]:
d[0]

array([0, 1, 2, 3, 4])

In [39]:
d[0:2]

array([[0, 1, 2, 3, 4],
       [5, 6, 7, 8, 9]])

In [40]:
d[0,2]

2

### 콜론을 이용한 슬라이싱

In [41]:
d[0:3,1:3]

array([[ 1,  2],
       [ 6,  7],
       [11, 12]])

In [42]:
d[:3,1:3]

array([[ 1,  2],
       [ 6,  7],
       [11, 12]])

### 이중 대괄호를 이용한 슬라이싱
 

In [43]:
d= np.arange(20).reshape(4, 5)
d

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])

In [44]:
d[0][2] # the same result with the above d[0,2]

2

In [45]:
d[0:3][1:3] # a different result from the above d[0:3,1:3]

array([[ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

- 대괄호 두개 '[ ][ ]'는 첫번째 대괄호 '[ ]'에서 indexing을 먼저 하고 나서, 그 결과를 가져다가 두번째 대괄호 '[ ]'에서 한번 더 indexing을 하게 됩니다.

## 3차 배열 인데싱

In [5]:
e = np.arange(24).reshape(2, 3, 4)
e

array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])

In [6]:
e[0]

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

In [7]:
e[0, 0]

array([0, 1, 2, 3])

In [10]:
e[0,0,0]

0

In [11]:
e[0, 0, 0:3]

array([0, 1, 2])

In [12]:
# 축 하나를 통째로 가져오기
e[0, :, 0:3]

array([[ 0,  1,  2],
       [ 4,  5,  6],
       [ 8,  9, 10]])

콜론(colon) ':' 을 사용해서 행 축(row, axis 0)을 통째로 slicing 해올 수 있습니다.

## 조건문 인데싱

In [17]:
arr = np.arange(20).reshape(5, 4)
arr

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19]])

In [19]:
arr[arr >= 10] = 0
arr

array([[0, 1, 2, 3],
       [4, 5, 6, 7],
       [8, 9, 0, 0],
       [0, 0, 0, 0],
       [0, 0, 0, 0]])

In [21]:
arr = np.arange(20).reshape(5, 4)
arr[(arr >= 8) & (arr <= 15)] = 10
arr

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [10, 10, 10, 10],
       [10, 10, 10, 10],
       [16, 17, 18, 19]])

## Fancy 인데싱
[출처](http://rfriend.tistory.com/292)

### 대괄호(square brackets) 2개를 사용 입력

In [22]:
a = np.arange(15).reshape(5, 3)
a

array([[ 0,  1,  2],
       [ 3,  4,  5],
       [ 6,  7,  8],
       [ 9, 10, 11],
       [12, 13, 14]])

In [27]:
a[[1, 2]] # Fancy 인데싱, 대괄호 2개

array([[3, 4, 5],
       [6, 7, 8]])

In [26]:
a[1,2] # 일반 인데싱

5

### np.ix_() 사용
![](http://cfile9.uf.tistory.com/image/263AD73558B6C13920D923)


In [28]:
a = np.arange(15).reshape(5, 3)
a

array([[ 0,  1,  2],
       [ 3,  4,  5],
       [ 6,  7,  8],
       [ 9, 10, 11],
       [12, 13, 14]])

In [29]:
# 특정 순서로 행(row)을 fancy indexing 합니다. 그런 후에 전체 행을 ':'로 선택하고, 특정 칼럼을 순서대로 배열을 사용해서 indexing을 한번 더 해주는 겁니다.
a[[0, 2, 4]][:, [0, 2]]

array([[ 0,  2],
       [ 6,  8],
       [12, 14]])

In [30]:
# np.ix_ 함수를 사용해서 배열1 로 특정 행(row)을 지정, 배열2 로 특정 열(column)을 지정해주는 것입니다.
a[np.ix_([0, 2, 4], [0, 2])]

array([[ 0,  2],
       [ 6,  8],
       [12, 14]])