# 4.1 ndarray : 다차원 배열 객체

- N차원 배열 객체를 생성.

In [1]:
import numpy as np

In [2]:
# 임의값 생성
data = np.random.randn(2, 3)
data

array([[ 0.76513294, -0.54846029,  1.58536121],
       [-0.58198679, -1.06289171,  0.06553069]])

In [3]:
# 산술연산
data * 10

array([[  7.65132944,  -5.48460293,  15.85361208],
       [ -5.8198679 , -10.62891715,   0.65530687]])

In [4]:
# 산술연산
data + data

array([[ 1.53026589, -1.09692059,  3.17072242],
       [-1.16397358, -2.12578343,  0.13106137]])

In [7]:
data.astype # ndarray

<function ndarray.astype>

- ndarray는 같은 종류의 데이터를 담을 수 있는 포괄적인 다차원 배열
- ndarray의 모든 원소는 같은 자료형이여야 한다.
- `shape` : 배열의 각 차원 크기 (튜플로 알려줌)
- `dtype` : 자료형을 알려줌

In [8]:
data.shape

(2, 3)

In [9]:
data.dtype

dtype('float64')

배열, Numpy배열, ndarray는 아주 극소수를 제외하면 다 ndarray 객체를 말한다

## 4.1.1 ndarray 생성하기

- 배열 생성 : `array` 함수 이용

In [10]:
data1 = [6, 7.5, 8, 0, 1]
arr1 = np.array(data1)
arr1

array([6. , 7.5, 8. , 0. , 1. ])

In [14]:
arr1.astype

<function ndarray.astype>

In [15]:
# 다차원 배열
data2 = [[1,2,3,4], [5,6,7,8]]
arr2 = np.array(data2)
arr2

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

- `shape` : 각 차원 크기
- `ndim` : 차원 수

In [16]:
print(arr2.ndim)
print(arr2.shape)

2
(2, 4)


In [17]:
print(arr1.dtype)
print(arr2.dtype)

float64
int32


- `zeros` : 0 벡터(행렬) 배열 생성
- `ones` : 1 벡터(행렬) 배열 생성

In [18]:
np.zeros(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [19]:
np.zeros((3,6)) # 안에 크기는 튜플로 넣어주자

array([[0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0.]])

In [22]:
np.zeros((2,3,2)) #3by2 행렬을 2개 생성 (텐서 모양)

array([[[0., 0.],
        [0., 0.],
        [0., 0.]],

       [[0., 0.],
        [0., 0.],
        [0., 0.]]])

- `arange` : 파이썬 range함수의 배열 버전

In [25]:
np.arange(15) # 15개 생성 : 0~14

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])

넘파이는 산술 연산에 초점이 맞춰져 있기에 자료형을 따로 명시하지 않으면 float64(부동소수점)으로 나올 것이다

### Table 4.1 배열 생성 함수 정리
| 함수 | 설명 |
| :-- | :-- |
| array | 입력 데이터(리스트, 튜플, 배열 또는 다른 순차형 데이터)를 ndarray로 변환하며 dtype을 명시하지 않은 경우 자료형을 추론하여 저장한다. 기본적으로 입력 데이터는 복사 된다. |
| asarray | 입력 데이터를 ndarray로 변환하지만 입력 데이터가 이미 ndarray일 경우 복사가 일어나지 않는다. |
| arange | 내장 range 함수와 유사하지만 리스트대신 ndarray를 반환한다 |
| ones, ones_like | 주어진 dtype과 모양을 가지는 배열을 생성하고 내용을 모두 1로 초기화한다. ones_like는 주어진 배열과 동일한 모양과 dtype을 가지는 배열을 새로 생성하여 내용을 모두 1로 초기화한다. |
| zeros, zeros_like | ones, ones_like와 동일하지만 내용을 0으로 채운다 |
| empty, empty_like | 메모리를 할당하여 새로운 배열을 생성하지만 ones나 zeros처럼 값을 초기화하지 않는다. |
| full, full_like | 인자로 받은 dtype과 배열의 모양을 가지는 배열을 생성하고 인자로 받은 값으로 배열을 채운다. |
| eye, identity | N by N 크기의 단위행렬을 생성한다 |


## 4.1.2 ndarray의 dtype

In [26]:
arr1 = np.array([1,2,3], dtype=np.float64)
arr2 = np.array([1,2,3], dtype=np.int32)

In [27]:
print(arr1.dtype)
print(arr2.dtype)

float64
int32


### Table 4.2 넘파이의 자료형
| 자료형 | 자료형 코드 | 설명 |
| :-- | :-- | :-- |
| int8, uint8 | i1, u1 | 부호가 있는 8비트(1바이트) 정수형과 부호가 없는 8비트 정수형 |
| int16, uint16 | i2, u2 | 부호가 있는 16비트 정수형과 부호가 없는 16비트 정수형 |
| int32, uint32 | i4, u4 | 부호가 있는 32비트 정수형과 부호가 없는 32비트 정수형 |
| int64, uint64 | i8, u8 | 부호가 있는 64비트 정수형과 부호가 없는 64비트 정수형 |
| float16 | f2 | 반정밀도 부동소수점 |
| float32 | f4 또는 f | 단정밀도 부동소수점, C언어의 float형과 호환 |
| float64 | f8또는 d | 배정밀도 부동소수점, C언어의 double형과 파이썬 float 객체와 호한
| float128 | f16 또는 g | 확장정밀도 부동소수점 |
| complex64 <br/> complex128 <br/> complex256 | c8, c16, c32 | 각각 2개의 32, 64, 128비트 부동소수점형을 가지는 복소수 |
| bool | ? | True와 False 값을 저장하는 불리언형 |
| object | O | 파이썬 객체형
| string_ | S | 고정 길이 아스키 문자열형(각 문자는 1바이트), 길이가 10인 문자열 dtype은 S10이 된다. |
| unicode_ | U | 고정 길이 유니코드형(플랫폼에 따라 문자별 바이트 수가 다르다), string_ 형과 같은 형식을 쓴다.(예. U10) |