# Numpy

## 01. 개요

>Numeric Python

- 다차원 배열을 쉽게 처리하고 효율적으로 사용할 수 있도록 지원하는 파이썬 패키지
- 데이터 구조 외에도 수치 계산을 위해 효율적으로 구현된 기능을 제공
- 데이터 분석에서 pandas와 함께 자주 사용하는 도구
- 실제로 데이터 분석을 수행하기 위한 전제 조건은 컴퓨터가 이해할 수 있도록 데이터를 숫자 형식으로 변환하는 것임 -> 데이터 분석을 하기위해서 데이터를 숫자형식으로 변환해야한다
- 파이썬 list 자료형의 경우 데이터의 크기가 커질수록 저장 및 가공에 효율성을 보장하지 못함
- 이러한 단점을 보완하기 위한 패키지이기 때문에 Data Science에서 핵심적인 도구로 인식되고 있음

## 02. 준비과정

### 패키지 참조

In [2]:
import numpy as np

## 03. Numpy가 제공하는 데이터 타입

> 리스트의 업그레이드 버전인 **배열(array)** 라는 데이터 타입을 제공합니다. - > 리스트 != 배열

- list 타입 : 서로 다른 타입의 원소를 허용한다 ex) [1, 'hello'] # ==, !=
- array 타입 : 반드시 모든 원소의 데이터 타입이 동일해야 한다.  # is, not is

### 1.numpy 배열 생성과 기본활용

> 리스트를 통한 1차원 배열 만들기
- 인덱스 번호와 길이의 존재
- 반복문을 통한 원소의 탐색
- 인덱싱, 슬라이싱

In [3]:
arr = np.array([1, 3, 5, 7, 9])
arr

array([1, 3, 5, 7, 9])

### 2. 배열의 크기

기본 특성은 list와 동일

In [4]:
size = len(arr)
size

5

### 3. 배열의 원소

리스트와 마찬가지로 인덱스 번호가 존재

In [5]:
print(arr[1])
print(arr[0])

3
1


### 4. 반복문을 통한 활용

리스트와 동일하게 사용할 수 있다


In [6]:
for i, v in enumerate(arr):
    print(i, v)

0 1
1 3
2 5
3 7
4 9


## 04. numpy배열의 특성

### 1. list 타입의 경우

서로다른 타입의 원소 허용


In [18]:
arrr = [100, 3.14, True]

### 2. numpy 배열의 경우

리스트를 배열로 변환할 경우 원소의 타입이 서로 다른것을 허용하지 않기 때문에 가장 포괄적인 형태의 자료형으로 통일함.
> 'arrr'같은 경우는 실수의 범위가 더 크므로 모든 원소가 실수형으로 변환됨

In [8]:
arr2 = np.array(arrr)
print(arr2)

[100.     3.14   1.  ]


### 3. 강제 형 변환

'np.array()' 메서드에 'dtype' 파라미터로 특정 타입을 강제 지정할 수 있음
> 실수형 값을 정수로 변환하는 과정에서 소수점 아래는 반올림이 아닌 모두 버린다(삭제 개념)

In [21]:
arr4 = np.array(arrr, dtype = 'int')
print(arr4)

[100   3   1]


### 4. 문자열이 포함된 경우

모든 프로그래밍 언어에서 가장 표현범위가 넓은 타입은 문자열이다

그러므로 문자열이 포함된 리스트를 배열로 변환할 경우 모든 원소가 문자열이 된다.

In [20]:
arr5= np.array([1.2, 3, '4', True])
print(arr5)
arr5

# 리스트와 array형식의 눈에 띄는 차이점은 원소마다 컴마가 찍히냐 안찍히냐 차이임, 확실히 확인하는 방법은 type함수 써서 확인하는 것임

['1.2' '3' '4' 'True']


array(['1.2', '3', '4', 'True'], dtype='<U32')

## 05. list 타입으로 역변환

서로 호환 가능

In [15]:
mylist = list(arr5)
print(type(mylist))
mylist

<class 'list'>


['1.2', '3', '4']