이번 유닛에서는 NumPy 라이브러리의 기초에 대해 간단히 소개합니다.
NumPy는 수치 계산을 위한 파이썬 라이브러리로, 대규모 다차원 배열과 행렬을 쉽게 처
리할 수 있게 합니다

NumPy 소개 및 설치

NumPy(Numerical Python)는 파이썬에서 대규모 다차원 배열을 효율적으로 처리할 수
있는 라이브러리입니다.
대규모 다차원 배열과 행렬 연산을 효율적으로 처리할 수 있게 해줍니다.

NumPy 임포트:

여기서 np 는 numpy의 일반적인 별칭(alias)입니다.
이를 통해 numpy 대신 np 로 간단히 참조할 수 있습니다.
import numpy as np

NumPy 배열 생성

NumPy 배열은 일반 파이썬 리스트보다 더 효율적이고 다양한 기능을 제공합니다.
동일한 데이터 타입을 가진 원소들로 구성되어 있어 메모리 사용이 최적화됩니다.
NumPy의 가장 기본적인 데이터 구조는 ndarray(n-dimensional array)입니다

In [None]:
import numpy as np

np.array() : 리스트나 튜플로부터 NumPy 배열을 생성합니다.

In [None]:
# 1차원 배열
arr1 = np.array([1, 2, 3, 4, 5])
arr1

In [None]:
# 2차원 배열
arr2 = np.array([[1, 2, 3], [4, 5, 6]])
arr2

ndim : 배열의 차원 수를 반환합니다.


In [None]:
arr1.ndim

In [None]:
arr2.ndim

shape : 배열의 형태(각 차원의 크기)를 반환합니다.


In [None]:
arr1.shape

In [None]:
arr2.shape

dtype : 배열의 데이터 타입을 반환합니다

In [None]:
arr1.dtype

In [None]:
arr2.dtype

배열 인덱싱과 슬라이싱

NumPy 배열의 인덱싱과 슬라이싱은 파이썬 리스트와 유사하지만 더 강력한 기능을 제
공합니다.
다차원 배열에서도 쉽게 원하는 데이터에 접근할 수 있습니다

In [None]:
arr = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
arr

인덱싱: 배열의 특정 위치 원소에 접근합니다.

In [None]:
arr[1, 2]

슬라이싱: 배열의 부분 집합을 추출합니다.

In [None]:
arr[:, 1:3]

In [None]:
bool_idx = arr > 5
arr[bool_idx]

기본 수학 연산

NumPy는 배열 간의 기본적인 수학 연산을 매우 효율적으로 수행합니다.
이는 대규모 데이터셋에 대한 계산을 빠르게 처리할 수 있게 합니다

In [None]:
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

NumPy는 배열 간 기본 산술 연산을 지원합니다

In [None]:
a + b

In [None]:
a - b

In [None]:
a * b # 원소별 곱셈

In [None]:
a / b

np.square() : 배열의 각 원소를 제곱합니다.

In [None]:
np.square(a)

np.dot() : 두 배열의 내적(dot product)을 계산합니다.


In [None]:
np.dot(a, b)

기본 통계 함수

NumPy는 데이터 분석에 필요한 다양한 통계 함수를 제공합니다.
이를 통해 대규모 데이터셋의 특성을 쉽게 파악할 수 있습니다.

In [None]:
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
arr

np.mean() : 배열의 평균을 계산합니다.

In [None]:
np.mean(arr)

np.median() : 배열의 중앙값을 계산합니다.


In [None]:
np.median(arr)

np.min() , np.max() : 배열의 최소값과 최대값을 찾습니다.


In [None]:
np.min(arr)

In [None]:
np.max(arr)


np.sum() : 배열의 모든 원소의 합을 계산합니다.


In [None]:
np.sum(arr)

axis 매개변수를 사용하여 특정 축을 따라 연산을 수행할 수 있습니다.

In [None]:
np.mean(arr, axis = 0) # 각 열의 평균

In [None]:
np.mean(arr, axis = 1) # 각 행의 평균

In [None]:
np.sum(arr, axis = 0) # 각 열의 합계

In [None]:
np.sum(arr, axis = 1) # 각 행의 합계

데이터 분석과 인공지능에서의 활용

NumPy는 데이터 분석의 기초가 되는 라이브러리입니다.

예) 간단한 데이터 분석
이 예제에서는 간단한 온도 데이터 분석을 수행합니다.
1. 기본 통계 계산
2. 연속된 날짜 간 온도 변화 계산
3. 조건에 맞는 데이터 필터링


In [None]:
import numpy as np

In [None]:
# 일일 온도 데이터 (1주일)
temperatures = np.array([20, 22, 23, 19, 25, 28, 24])

1. 기본 통계 계산:
np.mean() , np.max() , np.min() 을 사용하여 평균, 최고, 최저 온도를 계산합
니다.


In [None]:
# 기본 통계
print('평균 온도:', np.mean(temperatures))
print('최고 온도:', np.max(temperatures))
print('최저 온도:', np.min(temperatures))

온도 변화 계산:
np.diff() 함수는 배열의 연속된 원소 간의 차이를 계산합니다.
여기서는 하루 간의 온도 변화를 계산합니다. 예를 들어, [22-20, 23-22, ...] 형태의 결
과가 나옵니다.

In [None]:
# 온도 변화
temp_changes = np.diff(temperatures)
print('일일 온도 변화:', temp_changes)

. 조건에 맞는 데이터 필터링:
불리언 인덱싱을 사용하여 23도 이상인 날의 온도만 선택합니다

In [None]:
# 특정 조건에 맞는 날 찾기
hot_days = temperatures[temperatures >= 23]
print('23도 이상인 날의 온도:', hot_days)