# 🚴 공유 자전거 데이터 분석 by Numpy

### 0. 환경 설정 (Numpy 설치)

In [1]:
!pip install numpy



In [2]:
import numpy as np

### 1. 공유 자전거 대여량 데이터 준비 및 확인

- ndarray 생성: `np.array`, `np.zeros`, `np.ones`, `np.arange`, `np.linspace`, `np.random`

In [3]:
rentals = np.array([120, 150, 80, 200, 220, 300, 250, 100, 90, 180])

- ndarray 속성: `ndim`, `shape`, `size`, `dtype`

In [4]:
print("대여량 데이터:", rentals)
print("차원(ndim):", rentals.ndim)
print("형태(shape):", rentals.shape)
print("크기(size):", rentals.size)
print("자료형(dtype):", rentals.dtype)

대여량 데이터: [120 150  80 200 220 300 250 100  90 180]
차원(ndim): 1
형태(shape): (10,)
크기(size): 10
자료형(dtype): int32


##### 💡 Python list와 ndarray의 차이

- ndarray는 동일한 자료형만 저장 가능
- ndarray는 다차원인 경우, 중첩 배열은 동일한 크기만 허용
- 형태/길이를 확인하는 방법의 차이
    - python list: len()
    - ndarry: ndarray.shape, ndarray.ndim, ndarray.size

### 2. 특정 조건의 데이터 확인

- 기본 인덱싱 (1D, 2D, 3D)

In [None]:
# 🙋🏻 특정일 하루의 대여량을 알고 싶어요
print("첫째 날 대여량:", rentals[0])
print("마지막 날 대여량:", rentals[-1])

- 슬라이싱

In [None]:
# 🙋🏻 특정 기간의 대여량을 알고 싶어요
print("첫 5일 대여량:", rentals[:5])

- 팬시 인덱싱

In [None]:
# 🙋🏻 특정일의 대여량을 한번에 알고 싶어요
print("2, 4, 6일차 대여량:", rentals[[1, 3, 5]])

- 불리언 인덱싱

In [None]:
# 🙋🏻 특정 조건일 때의 대여량을 알고 싶어요
print("200 이상 대여량:", rentals[rentals >= 200])

### 3. 데이터 분석을 위한 데이터 조작

- 기본 산술 연산 (덧셈, 뺄셈, 곱셈, 나눗셈)

In [None]:
# 🙋🏻 단체 대여가 있어서 대여량이 추가됐어요
added_rentals = np.array([120, 150, 80, 200, 220, 300, 250, 100, 90, 180])
print("대여량 데이터 추가:", rentals + added_rentals)

- 내적(dot product)

In [None]:
# 🙋🏻 프로모션이 적용된 날의 총 대여량을 알고 싶어요
promo = np.array([0, 0, 0, 0, 0, 1, 1, 0, 0, 0])

promo_rentals = np.dot(rentals, promo)
print("프로모션 기간 총 대여량:", promo_rentals)

- 브로드캐스팅

In [None]:
# 🙋🏻 대여량이 지금보다 10% 증가하면 얼마나 될까요?
increased = rentals * 1.1
print("10% 증가:", increased)

- 비교 연산

In [None]:
# 🙋🏻 모든 대여일 중에 특정 조건을 만족하는 대여일은 언제인가요?
print("200 이상 대여한 날:", rentals >= 200)

- 집계 함수 (`sum`, `mean`, `max`, `min`, `std`, `cumsum`)

In [None]:
# 🙋🏻 대여량 통계 데이터를 알아야 해요
mean_val = rentals.mean()
print("평균 대여량:", mean_val)
print("평균 대비 차이:", rentals - mean_val)

print("총 대여량:", rentals.sum())
print("최고 대여일:", rentals.max())
print("최저 대여일:", rentals.min())

print("누적 대여량:", rentals.cumsum())

### 4. 데이터 순서대로 보기

- `np.sort` (오름차순, 내림차순)

In [None]:
# 🙋🏻 대여량 순으로 정렬해서 보고 싶어요
print("오름차순:", np.sort(rentals))
print("내림차순:", np.sort(rentals)[::-1])

- `np.argsort` (인덱스 기반 정렬)

In [None]:
# 🙋🏻 대여량이 높은 날은 언제에요?
rank = np.argsort(rentals)[::-1]
print("대여량 순위 (인덱스):", rank)
print("상위 3일 대여량:", rentals[rank[:3]])

### 5. 각각의 데이터 합쳐서 한번에 보기 (병합)

- `np.vstack`, `np.hstack`

In [None]:
# 🙋🏻 날씨에 따라 대여량이 어떻게 되는지 붙여서 보고 싶어요

# 날씨 데이터 (임의 생성: 평균 기온)
temperature = np.array([2, 3, 5, 7, 6, 8, 10, 4, 3, 5])

# 수평 병합
merged = np.vstack((rentals, temperature)).T
print("대여량 + 평균 기온 병합 데이터:\n", merged)

### 6. 합쳐진 데이터를 필요에 따라 나누기 (분할)

- np.split()

In [None]:
# 🙋🏻 전체 대여량을 주차별로 나눠서 보고 싶어요

# 5일씩 2주로 나누기
week1, week2 = np.split(rentals, 2)

print("1주차 대여량:", week1)
print("2주차 대여량:", week2)

# 각 주차별 평균 대여량
print("1주차 평균:", week1.mean())
print("2주차 평균:", week2.mean())