<a href="https://colab.research.google.com/github/jetsonmom/6.23_automobility_lesson/blob/main/%EC%88%98%EC%97%85_6_NumPy_%26_PANDAS.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

🧩 현재 코드에 포함된 NumPy 기능들
✅ 배열 기초

np.array() - 배열 생성
np.zeros(), np.ones() - 특수 배열
np.arange(), np.linspace() - 범위 배열

✅ 배열 연산

사칙연산 (+, -, *, /)
배열 간 연산
브로드캐스팅

✅ 통계 함수

np.mean(), np.max(), np.min()
np.median(), np.std(), np.sum()
np.argmax(), np.argmin()

✅ 조건부 처리

불린 마스킹
조건 필터링 (>, <, &, |)
복합 조건

✅ 2D 배열

매트릭스 생성 및 조작
axis=0, axis=1 개념
행/열별 연산

✅ 벡터 연산

유클리드 거리
벡터 차이 계산
np.sqrt(), np.sum()

✅ 고급 기능

np.column_stack() - 배열 결합
다차원 배열 인덱싱

In [None]:
# 1단계: NumPy 기초 - 자율주행 센서 데이터 처리
# 코랩에서 바로 실행 가능!

import numpy as np
print("🚗 자율주행 NumPy 기초 학습 시작!")
print("📦 NumPy 버전:", np.__version__)
print()

# ===== 1. NumPy 배열 기초 =====
print("=== 1. NumPy 배열 기초 ===")

# 1-1. 리스트를 NumPy 배열로 변환
print("📊 1-1. 센서 거리 데이터")
sensor_distances = [8.5, 12.3, 15.7, 2.1, 9.8]  # 파이썬 리스트
print("원본 리스트:", sensor_distances)
print("리스트 타입:", type(sensor_distances))

# NumPy 배열로 변환
np_distances = np.array(sensor_distances)
print("NumPy 배열:", np_distances)
print("NumPy 타입:", type(np_distances))
print("배열 모양:", np_distances.shape)
print("배열 크기:", np_distances.size)
print()

# 1-2. 직접 배열 생성
print("📊 1-2. 다양한 배열 생성 방법")
zeros_array = np.zeros(5)  # 0으로 채운 배열
ones_array = np.ones(4)    # 1로 채운 배열
range_array = np.arange(0, 10, 2)  # 0부터 10까지 2씩 증가
linspace_array = np.linspace(0, 100, 5)  # 0부터 100까지 5개 구간

print("0으로 채운 배열:", zeros_array)
print("1로 채운 배열:", ones_array)
print("범위 배열 (0~10, 2씩):", range_array)
print("구간 배열 (0~100, 5개):", linspace_array)
print()

# ===== 2. 배열 연산 =====
print("=== 2. 배열 연산 ===")

# 2-1. 기본 산술 연산
print("📊 2-1. 센서 데이터 계산")
distances = np.array([8.5, 12.3, 15.7, 2.1, 9.8])
print("원본 거리:", distances)

# 모든 값에 동일한 연산 적용
distances_in_cm = distances * 100  # 미터를 센티미터로
distances_plus_offset = distances + 1.5  # 모든 값에 1.5 더하기

print("센티미터 변환:", distances_in_cm)
print("오프셋 적용:", distances_plus_offset)
print()

# 2-2. 배열 간 연산
print("📊 2-2. 두 센서 데이터 비교")
front_sensors = np.array([8.5, 12.3, 15.7])
rear_sensors = np.array([6.2, 9.1, 13.4])

print("전방 센서:", front_sensors)
print("후방 센서:", rear_sensors)
print("센서 차이:", front_sensors - rear_sensors)
print("평균 거리:", (front_sensors + rear_sensors) / 2)
print()

# ===== 3. 배열 통계 함수 =====
print("=== 3. 배열 통계 함수 ===")

print("📊 3-1. 센서 데이터 통계")
all_distances = np.array([8.5, 12.3, 15.7, 2.1, 9.8, 6.2, 11.4, 3.9])
print("전체 센서 데이터:", all_distances)

print("최대값:", np.max(all_distances))
print("최소값:", np.min(all_distances))
print("평균값:", np.mean(all_distances))
print("중간값:", np.median(all_distances))
print("표준편차:", np.std(all_distances))
print("합계:", np.sum(all_distances))
print()

# 3-2. 인덱스 찾기
print("📊 3-2. 특정 값의 위치 찾기")
max_index = np.argmax(all_distances)  # 최대값의 인덱스
min_index = np.argmin(all_distances)  # 최소값의 인덱스

print(f"가장 먼 거리: {all_distances[max_index]}m (인덱스: {max_index})")
print(f"가장 가까운 거리: {all_distances[min_index]}m (인덱스: {min_index})")
print()

# ===== 4. 조건부 필터링 =====
print("=== 4. 조건부 필터링 ===")

# 4-1. 조건으로 데이터 선택
print("📊 4-1. 위험 거리 감지 (5m 이하)")
dangerous_mask = all_distances <= 5.0  # 조건 마스크 생성
print("조건 마스크:", dangerous_mask)

dangerous_distances = all_distances[dangerous_mask]  # 조건에 맞는 값들
safe_distances = all_distances[all_distances > 5.0]  # 한 줄로 표현

print("위험 거리:", dangerous_distances)
print("안전 거리:", safe_distances)
print("위험 센서 개수:", len(dangerous_distances))
print("안전 센서 개수:", len(safe_distances))
print()

# 4-2. 복합 조건
print("📊 4-2. 복합 조건 (5m 이하 OR 15m 이상)")
extreme_distances = all_distances[(all_distances <= 5.0) | (all_distances >= 15.0)]
print("극한 거리 (너무 가깝거나 너무 먼):", extreme_distances)

normal_distances = all_distances[(all_distances > 5.0) & (all_distances < 15.0)]
print("정상 범위 거리:", normal_distances)
print()

# ===== 5. 2차원 배열 (매트릭스) =====
print("=== 5. 2차원 배열 (매트릭스) ===")

# 5-1. 2D 센서 배열 생성
print("📊 5-1. 다방향 센서 매트릭스")
# 4x4 센서 그리드 (전방, 우측, 후방, 좌측)
sensor_matrix = np.array([
    [8.5, 12.3, 15.7, 11.2],  # 전방 4개 센서
    [9.1, 6.8, 13.4, 7.5],    # 우측 4개 센서
    [10.2, 8.9, 14.1, 9.7],   # 후방 4개 센서
    [7.3, 11.6, 12.8, 6.4]    # 좌측 4개 센서
])

print("센서 매트릭스:")
print(sensor_matrix)
print("매트릭스 모양:", sensor_matrix.shape)  # (행, 열)
print("총 센서 개수:", sensor_matrix.size)
print()

# 5-2. 행/열별 연산
print("📊 5-2. 방향별 센서 분석")
print("전방 센서 (첫 번째 행):", sensor_matrix[0])
print("전방 센서 평균:", np.mean(sensor_matrix[0]))

print("모든 방향 평균:")
direction_names = ['전방', '우측', '후방', '좌측']
for i, direction in enumerate(direction_names):
    avg_distance = np.mean(sensor_matrix[i])
    print(f"  {direction}: {avg_distance:.2f}m")
print()

# 5-3. 전체 매트릭스 연산
print("📊 5-3. 전체 센서 통계")
print("전체 평균:", np.mean(sensor_matrix))
print("전체 최대:", np.max(sensor_matrix))
print("전체 최소:", np.min(sensor_matrix))

# 각 열 (센서 위치)별 평균
column_averages = np.mean(sensor_matrix, axis=0)  # axis=0: 행 방향으로 평균
print("센서 위치별 평균:", column_averages)

# 각 행 (방향)별 평균
row_averages = np.mean(sensor_matrix, axis=1)  # axis=1: 열 방향으로 평균
print("방향별 평균:", row_averages)
print()

# ===== 6. GPS 좌표 처리 =====
print("=== 6. GPS 좌표 처리 ===")

# 6-1. 위치 벡터
print("📊 6-1. 현재 위치와 목적지")
current_pos = np.array([127.123, 37.456])  # [경도, 위도]
destination = np.array([127.145, 37.478])

print("현재 위치:", current_pos)
print("목적지:", destination)

# 이동 벡터 계산
movement_vector = destination - current_pos
print("이동 벡터:", movement_vector)
print("경도 이동:", movement_vector[0])
print("위도 이동:", movement_vector[1])
print()

# 6-2. 거리 계산
print("📊 6-2. 직선 거리 계산")
# 유클리드 거리 공식: sqrt((x2-x1)^2 + (y2-y1)^2)
distance = np.sqrt(np.sum(movement_vector**2))
print("직선 거리:", distance)

# 맨하탄 거리 (격자 도로에서 실제 이동 거리)
manhattan_distance = np.sum(np.abs(movement_vector))
print("맨하탄 거리:", manhattan_distance)
print()

# ===== 7. 경로 생성 =====
print("=== 7. 경로 생성 ===")

# 7-1. 직선 경로 포인트 생성
print("📊 7-1. 자동 경로 생성")
num_waypoints = 8
route_x = np.linspace(current_pos[0], destination[0], num_waypoints)
route_y = np.linspace(current_pos[1], destination[1], num_waypoints)

print("경로 X 좌표:", route_x)
print("경로 Y 좌표:", route_y)

# 좌표를 하나의 2D 배열로 결합
route_points = np.column_stack((route_x, route_y))
print("경로 포인트 매트릭스:")
print(route_points)
print("경로 모양:", route_points.shape)
print()

# 7-2. 각 구간별 거리 계산
print("📊 7-2. 구간별 이동 거리")
# 연속된 포인트 간 거리 계산
segment_distances = []
for i in range(len(route_points) - 1):
    point1 = route_points[i]
    point2 = route_points[i + 1]
    segment_dist = np.sqrt(np.sum((point2 - point1)**2))
    segment_distances.append(segment_dist)
    print(f"구간 {i+1}: {segment_dist:.6f}")

total_route_distance = np.sum(segment_distances)
print(f"총 경로 거리: {total_route_distance:.6f}")
print()

# ===== 8. 실전 응용 - 장애물 회피 =====
print("=== 8. 실전 응용 - 장애물 회피 ===")

# 8-1. 장애물 위치
print("📊 8-1. 장애물 감지 및 분석")
obstacles = np.array([
    [127.130, 37.460],  # 장애물 1
    [127.135, 37.465],  # 장애물 2
    [127.140, 37.470]   # 장애물 3
])

print("감지된 장애물 위치:")
print(obstacles)

# 현재 위치에서 각 장애물까지의 거리
obstacle_distances = []
for i, obstacle in enumerate(obstacles):
    dist = np.sqrt(np.sum((obstacle - current_pos)**2))
    obstacle_distances.append(dist)
    print(f"장애물 {i+1}까지 거리: {dist:.6f}")

# 가장 가까운 장애물 찾기
closest_obstacle_index = np.argmin(obstacle_distances)
closest_distance = obstacle_distances[closest_obstacle_index]
print(f"가장 가까운 장애물: {closest_obstacle_index+1}번 (거리: {closest_distance:.6f})")
print()

# 8-2. 안전 반경 체크
print("📊 8-2. 안전 반경 체크")
safety_radius = 0.005  # 대략 500m 정도
dangerous_obstacles = []

for i, dist in enumerate(obstacle_distances):
    if dist <= safety_radius:
        dangerous_obstacles.append(i+1)
        print(f"⚠️ 장애물 {i+1}: 위험 구역 (거리: {dist:.6f})")
    else:
        print(f"✅ 장애물 {i+1}: 안전 (거리: {dist:.6f})")

if dangerous_obstacles:
    print(f"총 {len(dangerous_obstacles)}개 장애물이 위험 구역에 있습니다!")
else:
    print("모든 장애물이 안전 거리에 있습니다.")
print()

print("🎓 NumPy 기초 학습 완료!")
print("📚 학습한 내용:")
print("   ✅ 배열 생성 및 기본 연산")
print("   ✅ 통계 함수 (평균, 최대, 최소 등)")
print("   ✅ 조건부 필터링 (위험 감지)")
print("   ✅ 2D 배열 (센서 매트릭스)")
print("   ✅ GPS 좌표 처리")
print("   ✅ 경로 생성 및 거리 계산")
print("   ✅ 장애물 감지 및 안전 반경 체크")
print("\n🚗 다음은 Pandas로 주행 데이터를 분석해보겠습니다!")
print("="*60)

PANDAS

In [None]:
# 2단계: Pandas 기초 - 자율주행 데이터 분석
# 코랩에서 바로 실행 가능!

import pandas as pd
import numpy as np
print("🚗 자율주행 Pandas 기초 학습 시작!")
print("📦 Pandas 버전:", pd.__version__)
print()

# ===== 1. DataFrame 기초 - 주행 데이터 테이블 =====
print("=== 1. DataFrame 기초 ===")

# 1-1. 딕셔너리로 DataFrame 생성
print("📊 1-1. 주행 로그 데이터 생성")
# 자율주행차의 10분간 주행 데이터
driving_data = {
    'time': ['09:00', '09:01', '09:02', '09:03', '09:04', '09:05'],
    'speed': [0, 30, 60, 65, 45, 20],
    'battery': [100, 98, 95, 93, 91, 89],
    'distance': [0, 0.5, 1.5, 2.6, 3.4, 4.0]
}

df = pd.DataFrame(driving_data)
print("주행 데이터프레임:")
print(df)
print()

# 1-2. DataFrame 기본 정보
print("📊 1-2. 데이터프레임 기본 정보")
print("데이터 모양 (행, 열):", df.shape)        # (6, 4) - 6행 4열
print("컬럼 이름:", df.columns.tolist())         # ['time', 'speed', 'battery', 'distance']
print("인덱스:", df.index.tolist())              # [0, 1, 2, 3, 4, 5]
print("데이터 타입:")
print(df.dtypes)
print()

# 1-3. 데이터 미리보기
print("📊 1-3. 데이터 미리보기")
print("처음 3행:")
print(df.head(3))
print("\n마지막 3행:")
print(df.tail(3))
print()

# ===== 2. 컬럼 접근과 조작 =====
print("=== 2. 컬럼 접근과 조작 ===")

# 2-1. 컬럼 선택
print("📊 2-1. 특정 컬럼 선택")
# 하나의 컬럼 선택 (Series 반환)
speed_data = df['speed']
print("속도 데이터 타입:", type(speed_data))    # pandas.Series
print("속도 데이터:")
print(speed_data)
print()

# 여러 컬럼 선택 (DataFrame 반환)
speed_battery = df[['speed', 'battery']]
print("속도와 배터리 데이터:")
print(speed_battery)
print()

# 2-2. 새 컬럼 추가
print("📊 2-2. 새 컬럼 추가")
# 배터리 소모량 계산 (이전 값과의 차이)
df['battery_used'] = df['battery'].shift(1) - df['battery']
print("배터리 소모량 추가:")
print(df[['time', 'battery', 'battery_used']])
print()

# 에너지 효율성 계산 (km당 배터리 소모량)
df['efficiency'] = df['battery_used'] / (df['distance'].diff())
print("에너지 효율성 추가:")
print(df[['time', 'distance', 'battery_used', 'efficiency']])
print()

# ===== 3. 행 접근과 필터링 =====
print("=== 3. 행 접근과 필터링 ===")

# 3-1. 인덱스로 행 선택
print("📊 3-1. 인덱스로 행 선택")
# iloc: 위치 기반 선택
first_row = df.iloc[0]                    # 첫 번째 행
print("첫 번째 행:")
print(first_row)
print()

first_three = df.iloc[0:3]                # 처음 3행
print("처음 3행:")
print(first_three[['time', 'speed', 'battery']])
print()

# 3-2. 조건으로 행 필터링
print("📊 3-2. 조건 필터링")
# 고속 구간 (50km/h 이상)
high_speed = df[df['speed'] >= 50]
print("고속 구간 (50km/h 이상):")
print(high_speed[['time', 'speed', 'battery']])
print()

# 배터리 부족 구간 (95% 이하)
low_battery = df[df['battery'] <= 95]
print("배터리 부족 구간 (95% 이하):")
print(low_battery[['time', 'speed', 'battery']])
print()

# 복합 조건: 고속이면서 배터리 부족
critical = df[(df['speed'] >= 50) & (df['battery'] <= 95)]
print("위험 구간 (고속 + 배터리 부족):")
print(critical[['time', 'speed', 'battery']])
print()

# ===== 4. 기본 통계와 집계 =====
print("=== 4. 기본 통계와 집계 ===")

# 4-1. 기본 통계 정보
print("📊 4-1. 주행 데이터 기본 통계")
print("전체 통계:")
print(df.describe())
print()

# 4-2. 개별 통계
print("📊 4-2. 개별 통계 계산")
print("평균 속도:", df['speed'].mean())
print("최고 속도:", df['speed'].max())
print("최저 속도:", df['speed'].min())
print("속도 표준편차:", df['speed'].std())
print()

print("총 주행 거리:", df['distance'].max(), "km")
print("총 배터리 소모:", df['battery_used'].sum(), "%")
print("평균 효율성:", df['efficiency'].mean())
print()

# 4-3. 값 개수 세기
print("📊 4-3. 속도 구간별 개수")
# 속도를 구간으로 나누기
def speed_category(speed):
    if speed == 0:
        return '정지'
    elif speed <= 30:
        return '저속'
    elif speed <= 60:
        return '중속'
    else:
        return '고속'

df['speed_category'] = df['speed'].apply(speed_category)
speed_counts = df['speed_category'].value_counts()
print("속도 구간별 횟수:")
print(speed_counts)
print()

# ===== 5. 센서 데이터 DataFrame =====
print("=== 5. 센서 데이터 DataFrame ===")

# 5-1. 센서 데이터 생성
print("📊 5-1. 다중 센서 데이터")
sensor_data = {
    'sensor_id': ['CAM_01', 'LDR_01', 'RAD_01', 'CAM_02', 'LDR_02', 'RAD_02'],
    'sensor_type': ['camera', 'lidar', 'radar', 'camera', 'lidar', 'radar'],
    'position': ['front', 'front', 'front', 'rear', 'rear', 'rear'],
    'distance': [8.5, 12.3, 15.7, 6.2, 9.1, 11.4],
    'confidence': [0.95, 0.88, 0.92, 0.87, 0.91, 0.89],
    'status': ['active', 'active', 'warning', 'active', 'error', 'active']
}

sensor_df = pd.DataFrame(sensor_data)
print("센서 데이터프레임:")
print(sensor_df)
print()

# 5-2. 센서 타입별 그룹 분석
print("📊 5-2. 센서 타입별 분석")
# groupby: 같은 값끼리 그룹으로 묶어서 연산
sensor_groups = sensor_df.groupby('sensor_type')

print("센서 타입별 평균 거리:")
avg_distance = sensor_groups['distance'].mean()
print(avg_distance)
print()

print("센서 타입별 평균 신뢰도:")
avg_confidence = sensor_groups['confidence'].mean()
print(avg_confidence)
print()

# 5-3. 위치별 그룹 분석
print("📊 5-3. 센서 위치별 분석")
position_groups = sensor_df.groupby('position')

print("위치별 센서 개수:")
position_counts = position_groups.size()
print(position_counts)
print()

print("위치별 상태 분포:")
position_status = sensor_df.groupby(['position', 'status']).size()
print(position_status)
print()

# ===== 6. 데이터 정렬과 순위 =====
print("=== 6. 데이터 정렬과 순위 ===")

# 6-1. 단일 컬럼 정렬
print("📊 6-1. 거리순 센서 정렬")
# 거리 오름차순 정렬
distance_sorted = sensor_df.sort_values('distance')
print("거리 오름차순:")
print(distance_sorted[['sensor_id', 'distance', 'confidence']])
print()

# 거리 내림차순 정렬
distance_desc = sensor_df.sort_values('distance', ascending=False)
print("거리 내림차순:")
print(distance_desc[['sensor_id', 'distance', 'confidence']])
print()

# 6-2. 다중 컬럼 정렬
print("📊 6-2. 다중 기준 정렬")
# 위치별로 먼저 정렬하고, 그 다음 거리순 정렬
multi_sorted = sensor_df.sort_values(['position', 'distance'])
print("위치별 → 거리순 정렬:")
print(multi_sorted[['sensor_id', 'position', 'distance']])
print()

# 6-3. 순위 매기기
print("📊 6-3. 성능 순위")
# 신뢰도 기준 순위 (높을수록 좋음)
sensor_df['confidence_rank'] = sensor_df['confidence'].rank(ascending=False)
print("신뢰도 순위:")
print(sensor_df[['sensor_id', 'confidence', 'confidence_rank']].sort_values('confidence_rank'))
print()

# ===== 7. 결측값과 데이터 정리 =====
print("=== 7. 결측값과 데이터 정리 ===")

# 7-1. 결측값이 있는 데이터 생성
print("📊 7-1. 결측값 처리")
faulty_data = {
    'sensor': ['A', 'B', 'C', 'D', 'E'],
    'reading1': [8.5, np.nan, 12.3, 15.7, np.nan],  # NaN: 결측값
    'reading2': [6.2, 9.1, np.nan, 11.4, 8.8],
    'status': ['ok', 'error', 'ok', 'ok', 'error']
}

faulty_df = pd.DataFrame(faulty_data)
print("결측값이 있는 데이터:")
print(faulty_df)
print()

# 7-2. 결측값 확인
print("📊 7-2. 결측값 확인")
print("결측값 여부:")
print(faulty_df.isnull())
print()

print("컬럼별 결측값 개수:")
print(faulty_df.isnull().sum())
print()

# 7-3. 결측값 처리
print("📊 7-3. 결측값 처리 방법")

# 방법 1: 결측값 행 제거
cleaned_df = faulty_df.dropna()
print("결측값 행 제거:")
print(cleaned_df)
print()

# 방법 2: 평균값으로 채우기
filled_df = faulty_df.copy()
filled_df['reading1'] = filled_df['reading1'].fillna(filled_df['reading1'].mean())
filled_df['reading2'] = filled_df['reading2'].fillna(filled_df['reading2'].mean())
print("평균값으로 채우기:")
print(filled_df)
print()

# ===== 8. 시간 데이터 처리 =====
print("=== 8. 시간 데이터 처리 ===")

# 8-1. 시간 컬럼을 datetime 타입으로 변환
print("📊 8-1. 시간 데이터 변환")
# 더 상세한 시간 데이터
time_data = {
    'timestamp': ['2024-01-15 09:00:00', '2024-01-15 09:01:00',
                  '2024-01-15 09:02:00', '2024-01-15 09:03:00'],
    'speed': [0, 45, 60, 55],
    'location': ['집', '도로A', '도로B', '회사']
}

time_df = pd.DataFrame(time_data)
print("원본 시간 데이터:")
print(time_df)
print("timestamp 타입:", time_df['timestamp'].dtype)
print()

# 문자열을 datetime 타입으로 변환
time_df['timestamp'] = pd.to_datetime(time_df['timestamp'])
print("변환 후:")
print(time_df)
print("timestamp 타입:", time_df['timestamp'].dtype)
print()

# 8-2. 시간 기반 계산
print("📊 8-2. 시간 간격 계산")
# 이전 시간과의 차이 계산
time_df['time_diff'] = time_df['timestamp'].diff()
print("시간 간격:")
print(time_df[['timestamp', 'speed', 'time_diff']])
print()

# ===== 9. 실전 응용 - 주행 성능 분석 =====
print("=== 9. 실전 응용 - 주행 성능 분석 ===")

# 9-1. 종합 주행 데이터 생성
print("📊 9-1. 종합 주행 데이터")
performance_data = {
    'trip_id': [1, 1, 1, 2, 2, 2, 3, 3, 3, 3],
    'segment': ['start', 'highway', 'city', 'start', 'highway', 'city',
                'start', 'highway', 'city', 'parking'],
    'duration': [2, 15, 8, 3, 12, 10, 2, 18, 6, 5],  # 분
    'distance': [0.5, 18.0, 6.0, 0.8, 15.5, 8.2, 0.6, 22.0, 4.5, 0.3],  # km
    'fuel_used': [0.8, 12.5, 8.2, 1.1, 11.8, 9.5, 0.9, 14.2, 6.8, 0.5]  # 리터
}

perf_df = pd.DataFrame(performance_data)
print("주행 성능 데이터:")
print(perf_df)
print()

# 9-2. 여행별 통계
print("📊 9-2. 여행별 성능 분석")
trip_stats = perf_df.groupby('trip_id').agg({
    'duration': 'sum',      # 총 시간
    'distance': 'sum',      # 총 거리
    'fuel_used': 'sum'      # 총 연료
}).round(2)

print("여행별 총계:")
print(trip_stats)
print()

# 9-3. 구간별 효율성 분석
print("📊 9-3. 구간별 효율성")
segment_efficiency = perf_df.groupby('segment').agg({
    'distance': 'mean',     # 평균 거리
    'duration': 'mean',     # 평균 시간
    'fuel_used': 'mean'     # 평균 연료
}).round(2)

# 연비 계산 (km/L)
segment_efficiency['fuel_efficiency'] = (
    segment_efficiency['distance'] / segment_efficiency['fuel_used']
).round(2)

print("구간별 평균 성능:")
print(segment_efficiency)
print()

# 9-4. 최고/최악 성능 찾기
print("📊 9-4. 성능 극값 분석")
# 연비가 가장 좋은 구간
best_efficiency_idx = perf_df['distance'].sum() / perf_df['fuel_used'].sum()
print(f"전체 평균 연비: {best_efficiency_idx:.2f} km/L")

# 각 여행의 연비 계산
trip_efficiency = perf_df.groupby('trip_id').apply(
    lambda x: x['distance'].sum() / x['fuel_used'].sum()
).round(2)

print("여행별 연비:")
print(trip_efficiency)
print(f"가장 효율적인 여행: {trip_efficiency.idxmax()}번 ({trip_efficiency.max()} km/L)")
print(f"가장 비효율적인 여행: {trip_efficiency.idxmin()}번 ({trip_efficiency.min()} km/L)")
print()

print("🎓 Pandas 기초 학습 완료!")
print("📚 학습한 내용:")
print("   ✅ DataFrame 생성 및 기본 조작")
print("   ✅ 컬럼/행 선택 및 필터링")
print("   ✅ 기본 통계 및 집계 함수")
print("   ✅ groupby를 활용한 그룹 분석")
print("   ✅ 데이터 정렬 및 순위")
print("   ✅ 결측값 처리")
print("   ✅ 시간 데이터 처리")
print("   ✅ 실전 성능 분석")
print("\n🚗 다음은 NumPy + Pandas 통합 활용 예제입니다!")
print("="*60)