<a href="https://colab.research.google.com/github/jetsonmom/6.23_automobility_lesson/blob/main/%EC%88%98%EC%97%85_7~8_NumPy_%26_PANDAS_Matplotlib.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# 3. Matplotlib Basics - Autonomous Vehicle Data Visualization
# Ready to run in Google Colab!

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

print("🚗 Autonomous Vehicle Matplotlib Basics Started!")
print("📦 Matplotlib Backend:", plt.get_backend())
print()

# ===== 1. Basic Line Graph =====
print("=== 1. Basic Line Graph ===")

# 1-1. Most Basic Graph
print("📊 1-1. Basic Line Graph Creation")
# Time vs Speed data
time_minutes = [0, 1, 2, 3, 4, 5]  # minutes
speed_kmh = [0, 30, 60, 65, 45, 20]  # km/h

# Create basic graph
plt.figure(figsize=(8, 5))  # Set graph size (width 8, height 5 inches)
plt.plot(time_minutes, speed_kmh)  # x-axis: time, y-axis: speed
plt.title('Autonomous Vehicle Speed Change')  # title
plt.xlabel('Time (minutes)')  # x-axis label
plt.ylabel('Speed (km/h)')  # y-axis label
plt.show()  # display graph
print("✅ Basic line graph completed!")
print()

# 1-2. Graph Styling
print("📊 1-2. Graph Style Settings")
plt.figure(figsize=(10, 6))
plt.plot(time_minutes, speed_kmh,
         color='blue',      # line color
         linewidth=3,       # line thickness
         linestyle='-',     # line style ('-', '--', '-.', ':')
         marker='o',        # point shape ('o', 's', '^', 'v')
         markersize=8,      # point size
         label='Speed')     # label for legend

plt.title('Autonomous Vehicle Speed Change (Styled)', fontsize=16)
plt.xlabel('Time (minutes)', fontsize=12)
plt.ylabel('Speed (km/h)', fontsize=12)
plt.grid(True)  # show grid
plt.legend()    # show legend
plt.show()
print("✅ Styling applied!")
print()

# ===== 2. Multiple Data Graphs =====
print("=== 2. Multiple Data Graphs ===")

# 2-1. Multiple data in one graph
print("📊 2-1. Speed and Battery Display Together")
battery_percent = [100, 98, 95, 93, 91, 89]

plt.figure(figsize=(12, 6))

# First y-axis (speed)
ax1 = plt.gca()
ax1.plot(time_minutes, speed_kmh, 'b-o', linewidth=2, label='Speed (km/h)')
ax1.set_xlabel('Time (minutes)', fontsize=12)
ax1.set_ylabel('Speed (km/h)', color='blue', fontsize=12)
ax1.tick_params(axis='y', labelcolor='blue')

# Second y-axis (battery) - different scale requires separate axis
ax2 = ax1.twinx()  # create second y-axis
ax2.plot(time_minutes, battery_percent, 'r-s', linewidth=2, label='Battery (%)')
ax2.set_ylabel('Battery (%)', color='red', fontsize=12)
ax2.tick_params(axis='y', labelcolor='red')

plt.title('Speed and Battery Change', fontsize=16)

# Combine legends from both axes
lines1, labels1 = ax1.get_legend_handles_labels()
lines2, labels2 = ax2.get_legend_handles_labels()
ax1.legend(lines1 + lines2, labels1 + labels2, loc='upper right')

plt.tight_layout()
plt.show()
print("✅ Dual axis graph completed!")
print()

# 2-2. Subplots for separate display
print("📊 2-2. Subplot Separation Display")
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(10, 8))  # 2 rows, 1 column

# Top graph: Speed
ax1.plot(time_minutes, speed_kmh, 'b-o', linewidth=2)
ax1.set_title('Autonomous Vehicle Speed Change')
ax1.set_ylabel('Speed (km/h)')
ax1.grid(True)

# Bottom graph: Battery
ax2.plot(time_minutes, battery_percent, 'r-s', linewidth=2)
ax2.set_title('Battery Level Change')
ax2.set_xlabel('Time (minutes)')
ax2.set_ylabel('Battery (%)')
ax2.grid(True)

plt.tight_layout()  # auto-adjust subplot spacing
plt.show()
print("✅ Subplots completed!")
print()

# ===== 3. Scatter Plot - Sensor Data =====
print("=== 3. Scatter Plot - Sensor Data ===")

# 3-1. Basic Scatter Plot
print("📊 3-1. Sensor Distance Scatter Plot")
# Generate sensor data
np.random.seed(42)  # reproducible random data
sensor_angles = np.random.uniform(-180, 180, 50)  # angles -180~180 degrees
sensor_distances = np.random.uniform(2, 20, 50)   # distances 2~20m

plt.figure(figsize=(10, 8))
plt.scatter(sensor_angles, sensor_distances,
           c='blue',        # color
           s=50,            # point size
           alpha=0.7)       # transparency
plt.title('Sensor Detection Data (Angle vs Distance)', fontsize=16)
plt.xlabel('Angle (degrees)', fontsize=12)
plt.ylabel('Distance (m)', fontsize=12)
plt.grid(True, alpha=0.3)
plt.show()
print("✅ Basic scatter plot completed!")
print()

# 3-2. Color-coded scatter plot
print("📊 3-2. Risk Level Color Coding")
# Risk classification by distance
colors = []
for dist in sensor_distances:
    if dist < 5:
        colors.append('red')     # danger (red)
    elif dist < 10:
        colors.append('orange')  # caution (orange)
    else:
        colors.append('green')   # safe (green)

plt.figure(figsize=(10, 8))
plt.scatter(sensor_angles, sensor_distances, c=colors, s=60, alpha=0.8)
plt.title('Sensor Risk Analysis (Distance-based Color Coding)', fontsize=16)
plt.xlabel('Angle (degrees)', fontsize=12)
plt.ylabel('Distance (m)', fontsize=12)

# Show risk zones
plt.axhline(y=5, color='red', linestyle='--', alpha=0.5, label='Danger Line (5m)')
plt.axhline(y=10, color='orange', linestyle='--', alpha=0.5, label='Caution Line (10m)')

plt.grid(True, alpha=0.3)
plt.legend()
plt.show()
print("✅ Color-coded scatter plot completed!")
print()

# ===== 4. Histogram - Data Distribution =====
print("=== 4. Histogram - Data Distribution ===")

# 4-1. Basic Histogram
print("📊 4-1. Sensor Distance Distribution")
plt.figure(figsize=(10, 6))
plt.hist(sensor_distances,
         bins=10,           # number of bins
         color='skyblue',   # color
         alpha=0.7,         # transparency
         edgecolor='black') # border color
plt.title('Sensor Detection Distance Distribution', fontsize=16)
plt.xlabel('Distance (m)', fontsize=12)
plt.ylabel('Frequency', fontsize=12)
plt.grid(True, alpha=0.3)
plt.show()
print("✅ Basic histogram completed!")
print()

# 4-2. Comparison histogram
print("📊 4-2. Front vs Rear Sensor Comparison")
# Generate front and rear sensor data
front_sensors = np.random.normal(12, 3, 100)  # mean 12m, std 3
rear_sensors = np.random.normal(8, 2, 100)    # mean 8m, std 2

plt.figure(figsize=(12, 6))
plt.hist([front_sensors, rear_sensors],
         bins=15,
         label=['Front Sensors', 'Rear Sensors'],
         color=['blue', 'red'],
         alpha=0.6)
plt.title('Front vs Rear Sensor Distance Distribution Comparison', fontsize=16)
plt.xlabel('Distance (m)', fontsize=12)
plt.ylabel('Frequency', fontsize=12)
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()
print("✅ Comparison histogram completed!")
print()

# ===== 5. Bar Chart - Categorical Data =====
print("=== 5. Bar Chart - Categorical Data ===")

# 5-1. Basic Bar Chart
print("📊 5-1. Sensor Type Count")
sensor_types = ['Camera', 'LiDAR', 'Radar', 'Ultrasonic']
sensor_counts = [8, 4, 6, 12]

plt.figure(figsize=(10, 6))
bars = plt.bar(sensor_types, sensor_counts,
               color=['blue', 'green', 'red', 'orange'])
plt.title('Sensor Type Count by Vehicle', fontsize=16)
plt.xlabel('Sensor Type', fontsize=12)
plt.ylabel('Count', fontsize=12)

# Display values on top of bars
for bar, count in zip(bars, sensor_counts):
    plt.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.1,
             str(count), ha='center', va='bottom', fontsize=12)

plt.grid(True, alpha=0.3)
plt.show()
print("✅ Basic bar chart completed!")
print()

# 5-2. Grouped Bar Chart
print("📊 5-2. Vehicle Sensor Comparison")
vehicles = ['Model A', 'Model B', 'Model C']
camera_counts = [6, 8, 10]
lidar_counts = [2, 4, 4]
radar_counts = [4, 6, 8]

x = np.arange(len(vehicles))  # vehicle positions
width = 0.25  # bar width

plt.figure(figsize=(12, 6))
plt.bar(x - width, camera_counts, width, label='Camera', color='blue')
plt.bar(x, lidar_counts, width, label='LiDAR', color='green')
plt.bar(x + width, radar_counts, width, label='Radar', color='red')

plt.title('Sensor Configuration by Vehicle Model', fontsize=16)
plt.xlabel('Vehicle Model', fontsize=12)
plt.ylabel('Sensor Count', fontsize=12)
plt.xticks(x, vehicles)
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()
print("✅ Grouped bar chart completed!")
print()

# ===== 6. Route Visualization - GPS Coordinates =====
print("=== 6. Route Visualization - GPS Coordinates ===")

# 6-1. Basic Route Graph
print("📊 6-1. Autonomous Driving Route")
# GPS coordinate data (Seoul area)
route_lat = [37.566, 37.568, 37.570, 37.572, 37.574, 37.576]  # latitude
route_lon = [126.978, 126.980, 126.982, 126.984, 126.986, 126.988]  # longitude

plt.figure(figsize=(10, 8))
plt.plot(route_lon, route_lat, 'b-o', linewidth=3, markersize=8)

# Mark start and end points
plt.scatter(route_lon[0], route_lat[0], color='green', s=200,
           marker='s', label='Start', zorder=5)
plt.scatter(route_lon[-1], route_lat[-1], color='red', s=200,
           marker='s', label='Destination', zorder=5)

plt.title('Autonomous Driving Route (GPS Coordinates)', fontsize=16)
plt.xlabel('Longitude', fontsize=12)
plt.ylabel('Latitude', fontsize=12)
plt.grid(True, alpha=0.3)
plt.legend()
plt.axis('equal')  # equal x, y axis ratio
plt.show()
print("✅ Basic route visualization completed!")
print()

# 6-2. Speed-based Route Colors
print("📊 6-2. Speed-based Route Colors")
route_speeds = [30, 50, 45, 60, 40, 25]  # speed for each segment

plt.figure(figsize=(12, 8))

# Draw lines with different colors for each segment
for i in range(len(route_lat)-1):
    speed = route_speeds[i]
    if speed >= 50:
        color = 'red'      # high speed
        width = 4
    elif speed >= 40:
        color = 'orange'   # medium speed
        width = 3
    else:
        color = 'blue'     # low speed
        width = 2

    plt.plot([route_lon[i], route_lon[i+1]],
             [route_lat[i], route_lat[i+1]],
             color=color, linewidth=width)

# Display points
plt.scatter(route_lon, route_lat, c=route_speeds,
           cmap='coolwarm', s=100, edgecolor='black', linewidth=1)

# Add colorbar
cbar = plt.colorbar()
cbar.set_label('Speed (km/h)', fontsize=12)

plt.title('Route Color Change by Speed', fontsize=16)
plt.xlabel('Longitude', fontsize=12)
plt.ylabel('Latitude', fontsize=12)
plt.grid(True, alpha=0.3)
plt.show()
print("✅ Speed-based route visualization completed!")
print()

# ===== 7. Dashboard Style - Comprehensive Monitoring =====
print("=== 7. Dashboard Style - Comprehensive Monitoring ===")

print("📊 7-1. Autonomous Vehicle Dashboard")
# Prepare comprehensive data
time_data = np.arange(0, 10, 0.5)  # 0~9.5 minutes, 0.5 minute intervals
speed_data = 50 + 10 * np.sin(time_data) + np.random.normal(0, 2, len(time_data))
battery_data = 100 - time_data * 1.5 - np.random.normal(0, 0.5, len(time_data))
distance_data = time_data * 0.8 + np.random.normal(0, 0.1, len(time_data))

# Create 2x2 subplots
fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 10))

# 1. Speed graph
ax1.plot(time_data, speed_data, 'b-', linewidth=2)
ax1.set_title('Real-time Speed', fontsize=14, fontweight='bold')
ax1.set_ylabel('Speed (km/h)')
ax1.grid(True, alpha=0.3)
ax1.set_ylim(20, 80)

# 2. Battery graph
ax2.plot(time_data, battery_data, 'r-', linewidth=2)
ax2.set_title('Battery Level', fontsize=14, fontweight='bold')
ax2.set_ylabel('Battery (%)')
ax2.grid(True, alpha=0.3)
ax2.set_ylim(80, 105)

# 3. Cumulative distance
ax3.plot(time_data, distance_data, 'g-', linewidth=2)
ax3.set_title('Cumulative Driving Distance', fontsize=14, fontweight='bold')
ax3.set_xlabel('Time (minutes)')
ax3.set_ylabel('Distance (km)')
ax3.grid(True, alpha=0.3)

# 4. Sensor status (bar chart)
sensor_names = ['Front', 'Rear', 'Left', 'Right']
sensor_distances = [8.5, 6.2, 7.8, 9.1]
colors = ['green' if d > 7 else 'orange' if d > 5 else 'red' for d in sensor_distances]

bars = ax4.bar(sensor_names, sensor_distances, color=colors)
ax4.set_title('Sensor Distance Status', fontsize=14, fontweight='bold')
ax4.set_ylabel('Distance (m)')
ax4.set_ylim(0, 12)

# Display values on top of bars
for bar, dist in zip(bars, sensor_distances):
    ax4.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.2,
             f'{dist:.1f}m', ha='center', va='bottom')

plt.suptitle('🚗 Autonomous Vehicle Real-time Monitoring Dashboard',
             fontsize=18, fontweight='bold', y=0.98)
plt.tight_layout()
plt.show()
print("✅ Comprehensive dashboard completed!")
print()

print("🎓 Matplotlib Basics Learning Completed!")
print("📚 Learned Contents:")
print("   ✅ Basic line graphs (speed, battery changes)")
print("   ✅ Multiple data visualization (dual axis, subplots)")
print("   ✅ Scatter plots (sensor data, color coding)")
print("   ✅ Histograms (data distribution analysis)")
print("   ✅ Bar charts (sensor types, vehicle comparison)")
print("   ✅ Route visualization (GPS coordinates, speed-based colors)")
print("   ✅ Dashboard (comprehensive monitoring screen)")
print("\n🚗 Next: NumPy + Pandas + Matplotlib Integration Project!")
print("="*60)

In [None]:
import matplotlib.pyplot as plt
import matplotlib as mpl
import matplotlib.font_manager as fm
import platform
import os

# OS별 폰트 설정
if platform.system() == 'Linux':
    # 1. 나눔폰트 설치
    !apt-get -qq update
    !apt-get -qq install -y fonts-nanum

    # 2. 폰트 경로 확인 및 설정
    font_path = '/usr/share/fonts/truetype/nanum/NanumGothic.ttf'
    if os.path.exists(font_path):
        font_name = fm.FontProperties(fname=font_path).get_name()
        mpl.rc('font', family=font_name)
        print(f"✅ 한글 폰트 적용됨: {font_name}")
    else:
        print("❌ 폰트 파일을 찾을 수 없습니다.")

elif platform.system() == 'Windows':
    mpl.rc('font', family='Malgun Gothic')
elif platform.system() == 'Darwin':
    mpl.rc('font', family='AppleGothic')

# 마이너스 기호 깨짐 방지
mpl.rcParams['axes.unicode_minus'] = False


In [None]:
# 사용 가능한 폰트 목록 출력
import matplotlib.font_manager as fm
for f in fm.findSystemFonts(fontpaths=None, fontext='ttf'):
    if 'Nanum' in f:
        print(f)


In [None]:
# 4단계: 통합 프로젝트 - 자율주행 데이터 사이언스
# NumPy + Pandas + Matplotlib 완전 통합!
# 코랩에서 바로 실행 가능!

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from datetime import datetime, timedelta
import warnings
warnings.filterwarnings('ignore')

print("🚗 자율주행 데이터 사이언스 통합 프로젝트 시작!")
print("📦 사용 라이브러리:")
print(f"   NumPy: {np.__version__}")
print(f"   Pandas: {pd.__version__}")
print(f"   Matplotlib: {plt.matplotlib.__version__}")
print()

# ===== STEP 1: 기초 데이터 생성 (NumPy 활용) =====
print("=== STEP 1: 센서 데이터 생성 (NumPy) ===")

# 1-1. 시뮬레이션 설정
print("📊 1-1. 자율주행 시뮬레이션 설정")
# 30분간의 주행 데이터 (1분 간격)
simulation_minutes = 30
time_points = np.arange(0, simulation_minutes + 1, 1)  # 0~30분, 1분 간격
print(f"시뮬레이션 시간: {simulation_minutes}분")
print(f"데이터 포인트: {len(time_points)}개")
print(f"시간 배열: {time_points[:5]}... (처음 5개)")
print()

# 1-2. 속도 데이터 생성 (NumPy 활용)
print("📊 1-2. 속도 패턴 생성")
# 실제 주행과 비슷한 속도 패턴 생성
np.random.seed(42)  # 재현 가능한 결과

# 기본 속도 패턴: 출발 → 가속 → 순항 → 감속 → 도착
base_speed = np.zeros(len(time_points))
base_speed[0:5] = np.linspace(0, 40, 5)        # 출발~가속 (0-40km/h)
base_speed[5:15] = 60 + np.random.normal(0, 5, 10)  # 순항 (60±5km/h)
base_speed[15:25] = 45 + np.random.normal(0, 3, 10) # 시내 (45±3km/h)
base_speed[25:31] = np.linspace(30, 0, 6)      # 감속~정지

# 음수 속도 제거 (물리적으로 불가능)
speed_data = np.maximum(base_speed, 0)

print(f"평균 속도: {np.mean(speed_data):.1f} km/h")
print(f"최고 속도: {np.max(speed_data):.1f} km/h")
print(f"속도 표준편차: {np.std(speed_data):.1f} km/h")
print()

# 1-3. 배터리 소모 계산 (NumPy 활용)
print("📊 1-3. 배터리 소모 모델링")
# 속도에 비례한 배터리 소모 + 기본 소모량
base_consumption = 0.5  # 분당 기본 소모량 (%)
speed_factor = 0.02     # 속도 비례 계수

battery_consumption = base_consumption + speed_data * speed_factor
battery_levels = 100 - np.cumsum(battery_consumption)  # 누적 소모

print(f"시작 배터리: {battery_levels[0]:.1f}%")
print(f"끝 배터리: {battery_levels[-1]:.1f}%")
print(f"총 소모량: {100 - battery_levels[-1]:.1f}%")
print()

# 1-4. GPS 좌표 생성 (NumPy 활용)
print("📊 1-4. GPS 경로 데이터 생성")
# 서울 시내 가상 경로
start_lat, start_lon = 37.566, 126.978  # 시작점 (명동 근처)
end_lat, end_lon = 37.580, 126.990      # 종료점 (종로 근처)

# 직선 경로에 약간의 변동 추가 (실제 도로처럼)
lat_base = np.linspace(start_lat, end_lat, len(time_points))
lon_base = np.linspace(start_lon, end_lon, len(time_points))

# 실제 도로의 곡선 효과 추가
lat_noise = np.random.normal(0, 0.0005, len(time_points))
lon_noise = np.random.normal(0, 0.0005, len(time_points))

latitude = lat_base + lat_noise
longitude = lon_base + lon_noise

print(f"시작 좌표: ({latitude[0]:.6f}, {longitude[0]:.6f})")
print(f"종료 좌표: ({latitude[-1]:.6f}, {longitude[-1]:.6f})")

# 총 이동 거리 계산 (간단한 근사)
total_distance = np.sqrt((end_lat - start_lat)**2 + (end_lon - start_lon)**2) * 111  # 대략적 km 변환
print(f"직선 거리: 약 {total_distance:.1f} km")
print()

# ===== STEP 2: 데이터프레임 생성 (Pandas 활용) =====
print("=== STEP 2: 데이터프레임 생성 (Pandas) ===")

# 2-1. 기본 주행 데이터프레임
print("📊 2-1. 주행 로그 데이터프레임 생성")
# 실제 시간 스탬프 생성
start_time = datetime(2024, 1, 15, 9, 0, 0)  # 2024년 1월 15일 오전 9시

# 수정된 코드
timestamps = [start_time + timedelta(minutes=int(i)) for i in time_points]
# 메인 데이터프레임 생성
driving_df = pd.DataFrame({
    'timestamp': timestamps,
    'time_minutes': time_points,
    'speed_kmh': speed_data,
    'battery_percent': battery_levels,
    'latitude': latitude,
    'longitude': longitude
})

print("주행 데이터프레임 기본 정보:")
print(f"행 수: {len(driving_df)}")
print(f"열 수: {len(driving_df.columns)}")
print("\n처음 5행:")
print(driving_df.head())
print()

# 2-2. 파생 변수 생성 (Pandas 활용)
print("📊 2-2. 파생 변수 계산")

# 이동 거리 계산 (이전 포인트와의 차이)
driving_df['lat_diff'] = driving_df['latitude'].diff()
driving_df['lon_diff'] = driving_df['longitude'].diff()
driving_df['distance_km'] = np.sqrt(driving_df['lat_diff']**2 + driving_df['lon_diff']**2) * 111
driving_df['cumulative_distance'] = driving_df['distance_km'].cumsum()

# 배터리 소모율 계산
driving_df['battery_used'] = driving_df['battery_percent'].diff() * -1  # 음수를 양수로

# 연비 계산 (km당 배터리 소모량)
driving_df['efficiency_km_per_percent'] = driving_df['distance_km'] / driving_df['battery_used']

# 속도 구간 분류
def classify_speed(speed):
    if speed <= 20:
        return '저속'
    elif speed <= 50:
        return '중속'
    else:
        return '고속'

driving_df['speed_category'] = driving_df['speed_kmh'].apply(classify_speed)

print("파생 변수 추가 완료:")
print("- distance_km: 구간별 이동 거리")
print("- cumulative_distance: 누적 이동 거리")
print("- battery_used: 구간별 배터리 소모량")
print("- efficiency_km_per_percent: 연비")
print("- speed_category: 속도 구간")
print()

# 2-3. 기본 통계 (Pandas 활용)
print("📊 2-3. 주행 데이터 기본 통계")
print("전체 통계:")
print(driving_df[['speed_kmh', 'battery_percent', 'distance_km']].describe())
print()

print("속도 구간별 통계:")
speed_stats = driving_df.groupby('speed_category').agg({
    'speed_kmh': ['mean', 'count'],
    'battery_used': 'sum',
    'distance_km': 'sum'
}).round(2)
print(speed_stats)
print()

# ===== STEP 3: 센서 데이터 시뮬레이션 (NumPy + Pandas) =====
print("=== STEP 3: 센서 데이터 시뮬레이션 ===")

# 3-1. 다중 센서 데이터 생성 (NumPy)
print("📊 3-1. 다방향 센서 데이터 생성")
n_sensors = 8  # 8방향 센서
n_readings = len(time_points)

# 각 방향별 센서 (0도=전방, 시계방향)
sensor_angles = np.array([0, 45, 90, 135, 180, 225, 270, 315])
sensor_names = ['전방', '우전방', '우측', '우후방', '후방', '좌후방', '좌측', '좌전방']

# 시간에 따른 센서 데이터 생성
np.random.seed(42)
sensor_data_matrix = np.zeros((n_readings, n_sensors))

for i, angle in enumerate(sensor_angles):
    # 기본 거리 + 노이즈 + 각도별 특성
    base_distance = 8 + 2 * np.sin(np.radians(angle))  # 각도별 기본 거리
    noise = np.random.normal(0, 1, n_readings)          # 랜덤 노이즈
    time_variation = np.sin(time_points * 0.2) * 2      # 시간에 따른 변화

    sensor_data_matrix[:, i] = np.maximum(base_distance + noise + time_variation, 1.0)

print(f"센서 데이터 매트릭스 크기: {sensor_data_matrix.shape}")
print(f"센서 방향: {sensor_names}")
print()

# 3-2. 센서 데이터프레임 생성 (Pandas)
print("📊 3-2. 센서 데이터프레임 생성")
# 긴 형태(long format)로 센서 데이터 정리
sensor_records = []

for time_idx, time_point in enumerate(time_points):
    for sensor_idx, (angle, name) in enumerate(zip(sensor_angles, sensor_names)):
        record = {
            'timestamp': timestamps[time_idx],
            'time_minutes': time_point,
            'sensor_name': name,
            'sensor_angle': angle,
            'distance_m': sensor_data_matrix[time_idx, sensor_idx],
            'is_critical': sensor_data_matrix[time_idx, sensor_idx] < 3.0  # 3m 이하면 위험
        }
        sensor_records.append(record)

sensor_df = pd.DataFrame(sensor_records)
print(f"센서 레코드 수: {len(sensor_df)}")
print("센서 데이터 샘플:")
print(sensor_df.head(10))
print()

# 3-3. 센서 위험 상황 분석 (Pandas)
print("📊 3-3. 센서 위험 상황 분석")
critical_situations = sensor_df[sensor_df['is_critical']]
print(f"총 위험 상황: {len(critical_situations)}회")

danger_by_sensor = critical_situations.groupby('sensor_name').size().sort_values(ascending=False)
print("센서별 위험 감지 횟수:")
print(danger_by_sensor)
print()

danger_by_time = critical_situations.groupby('time_minutes').size()
if len(danger_by_time) > 0:
    print(f"가장 위험한 시간: {danger_by_time.idxmax()}분 ({danger_by_time.max()}개 센서)")
print()

# ===== STEP 4: 종합 시각화 (Matplotlib) =====
print("=== STEP 4: 종합 데이터 시각화 ===")

# 4-1. 주행 성능 대시보드
print("📊 4-1. 주행 성능 대시보드 생성")
fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(16, 12))

# 좌상: 속도 변화
ax1.plot(driving_df['time_minutes'], driving_df['speed_kmh'], 'b-', linewidth=2)
ax1.set_title('속도 변화', fontsize=14, fontweight='bold')
ax1.set_ylabel('속도 (km/h)')
ax1.grid(True, alpha=0.3)
ax1.set_ylim(0, max(driving_df['speed_kmh']) + 10)

# 우상: 배터리 잔량
ax2.plot(driving_df['time_minutes'], driving_df['battery_percent'], 'r-', linewidth=2)
ax2.set_title('배터리 잔량', fontsize=14, fontweight='bold')
ax2.set_ylabel('배터리 (%)')
ax2.grid(True, alpha=0.3)
ax2.set_ylim(min(driving_df['battery_percent']) - 5, 105)

# 좌하: 누적 주행 거리
ax3.plot(driving_df['time_minutes'], driving_df['cumulative_distance'], 'g-', linewidth=2)
ax3.set_title('누적 주행 거리', fontsize=14, fontweight='bold')
ax3.set_xlabel('시간 (분)')
ax3.set_ylabel('거리 (km)')
ax3.grid(True, alpha=0.3)

# 우하: 속도 구간별 분포
speed_counts = driving_df['speed_category'].value_counts()
colors = ['blue', 'orange', 'red']
bars = ax4.bar(speed_counts.index, speed_counts.values, color=colors[:len(speed_counts)])
ax4.set_title('속도 구간별 분포', fontsize=14, fontweight='bold')
ax4.set_xlabel('속도 구간')
ax4.set_ylabel('횟수')

# 막대 위에 값 표시
for bar, count in zip(bars, speed_counts.values):
    ax4.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.5,
             str(count), ha='center', va='bottom')

plt.suptitle('🚗 자율주행 성능 대시보드', fontsize=18, fontweight='bold')
plt.tight_layout()
plt.show()
print("✅ 성능 대시보드 완성!")
print()

# 4-2. GPS 경로 시각화
print("📊 4-2. GPS 경로 및 센서 위험도 시각화")
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 6))

# 좌측: GPS 경로 (속도별 색상)
scatter = ax1.scatter(driving_df['longitude'], driving_df['latitude'],
                     c=driving_df['speed_kmh'], cmap='coolwarm', s=50)
ax1.plot(driving_df['longitude'], driving_df['latitude'], 'k-', alpha=0.5, linewidth=1)

# 시작점과 끝점 표시
ax1.scatter(driving_df['longitude'].iloc[0], driving_df['latitude'].iloc[0],
           color='green', s=200, marker='s', label='출발지', zorder=5)
ax1.scatter(driving_df['longitude'].iloc[-1], driving_df['latitude'].iloc[-1],
           color='red', s=200, marker='s', label='목적지', zorder=5)

ax1.set_title('GPS 경로 (속도별 색상)', fontsize=14, fontweight='bold')
ax1.set_xlabel('경도')
ax1.set_ylabel('위도')
ax1.legend()
ax1.grid(True, alpha=0.3)

# 컬러바 추가
cbar1 = plt.colorbar(scatter, ax=ax1)
cbar1.set_label('속도 (km/h)')

# 우측: 센서 위험도 히트맵
pivot_sensor = sensor_df.pivot_table(values='distance_m', index='time_minutes',
                                     columns='sensor_name', aggfunc='mean')
im = ax2.imshow(pivot_sensor.T, cmap='RdYlGn', aspect='auto', origin='lower')
ax2.set_title('센서 거리 히트맵 (시간별)', fontsize=14, fontweight='bold')
ax2.set_xlabel('시간 인덱스')
ax2.set_ylabel('센서 방향')
ax2.set_yticks(range(len(sensor_names)))
ax2.set_yticklabels(sensor_names)

# 컬러바 추가
cbar2 = plt.colorbar(im, ax=ax2)
cbar2.set_label('거리 (m)')

plt.tight_layout()
plt.show()
print("✅ 경로 및 센서 시각화 완성!")
print()

# ===== STEP 5: 종합 분석 및 인사이트 =====
print("=== STEP 5: 종합 분석 및 인사이트 ===")

# 5-1. 주요 성능 지표 계산
print("📊 5-1. 주요 성능 지표")
total_time = driving_df['time_minutes'].max()
total_distance = driving_df['cumulative_distance'].max()
total_battery_used = driving_df['battery_percent'].iloc[0] - driving_df['battery_percent'].iloc[-1]
avg_speed = total_distance / (total_time / 60)  # km/h 변환
efficiency = total_distance / total_battery_used  # km/%

print(f"📈 주행 성능 요약:")
print(f"   총 주행 시간: {total_time} 분")
print(f"   총 주행 거리: {total_distance:.2f} km")
print(f"   평균 속도: {avg_speed:.1f} km/h")
print(f"   배터리 소모: {total_battery_used:.1f} %")
print(f"   연비: {efficiency:.2f} km/% (거리/배터리소모)")
print()

# 5-2. 안전성 분석
print("📊 5-2. 안전성 분석")
critical_rate = len(critical_situations) / len(sensor_df) * 100
safe_driving_time = len(driving_df[driving_df['speed_kmh'] <= 60]) / len(driving_df) * 100

print(f"🛡️ 안전성 요약:")
print(f"   센서 위험 감지율: {critical_rate:.1f}%")
print(f"   안전 속도 준수율: {safe_driving_time:.1f}%")
print(f"   가장 위험한 센서: {danger_by_sensor.index[0] if len(danger_by_sensor) > 0 else 'None'}")
print(f"   최고 위험 시간대: {danger_by_time.idxmax() if len(danger_by_time) > 0 else 'None'}")
print()

# 5-3. 최종 권장사항
print("📊 5-3. 데이터 기반 권장사항")
print("💡 분석 결과 및 개선 방안:")

if avg_speed > 50:
    print("   ⚠️ 평균 속도가 높습니다. 안전 운행을 위해 속도 조절을 권장합니다.")
else:
    print("   ✅ 적절한 속도로 안전하게 주행했습니다.")

if efficiency < 1.0:
    print("   ⚠️ 연비가 낮습니다. 급가속/급제동을 줄여보세요.")
else:
    print("   ✅ 효율적인 주행 패턴을 보여줍니다.")

if critical_rate > 10:
    print("   ⚠️ 센서 위험 감지가 빈번합니다. 주변 환경 주의가 필요합니다.")
else:
    print("   ✅ 안전한 환경에서 주행했습니다.")

print()
print("🎓 자율주행 데이터 사이언스 통합 프로젝트 완료!")
print("📚 활용된 기술:")
print("   🔢 NumPy: 센서 데이터 생성, 수치 계산, 배열 연산")
print("   📊 Pandas: 데이터프레임 관리, 통계 분석, 그룹 연산")
print("   📈 Matplotlib: 대시보드, 경로 시각화, 히트맵")
print("   🚗 자율주행: GPS 추적, 센서 융합, 성능 분석")
print("="*70)





In [None]:
# 4단계: 통합 프로젝트 - 자율주행 데이터 사이언스
# NumPy + Pandas + Matplotlib 완전 통합!
# 코랩에서 바로 실행 가능!

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from datetime import datetime, timedelta
import warnings
warnings.filterwarnings('ignore')

print("🚗 자율주행 데이터 사이언스 통합 프로젝트 시작!")
print("📦 사용 라이브러리:")
print(f"   NumPy: {np.__version__}")
print(f"   Pandas: {pd.__version__}")
print(f"   Matplotlib: {plt.matplotlib.__version__}")
print()

# ===== STEP 1: 기초 데이터 생성 (NumPy 활용) =====
print("=== STEP 1: 센서 데이터 생성 (NumPy) ===")

# 1-1. 시뮬레이션 설정
print("📊 1-1. 자율주행 시뮬레이션 설정")
# 30분간의 주행 데이터 (1분 간격)
simulation_minutes = 30
time_points = np.arange(0, simulation_minutes + 1, 1)  # 0~30분, 1분 간격
print(f"시뮬레이션 시간: {simulation_minutes}분")
print(f"데이터 포인트: {len(time_points)}개")
print(f"시간 배열: {time_points[:5]}... (처음 5개)")
print()

# 1-2. 속도 데이터 생성 (NumPy 활용)
print("📊 1-2. 속도 패턴 생성")
# 실제 주행과 비슷한 속도 패턴 생성
np.random.seed(42)  # 재현 가능한 결과

# 기본 속도 패턴: 출발 → 가속 → 순항 → 감속 → 도착
base_speed = np.zeros(len(time_points))
base_speed[0:5] = np.linspace(0, 40, 5)        # 출발~가속 (0-40km/h)
base_speed[5:15] = 60 + np.random.normal(0, 5, 10)  # 순항 (60±5km/h)
base_speed[15:25] = 45 + np.random.normal(0, 3, 10) # 시내 (45±3km/h)
base_speed[25:31] = np.linspace(30, 0, 6)      # 감속~정지

# 음수 속도 제거 (물리적으로 불가능)
speed_data = np.maximum(base_speed, 0)

print(f"평균 속도: {np.mean(speed_data):.1f} km/h")
print(f"최고 속도: {np.max(speed_data):.1f} km/h")
print(f"속도 표준편차: {np.std(speed_data):.1f} km/h")
print()

# 1-3. 배터리 소모 계산 (NumPy 활용)
print("📊 1-3. 배터리 소모 모델링")
# 속도에 비례한 배터리 소모 + 기본 소모량
base_consumption = 0.5  # 분당 기본 소모량 (%)
speed_factor = 0.02     # 속도 비례 계수

battery_consumption = base_consumption + speed_data * speed_factor
battery_levels = 100 - np.cumsum(battery_consumption)  # 누적 소모

print(f"시작 배터리: {battery_levels[0]:.1f}%")
print(f"끝 배터리: {battery_levels[-1]:.1f}%")
print(f"총 소모량: {100 - battery_levels[-1]:.1f}%")
print()

# 1-4. GPS 좌표 생성 (NumPy 활용)
print("📊 1-4. GPS 경로 데이터 생성")
# 서울 시내 가상 경로
start_lat, start_lon = 37.566, 126.978  # 시작점 (명동 근처)
end_lat, end_lon = 37.580, 126.990      # 종료점 (종로 근처)

# 직선 경로에 약간의 변동 추가 (실제 도로처럼)
lat_base = np.linspace(start_lat, end_lat, len(time_points))
lon_base = np.linspace(start_lon, end_lon, len(time_points))

# 실제 도로의 곡선 효과 추가
lat_noise = np.random.normal(0, 0.0005, len(time_points))
lon_noise = np.random.normal(0, 0.0005, len(time_points))

latitude = lat_base + lat_noise
longitude = lon_base + lon_noise

print(f"시작 좌표: ({latitude[0]:.6f}, {longitude[0]:.6f})")
print(f"종료 좌표: ({latitude[-1]:.6f}, {longitude[-1]:.6f})")

# 총 이동 거리 계산 (간단한 근사)
total_distance = np.sqrt((end_lat - start_lat)**2 + (end_lon - start_lon)**2) * 111  # 대략적 km 변환
print(f"직선 거리: 약 {total_distance:.1f} km")
print()

# ===== STEP 2: 데이터프레임 생성 (Pandas 활용) =====
print("=== STEP 2: 데이터프레임 생성 (Pandas) ===")

# 2-1. 기본 주행 데이터프레임
print("📊 2-1. 주행 로그 데이터프레임 생성")
# 실제 시간 스탬프 생성
start_time = datetime(2024, 1, 15, 9, 0, 0)  # 2024년 1월 15일 오전 9시
timestamps = [start_time + timedelta(minutes=int(i)) for i in time_points]

# 메인 데이터프레임 생성
driving_df = pd.DataFrame({
    'timestamp': timestamps,
    'time_minutes': time_points,
    'speed_kmh': speed_data,
    'battery_percent': battery_levels,
    'latitude': latitude,
    'longitude': longitude
})

print("주행 데이터프레임 기본 정보:")
print(f"행 수: {len(driving_df)}")
print(f"열 수: {len(driving_df.columns)}")
print("\n처음 5행:")
print(driving_df.head())
print()

# 2-2. 파생 변수 생성 (Pandas 활용)
print("📊 2-2. 파생 변수 계산")

# 이동 거리 계산 (이전 포인트와의 차이)
driving_df['lat_diff'] = driving_df['latitude'].diff()
driving_df['lon_diff'] = driving_df['longitude'].diff()
driving_df['distance_km'] = np.sqrt(driving_df['lat_diff']**2 + driving_df['lon_diff']**2) * 111
driving_df['cumulative_distance'] = driving_df['distance_km'].cumsum()

# 배터리 소모율 계산
driving_df['battery_used'] = driving_df['battery_percent'].diff() * -1  # 음수를 양수로

# 연비 계산 (km당 배터리 소모량)
driving_df['efficiency_km_per_percent'] = driving_df['distance_km'] / driving_df['battery_used']

# 속도 구간 분류 (영어로 변경)
def classify_speed(speed):
    if speed <= 20:
        return 'Low'
    elif speed <= 50:
        return 'Medium'
    else:
        return 'High'

driving_df['speed_category'] = driving_df['speed_kmh'].apply(classify_speed)

print("파생 변수 추가 완료:")
print("- distance_km: 구간별 이동 거리")
print("- cumulative_distance: 누적 이동 거리")
print("- battery_used: 구간별 배터리 소모량")
print("- efficiency_km_per_percent: 연비")
print("- speed_category: 속도 구간")
print()

# 2-3. 기본 통계 (Pandas 활용)
print("📊 2-3. 주행 데이터 기본 통계")
print("전체 통계:")
print(driving_df[['speed_kmh', 'battery_percent', 'distance_km']].describe())
print()

print("속도 구간별 통계:")
speed_stats = driving_df.groupby('speed_category').agg({
    'speed_kmh': ['mean', 'count'],
    'battery_used': 'sum',
    'distance_km': 'sum'
}).round(2)
print(speed_stats)
print()

# ===== STEP 3: 센서 데이터 시뮬레이션 (NumPy + Pandas) =====
print("=== STEP 3: 센서 데이터 시뮬레이션 ===")

# 3-1. 다중 센서 데이터 생성 (NumPy)
print("📊 3-1. 다방향 센서 데이터 생성")
n_sensors = 8  # 8방향 센서
n_readings = len(time_points)

# 각 방향별 센서 (0도=전방, 시계방향) - 영어로 변경
sensor_angles = np.array([0, 45, 90, 135, 180, 225, 270, 315])
sensor_names = ['Front', 'Front-Right', 'Right', 'Rear-Right', 'Rear', 'Rear-Left', 'Left', 'Front-Left']

# 시간에 따른 센서 데이터 생성
np.random.seed(42)
sensor_data_matrix = np.zeros((n_readings, n_sensors))

for i, angle in enumerate(sensor_angles):
    # 기본 거리 + 노이즈 + 각도별 특성
    base_distance = 8 + 2 * np.sin(np.radians(angle))  # 각도별 기본 거리
    noise = np.random.normal(0, 1, n_readings)          # 랜덤 노이즈
    time_variation = np.sin(time_points * 0.2) * 2      # 시간에 따른 변화

    sensor_data_matrix[:, i] = np.maximum(base_distance + noise + time_variation, 1.0)

print(f"센서 데이터 매트릭스 크기: {sensor_data_matrix.shape}")
print(f"센서 방향: {sensor_names}")
print()

# 3-2. 센서 데이터프레임 생성 (Pandas)
print("📊 3-2. 센서 데이터프레임 생성")
# 긴 형태(long format)로 센서 데이터 정리
sensor_records = []

for time_idx, time_point in enumerate(time_points):
    for sensor_idx, (angle, name) in enumerate(zip(sensor_angles, sensor_names)):
        record = {
            'timestamp': timestamps[time_idx],
            'time_minutes': time_point,
            'sensor_name': name,
            'sensor_angle': angle,
            'distance_m': sensor_data_matrix[time_idx, sensor_idx],
            'is_critical': sensor_data_matrix[time_idx, sensor_idx] < 3.0  # 3m 이하면 위험
        }
        sensor_records.append(record)

sensor_df = pd.DataFrame(sensor_records)
print(f"센서 레코드 수: {len(sensor_df)}")
print("센서 데이터 샘플:")
print(sensor_df.head(10))
print()

# 3-3. 센서 위험 상황 분석 (Pandas)
print("📊 3-3. 센서 위험 상황 분석")
critical_situations = sensor_df[sensor_df['is_critical']]
print(f"총 위험 상황: {len(critical_situations)}회")

danger_by_sensor = critical_situations.groupby('sensor_name').size().sort_values(ascending=False)
print("센서별 위험 감지 횟수:")
print(danger_by_sensor)
print()

danger_by_time = critical_situations.groupby('time_minutes').size()
if len(danger_by_time) > 0:
    print(f"가장 위험한 시간: {danger_by_time.idxmax()}분 ({danger_by_time.max()}개 센서)")
print()

# ===== STEP 4: 종합 시각화 (Matplotlib) =====
print("=== STEP 4: 종합 데이터 시각화 ===")

# 4-1. 주행 성능 대시보드
print("📊 4-1. 주행 성능 대시보드 생성")
fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(16, 12))

# 좌상: 속도 변화
ax1.plot(driving_df['time_minutes'], driving_df['speed_kmh'], 'b-', linewidth=2)
ax1.set_title('Speed Change', fontsize=14, fontweight='bold')
ax1.set_ylabel('Speed (km/h)')
ax1.grid(True, alpha=0.3)
ax1.set_ylim(0, max(driving_df['speed_kmh']) + 10)

# 우상: 배터리 잔량
ax2.plot(driving_df['time_minutes'], driving_df['battery_percent'], 'r-', linewidth=2)
ax2.set_title('Battery Level', fontsize=14, fontweight='bold')
ax2.set_ylabel('Battery (%)')
ax2.grid(True, alpha=0.3)
ax2.set_ylim(min(driving_df['battery_percent']) - 5, 105)

# 좌하: 누적 주행 거리
ax3.plot(driving_df['time_minutes'], driving_df['cumulative_distance'], 'g-', linewidth=2)
ax3.set_title('Cumulative Distance', fontsize=14, fontweight='bold')
ax3.set_xlabel('Time (minutes)')
ax3.set_ylabel('Distance (km)')
ax3.grid(True, alpha=0.3)

# 우하: 속도 구간별 분포
speed_counts = driving_df['speed_category'].value_counts()
colors = ['blue', 'orange', 'red']
bars = ax4.bar(speed_counts.index, speed_counts.values, color=colors[:len(speed_counts)])
ax4.set_title('Speed Category Distribution', fontsize=14, fontweight='bold')
ax4.set_xlabel('Speed Category')
ax4.set_ylabel('Count')

# 막대 위에 값 표시
for bar, count in zip(bars, speed_counts.values):
    ax4.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.5,
             str(count), ha='center', va='bottom')

plt.suptitle('🚗 Autonomous Vehicle Performance Dashboard', fontsize=18, fontweight='bold')
plt.tight_layout()
plt.show()
print("✅ 성능 대시보드 완성!")
print()

# 4-2. GPS 경로 시각화
print("📊 4-2. GPS 경로 및 센서 위험도 시각화")
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 6))

# 좌측: GPS 경로 (속도별 색상)
scatter = ax1.scatter(driving_df['longitude'], driving_df['latitude'],
                     c=driving_df['speed_kmh'], cmap='coolwarm', s=50)
ax1.plot(driving_df['longitude'], driving_df['latitude'], 'k-', alpha=0.5, linewidth=1)

# 시작점과 끝점 표시
ax1.scatter(driving_df['longitude'].iloc[0], driving_df['latitude'].iloc[0],
           color='green', s=200, marker='s', label='Start', zorder=5)
ax1.scatter(driving_df['longitude'].iloc[-1], driving_df['latitude'].iloc[-1],
           color='red', s=200, marker='s', label='Destination', zorder=5)

ax1.set_title('GPS Route (Speed-based Colors)', fontsize=14, fontweight='bold')
ax1.set_xlabel('Longitude')
ax1.set_ylabel('Latitude')
ax1.legend()
ax1.grid(True, alpha=0.3)

# 컬러바 추가
cbar1 = plt.colorbar(scatter, ax=ax1)
cbar1.set_label('Speed (km/h)')

# 우측: 센서 위험도 히트맵
pivot_sensor = sensor_df.pivot_table(values='distance_m', index='time_minutes',
                                     columns='sensor_name', aggfunc='mean')
im = ax2.imshow(pivot_sensor.T, cmap='RdYlGn', aspect='auto', origin='lower')
ax2.set_title('Sensor Distance Heatmap (by Time)', fontsize=14, fontweight='bold')
ax2.set_xlabel('Time Index')
ax2.set_ylabel('Sensor Direction')
ax2.set_yticks(range(len(sensor_names)))
ax2.set_yticklabels(sensor_names)

# 컬러바 추가
cbar2 = plt.colorbar(im, ax=ax2)
cbar2.set_label('Distance (m)')

plt.tight_layout()
plt.show()
print("✅ 경로 및 센서 시각화 완성!")
print()

# ===== STEP 5: 종합 분석 및 인사이트 =====
print("=== STEP 5: 종합 분석 및 인사이트 ===")

# 5-1. 주요 성능 지표 계산
print("📊 5-1. 주요 성능 지표")
total_time = driving_df['time_minutes'].max()
total_distance = driving_df['cumulative_distance'].max()
total_battery_used = driving_df['battery_percent'].iloc[0] - driving_df['battery_percent'].iloc[-1]
avg_speed = total_distance / (total_time / 60)  # km/h 변환
efficiency = total_distance / total_battery_used  # km/%

print(f"📈 주행 성능 요약:")
print(f"   총 주행 시간: {total_time} 분")
print(f"   총 주행 거리: {total_distance:.2f} km")
print(f"   평균 속도: {avg_speed:.1f} km/h")
print(f"   배터리 소모: {total_battery_used:.1f} %")
print(f"   연비: {efficiency:.2f} km/% (거리/배터리소모)")
print()

# 5-2. 안전성 분석
print("📊 5-2. 안전성 분석")
critical_rate = len(critical_situations) / len(sensor_df) * 100
safe_driving_time = len(driving_df[driving_df['speed_kmh'] <= 60]) / len(driving_df) * 100

print(f"🛡️ 안전성 요약:")
print(f"   센서 위험 감지율: {critical_rate:.1f}%")
print(f"   안전 속도 준수율: {safe_driving_time:.1f}%")
print(f"   가장 위험한 센서: {danger_by_sensor.index[0] if len(danger_by_sensor) > 0 else 'None'}")
print(f"   최고 위험 시간대: {danger_by_time.idxmax() if len(danger_by_time) > 0 else 'None'}")
print()

# 5-3. 최종 권장사항
print("📊 5-3. 데이터 기반 권장사항")
print("💡 분석 결과 및 개선 방안:")

if avg_speed > 50:
    print("   ⚠️ 평균 속도가 높습니다. 안전 운행을 위해 속도 조절을 권장합니다.")
else:
    print("   ✅ 적절한 속도로 안전하게 주행했습니다.")

if efficiency < 1.0:
    print("   ⚠️ 연비가 낮습니다. 급가속/급제동을 줄여보세요.")
else:
    print("   ✅ 효율적인 주행 패턴을 보여줍니다.")

if critical_rate > 10:
    print("   ⚠️ 센서 위험 감지가 빈번합니다. 주변 환경 주의가 필요합니다.")
else:
    print("   ✅ 안전한 환경에서 주행했습니다.")

print()
print("🎓 자율주행 데이터 사이언스 통합 프로젝트 완료!")
print("📚 활용된 기술:")
print("   🔢 NumPy: 센서 데이터 생성, 수치 계산, 배열 연산")
print("   📊 Pandas: 데이터프레임 관리, 통계 분석, 그룹 연산")
print("   📈 Matplotlib: 대시보드, 경로 시각화, 히트맵")
print("   🚗 자율주행: GPS 추적, 센서 융합, 성능 분석")
print("="*70)

In [None]:
# 자율주행 충돌 회피 시뮬레이터
# NumPy + Pandas + Matplotlib만 사용
# 코랩에서 바로 실행 가능!

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from datetime import datetime, timedelta
import warnings
warnings.filterwarnings('ignore')

print("🚗 자율주행 충돌 회피 시뮬레이터 시작!")
print("📦 NumPy + Pandas + Matplotlib로 구현")
print()

# ===== PART 1: 시뮬레이션 환경 설정 (NumPy) =====
print("=== PART 1: 시뮬레이션 환경 설정 ===")

# 1-1. 기본 설정
print("📊 1-1. 환경 설정")
np.random.seed(42)  # 재현 가능한 결과

# 도로 환경 설정 (좌표계: 미터 단위)
road_width = 20      # 도로 폭 20m
road_length = 100    # 도로 길이 100m
lane_width = 3.5     # 차선 폭 3.5m (실제 도로 기준)

# 자율주행차 설정
vehicle_length = 4.5  # 차량 길이 4.5m
vehicle_width = 1.8   # 차량 폭 1.8m
max_speed = 60       # 최대 속도 60km/h
safe_distance = 5    # 안전 거리 5m

print(f"도로 환경: {road_length}m × {road_width}m")
print(f"차량 크기: {vehicle_length}m × {vehicle_width}m")
print(f"최대 속도: {max_speed} km/h")
print(f"안전 거리: {safe_distance}m")
print()

# 1-2. 장애물 생성 (NumPy)
print("📊 1-2. 장애물 배치")
n_obstacles = 8  # 장애물 개수
obstacles = np.array([
    [25, 10],   # 정면 장애물
    [35, 5],    # 우측 장애물
    [45, 15],   # 좌측 장애물
    [55, 8],    # 중앙 장애물
    [65, 12],   # 우측 장애물
    [75, 6],    # 중앙 장애물
    [85, 14],   # 좌측 장애물
    [95, 9]     # 최종 장애물
])

print(f"장애물 {n_obstacles}개 배치 완료")
print("장애물 위치 (x, y):")
for i, (x, y) in enumerate(obstacles):
    print(f"  장애물 {i+1}: ({x}m, {y}m)")
print()

# 1-3. 차량 초기 상태 설정
print("📊 1-3. 자율주행차 초기 설정")
# 시작 위치 (도로 시작점, 중앙 차선)
start_position = np.array([0, road_width/2])
# 목표 위치 (도로 끝점, 중앙 차선)
target_position = np.array([road_length, road_width/2])
# 현재 위치 (시뮬레이션 중 업데이트됨)
current_position = start_position.copy()

print(f"시작 위치: ({start_position[0]:.1f}, {start_position[1]:.1f})")
print(f"목표 위치: ({target_position[0]:.1f}, {target_position[1]:.1f})")
print()

# ===== PART 2: 충돌 회피 알고리즘 (NumPy) =====
print("=== PART 2: 충돌 회피 알고리즘 개발 ===")

def calculate_distance(point1, point2):
    """두 점 사이의 유클리드 거리 계산"""
    return np.sqrt(np.sum((point1 - point2)**2))

def detect_obstacles_in_path(position, obstacles, detection_range=15):
    """경로상의 장애물 감지"""
    vehicle_x, vehicle_y = position
    detected = []

    for i, obstacle in enumerate(obstacles):
        obs_x, obs_y = obstacle

        # 전방 범위 내 장애물만 감지
        if obs_x > vehicle_x and obs_x < vehicle_x + detection_range:
            distance = calculate_distance(position, obstacle)
            detected.append({
                'id': i,
                'position': obstacle,
                'distance': distance,
                'threat_level': 'high' if distance < safe_distance else 'medium' if distance < safe_distance*2 else 'low'
            })

    return detected

def plan_avoidance_path(current_pos, detected_obstacles, target_pos):
    """장애물 회피 경로 계획"""
    if not detected_obstacles:
        # 장애물 없으면 직진
        return current_pos, target_pos, 'straight'

    # 가장 가까운 장애물 찾기
    closest_obstacle = min(detected_obstacles, key=lambda x: x['distance'])
    obs_pos = closest_obstacle['position']

    vehicle_x, vehicle_y = current_pos
    obs_x, obs_y = obs_pos

    # 회피 방향 결정 (왼쪽 또는 오른쪽)
    if obs_y > road_width/2:  # 장애물이 위쪽에 있으면 아래로 회피
        avoidance_y = max(2, obs_y - safe_distance)
        direction = 'right'
    else:  # 장애물이 아래쪽에 있으면 위로 회피
        avoidance_y = min(road_width-2, obs_y + safe_distance)
        direction = 'left'

    # 회피 지점 계산
    avoidance_x = obs_x - safe_distance
    avoidance_point = np.array([avoidance_x, avoidance_y])

    return current_pos, avoidance_point, direction

print("✅ 충돌 회피 알고리즘 구현 완료")
print("- 전방 15m 범위 장애물 감지")
print("- 안전 거리 기반 회피 경로 계획")
print("- 좌/우 방향 회피 지원")
print()

# ===== PART 3: 시뮬레이션 실행 (NumPy + Pandas) =====
print("=== PART 3: 시뮬레이션 실행 ===")

# 3-1. 시뮬레이션 파라미터
print("📊 3-1. 시뮬레이션 파라미터 설정")
time_step = 1.0      # 시간 간격 (초)
total_time = 20      # 총 시뮬레이션 시간 (초)
speed_ms = max_speed / 3.6  # km/h를 m/s로 변환

steps = int(total_time / time_step)
time_points = np.arange(0, total_time + time_step, time_step)

print(f"시뮬레이션 시간: {total_time}초")
print(f"시간 간격: {time_step}초")
print(f"총 단계: {steps}단계")
print(f"차량 속도: {speed_ms:.1f} m/s")
print()

# 3-2. 단계별 시뮬레이션 실행
print("📊 3-2. 단계별 시뮬레이션 실행")

# 결과 저장용 리스트
simulation_data = []
current_pos = start_position.copy()

print("단계별 실행 과정:")
for step in range(steps):
    current_time = step * time_step

    # 장애물 감지
    detected = detect_obstacles_in_path(current_pos, obstacles)

    # 회피 경로 계획
    start_point, avoidance_point, direction = plan_avoidance_path(
        current_pos, detected, target_position)

    # 차량 이동 (간단한 직선 이동)
    if step == 0:
        next_pos = current_pos + np.array([speed_ms * time_step, 0])
    else:
        # 이전 회피 계획에 따라 이동
        prev_direction = simulation_data[-1]['avoidance_direction']
        if prev_direction == 'left':
            next_pos = current_pos + np.array([speed_ms * time_step, 0.5])
        elif prev_direction == 'right':
            next_pos = current_pos + np.array([speed_ms * time_step, -0.5])
        else:
            next_pos = current_pos + np.array([speed_ms * time_step, 0])

    # 도로 경계 제한
    next_pos[1] = np.clip(next_pos[1], 1, road_width-1)

    # 시뮬레이션 데이터 저장
    simulation_data.append({
        'step': step,
        'time': current_time,
        'position_x': current_pos[0],
        'position_y': current_pos[1],
        'next_position_x': next_pos[0],
        'next_position_y': next_pos[1],
        'obstacles_detected': len(detected),
        'avoidance_direction': direction,
        'threat_level': detected[0]['threat_level'] if detected else 'none',
        'speed_ms': speed_ms,
        'safety_distance': safe_distance
    })

    print(f"  단계 {step+1:2d}: 위치({current_pos[0]:5.1f}, {current_pos[1]:4.1f}) → "
          f"감지 장애물 {len(detected)}개, 회피: {direction}")

    # 위치 업데이트
    current_pos = next_pos.copy()

    # 목표 지점 도달 확인
    if current_pos[0] >= target_position[0]:
        print(f"  🎯 목표 지점 도달! (단계 {step+1})")
        break

print()

# 3-3. 데이터프레임 생성 (Pandas)
print("📊 3-3. 시뮬레이션 결과 데이터프레임 생성")
sim_df = pd.DataFrame(simulation_data)

print("시뮬레이션 데이터 요약:")
print(f"총 실행 단계: {len(sim_df)}")
print(f"총 이동 거리: {sim_df['next_position_x'].iloc[-1] - sim_df['position_x'].iloc[0]:.1f}m")
print(f"평균 y축 편차: {np.abs(sim_df['position_y'] - road_width/2).mean():.2f}m")
print(f"장애물 감지 횟수: {sim_df['obstacles_detected'].sum()}회")
print()

print("처음 5단계 데이터:")
print(sim_df[['step', 'time', 'position_x', 'position_y', 'obstacles_detected', 'avoidance_direction']].head())
print()

# ===== PART 4A: 단계별 진행 시각화 (Matplotlib) =====
print("=== PART 4A: 단계별 진행 시각화 ===")

def visualize_step(step_data, obstacles, title_prefix=""):
    """개별 단계 시각화"""
    plt.figure(figsize=(12, 6))

    # 도로 그리기
    plt.fill([0, road_length, road_length, 0], [0, 0, road_width, road_width],
             color='lightgray', alpha=0.3, label='Road')

    # 차선 그리기
    for lane in [lane_width, lane_width*2, lane_width*3]:
        if lane < road_width:
            plt.plot([0, road_length], [lane, lane], 'w--', alpha=0.7, linewidth=1)

    # 장애물 그리기
    plt.scatter(obstacles[:, 0], obstacles[:, 1], c='red', s=150,
               marker='s', label='Obstacles', zorder=4)

    # 차량 현재 위치
    plt.scatter(step_data['position_x'], step_data['position_y'],
               c='blue', s=300, marker='o', label='Vehicle', zorder=5)

    # 차량 다음 위치 (화살표)
    plt.arrow(step_data['position_x'], step_data['position_y'],
             step_data['next_position_x'] - step_data['position_x'],
             step_data['next_position_y'] - step_data['position_y'],
             head_width=0.8, head_length=2, fc='blue', ec='blue', alpha=0.7)

    # 감지 범위 표시
    if step_data['obstacles_detected'] > 0:
        detection_circle = plt.Circle((step_data['position_x'], step_data['position_y']),
                                    15, fill=False, color='orange', linestyle='--', alpha=0.5)
        plt.gca().add_patch(detection_circle)

    # 그래프 설정
    plt.xlim(-5, road_length + 5)
    plt.ylim(-2, road_width + 2)
    plt.xlabel('Distance (m)')
    plt.ylabel('Road Width (m)')
    plt.title(f'{title_prefix}Step {step_data["step"]+1}: {step_data["avoidance_direction"].title()} Avoidance')
    plt.legend()
    plt.grid(True, alpha=0.3)
    plt.axis('equal')

    # 상태 정보 텍스트
    info_text = f'Time: {step_data["time"]:.1f}s\n'
    info_text += f'Position: ({step_data["position_x"]:.1f}, {step_data["position_y"]:.1f})\n'
    info_text += f'Obstacles: {step_data["obstacles_detected"]}\n'
    info_text += f'Direction: {step_data["avoidance_direction"]}'

    plt.text(road_length-20, road_width-3, info_text,
            bbox=dict(boxstyle="round,pad=0.3", facecolor="lightblue", alpha=0.8),
            fontsize=9, verticalalignment='top')

print("📊 4A-1. 주요 단계별 시각화 (6단계 선택)")

# 주요 단계들만 선택해서 표시 (너무 많으면 복잡하므로)
key_steps = [0, 2, 4, 6, 8, -1]  # 첫째, 셋째, 다섯째, 일곱째, 아홉째, 마지막 단계
key_steps = [i for i in key_steps if i < len(sim_df) or i == -1]

for i, step_idx in enumerate(key_steps):
    if step_idx == -1:
        step_idx = len(sim_df) - 1

    step_data = sim_df.iloc[step_idx]
    visualize_step(step_data, obstacles, f"Key Progress {i+1}/6 - ")
    plt.show()

print("✅ 단계별 진행 시각화 완료!")
print()

# ===== PART 4B: 종합 대시보드 시각화 (Matplotlib) =====
print("=== PART 4B: 종합 대시보드 시각화 ===")

print("📊 4B-1. 종합 모니터링 대시보드 생성")

fig = plt.figure(figsize=(20, 12))

# 전체 경로 시각화 (좌상단)
ax1 = plt.subplot(2, 3, (1, 2))  # 2행 3열에서 1,2번 자리 (넓게)

# 도로 환경
ax1.fill([0, road_length, road_length, 0], [0, 0, road_width, road_width],
         color='lightgray', alpha=0.3, label='Road')

# 차선
for lane in [lane_width, lane_width*2, lane_width*3]:
    if lane < road_width:
        ax1.plot([0, road_length], [lane, lane], 'w--', alpha=0.7, linewidth=1)

# 장애물
ax1.scatter(obstacles[:, 0], obstacles[:, 1], c='red', s=200,
           marker='s', label='Obstacles', zorder=4)

# 전체 주행 경로
path_x = sim_df['position_x'].values
path_y = sim_df['position_y'].values
ax1.plot(path_x, path_y, 'b-', linewidth=3, alpha=0.7, label='Vehicle Path')

# 시작점과 끝점
ax1.scatter(start_position[0], start_position[1], c='green', s=300,
           marker='s', label='Start', zorder=5)
ax1.scatter(path_x[-1], path_y[-1], c='blue', s=300,
           marker='o', label='End', zorder=5)

# 위험 구간 표시
danger_steps = sim_df[sim_df['obstacles_detected'] > 0]
if len(danger_steps) > 0:
    ax1.scatter(danger_steps['position_x'], danger_steps['position_y'],
               c='orange', s=100, alpha=0.6, label='Danger Zones')

ax1.set_xlim(-5, road_length + 5)
ax1.set_ylim(-2, road_width + 2)
ax1.set_xlabel('Distance (m)')
ax1.set_ylabel('Road Width (m)')
ax1.set_title('Complete Collision Avoidance Path', fontsize=14, fontweight='bold')
ax1.legend()
ax1.grid(True, alpha=0.3)

# 실시간 센서 데이터 (우상단)
ax2 = plt.subplot(2, 3, 3)
detection_counts = sim_df.groupby('step')['obstacles_detected'].first()
ax2.plot(detection_counts.index, detection_counts.values, 'ro-', linewidth=2, markersize=6)
ax2.set_xlabel('Time Step')
ax2.set_ylabel('Obstacles Detected')
ax2.set_title('Sensor Detection Over Time', fontweight='bold')
ax2.grid(True, alpha=0.3)
ax2.set_ylim(-0.5, max(detection_counts) + 0.5)

# 회피 방향 분석 (좌하단)
ax3 = plt.subplot(2, 3, 4)
direction_counts = sim_df['avoidance_direction'].value_counts()
colors = ['lightblue', 'lightcoral', 'lightgreen']
bars = ax3.bar(direction_counts.index, direction_counts.values, color=colors[:len(direction_counts)])
ax3.set_xlabel('Avoidance Direction')
ax3.set_ylabel('Count')
ax3.set_title('Avoidance Strategy Distribution', fontweight='bold')

# 막대 위에 값 표시
for bar, count in zip(bars, direction_counts.values):
    ax3.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.1,
             str(count), ha='center', va='bottom')

# 차량 궤적 분석 (중하단)
ax4 = plt.subplot(2, 3, 5)
ax4.plot(sim_df['time'], sim_df['position_y'], 'g-', linewidth=2, label='Y Position')
ax4.axhline(y=road_width/2, color='black', linestyle='--', alpha=0.5, label='Center Line')
ax4.fill_between([0, max(sim_df['time'])], [0, 0], [road_width, road_width], alpha=0.1, color='gray')
ax4.set_xlabel('Time (s)')
ax4.set_ylabel('Y Position (m)')
ax4.set_title('Lateral Position Over Time', fontweight='bold')
ax4.legend()
ax4.grid(True, alpha=0.3)

# 안전성 분석 (우하단)
ax5 = plt.subplot(2, 3, 6)

# 안전 지표 계산
total_steps = len(sim_df)
danger_steps_count = len(sim_df[sim_df['obstacles_detected'] > 0])
safe_percentage = (total_steps - danger_steps_count) / total_steps * 100
path_deviation = np.abs(sim_df['position_y'] - road_width/2).mean()

safety_metrics = ['Safe Time\n(%)', 'Avg Deviation\n(m)', 'Total Distance\n(m)']
safety_values = [safe_percentage, path_deviation, path_x[-1] - path_x[0]]
colors = ['green' if safe_percentage > 70 else 'orange',
          'green' if path_deviation < 2 else 'orange',
          'blue']

bars = ax5.bar(safety_metrics, safety_values, color=colors)
ax5.set_title('Safety Performance Metrics', fontweight='bold')

# 값 표시
for bar, value in zip(bars, safety_values):
    ax5.text(bar.get_x() + bar.get_width()/2, bar.get_height() + max(safety_values)*0.02,
             f'{value:.1f}', ha='center', va='bottom', fontweight='bold')

plt.suptitle('🚗 Autonomous Vehicle Collision Avoidance Dashboard',
             fontsize=18, fontweight='bold', y=1.02)
plt.tight_layout()
plt.show()

print("✅ 종합 대시보드 완료!")
print()

# ===== PART 5: 시뮬레이션 결과 분석 (Pandas) =====
print("=== PART 5: 시뮬레이션 결과 분석 ===")

print("📊 5-1. 성능 지표 계산")

# 주요 성능 지표
total_distance = sim_df['next_position_x'].iloc[-1] - sim_df['position_x'].iloc[0]
total_time = sim_df['time'].iloc[-1]
avg_speed = total_distance / total_time if total_time > 0 else 0
max_deviation = np.abs(sim_df['position_y'] - road_width/2).max()
avg_deviation = np.abs(sim_df['position_y'] - road_width/2).mean()

print(f"📈 주행 성능 요약:")
print(f"   총 주행 거리: {total_distance:.1f} m")
print(f"   총 주행 시간: {total_time:.1f} s")
print(f"   평균 속도: {avg_speed:.1f} m/s ({avg_speed*3.6:.1f} km/h)")
print(f"   최대 차선 이탈: {max_deviation:.2f} m")
print(f"   평균 차선 이탈: {avg_deviation:.2f} m")
print()

print("📊 5-2. 안전성 분석")
danger_rate = len(sim_df[sim_df['obstacles_detected'] > 0]) / len(sim_df) * 100
successful_avoidance = len(sim_df[sim_df['avoidance_direction'] != 'straight']) / len(sim_df) * 100

print(f"🛡️ 안전성 요약:")
print(f"   장애물 감지율: {danger_rate:.1f}%")
print(f"   성공적 회피율: {successful_avoidance:.1f}%")
print(f"   총 회피 기동: {len(sim_df[sim_df['avoidance_direction'] != 'straight'])}회")
print()

print("📊 5-3. 회피 패턴 분석")
avoidance_summary = sim_df.groupby('avoidance_direction').agg({
    'obstacles_detected': 'sum',
    'position_y': 'mean'
}).round(2)

print("회피 방향별 통계:")
print(avoidance_summary)
print()

# 최종 권장사항
print("📊 5-4. 시스템 성능 평가")
print("💡 시뮬레이션 결과 분석:")

if avg_deviation < 1.0:
    print("   ✅ 우수한 차선 유지 성능")
else:
    print("   ⚠️ 차선 유지 개선 필요")

if danger_rate < 30:
    print("   ✅ 적절한 안전 거리 유지")
else:
    print("   ⚠️ 장애물 감지 빈도 높음 - 속도 조절 권장")

if successful_avoidance > 80:
    print("   ✅ 효과적인 충돌 회피 시스템")
else:
    print("   ⚠️ 회피 알고리즘 개선 필요")

print()
print("🎓 자율주행 충돌 회피 시뮬레이션 완료!")
print("📚 구현된 기능:")
print("   🔢 NumPy: 좌표 계산, 거리 측정, 경로 계획")
print("   📊 Pandas: 시뮬레이션 데이터 관리, 성능 분석")
print("   📈 Matplotlib: 단계별 시각화, 종합 대시보드")
print("   🚗 자율주행: 장애물 감지, 충돌 회피, 안전 분석")
print("="*70)