In [2]:
# ✅ 시각화를 위한 필수 라이브러리를 설치합니다.
# matplotlib: 그래프와 그림을 그리는 라이브러리입니다.
# seaborn: matplotlib을 기반으로 더 예쁘고 직관적인 시각화를 가능하게 해주는 라이브러리입니다.

!pip install matplotlib
!pip install seaborn

# ✅ 설치한 라이브러리를 코드에서 사용할 수 있도록 불러옵니다.

# seaborn 라이브러리를 불러옵니다.
# seaborn은 데이터를 예쁘고 직관적으로 시각화할 수 있도록 도와주는 도구입니다.
# 예를 들어, 산점도(scatter plot), 막대그래프(bar chart) 등을 쉽게 그릴 수 있습니다.
import seaborn as sns

# matplotlib 라이브러리에서 pyplot 모듈을 불러옵니다.
# pyplot은 그래프를 그리는 데 사용하는 도구이며, 그림을 띄우고 꾸미는 데 사용됩니다.
# plt는 관례적으로 사용하는 별칭으로, 앞으로 그래프를 그릴 때 plt.plot() 등으로 사용합니다.
import matplotlib.pyplot as plt

# pandas 라이브러리를 불러옵니다.
# pandas는 엑셀처럼 표 형태의 데이터를 읽고 다루는 데 사용하는 도구입니다.
# 예: CSV 파일 불러오기, 표 형태로 정리, 특정 열/행 선택 등
import pandas as pd

# numpy 라이브러리를 불러옵니다.
# numpy는 숫자 계산을 빠르고 효율적으로 하기 위한 도구입니다.
# 배열(array), 평균, 합계, 제곱, 통계 처리 등을 쉽게 할 수 있습니다.
import numpy as np

# ✅ 그래프 스타일을 'ggplot' 스타일로 지정합니다.
# 'ggplot'은 R 언어의 ggplot2 스타일에서 영향을 받은 스타일입니다.
# 배경에 격자가 있고, 선과 점이 보기 좋게 꾸며집니다.
# 이 설정을 하면 matplotlib에서 그리는 모든 그래프에 이 스타일이 적용됩니다.
plt.style.use("ggplot")

# 1. CSV 파일을 읽어옵니다.
# pd.read_csv("파일이름") 함수는 CSV 파일을 불러와서 표(데이터프레임) 형태로 만들어줍니다.
df = pd.read_csv("weight_vs_mpg.csv")  # "weight_vs_mpg.csv"는 차량 무게와 연비가 들어 있는 데이터 파일입니다.
df  # 데이터프레임을 출력하면 실제 표처럼 생긴 데이터가 나옵니다.

# ✅ 2. 데이터를 시각화를 시작합니다.
# plt.figure(figsize=(8,6))는 가로 8인치, 세로 6인치 크기의 그림을 준비합니다.
plt.figure(figsize=(8,6))

# sns.scatterplot() 함수는 데이터 점들만 시각화합니다.
# x="weight": X축에는 차량 무게를 사용합니다.
# y="mpg": Y축에는 연비(MPG)를 사용합니다.
# data=df: 시각화에 사용할 데이터프레임을 지정합니다.
# alpha=0.5: 점의 투명도를 50%로 설정하여 겹칠 때 잘 보이도록 합니다.
# color="blue": 점의 색상을 파란색으로 지정합니다.
sns.scatterplot(
    x="weight",       # X축 데이터: 차량 무게
    y="mpg",          # Y축 데이터: 연비(MPG)
    data=df,          # 시각화에 사용할 데이터프레임
    alpha=0.5,        # 점의 투명도 설정 (0: 완전 투명, 1: 불투명)
    color="gold",      # 점 색상 지정
)

# ✅ 4. 그래프에 X축, Y축 이름을 붙입니다.
plt.xlabel("Vehicle Weight")       # X축 제목 설정: Vehicle Weight (차량 무게)
plt.ylabel("Fuel Efficiency (MPG)")  # Y축 제목 설정: Fuel Efficiency (연비)

# ✅ 5. 그래프 제목을 붙입니다.
plt.title("Vehicle Weight vs Fuel Efficiency")

# ✅ 6. 그래프에 격자선을 표시합니다.
plt.grid(True)

# ✅ 7. 그래프 전체 레이아웃을 자동 정렬합니다.
plt.tight_layout()

# ✅ 8. 최종적으로 그래프를 화면에 출력합니다.
plt.show()



FileNotFoundError: [Errno 2] No such file or directory: 'weight_vs_mpg.csv'