# Week 11: Matplotlib Basics - Data Visualization
**Matplotlib 기초 - 데이터 시각화**

**Duration (수업 시간)**: 3 hours (3시간)  
**Structure (구성)**: Lecture & Lab 2 hours + Quiz 1 hour (강의 및 실습 2시간 + 퀴즈 1시간)  
**Level (수준)**: Intermediate (중급)

---

## Learning Objectives (학습 목표)

By the end of this lesson, students will be able to:
이 수업을 마친 후 학생들은 다음을 할 수 있습니다:

- Install and import matplotlib library (matplotlib 라이브러리 설치 및 가져오기)
- Create simple line graphs (간단한 선 그래프 생성)
- Make bar charts for data comparison (데이터 비교용 막대 그래프 만들기)
- Add titles and labels to graphs (그래프에 제목과 라벨 추가)

---

## 1. Introduction to Matplotlib (Matplotlib 소개)

**Matplotlib** is a Python library that helps you create graphs and charts. Think of it like a digital paintbrush for drawing with numbers.
**Matplotlib**은 그래프와 차트를 만들어주는 파이썬 라이브러리입니다. 숫자로 그림을 그리는 디지털 붓이라고 생각하세요.

### Why Use Graphs? (왜 그래프를 사용하나요?)

- **Easy to understand**: Pictures are easier than numbers (이해하기 쉬움: 그림이 숫자보다 쉬움)
- **Show patterns**: See trends quickly (패턴 보기: 트렌드를 빠르게 확인)
- **Compare data**: Side-by-side comparison (데이터 비교: 나란히 비교)

---

## 2. Installing Matplotlib (Matplotlib 설치)

Before using matplotlib, you need to install it using **pip**.
matplotlib을 사용하기 전에 **pip**를 사용해서 설치해야 합니다.

### Installation Command (설치 명령어)

In [None]:
%%bash
pip install matplotlib

### Importing Matplotlib (Matplotlib 가져오기)

In [None]:
import matplotlib.pyplot as plt

This is the standard way to import matplotlib for plotting.
이것이 그래프 그리기를 위해 matplotlib을 가져오는 표준 방법입니다.

---

## 3. Line Graphs (선 그래프)

Line graphs show how data changes over time. Like tracking your height as you grow up.
선 그래프는 시간에 따른 데이터 변화를 보여줍니다. 자라면서 키를 추적하는 것과 같습니다.

### Simple Line Graph (간단한 선 그래프)

In [None]:
import matplotlib.pyplot as plt

# Data
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]

# Create line graph
plt.plot(x, y)
plt.show()

### Line Graph with Labels (라벨이 있는 선 그래프)

In [None]:
import matplotlib.pyplot as plt

# Monthly sales data
months = ['Jan', 'Feb', 'Mar', 'Apr', 'May']
sales = [1000, 1500, 1200, 1800, 2000]

# Create graph
plt.plot(months, sales)
plt.title('Monthly Sales')
plt.xlabel('Month')
plt.ylabel('Sales ($)')
plt.show()

---

## 4. Bar Charts (막대 그래프)

Bar charts compare different categories. Like comparing heights of different buildings.
막대 그래프는 서로 다른 카테고리를 비교합니다. 서로 다른 건물의 높이를 비교하는 것과 같습니다.

### Simple Bar Chart (간단한 막대 그래프)

In [None]:
import matplotlib.pyplot as plt

# Subject scores
subjects = ['Math', 'English', 'Science']
scores = [85, 90, 78]

# Create bar chart
plt.bar(subjects, scores)
plt.title('Subject Scores')
plt.ylabel('Score')
plt.show()

### Colorful Bar Chart (컬러풀한 막대 그래프)

In [None]:
import matplotlib.pyplot as plt

# Fruit sales
fruits = ['Apple', 'Banana', 'Orange', 'Grape']
sales = [50, 30, 40, 25]
colors = ['red', 'yellow', 'orange', 'purple']

# Create colorful bar chart
plt.bar(fruits, sales, color=colors)
plt.title('Fruit Sales')
plt.xlabel('Fruit Type')
plt.ylabel('Units Sold')
plt.show()

---

## 5. Histograms (히스토그램)

Histograms show how often different values appear. Like counting how many students got different grades.
히스토그램은 서로 다른 값들이 얼마나 자주 나타나는지 보여줍니다. 서로 다른 성적을 받은 학생 수를 세는 것과 같습니다.

### Simple Histogram (간단한 히스토그램)

In [None]:
import matplotlib.pyplot as plt

# Student heights (in cm)
heights = [160, 165, 170, 175, 168, 172, 158, 180, 162, 169]

# Create histogram
plt.hist(heights, bins=5)
plt.title('Student Heights')
plt.xlabel('Height (cm)')
plt.ylabel('Number of Students')
plt.show()

---

## 6. Graph Decoration (그래프 꾸미기)

Making graphs look better and more informative.
그래프를 더 좋아 보이고 정보가 풍부하게 만들기.

### Essential Graph Elements (필수 그래프 요소들)

In [None]:
import matplotlib.pyplot as plt

# Temperature data
days = ['Mon', 'Tue', 'Wed', 'Thu', 'Fri']
temp = [22, 25, 23, 27, 24]

# Create decorated graph
plt.plot(days, temp, color='blue', marker='o', linewidth=2)
plt.title('Weekly Temperature', fontsize=16)
plt.xlabel('Day', fontsize=12)
plt.ylabel('Temperature (°C)', fontsize=12)
plt.grid(True)
plt.show()

### Graph Styling Options (그래프 스타일 옵션)

- **Colors**: 'red', 'blue', 'green', 'orange' (색상)
- **Markers**: 'o' (circle), 's' (square), '^' (triangle) (마커)
- **Line styles**: '-' (solid), '--' (dashed), ':' (dotted) (선 스타일)

---

## Lab Exercises (실습)

### Lab 1: CSV Data Visualization (CSV 데이터 시각화)

**Problem**: Read CSV data and create different types of graphs.
문제: CSV 데이터를 읽고 다른 종류의 그래프를 만드세요.

**First, create this CSV file named 'monthly_data.csv':**
먼저 'monthly_data.csv' 파일을 다음과 같이 만드세요:

```
month,temperature,rainfall
January,15,45
February,18,38
March,22,52
April,25,40
May,28,35
June,32,20
```

**Solution**:

In [None]:
import matplotlib.pyplot as plt
import csv

# Read CSV data
months = []
temperatures = []
rainfall = []

with open('monthly_data.csv', 'r') as file:
    csv_reader = csv.DictReader(file)
    for row in csv_reader:
        months.append(row['month'])
        temperatures.append(int(row['temperature']))
        rainfall.append(int(row['rainfall']))

# Create line graph for temperature
plt.figure(figsize=(10, 4))

plt.subplot(1, 2, 1)
plt.plot(months, temperatures, color='red', marker='o')
plt.title('Monthly Temperature')
plt.xlabel('Month')
plt.ylabel('Temperature (°C)')
plt.xticks(rotation=45)

# Create bar chart for rainfall
plt.subplot(1, 2, 2)
plt.bar(months, rainfall, color='blue')
plt.title('Monthly Rainfall')
plt.xlabel('Month')
plt.ylabel('Rainfall (mm)')
plt.xticks(rotation=45)

plt.tight_layout()
plt.show()

### Lab 2: Stock Price Trend Graph (주식 가격 추이 그래프)

**Problem**: Create a stock price trend visualization.
문제: 주식 가격 추이 시각화를 만드세요.

**Data:**

In [None]:
# Stock price data
dates = ['Week 1', 'Week 2', 'Week 3', 'Week 4', 'Week 5', 'Week 6']
stock_price = [100, 105, 98, 110, 115, 108]

**Solution**:

In [None]:
import matplotlib.pyplot as plt

# Stock price data
dates = ['Week 1', 'Week 2', 'Week 3', 'Week 4', 'Week 5', 'Week 6']
stock_price = [100, 105, 98, 110, 115, 108]

# Create stock price graph
plt.figure(figsize=(10, 6))
plt.plot(dates, stock_price, color='green', marker='o', linewidth=2, markersize=8)

# Add styling
plt.title('Stock Price Trend', fontsize=16, fontweight='bold')
plt.xlabel('Time Period', fontsize=12)
plt.ylabel('Price ($)', fontsize=12)
plt.grid(True, alpha=0.3)

# Add value labels on points
for i, price in enumerate(stock_price):
    plt.annotate(f'${price}', (i, price), textcoords="offset points", 
                xytext=(0,10), ha='center')

plt.tight_layout()
plt.show()

# Calculate and show profit/loss
start_price = stock_price[0]
end_price = stock_price[-1]
change = end_price - start_price
print(f"Starting price: ${start_price}")
print(f"Ending price: ${end_price}")
print(f"Change: ${change}")

### Lab 3: Population Statistics Visualization (인구 통계 시각화)

**Problem**: Visualize population data by age group and region.
문제: 연령대별, 지역별 인구 데이터를 시각화하세요.

**Data:**

In [None]:
# Population data
age_groups = ['0-20', '21-40', '41-60', '60+']
population = [25, 35, 28, 12]

regions = ['North', 'South', 'East', 'West']
region_pop = [120, 95, 110, 85]

**Solution**:

In [None]:
import matplotlib.pyplot as plt

# Population data
age_groups = ['0-20', '21-40', '41-60', '60+']
population = [25, 35, 28, 12]

regions = ['North', 'South', 'East', 'West']
region_pop = [120, 95, 110, 85]

# Create two graphs side by side
plt.figure(figsize=(12, 5))

# Age group distribution (pie chart style with bar)
plt.subplot(1, 2, 1)
colors = ['lightblue', 'lightgreen', 'lightcoral', 'lightyellow']
plt.bar(age_groups, population, color=colors)
plt.title('Population by Age Group (%)')
plt.xlabel('Age Group')
plt.ylabel('Percentage')

# Add percentage labels
for i, percent in enumerate(population):
    plt.text(i, percent + 0.5, f'{percent}%', ha='center')

# Regional population (horizontal bar chart)
plt.subplot(1, 2, 2)
plt.barh(regions, region_pop, color=['red', 'blue', 'green', 'orange'])
plt.title('Population by Region (thousands)')
plt.xlabel('Population (thousands)')
plt.ylabel('Region')

# Add value labels
for i, pop in enumerate(region_pop):
    plt.text(pop + 2, i, f'{pop}k', va='center')

plt.tight_layout()
plt.show()

# Show summary statistics
print("Population Summary:")
print(f"Total age groups covered: {len(age_groups)}")
print(f"Largest age group: {age_groups[population.index(max(population))]} ({max(population)}%)")
print(f"Most populated region: {regions[region_pop.index(max(region_pop))]} ({max(region_pop)}k)")

---

## Quiz Section (퀴즈)

### Quiz 1: Basic Line Graph

**Question**: Create a line graph with x = [1, 2, 3, 4, 5] and y = [2, 4, 6, 8, 10]. Add appropriate title and axis labels.

x = [1, 2, 3, 4, 5]와 y = [2, 4, 6, 8, 10]으로 선 그래프를 그리는 코드를 작성하시오. 적절한 제목과 축 라벨을 추가하세요.

**Write your answer here (답을 여기에 작성하세요)**:

In [None]:
# Your code here

### Quiz 2: Subject Scores Bar Chart

**Question**: Create a bar chart with subjects = ['Math', 'English', 'Science'] and scores = [85, 90, 78]. Add title "Subject Scores" and appropriate labels.

subjects = ['Math', 'English', 'Science']와 scores = [85, 90, 78]로 막대 그래프를 그리고 "Subject Scores" 제목을 설정하시오. 적절한 라벨도 추가하세요.

**Write your answer here (답을 여기에 작성하세요)**:

In [None]:
# Your code here

### Quiz 3: Height Distribution Histogram

**Question**: Create a histogram with heights = [160, 165, 170, 175, 168, 172, 158, 180] and set appropriate bins. Add title and labels.

heights = [160, 165, 170, 175, 168, 172, 158, 180]로 히스토그램을 그리고 적절한 구간으로 설정하시오. 제목과 라벨을 추가하세요.

**Write your answer here (답을 여기에 작성하세요)**:

In [None]:
# Your code here

---

## References (참고)

1. **Matplotlib Official Tutorial**: https://matplotlib.org/stable/tutorials/index.html
2. **Matplotlib Basic Examples**: https://matplotlib.org/stable/gallery/index.html
3. **Python Graph Gallery**: https://python-graph-gallery.com/
4. **Real Python Matplotlib Guide**: https://realpython.com/python-matplotlib-guide/

---

## Key Points (핵심 포인트)

### Remember (기억하세요)
1. **Import first**: Always import matplotlib.pyplot as plt (먼저 가져오기: 항상 matplotlib.pyplot을 plt로 가져오기)
2. **plt.show()**: Don't forget to show your graph (plt.show(): 그래프 보여주는 것 잊지 말기)
3. **Add labels**: Title, xlabel, ylabel make graphs clear (라벨 추가: 제목, x라벨, y라벨이 그래프를 명확하게 만듦)
4. **Choose right graph**: Line for trends, bar for comparison (올바른 그래프 선택: 트렌드는 선 그래프, 비교는 막대 그래프)

### Common Graph Types (일반적인 그래프 유형)
- **Line graphs**: Time series, trends (선 그래프: 시계열, 트렌드)
- **Bar charts**: Categories comparison (막대 그래프: 카테고리 비교)
- **Histograms**: Distribution of values (히스토그램: 값의 분포)

### Next Week Preview (다음 주 미리보기)
Next week: **Web Scraping Basics** - Getting data from websites
다음 주: **웹 스크래핑 기초** - 웹사이트에서 데이터 가져오기

---

## Homework (숙제)

1. Complete all three lab exercises (3개 실습 모두 완료)
2. Practice creating different types of graphs with your own data (자신만의 데이터로 다른 종류의 그래프 만들기 연습)
3. Try different colors and styling options (다른 색상과 스타일 옵션 시도)
4. Create graphs from CSV files you made in previous weeks (이전 주에 만든 CSV 파일로 그래프 생성)

**Graphs make data come alive - they tell stories that numbers alone cannot!**
**그래프는 데이터를 생생하게 만듭니다 - 숫자만으로는 할 수 없는 이야기를 들려줍니다!**