## 1. 테스트 테이블 생성 (SQL)

테스트용 테이블을 생성합니다. 이미 존재하는 경우 스킵합니다.

In [None]:
CREATE TABLE IF NOT EXISTS test_table (
    id INTEGER AUTOINCREMENT,
    timestamp TIMESTAMP,
    value FLOAT,
    category VARCHAR(50)
);

## 2. 랜덤 데이터 생성 (Python)

현재 시간과 랜덤한 값, 카테고리를 생성합니다.

In [None]:
import random
from datetime import datetime

v_current_time = datetime.now().strftime('%Y-%m-%d %H:%M:%S')
random_value = random.uniform(0, 100)
categories = ['A', 'B', 'C', 'D']
random_category = random.choice(categories)

print(f"Time: {v_current_time}")
print(f"Value: {random_value}")
print(f"Category: {random_category}")

## 3. 데이터 삽입 (SQL)

이전 셀에서 생성한 Python 변수를 Jinja 템플릿으로 참조하여 테이블에 데이터를 삽입합니다.

In [None]:
INSERT INTO test_table (timestamp, value, category)
VALUES ('{{v_current_time}}', {{random_value}}, '{{random_category}}')

## 4. 데이터 조회 (SQL)

입력된 데이터를 SQL 쿼리로 조회합니다.

In [None]:
SELECT * FROM test_table ORDER BY timestamp DESC

## 5. 데이터 시각화 (Python)

조회한 데이터에 대해 차트로 시각화합니다.

_이 셀을 실행하려면 **matplotlib**와 **seaborn**패키지를 추가해야합니다_

- 화면 상단의 Packages를 엽니다
- Find Packages에서 **matplotlib**와 **seaborn**을 각각 검색합니다
- `save` 버튼을 클릭합니다
- notebook 세션이 다시 Active 상태가 될 때까지 기다립니다

In [None]:

import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns

df = S3.to_pandas()

fig, axes = plt.subplots(2, 2, figsize=(16, 10))
fig.subplots_adjust(hspace=0.4, wspace=0.3)

# Color palette
colors = sns.color_palette('Set2', len(df['CATEGORY'].unique()))

# 1. Count by Category
category_counts = df.groupby('CATEGORY').size().sort_index()
bars1 = axes[0, 0].bar(category_counts.index, category_counts.values, 
                       color=colors, edgecolor='black', linewidth=2, width=0.6)
for bar in bars1:
    height = bar.get_height()
    axes[0, 0].text(bar.get_x() + bar.get_width()/2., height,
                    f'{int(height)}', ha='center', va='bottom', 
                    fontweight='bold', fontsize=11)
axes[0, 0].set_xlabel('Category', fontsize=13, fontweight='bold')
axes[0, 0].set_ylabel('Count', fontsize=13, fontweight='bold')
axes[0, 0].set_title('Count by Category', fontsize=15, fontweight='bold', pad=20)
axes[0, 0].grid(True, alpha=0.3, axis='y', linestyle='--')

# 2. Average by Category
category_avg = df.groupby('CATEGORY')['VALUE'].mean().sort_index()
bars2 = axes[0, 1].bar(category_avg.index, category_avg.values,
                       color=colors, edgecolor='black', linewidth=2, width=0.6)
for bar in bars2:
    height = bar.get_height()
    axes[0, 1].text(bar.get_x() + bar.get_width()/2., height,
                    f'{height:.1f}', ha='center', va='bottom', 
                    fontweight='bold', fontsize=11)
axes[0, 1].set_xlabel('Category', fontsize=13, fontweight='bold')
axes[0, 1].set_ylabel('Average Value', fontsize=13, fontweight='bold')
axes[0, 1].set_title('Average by Category', fontsize=15, fontweight='bold', pad=20)
axes[0, 1].grid(True, alpha=0.3, axis='y', linestyle='--')

# 3. Minimum by Category
category_min = df.groupby('CATEGORY')['VALUE'].min().sort_index()
bars3 = axes[1, 0].bar(category_min.index, category_min.values,
                       color=colors, edgecolor='black', linewidth=2, width=0.6)
for bar in bars3:
    height = bar.get_height()
    axes[1, 0].text(bar.get_x() + bar.get_width()/2., height,
                    f'{height:.1f}', ha='center', va='bottom', 
                    fontweight='bold', fontsize=11)
axes[1, 0].set_xlabel('Category', fontsize=13, fontweight='bold')
axes[1, 0].set_ylabel('Min Value', fontsize=13, fontweight='bold')
axes[1, 0].set_title('Minimum by Category', fontsize=15, fontweight='bold', pad=20)
axes[1, 0].grid(True, alpha=0.3, axis='y', linestyle='--')

# 4. Maximum by Category
category_max = df.groupby('CATEGORY')['VALUE'].max().sort_index()
bars4 = axes[1, 1].bar(category_max.index, category_max.values,
                       color=colors, edgecolor='black', linewidth=2, width=0.6)
for bar in bars4:
    height = bar.get_height()
    axes[1, 1].text(bar.get_x() + bar.get_width()/2., height,
                    f'{height:.1f}', ha='center', va='bottom', 
                    fontweight='bold', fontsize=11)
axes[1, 1].set_xlabel('Category', fontsize=13, fontweight='bold')
axes[1, 1].set_ylabel('Max Value', fontsize=13, fontweight='bold')
axes[1, 1].set_title('Maximum by Category', fontsize=15, fontweight='bold', pad=20)
axes[1, 1].grid(True, alpha=0.3, axis='y', linestyle='--')

plt.show()

# Summary statistics
print("=" * 60)
print("Data Summary".center(60))
print("=" * 60)
print(f"Total Records: {len(df):,}")
print(f"Value Range: {df['VALUE'].min():.2f} ~ {df['VALUE'].max():.2f}")
print(f"Mean Value: {df['VALUE'].mean():.2f}")
print(f"Standard Deviation: {df['VALUE'].std():.2f}")

print("\n" + "=" * 60)
print("Category Statistics".center(60))
print("=" * 60)
category_stats = df.groupby('CATEGORY')['VALUE'].agg(['count', 'mean', 'min', 'max']).round(2)
category_stats.columns = ['Count', 'Average', 'Minimum', 'Maximum']
print(category_stats.to_string())