# การสร้าง Data Visualization ด้วย Python (Matplotlib และ Seaborn)

## วัตถุประสงค์การเรียนรู้
- เข้าใจความสำคัญของการแสดงผลข้อมูล (Data Visualization)
- สามารถใช้ Matplotlib สร้างกราฟพื้นฐานได้
- สามารถใช้ Seaborn สร้างการแสดงผลข้อมูลที่สวยงาม
- รู้จักการเลือกใช้ประเภทของการแสดงผลข้อมูลให้เหมาะสมกับข้อมูล

## 1. ความสำคัญของการแสดงผลข้อมูล (Data Visualization)

การแสดงผลข้อมูล (Data Visualization) เป็นการนำเสนอข้อมูลในรูปแบบที่มองเห็นได้ เช่น กราฟ แผนภูมิ แผนที่ หรือแดชบอร์ด ซึ่งมีความสำคัญหลายประการ:

1. **สื่อสารข้อมูลซับซ้อนได้อย่างชัดเจน**: ช่วยให้เข้าใจข้อมูลที่ซับซ้อนได้ง่ายขึ้น
2. **ค้นพบแนวโน้มและรูปแบบ**: มองเห็นแนวโน้ม รูปแบบ และความผิดปกติในข้อมูลได้ง่าย
3. **ตัดสินใจได้ดีขึ้น**: สนับสนุนการตัดสินใจโดยอิงจากข้อมูลที่ชัดเจน
4. **นำเสนอข้อมูลได้น่าสนใจ**: ทำให้การนำเสนอข้อมูลน่าสนใจและน่าจดจำ
5. **เปรียบเทียบข้อมูลได้ง่าย**: ช่วยในการเปรียบเทียบข้อมูลหลายชุดได้อย่างมีประสิทธิภาพ

ในการสร้าง Data Visualization ด้วย Python มีไลบรารีที่นิยมใช้กันมากคือ Matplotlib และ Seaborn

## 2. การติดตั้งและนำเข้าไลบรารี

ก่อนที่จะเริ่มต้นสร้าง Data Visualization เราจำเป็นต้องติดตั้งและนำเข้าไลบรารีที่จำเป็น ซึ่งประกอบด้วย Matplotlib, Seaborn และ Pandas (สำหรับจัดการข้อมูล)

In [None]:
# ติดตั้งไลบรารี (หากยังไม่ได้ติดตั้ง)
# !pip install matplotlib seaborn pandas numpy

# นำเข้าไลบรารีที่จำเป็น
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
import numpy as np

# ตั้งค่าสไตล์ของ Seaborn
sns.set(style="whitegrid")

# ตั้งค่าให้แสดงกราฟใน Jupyter Notebook
%matplotlib inline

# ตั้งค่าขนาดกราฟเริ่มต้น
plt.rcParams['figure.figsize'] = (10, 6)

# ตั้งค่าให้แสดงฟอนต์ภาษาไทยได้ (ถ้าใช้ภาษาไทย)
# plt.rcParams['font.family'] = 'Tahoma'

# ตรวจสอบเวอร์ชันของไลบรารี
print(f"Matplotlib version: {plt.__version__}")
print(f"Seaborn version: {sns.__version__}")
print(f"Pandas version: {pd.__version__}")
print(f"NumPy version: {np.__version__}")

## 3. สร้างข้อมูลสำหรับการทดลอง

เราจะสร้างข้อมูลจำลองขึ้นมาเพื่อใช้ในการทดลองสร้าง Data Visualization

In [None]:
# สร้าง DataFrame สำหรับทดลอง
np.random.seed(42)  # ตั้งค่า seed เพื่อให้ผลลัพธ์เหมือนกันทุกครั้ง

# สร้างข้อมูลยอดขาย
dates = pd.date_range('2023-01-01', periods=12, freq='M')
sales_data = {
    'date': dates,
    'sales': np.random.randint(100, 500, size=len(dates)),
    'expenses': np.random.randint(50, 300, size=len(dates)),
    'category': np.random.choice(['A', 'B', 'C'], size=len(dates))
}
sales_df = pd.DataFrame(sales_data)
sales_df['profit'] = sales_df['sales'] - sales_df['expenses']
sales_df['month'] = sales_df['date'].dt.strftime('%b')

# สร้างข้อมูลผลิตภัณฑ์
products = ['Product A', 'Product B', 'Product C', 'Product D', 'Product E']
product_data = {
    'product': products,
    'sales': np.random.randint(100, 1000, size=len(products)),
    'customer_rating': np.random.uniform(3.5, 5.0, size=len(products)),
    'market_share': np.random.uniform(0.05, 0.25, size=len(products))
}
product_df = pd.DataFrame(product_data)

# สร้างข้อมูลลูกค้า
n_customers = 100
customer_data = {
    'age': np.random.randint(18, 70, size=n_customers),
    'income': np.random.randint(15000, 80000, size=n_customers),
    'spending': np.random.randint(1000, 20000, size=n_customers),
    'region': np.random.choice(['North', 'South', 'East', 'West', 'Central'], size=n_customers),
    'satisfaction': np.random.uniform(1, 5, size=n_customers)
}
customer_df = pd.DataFrame(customer_data)

# แสดงตัวอย่างข้อมูล
print("ข้อมูลยอดขาย:")
display(sales_df.head())

print("\nข้อมูลผลิตภัณฑ์:")
display(product_df.head())

print("\nข้อมูลลูกค้า:")
display(customer_df.head())

## 4. การสร้างกราฟพื้นฐานด้วย Matplotlib

Matplotlib เป็นไลบรารีพื้นฐานสำหรับการสร้างกราฟใน Python เราจะเริ่มต้นด้วยการสร้างกราฟประเภทต่างๆ

### 4.1 กราฟเส้น (Line Plot)

In [None]:
# สร้างกราฟเส้นแสดงยอดขายตามเวลา
plt.figure(figsize=(12, 6))
plt.plot(sales_df['date'], sales_df['sales'], marker='o', linestyle='-', color='blue', label='ยอดขาย')
plt.plot(sales_df['date'], sales_df['expenses'], marker='s', linestyle='--', color='red', label='ค่าใช้จ่าย')
plt.plot(sales_df['date'], sales_df['profit'], marker='^', linestyle='-.', color='green', label='กำไร')

plt.title('ยอดขาย ค่าใช้จ่าย และกำไรรายเดือน ปี 2023', fontsize=16)
plt.xlabel('เดือน', fontsize=12)
plt.ylabel('จำนวนเงิน (บาท)', fontsize=12)
plt.grid(True, linestyle='--', alpha=0.7)
plt.legend()

# ปรับการแสดงวันที่บนแกน x
plt.xticks(sales_df['date'], sales_df['month'], rotation=45)

# เพิ่มการแสดงค่าที่จุดข้อมูลสำหรับกำไร
for i, profit in enumerate(sales_df['profit']):
    plt.annotate(f'{profit}', (sales_df['date'][i], profit), 
                 textcoords="offset points", xytext=(0,10), ha='center')

plt.tight_layout()
plt.show()

### 4.2 กราฟแท่ง (Bar Plot)

In [None]:
# สร้างกราฟแท่งแสดงยอดขายของแต่ละผลิตภัณฑ์
plt.figure(figsize=(10, 6))
bars = plt.bar(product_df['product'], product_df['sales'], color='skyblue', edgecolor='navy')

plt.title('ยอดขายตามผลิตภัณฑ์', fontsize=16)
plt.xlabel('ผลิตภัณฑ์', fontsize=12)
plt.ylabel('ยอดขาย (บาท)', fontsize=12)
plt.grid(axis='y', linestyle='--', alpha=0.7)

# เพิ่มค่าบนกราฟแท่ง
for bar in bars:
    height = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2., height + 10,
             f'{height:,}', ha='center', va='bottom')

plt.tight_layout()
plt.show()

### 4.3 กราฟแท่งแนวนอน (Horizontal Bar Plot)

In [None]:
# จัดเรียงข้อมูลตามยอดขาย
product_sorted = product_df.sort_values('sales', ascending=True)

# สร้างกราฟแท่งแนวนอน
plt.figure(figsize=(10, 6))
bars = plt.barh(product_sorted['product'], product_sorted['sales'], color='lightgreen', edgecolor='darkgreen')

plt.title('ยอดขายตามผลิตภัณฑ์ (เรียงลำดับ)', fontsize=16)
plt.xlabel('ยอดขาย (บาท)', fontsize=12)
plt.ylabel('ผลิตภัณฑ์', fontsize=12)
plt.grid(axis='x', linestyle='--', alpha=0.7)

# เพิ่มค่าในกราฟแท่ง
for bar in bars:
    width = bar.get_width()
    plt.text(width + 10, bar.get_y() + bar.get_height()/2.,
             f'{width:,}', va='center')

plt.tight_layout()
plt.show()

### 4.4 กราฟวงกลม (Pie Chart)

In [None]:
# สร้างกราฟวงกลมแสดงส่วนแบ่งตลาดของผลิตภัณฑ์
plt.figure(figsize=(10, 8))
plt.pie(product_df['market_share'], labels=product_df['product'], 
        autopct='%1.1f%%', startangle=90, shadow=True,
        wedgeprops={'edgecolor': 'black'},
        textprops={'fontsize': 12})

plt.title('ส่วนแบ่งตลาดของผลิตภัณฑ์', fontsize=16)
plt.axis('equal')  # ทำให้วงกลมเป็นวงกลมจริงๆ ไม่บิดเบี้ยว
plt.tight_layout()
plt.show()

### 4.5 กราฟกระจาย (Scatter Plot)

In [None]:
# สร้างกราฟกระจายแสดงความสัมพันธ์ระหว่างอายุและรายได้ของลูกค้า
plt.figure(figsize=(10, 6))
plt.scatter(customer_df['age'], customer_df['income'], 
            s=customer_df['spending']/100,  # ขนาดจุดขึ้นอยู่กับค่าใช้จ่าย
            c=customer_df['satisfaction'],  # สีขึ้นอยู่กับความพึงพอใจ
            cmap='viridis', alpha=0.7)

plt.colorbar(label='ระดับความพึงพอใจ')
plt.title('ความสัมพันธ์ระหว่างอายุ รายได้ และค่าใช้จ่ายของลูกค้า', fontsize=16)
plt.xlabel('อายุ (ปี)', fontsize=12)
plt.ylabel('รายได้ (บาท)', fontsize=12)
plt.grid(True, linestyle='--', alpha=0.7)

# เพิ่มคำอธิบายเกี่ยวกับขนาดของจุด
plt.figtext(0.15, 0.02, 'หมายเหตุ: ขนาดของจุดแสดงถึงค่าใช้จ่ายของลูกค้า', fontsize=10)

plt.tight_layout()
plt.show()

### 4.6 ฮีสโตแกรม (Histogram)

In [None]:
# สร้างฮีสโตแกรมแสดงการกระจายของอายุลูกค้า
plt.figure(figsize=(10, 6))
plt.hist(customer_df['age'], bins=10, color='purple', alpha=0.7, edgecolor='black')

plt.title('การกระจายของอายุลูกค้า', fontsize=16)
plt.xlabel('อายุ (ปี)', fontsize=12)
plt.ylabel('จำนวนลูกค้า', fontsize=12)
plt.grid(True, linestyle='--', alpha=0.7)

# เพิ่มค่าเฉลี่ยและค่ามัธยฐาน
mean_age = customer_df['age'].mean()
median_age = customer_df['age'].median()
plt.axvline(mean_age, color='red', linestyle='--', linewidth=2, label=f'ค่าเฉลี่ย: {mean_age:.1f}')
plt.axvline(median_age, color='green', linestyle='-', linewidth=2, label=f'ค่ามัธยฐาน: {median_age:.1f}')
plt.legend()

plt.tight_layout()
plt.show()

### 4.7 การสร้างกราฟย่อยหลายกราฟ (Subplots)

In [None]:
# สร้างกราฟย่อยหลายกราฟในตารางเดียวกัน
fig, axes = plt.subplots(2, 2, figsize=(14, 10))

# กราฟแรก: กราฟเส้นแสดงยอดขายและค่าใช้จ่าย
axes[0, 0].plot(sales_df['month'], sales_df['sales'], marker='o', color='blue', label='ยอดขาย')
axes[0, 0].plot(sales_df['month'], sales_df['expenses'], marker='s', color='red', label='ค่าใช้จ่าย')
axes[0, 0].set_title('ยอดขายและค่าใช้จ่ายรายเดือน')
axes[0, 0].set_xlabel('เดือน')
axes[0, 0].set_ylabel('จำนวนเงิน (บาท)')
axes[0, 0].legend()
axes[0, 0].grid(True, linestyle='--', alpha=0.7)
axes[0, 0].tick_params(axis='x', rotation=45)

# กราฟที่สอง: กราฟแท่งแสดงยอดขายตามผลิตภัณฑ์
bars = axes[0, 1].bar(product_df['product'], product_df['sales'], color='skyblue')
axes[0, 1].set_title('ยอดขายตามผลิตภัณฑ์')
axes[0, 1].set_xlabel('ผลิตภัณฑ์')
axes[0, 1].set_ylabel('ยอดขาย (บาท)')
axes[0, 1].tick_params(axis='x', rotation=45)
axes[0, 1].grid(axis='y', linestyle='--', alpha=0.7)

# กราฟที่สาม: ฮีสโตแกรมแสดงการกระจายของรายได้ลูกค้า
axes[1, 0].hist(customer_df['income'], bins=10, color='green', alpha=0.7, edgecolor='black')
axes[1, 0].set_title('การกระจายของรายได้ลูกค้า')
axes[1, 0].set_xlabel('รายได้ (บาท)')
axes[1, 0].set_ylabel('จำนวนลูกค้า')
axes[1, 0].grid(True, linestyle='--', alpha=0.7)

# กราฟที่สี่: กราฟวงกลมแสดงลูกค้าตามภูมิภาค
region_counts = customer_df['region'].value_counts()
axes[1, 1].pie(region_counts, labels=region_counts.index, autopct='%1.1f%%', startangle=90,
               shadow=True, wedgeprops={'edgecolor': 'black'})
axes[1, 1].set_title('สัดส่วนลูกค้าตามภูมิภาค')
axes[1, 1].axis('equal')

plt.tight_layout()
plt.suptitle('ภาพรวมข้อมูลธุรกิจ', fontsize=20, y=1.02)
plt.subplots_adjust(top=0.9)
plt.show()

## 5. การสร้างการแสดงผลข้อมูลด้วย Seaborn

Seaborn เป็นไลบรารีที่สร้างขึ้นบน Matplotlib แต่มีความสามารถในการสร้างกราฟที่สวยงามและซับซ้อนได้ง่ายกว่า

### 5.1 การตั้งค่าสไตล์ของ Seaborn

In [None]:
# ตัวอย่างการตั้งค่าสไตล์ต่างๆ ของ Seaborn
styles = ['whitegrid', 'darkgrid', 'white', 'dark', 'ticks']
contexts = ['paper', 'notebook', 'talk', 'poster']

# แสดงตัวอย่างสไตล์ต่างๆ
fig, axes = plt.subplots(len(styles), 1, figsize=(10, 15))

for i, style in enumerate(styles):
    sns.set_style(style)
    ax = axes[i]
    sns.lineplot(x=sales_df['month'], y=sales_df['sales'], ax=ax)
    ax.set_title(f'Style: {style}')
    ax.set_xlabel('เดือน')
    ax.set_ylabel('ยอดขาย')
    
plt.tight_layout()
plt.show()

# กลับไปใช้สไตล์ whitegrid
sns.set_style("whitegrid")

### 5.2 การสร้างกราฟเส้นด้วย Seaborn (Line Plot)

In [None]:
# สร้างกราฟเส้นด้วย Seaborn
plt.figure(figsize=(12, 6))
sns.lineplot(data=sales_df, x='month', y='sales', marker='o', label='ยอดขาย')
sns.lineplot(data=sales_df, x='month', y='expenses', marker='s', label='ค่าใช้จ่าย')
sns.lineplot(data=sales_df, x='month', y='profit', marker='^', label='กำไร')

plt.title('ยอดขาย ค่าใช้จ่าย และกำไรรายเดือน ปี 2023', fontsize=16)
plt.xlabel('เดือน', fontsize=12)
plt.ylabel('จำนวนเงิน (บาท)', fontsize=12)
plt.xticks(rotation=45)
plt.legend(title='ประเภท')

plt.tight_layout()
plt.show()

### 5.3 การสร้างกราฟแท่งด้วย Seaborn (Bar Plot)

In [None]:
# สร้างกราฟแท่งด้วย Seaborn
plt.figure(figsize=(12, 6))
sns.barplot(data=product_df, x='product', y='sales', hue='product', palette='viridis')

plt.title('ยอดขายตามผลิตภัณฑ์', fontsize=16)
plt.xlabel('ผลิตภัณฑ์', fontsize=12)
plt.ylabel('ยอดขาย (บาท)', fontsize=12)
plt.xticks(rotation=45)
plt.legend().remove()  # ลบ legend เนื่องจากมีสีเหมือนกับแท่ง

# เพิ่มค่าบนกราฟแท่ง
for i, v in enumerate(product_df['sales']):
    plt.text(i, v + 10, f"{v:,}", ha='center')

plt.tight_layout()
plt.show()

### 5.4 การสร้างแผนภูมิกล่อง (Box Plot)

In [None]:
# เตรียมข้อมูลสำหรับ Box Plot
melted_sales = pd.melt(sales_df, id_vars='category', value_vars=['sales', 'expenses', 'profit'],
                        var_name='metric', value_name='value')

# สร้าง Box Plot
plt.figure(figsize=(12, 6))
sns.boxplot(data=melted_sales, x='category', y='value', hue='metric', palette='Set2')

plt.title('การเปรียบเทียบยอดขาย ค่าใช้จ่าย และกำไรตามหมวดหมู่', fontsize=16)
plt.xlabel('หมวดหมู่', fontsize=12)
plt.ylabel('จำนวนเงิน (บาท)', fontsize=12)
plt.legend(title='ตัวชี้วัด')

plt.tight_layout()
plt.show()

### 5.5 การสร้างกราฟกระจาย (Scatter Plot) ด้วย Seaborn

In [None]:
# สร้างกราฟกระจายด้วย Seaborn
plt.figure(figsize=(10, 6))
sns.scatterplot(data=customer_df, x='age', y='income', 
                hue='region', size='spending', sizes=(20, 200),
                palette='deep')

plt.title('ความสัมพันธ์ระหว่างอายุ รายได้ ค่าใช้จ่าย และภูมิภาคของลูกค้า', fontsize=16)
plt.xlabel('อายุ (ปี)', fontsize=12)
plt.ylabel('รายได้ (บาท)', fontsize=12)
plt.legend(title='ภูมิภาค', bbox_to_anchor=(1.05, 1), loc='upper left')

plt.tight_layout()
plt.show()

### 5.6 การสร้างแผนที่ความร้อน (Heatmap)

In [None]:
# สร้างข้อมูลสำหรับ Heatmap โดยใช้ความสัมพันธ์ของข้อมูลลูกค้า
correlation = customer_df.corr()

# สร้าง Heatmap
plt.figure(figsize=(10, 8))
sns.heatmap(correlation, annot=True, cmap='coolwarm', fmt='.2f', linewidths=.5)

plt.title('ความสัมพันธ์ระหว่างตัวแปรของข้อมูลลูกค้า', fontsize=16)

plt.tight_layout()
plt.show()

### 5.7 การสร้างกราฟคู่ (Pair Plot)

In [None]:
# สร้าง Pair Plot เพื่อดูความสัมพันธ์ระหว่างตัวแปรต่างๆ
plt.figure(figsize=(12, 10))
sns.pairplot(customer_df[['age', 'income', 'spending', 'satisfaction']], 
             hue='satisfaction', palette='viridis', diag_kind='kde', height=2.5)

plt.suptitle('ความสัมพันธ์ระหว่างตัวแปรต่างๆ ของข้อมูลลูกค้า', fontsize=16, y=1.02)

plt.tight_layout()
plt.show()

### 5.8 การสร้างกราฟการกระจาย (Distribution Plot)

In [None]:
# สร้างกราฟการกระจายของข้อมูลลูกค้า
plt.figure(figsize=(15, 10))

plt.subplot(2, 2, 1)
sns.histplot(customer_df['age'], kde=True, color='blue')
plt.title('การกระจายของอายุลูกค้า')
plt.xlabel('อายุ (ปี)')
plt.ylabel('จำนวนลูกค้า')

plt.subplot(2, 2, 2)
sns.histplot(customer_df['income'], kde=True, color='green')
plt.title('การกระจายของรายได้ลูกค้า')
plt.xlabel('รายได้ (บาท)')
plt.ylabel('จำนวนลูกค้า')

plt.subplot(2, 2, 3)
sns.histplot(customer_df['spending'], kde=True, color='red')
plt.title('การกระจายของค่าใช้จ่ายลูกค้า')
plt.xlabel('ค่าใช้จ่าย (บาท)')
plt.ylabel('จำนวนลูกค้า')

plt.subplot(2, 2, 4)
sns.histplot(customer_df['satisfaction'], kde=True, bins=10, color='purple')
plt.title('การกระจายของความพึงพอใจลูกค้า')
plt.xlabel('ระดับความพึงพอใจ (1-5)')
plt.ylabel('จำนวนลูกค้า')

plt.tight_layout()
plt.suptitle('การกระจายของข้อมูลลูกค้า', fontsize=16, y=1.02)
plt.subplots_adjust(top=0.9)
plt.show()

### 5.9 การสร้างกราฟเส้นที่มีช่วงความเชื่อมั่น (Line Plot with Confidence Interval)

In [None]:
# เตรียมข้อมูลสำหรับกราฟเส้นที่มีช่วงความเชื่อมั่น
# สร้างข้อมูลจำลองเพิ่มเติม
monthly_data = pd.DataFrame({
    'month': np.repeat(sales_df['month'], 5),
    'sales': np.random.normal(loc=sales_df['sales'].values.repeat(5), scale=50),
    'year': np.random.choice(['2023', '2024'], size=5*len(sales_df['month']))
})

# สร้างกราฟเส้นที่มีช่วงความเชื่อมั่น
plt.figure(figsize=(12, 6))
sns.lineplot(data=monthly_data, x='month', y='sales', hue='year', style='year',
             markers=True, dashes=False, ci=95)

plt.title('ยอดขายรายเดือนปี 2023-2024 พร้อมช่วงความเชื่อมั่น 95%', fontsize=16)
plt.xlabel('เดือน', fontsize=12)
plt.ylabel('ยอดขาย (บาท)', fontsize=12)
plt.xticks(rotation=45)
plt.legend(title='ปี')

plt.tight_layout()
plt.show()

## 6. การเลือกใช้ประเภทของการแสดงผลข้อมูลให้เหมาะสม

การเลือกใช้ประเภทของการแสดงผลข้อมูลให้เหมาะสมกับข้อมูลและวัตถุประสงค์เป็นสิ่งสำคัญ ต่อไปนี้เป็นแนวทางในการเลือกใช้:

### 6.1 การเลือกใช้ประเภทของกราฟตามประเภทข้อมูลและวัตถุประสงค์

#### เมื่อต้องการแสดงการเปลี่ยนแปลงตามเวลา:
- **กราฟเส้น (Line Plot)**: เหมาะสำหรับแสดงแนวโน้มและการเปลี่ยนแปลงที่ต่อเนื่องตามเวลา
- **กราฟแท่ง (Bar Plot)**: เหมาะสำหรับแสดงการเปลี่ยนแปลงในช่วงเวลาที่ไม่ต่อเนื่อง
- **กราฟพื้นที่ (Area Plot)**: เหมาะสำหรับแสดงปริมาณและการเปลี่ยนแปลงสะสมตามเวลา

#### เมื่อต้องการเปรียบเทียบค่าระหว่างกลุ่ม:
- **กราฟแท่ง (Bar Plot)**: เหมาะสำหรับเปรียบเทียบค่าระหว่างกลุ่มต่างๆ
- **กราฟแท่งแนวนอน (Horizontal Bar Plot)**: เหมาะสำหรับเปรียบเทียบค่าระหว่างกลุ่มที่มีชื่อยาว
- **แผนภูมิกล่อง (Box Plot)**: เหมาะสำหรับแสดงการกระจายและเปรียบเทียบสถิติสำคัญระหว่างกลุ่ม

#### เมื่อต้องการแสดงสัดส่วน:
- **กราฟวงกลม (Pie Chart)**: เหมาะสำหรับแสดงสัดส่วนของทั้งหมด แต่ควรมีไม่เกิน 5-7 กลุ่ม
- **กราฟแท่งที่เป็นเปอร์เซ็นต์ (Percentage Stacked Bar Chart)**: เหมาะสำหรับแสดงสัดส่วนที่มีหลายกลุ่ม
- **กราฟวงแหวน (Donut Chart)**: คล้ายกับกราฟวงกลมแต่มีรูตรงกลาง

#### เมื่อต้องการแสดงความสัมพันธ์:
- **กราฟกระจาย (Scatter Plot)**: เหมาะสำหรับแสดงความสัมพันธ์ระหว่างตัวแปร 2 ตัว
- **แผนที่ความร้อน (Heatmap)**: เหมาะสำหรับแสดงความสัมพันธ์ระหว่างตัวแปรหลายตัว
- **กราฟคู่ (Pair Plot)**: เหมาะสำหรับแสดงความสัมพันธ์ระหว่างตัวแปรหลายคู่

#### เมื่อต้องการแสดงการกระจาย:
- **ฮีสโตแกรม (Histogram)**: เหมาะสำหรับแสดงการกระจายของข้อมูลตัวแปรเดียว
- **กราฟการกระจาย (Distribution Plot)**: เหมาะสำหรับแสดงการกระจายของข้อมูลพร้อมเส้นโค้งความหนาแน่น
- **แผนภูมิกล่อง (Box Plot)**: เหมาะสำหรับแสดงการกระจายและสถิติสำคัญเช่น ค่ามัธยฐาน, quartiles
- **แผนภูมิไวโอลิน (Violin Plot)**: เหมาะสำหรับแสดงการกระจายของข้อมูลและความหนาแน่น

### 6.2 หลักการออกแบบการแสดงผลข้อมูลที่ดี

1. **ความชัดเจนเป็นหัวใจสำคัญ**
   - มีชื่อกราฟ (Title) ที่ชัดเจนและสื่อความหมาย
   - มีคำอธิบายแกน (Axis Labels) ที่ชัดเจนและมีหน่วย
   - ใช้สีที่แตกต่างกันอย่างเหมาะสม
   - มีคำอธิบายส่วนประกอบ (Legend) ที่เข้าใจง่าย

2. **ความเรียบง่าย (Simplicity)**
   - ลดความรกรุงรังของข้อมูล (Data Ink Ratio)
   - แสดงเฉพาะข้อมูลที่จำเป็น
   - ใช้ Grid Lines อย่างเหมาะสม
   - หลีกเลี่ยงการใช้เทคนิคพิเศษที่ไม่จำเป็น (3D, เงา)

3. **การใช้สีอย่างมีประสิทธิภาพ**
   - ใช้สีอย่างมีวัตถุประสงค์และมีความหมาย
   - ใช้ความตัดกันของสีอย่างเหมาะสม
   - คำนึงถึงผู้ที่มีปัญหาในการมองเห็นสี (Colorblind-friendly)
   - ใช้ Colormap ที่เหมาะสมกับประเภทข้อมูล

4. **การจัดวางองค์ประกอบ**
   - จัดวางกราฟให้มีความสมดุล
   - ใช้พื้นที่อย่างมีประสิทธิภาพ
   - ระวังการซ้อนทับของข้อความหรือองค์ประกอบ
   - เรียงลำดับข้อมูลอย่างมีความหมาย

5. **การปรับแต่งตามกลุ่มเป้าหมาย**
   - ปรับขนาดตัวอักษรให้อ่านง่าย
   - ใช้ภาษาที่เหมาะสมกับกลุ่มเป้าหมาย
   - พิจารณาความรู้พื้นฐานของผู้ชม
   - เพิ่มการอธิบายเพิ่มเติมหากจำเป็น

## 7. แบบฝึกหัด: สร้างและปรับแต่งการแสดงผลข้อมูล

ให้สร้างแดชบอร์ดสำหรับแสดงข้อมูลลูกค้าและยอดขาย โดยใช้ข้อมูลที่มีอยู่ ประกอบด้วย:

1. การกระจายของรายได้และค่าใช้จ่ายของลูกค้าตามภูมิภาค
2. ความสัมพันธ์ระหว่างอายุและความพึงพอใจของลูกค้า
3. แนวโน้มยอดขายและกำไรตามเวลา
4. การเปรียบเทียบยอดขายและคะแนนความพึงพอใจของผลิตภัณฑ์

ให้เลือกใช้ประเภทของกราฟให้เหมาะสมกับข้อมูลและวัตถุประสงค์ พร้อมทั้งปรับแต่งให้อ่านง่ายและสวยงาม

In [None]:
# เพิ่มโค้ดของคุณที่นี่
# สร้างแดชบอร์ดข้อมูลลูกค้าและยอดขาย

# สร้างตัวแปรเพื่อเก็บข้อมูลที่จำเป็น

# สร้าง subplots สำหรับแดชบอร์ด
fig, axes = plt.subplots(2, 2, figsize=(20, 16))

# 1. การกระจายของรายได้และค่าใช้จ่ายของลูกค้าตามภูมิภาค

# 2. ความสัมพันธ์ระหว่างอายุและความพึงพอใจของลูกค้า

# 3. แนวโน้มยอดขายและกำไรตามเวลา

# 4. การเปรียบเทียบยอดขายและคะแนนความพึงพอใจของผลิตภัณฑ์

# ปรับแต่งแดชบอร์ด
plt.tight_layout()
plt.suptitle('แดชบอร์ดข้อมูลลูกค้าและยอดขาย', fontsize=24, y=1.02)
plt.subplots_adjust(top=0.95)
plt.show()

## 8. สรุป

การแสดงผลข้อมูล (Data Visualization) เป็นเครื่องมือสำคัญในการสื่อสารข้อมูลและสนับสนุนการตัดสินใจ การเลือกใช้ประเภทของการแสดงผลข้อมูลให้เหมาะสมกับข้อมูลและวัตถุประสงค์จะช่วยให้การสื่อสารมีประสิทธิภาพมากขึ้น

ในบทเรียนนี้ เราได้เรียนรู้:
- ความสำคัญของการแสดงผลข้อมูล
- การสร้างกราฟพื้นฐานด้วย Matplotlib
- การสร้างการแสดงผลข้อมูลที่สวยงามด้วย Seaborn
- หลักการเลือกใช้ประเภทของการแสดงผลข้อมูล
- หลักการออกแบบการแสดงผลข้อมูลที่ดี

ทักษะเหล่านี้จะช่วยให้คุณสามารถนำเสนอข้อมูลได้อย่างมีประสิทธิภาพและน่าสนใจ ซึ่งเป็นส่วนสำคัญในการทำงานด้าน Data Science และ Data Analytics

---

## แหล่งข้อมูลเพิ่มเติม

1. [Matplotlib Documentation](https://matplotlib.org/stable/contents.html)
2. [Seaborn Documentation](https://seaborn.pydata.org/tutorial.html)
3. [Data Visualization with Python](https://www.python-graph-gallery.com/)
4. [Storytelling with Data](http://www.storytellingwithdata.com/)
5. [Information is Beautiful](https://informationisbeautiful.net/)