In [None]:
import matplotlib.pyplot as plt
import seaborn as sns

# 1. ตั้งค่าฟอนต์ภาษาไทย (ถ้ารันในเครื่องตัวเองที่มีฟอนต์ Tahoma)
# หมายเหตุ: ถ้าใน Kaggle/Colab อาจต้องลงฟอนต์เพิ่ม ถ้าไม่ขึ้นให้ใช้ภาษาอังกฤษแทน
plt.rcParams['font.family'] = 'Tahoma' 

# 2. สร้าง List สีธีมคริสต์มาส (แดง เขียว ทอง)
christmas_palette = ['#D6001C', '#00873C', '#FFD700', '#A00000', '#005000']
sns.set_palette(sns.color_palette(christmas_palette))

In [None]:
# แปลงวันที่ก่อน (ถ้ายังไม่ได้ทำ)
df['date'] = pd.to_datetime(df['date'])

# Filter เอาเฉพาะวันที่ 25 ธันวาคม ของทุกปี
dec25_data = df[(df['date'].dt.month == 12) & (df['date'].dt.day == 25)]

# รวมยอดสตรีมของวันคริสต์มาสในแต่ละปี
yearly_christmas_peak = dec25_data.groupby('year')['streams'].sum().reset_index()

# พล็อต
plt.figure(figsize=(10, 6))
# ใช้สีแดงสีเดียวแต่ไล่เฉด (Reds) ให้ดูขลัง
sns.barplot(data=yearly_christmas_peak, x='year', y='streams', palette='Reds') 

plt.title('ยอดฟังเพลงรวมในวันคริสต์มาส (25 ธ.ค.) ของแต่ละปี') # ภาษาไทย
plt.xlabel('ปี ค.ศ.')
plt.ylabel('ยอดสตรีมรวม (Streams)')
plt.show()

In [None]:
# ต้องลง library นี้ก่อน: pip install bar_chart_race ffmpeg
import bar_chart_race as bcr

# 1. เตรียมข้อมูล: Pivot Table (สำคัญมาก อาจารย์ชอบถามตรงนี้)
# index=วันที่, columns=ชื่อเพลง, values=ยอดฟัง
df_race = df.pivot_table(values='streams', index='date', columns='track_name', aggfunc='sum')

# เพื่อไม่ให้โหลดนาน เลือกมาแค่ช่วงเดือน ธ.ค. 2023 หรือปีล่าสุดพอ
df_race_dec = df_race[(df_race.index >= '2023-12-01') & (df_race.index <= '2023-12-31')]

# 2. จัดการข้อมูลที่เป็น NaN (เพลงที่ไม่มีคนฟังวันนั้นให้เป็น 0)
df_race_dec.fillna(0, inplace=True)

# 3. สร้างวิดีโอ (เลือก Top 10 เพลง)
bcr.bar_chart_race(
    df=df_race_dec,
    n_bars=10,
    fixed_order=False,
    fixed_max=True,
    title='การแข่งขันยอดฟังเพลงคริสต์มาส (Dec 2023)',
    colors='dark12', # หรือใช้สีอื่น
    filename='christmas_race.mp4' # เซฟเป็นไฟล์วิดีโอ
)

In [None]:
# รายชื่อศิลปินที่ต้องการเปรียบเทียบ
target_artists = ['Mariah Carey', 'Wham!', 'Ariana Grande', 'Michael Bublé']

# Filter เอาเฉพาะศิลปินเหล่านี้
top_artists_df = df[df['artist'].isin(target_artists)]

# รวมยอด streams ทั้งหมดของแต่ละคน
artist_comparison = top_artists_df.groupby('artist')['streams'].sum().sort_values(ascending=False).reset_index()

plt.figure(figsize=(10, 6))
sns.barplot(data=artist_comparison, x='artist', y='streams', palette='viridis')
plt.title('Total Streams Comparison: Top Christmas Artists')
plt.ylabel('Total Streams (Cumulative)')
plt.show()

In [None]:
# สร้างคอลัมน์ชื่อวัน (Monday, Tuesday, ...)
df['day_name'] = df['date'].dt.day_name()

# เรียงลำดับวันให้สวยงาม (ไม่ใช่เรียงตามตัวอักษร)
days_order = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']

# หาค่าเฉลี่ยการฟังในแต่ละวัน
daily_pattern = df.groupby('day_name')['streams'].mean().reindex(days_order).reset_index()

plt.figure(figsize=(10, 6))
sns.barplot(data=daily_pattern, x='day_name', y='streams', palette='coolwarm')
plt.title('Average Streams by Day of Week')
plt.xlabel('Day of Week')
plt.ylabel('Average Streams')
plt.show()

In [None]:
##สรุปคำตอบสั้นๆ เวลาอาจารย์จิ้มถามโค้ด:
ถาม: "ทำไมต้อง dt.month == 12?"

ตอบ: "เพื่อ Filter (กรอง) ข้อมูลเอาเฉพาะเดือนธันวาคมครับ ใช้คำสั่ง dt เพื่อเข้าถึงคุณสมบัติของวันที่ครับ"

ถาม: "กราฟสีแดงเขียวทำยังไง?"

ตอบ: "ผมกำหนด Palette เองครับ โดยใส่ Hex Code ของสีแดงและเขียวเข้าไป เพื่อให้ Mood & Tone ตรงกับเทศกาลครับ"

ถาม: "Bar Chart Race ต้องเตรียมข้อมูลยังไง?"

ตอบ: "ต้องใช้ Pivot Table ครับ เพื่อกระจายชื่อเพลงไปเป็น Column ทำให้เห็นการเปลี่ยนแปลงของแต่ละเพลงเทียบกันในแต่ละวันครับ"