คำสั่งนี้มีประโยชน์มากเวลาป๋าต้องทำรายงานส่งหัวหน้า เช่น "เดือนนี้ขายสินค้าหมวดไหนดีสุด?" หรือ "ยอดโอนเงินกับเก็บเงินปลายทาง อันไหนเยอะกว่ากัน?"

มาดูตัวอย่างงานร้านค้าออนไลน์กันต่อครับ

In [1]:
import pandas as pd

# ข้อมูลการขายรายวัน
data = {
    'Order_ID': ['001', '002', '003', '004', '005', '006'],
    'Category': ['เสื้อผ้า', 'ไอที', 'เสื้อผ้า', 'ของใช้บ้าน', 'ไอที', 'ไอที'],
    'Payment': ['โอนเงิน', 'ปลายทาง', 'โอนเงิน', 'ปลายทาง', 'โอนเงิน', 'บัตรเครดิต'],
    'Amount': [500, 2500, 300, 150, 12000, 5000]
}

df = pd.DataFrame(data)

print('--- ยอดขายวันนี้ ---')
print(df)

--- ยอดขายวันนี้ ---
  Order_ID    Category     Payment  Amount
0      001    เสื้อผ้า     โอนเงิน     500
1      002        ไอที     ปลายทาง    2500
2      003    เสื้อผ้า     โอนเงิน     300
3      004  ของใช้บ้าน     ปลายทาง     150
4      005        ไอที     โอนเงิน   12000
5      006        ไอที  บัตรเครดิต    5000


2. Grouping: รวมยอดขายตาม "หมวดสินค้า"
ถ้าป๋าอยากรู้ว่า "สินค้าแต่ละหมวด ขายได้เงินรวมเท่าไหร่?" หลักการคือ: "จัดกลุ่มตาม Category -> แล้วเอาช่อง Amount มาบวกกัน (sum)"

In [2]:
# จัดกลุ่มตาม 'Category' แล้วหาผลรวมของ Amount
category_sales = df.groupby('Category')['Amount'].sum()

print('--- ยอดขายแยกตามหมวดสินค้า (บาท) ---')
print(category_sales)

--- ยอดขายแยกตามหมวดสินค้า (บาท) ---
Category
ของใช้บ้าน      150
เสื้อผ้า        800
ไอที          19500
Name: Amount, dtype: int64


3. Grouping: นับจำนวนออเดอร์ตาม "วิธีจ่ายเงิน"
โจทย์นี้ฝ่ายบัญชีชอบถามครับ "วันนี้มีคนโอนมากี่คน? เก็บปลายทางกี่เจ้า?" หลักการคือ: "จัดกลุ่มตาม Payment -> แล้วนับจำนวน (count)"

In [3]:
payment_count = df.groupby('Payment')['Order_ID'].count()

print('--- จำนวนออเดอร์แยกตามวิธีจ่ายเงิน ---')
print(payment_count)

--- จำนวนออเดอร์แยกตามวิธีจ่ายเงิน ---
Payment
บัตรเครดิต    1
ปลายทาง       2
โอนเงิน       3
Name: Order_ID, dtype: int64


4. Advance: สรุปแบบหลายมิติ (เหมือน Pivot Table)
ถ้าป๋าอยากดูละเอียดขึ้น เช่น "ในแต่ละหมวดสินค้า ลูกค้าจ่ายเงินแบบไหนบ้าง และยอดเป็นเท่าไหร่" เราสามารถ Group ทีละ 2 คอลัมน์ได้ครับ

In [4]:
report = df.groupby(['Category', 'Payment'])['Amount'].sum()

print('--- รายงานละเอียด ---')
print(report)

--- รายงานละเอียด ---
Category    Payment   
ของใช้บ้าน  ปลายทาง         150
เสื้อผ้า    โอนเงิน         800
ไอที        บัตรเครดิต     5000
            ปลายทาง        2500
            โอนเงิน       12000
Name: Amount, dtype: int64


ใน Pandas การเซฟไฟล์ (Export) นั้นง่ายเหมือนปอกกล้วยครับ คำสั่งหลักคือ .to_csv() และ .to_excel()

1. วิธี Export เป็นไฟล์ CSV (ไฟล์ Text ที่เปิดได้ทุกโปรแกรม)
อันนี้ยอดฮิตครับ แต่มี ข้อควรระวังเรื่องภาษาไทย ครับ

ถ้าป๋าใช้คำสั่งปกติ เปิดมาภาษาไทยอาจจะเป็น "ภาษาต่างดาว" อ่านไม่ออก ต้องเติมโค้ดพิเศษ encoding='utf-8-sig' เข้าไปครับ

In [5]:
category_sales.to_csv('../output/สรุปยอดขายรายวัน.csv', encoding='utf-8-sig')
print('บันทึกไฟล์ CSV เรียบร้อยครับ')

บันทึกไฟล์ CSV เรียบร้อยครับ


2. วิธี Export เป็นไฟล์ Excel (.xlsx)
อันนี้หัวหน้าชอบแน่นอน เพราะเปิดแล้วจัดรูปแบบต่อได้เลย

In [6]:
category_sales.to_excel('../output/สรุปยยอดขายรายวัน.xlsx')
print('--- บันทึกไฟล์ Excel เรียบร้อยครับ')

--- บันทึกไฟล์ Excel เรียบร้อยครับ


3. [เทคนิคเสริม] การจัดหน้าตาให้สวยก่อน Export
ป๋าจำได้ไหมครับว่าตอนเราใช้ groupby ผลลัพธ์ที่ได้
คำว่า Category มันจะกลายเป็นหัวแถว (Index) ไม่ใช่หัวตารางปกติ เวลา Export ไป Excel บางทีมันจะดูแปลกๆ

จุกเงินแนะนำท่านี้ครับ: ให้ใช้คำสั่ง .reset_index() ก่อนเซฟ มันจะดึง Category กลับมาเป็นคอลัมน์ปกติ เหมือนตาราง Excel ทั่วไปครับ

In [7]:
# 1. รีเซ็ต Index ให้เป็นตารางสวยงามก่อน
clean_report = category_sales.reset_index()

# 2. ตั้งชื่อคอลัมน์ใหม่ให้ชัดเจน (ถ้าต้องการ)
clean_report.columns = ['หมวดสินค้า', 'ยอดขายรวม']

# 3. Export เป็น Excel โดยไม่เอาเลขบรรทัด (Index) 0, 1, 2 ติดไปด้วย
clean_report.to_excel('../output/รายงานยอดขายแบบสวย.xlsx', index=False)

print("--- หน้าตาข้อมูลก่อนเซฟ ---")
print(clean_report)

--- หน้าตาข้อมูลก่อนเซฟ ---
   หมวดสินค้า  ยอดขายรวม
0  ของใช้บ้าน        150
1    เสื้อผ้า        800
2        ไอที      19500
