Trong phần này, chúng em sẽ trực quan hóa các phát hiện chính từ quá trình phân tích dữ liệu quán ăn và món ăn trên ShopeeFood.

In [3]:
import pandas as pd
import plotly.express as px

restaurants_df = pd.read_csv("restaurants_cleaned.csv")
items_df = pd.read_csv("items_cleaned.csv")
restaurant_by_district = restaurants_df["District"].value_counts()

Biểu đồ từ dữ liệu quán ăn (Restaurants)

a. Biểu đồ: Top 5 quận có nhiều quán ăn nhất

In [6]:


# Lấy top 5 quận có nhiều quán nhất
restaurant_by_district = restaurants_df["District"].value_counts().nlargest(5)

# Vẽ biểu đồ thanh ngang
fig = px.bar(
    restaurant_by_district[::-1],  # đảo để quận nhiều nằm trên cùng
    orientation='h',
    text=restaurant_by_district[::-1],
    labels={'value': 'Số lượng quán', 'index': 'Quận/Huyện'},
    title='Top 5 Quận/Huyện Có Nhiều Quán Ăn Nhất',
)

# Cài đặt hiển thị chữ và hover
fig.update_traces(
    texttemplate='%{text}',
    hovertemplate='Quận: %{x}<br>Số lượng quán: %{y}',
    marker_color='lightskyblue'
)

# Tùy chỉnh layout + font tiêu đề to và in đậm
fig.update_layout(
    xaxis_title='Số lượng quán',
    yaxis_title='Quận/Huyện',
    height=400,
    title_font=dict(size=24, family='Arial', color='black'),  # Kích thước tiêu đề và in đậm
    title_x=0.5  # Căn giữa tiêu đề
)

# Hiển thị
fig.show()


b. Biểu đồ: Top 10 quán có nhiều món ăn nhất

In [5]:
import plotly.express as px

# Đếm số món ăn theo từng quán
dish_count_by_restaurant = items_df.groupby("Restaurant_Name")["Dish_Name"].count()

# Lấy top 10 quán có nhiều món nhất
top_dish_restaurants = dish_count_by_restaurant.sort_values(ascending=False).head(10)

# Vẽ biểu đồ thanh ngang
fig = px.bar(
    top_dish_restaurants[::-1],  # đảo ngược để quán nhiều món nằm trên cùng
    x=top_dish_restaurants[::-1],
    y=top_dish_restaurants[::-1].index,
    orientation='h',
    text=top_dish_restaurants[::-1],
    labels={'y': 'Tên Quán', 'x': 'Số Món Ăn'},
    title='Top 10 Quán Có Số Lượng Món Ăn Nhiều Nhất'
)

# Tuỳ chỉnh hiển thị
fig.update_traces(
    texttemplate='%{text}',
    hovertemplate='Quán: %{y}<br>Số món ăn: %{x}',
    marker_color='darkorange'
)

fig.update_layout(
    title_font=dict(size=22, family='Arial', color='black'),
    title_x=0.5,
    height=500,
    xaxis_title='Số Món Ăn',
    yaxis_title='Tên Quán'
)

fig.show()


Biểu đồ từ dữ liệu món ăn (Items)

 a. Biểu đồ: Top 10 món ăn phổ biến nhất

In [7]:
import plotly.express as px

# Đếm tần suất món ăn và lấy Top 10
top_dishes = items_df["Dish_Name"].value_counts().head(10)

# Chuyển sang DataFrame để dễ vẽ
top_dishes_df = top_dishes.reset_index()
top_dishes_df.columns = ["Dish_Name", "Count"]

# Vẽ biểu đồ thanh dọc
fig = px.bar(
    top_dishes_df,
    x="Dish_Name",
    y="Count",
    text="Count",
    title="Top 10 Món Ăn Phổ Biến Nhất",
    labels={"Dish_Name": "Tên Món Ăn", "Count": "Số Lần Xuất Hiện"}
)

# Tuỳ chỉnh hiển thị
fig.update_traces(
    texttemplate='%{text}',
    hovertemplate='Món: %{x}<br>Số lần xuất hiện: %{y}',
    marker_color='seagreen'
)

fig.update_layout(
    title_font=dict(size=22, family='Arial'),
    title_x=0.5,
    xaxis_title="Tên Món Ăn",
    yaxis_title="Số Lần Xuất Hiện",
    xaxis_tickangle=-45,  # xoay nhãn để không bị chồng lên nhau
    height=500
)

fig.show()


b. Biểu đồ: Top 10 món ăn đắt nhất

In [8]:
import plotly.express as px

# Đọc dữ liệu đã lọc sạch
items_df = pd.read_csv("items_cleaned.csv")

# Lấy Top 5 món đắt nhất
top10_expensive = items_df.sort_values(by="Dish_Price", ascending=False).head(10)

# Vẽ biểu đồ thanh ngang
fig = px.bar(
    top10_expensive[::-1],  # đảo ngược để món đắt nhất nằm trên cùng
    x="Dish_Price",
    y="Dish_Name",
    orientation="h",
    text="Dish_Price",
    title="Top 5 Món Ăn Đắt Nhất",
    labels={"Dish_Price": "Giá (VNĐ)", "Dish_Name": "Tên Món"}
)

# Tuỳ chỉnh hiển thị
fig.update_traces(
    texttemplate='%{text:,.0f}đ',
    hovertemplate='Món: %{y}<br>Giá: %{x:,.0f}đ',
    marker_color='crimson'
)

fig.update_layout(
    title_font=dict(size=22, color='black'),
    title_x=0.5,
    height=400,
    xaxis_title="Giá món ăn (VNĐ)",
    yaxis_title="Tên món ăn"
)

fig.show()



Qua quá trình trực quan hóa, chúng tôi nhận thấy:
- Khu vực Hà Đông là nơi tập trung nhiều quán ăn nhất, có thể là thị trường tiềm năng cho người kinh doanh ẩm thực.
- Một số quán có lượng đánh giá rất cao, cho thấy mức độ phổ biến và uy tín trong khu vực.
- Đồ uống chiếm tỷ trọng lớn trong top các món phổ biến, phản ánh xu hướng tiêu dùng tiện lợi và nhanh chóng.
- Giá món ăn có sự phân tán cao, tuy nhiên đa số vẫn tập trung quanh mức 30.000–70.000đ.

Từ các phát hiện trên, có thể đưa ra các gợi ý chiến lược về định giá, lựa chọn món ăn, cũng như khu vực mở rộng kinh doanh.
