# Tiki's books prices analyzation

In [1]:
import requests
import json
import pandas as pd
from IPython.display import HTML

In [2]:
lpt = pd.read_pickle("lowest_price_tracking.pkl")
df = pd.read_pickle("tiki_data.pkl")

_merge 2 dataframes_

In [3]:
df = df.merge(lpt, on="id", how="left", suffixes=("", "_x"))

*remove unfavorite books*

In [4]:
unfavorite_list = [
    "Sách Tham Khảo", 
    "Từ Điển", 
    "Sách Bà mẹ - Em bé", 
    "Sách Học Ngoại Ngữ", 
    "Truyện ngôn tình", 
    "Tô màu - Luyện chữ",
    "Đạo đức - Kỹ năng sống",
    "Sách Marketing - Bán hàng",
    "Sách Thường Thức - Gia Đình/Sách Nấu ăn",
    "Sách Tô Màu Dành Cho Người Lớn",
    "Truyện đam mỹ",
    "Sách Chiêm Tinh - Horoscope",
    "Sách thiếu nhi /Truyện tranh Ehon",
    "Sách Thường Thức - Gia Đình/Sách Làm Đẹp",
    "Sách Giáo Khoa - Giáo Trình",
    "Sách Nông - Lâm - Ngư Nghiệp",
    "Sách Công Nghệ Thông Tin/Lập Trình",
    "Sách Tâm lý - Giới tính/Sách Hôn Nhân - Giới Tính"
]

unf_str = '|'.join(unfavorite_list)

df = df[df.productset_group_name.str.contains(unf_str) == False]

*add difference column*

In [5]:
df["difference"] = df["price"] - df["lowest_price"]

_for renaming columns to more descriptive names_

In [6]:
display_vals = {
    "name": "Tên sách",
    "author_name": "Tác giả",
    "price": "Giá",
    "discount": "Tiết kiệm",
    "discount_rate": "Giảm giá %",
    "lowest_discount_rate": "Giảm thấp nhất",
    "difference": "Chênh lệch"
}

In [7]:
def prettifyDf(df):
    df["price"] = df["price"].map("{:,}".format)
    df["difference"] = df["difference"].map("{:,.0f}".format)
    df["discount"] = df["discount"].map("{:,}".format)
    df["discount_rate"] = df["discount_rate"].map("{}%".format)
    df["lowest_discount_rate"] = df["lowest_discount_rate"].map("{:.0f}%".format)
    
    renamed = df.rename(columns=display_vals)
    
    return renamed

---

### Show books with discount above or equal to the desired discount

Set the desired discount and interested columns

In [8]:
DESIRED = 35
INTERESTED_COL = ["name", "author_name", "price", "discount", "discount_rate", "lowest_discount_rate", "difference"]

#### All on Tiki

In [9]:
df1 = df.loc[df["discount_rate"] >= DESIRED, INTERESTED_COL]
df1 = df1.sort_values("discount_rate", ascending=False)
df1 = prettifyDf(df1)

In [10]:
HTML(df1.to_html())

Unnamed: 0_level_0,Tên sách,Tác giả,Giá,Tiết kiệm,Giảm giá %,Giảm thấp nhất,Chênh lệch
id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
2364813,Bãi Hoang,Jean-René Huguenin,35000,63000,64%,65%,1000
58409584,Dưới Trời Xanh Không Có Anh Vẫn Mỉm Cười,Minh Lạc,33600,49400,60%,60%,0
69196007,Bạn Có Phải Người Giỏi Lắng Nghe? (Tặng Kèm 1 Bookmark),Kate Murphy,40300,57700,59%,59%,0
66398432,Tương Lai Của Cảm Xúc,Kaitlin Ugolik Phillips,38500,50500,57%,57%,0
66952510,Malorie - Hành Trình Chạy Trốn Tử Thần (Tặng Kèm 1 Bookmark Tử Thần),Josh Malerman,51500,67500,57%,63%,8000
47454243,Người Trong Gương,Will Eaves,39500,49500,56%,70%,12800
58982895,"Đuổi Triết Học, Bắt Triết Lý - “Mỗi Lần Tôi Tìm Ra Ý Nghĩa Cuộc Đời, Người Ta Lại Thay Đổi Nó”",,38500,49500,56%,81%,22000
77035877,"Đam Mê Không Để Làm Cảnh, Đam Mê Là Để Ra Tiền",,82000,97000,54%,54%,0
68774254,Mong Muốn Của Nhím (Tặng Kèm: 01 Bookmark Một Mặt Và 01 Obi),Toon Tellegen,40500,48500,54%,68%,12000
71090278,Hồi Ức Không Nằm Trong Ảnh - Mà Ở Trong Tim,Chu Văn Tuệ,50500,58500,54%,70%,17900


#### Nhã Nam

In [11]:
df2 = df.loc[(df["discount_rate"] >= DESIRED) & (df["publisher"] == "Nhã Nam"), INTERESTED_COL]

In [12]:
if not df2.empty:
    df2.sort_values("discount_rate", ascending=False, inplace=True)
    df2 = prettifyDf(df2)

In [13]:
HTML(df2.to_html())

Unnamed: 0_level_0,name,author_name,price,discount,discount_rate,lowest_discount_rate,difference
id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1


#### Fahasa

In [14]:
df3 = df.loc[(df["discount_rate"] >= DESIRED) & (df["current_seller"] == "Nhà sách Fahasa"), INTERESTED_COL]

In [15]:
if not df3.empty:
    df3.sort_values("discount_rate", ascending=False, inplace=True)
    df3 = prettifyDf(df3)

In [16]:
HTML(df3.to_html())

Unnamed: 0_level_0,Tên sách,Tác giả,Giá,Tiết kiệm,Giảm giá %,Giảm thấp nhất,Chênh lệch
id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
56226544,Tam Quốc Diễn Nghĩa - 2 Tập (Bìa Cứng - Tái Bản 2020),La Quán Trung,234000,156000,40%,40%,0


#### Đông A

In [17]:
df4 = df.loc[(df["discount_rate"] >= DESIRED) & (df["publisher"] == "Công Ty Cổ Phần Văn Hóa Đông A"), INTERESTED_COL]

In [18]:
if not df4.empty:
    df4.sort_values("discount_rate", ascending=False, inplace=True)
    df4 = prettifyDf(df4)

In [19]:
HTML(df4.to_html())

Unnamed: 0_level_0,Tên sách,Tác giả,Giá,Tiết kiệm,Giảm giá %,Giảm thấp nhất,Chênh lệch
id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
518100,Những Người Khốn Khổ (Trọn Bộ 5 Tập),Victor Hugo,236900,158100,40%,40%,0
56226544,Tam Quốc Diễn Nghĩa - 2 Tập (Bìa Cứng - Tái Bản 2020),La Quán Trung,234000,156000,40%,40%,0
56094203,Heidi (Bìa Cứng),Johanna Spyri,149000,91000,38%,38%,0
520313,Bố Già (Mario Puzo),Mario Puzo,70000,40000,36%,37%,1000
6471217,Nhật Ký Anne Frank (Tái Bản),Anne Frank,55000,31000,36%,37%,1000
520343,Ông Trùm Cuối Cùng (Mario Puzo),Mario Puzo,96000,54000,36%,37%,2000
46332538,Sherlock Holmes Toàn Tập (3 Tập - Hộp Ngang) (Bìa Cứng)(Tái Bản),Arthur Conan Doyle,490000,260000,35%,35%,0
99681450,Napoléon Bonaparte,Adam Zamoyski,386400,203600,35%,35%,0
111290696,Việt Nam Sử Lược (Ấn Bản Kỉ Niệm 100 Năm Xuất Bản Lần Đầu) (Tái Bản),Trần Trọng Kim,294700,155300,35%,35%,0
111290700,Bố Già (Bìa Cứng) (Tái Bản),Mario Puzo,163000,87000,35%,40%,14000
