Dưới đây là loạt bài tập về JSON để bạn thực hành trong môi trường notebook (**ipynb**). Các bài tập tập trung vào việc xử lý dữ liệu JSON với Python, OOP, và lưu ra file CSV.

---

# 🚩 BÀI MẪU (Giải chi tiết):

### 🔹 Đề bài mẫu

**Cho một JSON chứa thông tin của các sinh viên như bên dưới:**

```json
[
    {"id": "SV001", "name": "Nguyen Van A", "scores": {"math": 8.5, "literature": 7.0}},
    {"id": "SV002", "name": "Tran Thi B", "scores": {"math": 9.0, "literature": 8.5}}
]
```

**Yêu cầu:**

* Đọc JSON.
* Tính điểm trung bình từng sinh viên.
* Xuất dữ liệu ra CSV gồm: `id, name, math, literature, average`.

### ✅ Output mẫu (CSV):

```
id,name,math,literature,average
SV001,Nguyen Van A,8.5,7.0,7.75
SV002,Tran Thi B,9.0,8.5,8.75
```

### 🛠️ Cách giải:

1. Dùng `json` để load dữ liệu JSON.
2. Viết Class `Student` quản lý việc tính điểm trung bình.
3. Dùng pandas để ghi ra file CSV.

In [1]:
json_data = [
    {"id": "SV001", "name": "Nguyen Van A", "scores": {"math": 8.5, "literature": 7.0}},
    {"id": "SV002", "name": "Tran Thi B", "scores": {"math": 9.0, "literature": 8.5}}
]

In [4]:
import json
import pandas as pd

class Student:
    def __init__(self, student_dict):
        self.id = student_dict["id"]
        self.name = student_dict["name"]
        self.math = student_dict["scores"]["math"]
        self.literature = student_dict["scores"]["literature"]
        self.average = None

    def cal_avg(self):
        self.average =  (self.math + self.literature)/2
        return self.average
    
    def to_dict(self):
        return {
            'id' : self.id,
            'name' : self.name,
            'math': self.math,
            'literature' : self.literature,
            'average' : self.average
        }

students = []

for items in json_data:
    student = Student(items)
    student.cal_avg()
    row = student.to_dict()
    students.append(row)

df = pd.DataFrame(students)
df


Unnamed: 0,id,name,math,literature,average
0,SV001,Nguyen Van A,8.5,7.0,7.75
1,SV002,Tran Thi B,9.0,8.5,8.75


---

## 📚 Các bài thực hành cho bạn luyện tập:

---

# 🟢 **CẤP ĐỘ DỄ**

### 🔸 Bài dễ 1:

**Đề bài:**
Bạn được cung cấp JSON chứa danh sách các món ăn và giá tiền.

```json
[
    {"food": "Bánh mì", "price": 15000},
    {"food": "Phở", "price": 35000},
    {"food": "Bún bò", "price": 40000}
]
```

**Yêu cầu:**
Chuyển sang CSV và thêm cột VAT (10%), tính tổng giá (price + VAT).

**Output mẫu CSV:**

```
food,price,VAT,total
Bánh mì,15000,1500,16500
Phở,35000,3500,38500
Bún bò,40000,4000,44000
```

In [11]:
json_data = [
    {"food": "Bánh mì", "price": 15000},
    {"food": "Phở", "price": 35000},
    {"food": "Bún bò", "price": 40000}
]

In [13]:
import json
import pandas as pd

class Food:
    def __init__(self, json_data):
        self.food = json_data["food"]
        self.price = json_data["price"]
        self.vat = None
        self.total = None
    
    def cal_vat(self):
        self.vat = self.price *0.1
        return self.vat
    def cal_total(self):
        self.total = self.vat + self.price
        return self.total
    def to_dict(self):
        return {
            "food": self.food,
            "price": self.price,
            "vat": self.vat,
            "total": self.total
        }
    
foods = []

for item in json_data:
    oop = Food(item)
    oop.cal_vat()
    oop.cal_total()
    row = oop.to_dict()
    foods.append(row)

df = pd.DataFrame(foods)
df


Unnamed: 0,food,price,vat,total
0,Bánh mì,15000,1500.0,16500.0
1,Phở,35000,3500.0,38500.0
2,Bún bò,40000,4000.0,44000.0


---

### 🔸 Bài dễ 2:

**Đề bài:**
JSON chứa thông tin thời tiết theo ngày.

```json
{
    "city": "Da Lat",
    "forecast": [
        {"day": "Monday", "temp": 20},
        {"day": "Tuesday", "temp": 21},
        {"day": "Wednesday", "temp": 19}
    ]
}
```

**Yêu cầu:**
Xuất ra CSV với 3 cột: city, day, temp.

**Output mẫu CSV:**

```
city,day,temp
Da Lat,Monday,20
Da Lat,Tuesday,21
Da Lat,Wednesday,19
```



In [None]:


import json
import pandas as pd

class DaLat:
    def __init__(self, city, forecast):
        self.city = city
        self.day = forecast["day"]
        self.temp = forecast["temp"]

    def to_dict(self):
        return {
            "city" : self.city,
            "day" : self.day,
            "temp" : self.temp
        }

data = []

for forecast in json_data["forecast"]:
    oop = DaLat(json_data["city"], forecast)
    data.append(oop.to_dict())


df = pd.DataFrame(data)
df

Unnamed: 0,city,day,temp
0,Da Lat,Monday,20
1,Da Lat,Tuesday,21
2,Da Lat,Wednesday,19


---

# 🟡 **CẤP ĐỘ TRUNG BÌNH**

### 🔸 Bài trung bình 1:

**Đề bài:**
JSON gồm các đơn hàng.

```json
[
    {"order_id": "DH001", "customer": {"name": "Anh Tu", "age": 25}, "amount": 250000},
    {"order_id": "DH002", "customer": {"name": "Chi Lan", "age": 30}, "amount": 180000}
]
```

**Yêu cầu:**

* Xuất ra CSV gồm: order\_id, customer\_name, customer\_age, amount.
* Thêm cột discount: nếu amount > 200k, discount 10%, còn lại 5%.

**Output mẫu CSV:**

```
order_id,customer_name,customer_age,amount,discount
DH001,Anh Tu,25,250000,25000
DH002,Chi Lan,30,180000,9000
```

---


In [8]:
json_data = [
    {"order_id": "DH001", "customer": {"name": "Anh Tu", "age": 25}, "amount": 250000},
    {"order_id": "DH002", "customer": {"name": "Chi Lan", "age": 30}, "amount": 180000}
]

import json
import pandas as pd

class Order:
    def __init__(self, order):
        self.order_id = order['order_id']
        self.customer_name = order['customer']['name']
        self.customer_age = order['customer']['age']
        self.amount = order['amount']
        self.discount = self.cal_discount()

    def cal_discount(self):
        if self.amount > 200000:
            self.discount = self.amount *0.9
        else:
            self.discount = self.amount * 0.95
        return self.discount
    def to_dict(self):
        return {
            'order_id' : self.order_id,
            'customer_name' : self.customer_name,
            'customer_age' : self.customer_age,
            'amount' : self.amount,
            'discount' : self.discount
        }
data = []
len_json = len(json_data)

for i in range(0, len_json):
    order = json_data[i]
    oop = Order(order)
    data.append(oop.to_dict())

df = pd.DataFrame(data)
df

Unnamed: 0,order_id,customer_name,customer_age,amount,discount
0,DH001,Anh Tu,25,250000,225000.0
1,DH002,Chi Lan,30,180000,171000.0


### 🔸 Bài trung bình 2:

**Đề bài:**
JSON mô tả điểm thi các môn của học sinh:

```json
[
    {"name": "Lan", "subjects": {"math": 9, "physics": 8, "chemistry": 7}},
    {"name": "Nam", "subjects": {"math": 6, "physics": 7, "chemistry": 9}}
]
```

**Yêu cầu:**

* Tính tổng điểm mỗi học sinh.
* Xuất ra CSV: name, math, physics, chemistry, total.

**Output mẫu CSV:**

```
name,math,physics,chemistry,total
Lan,9,8,7,24
Nam,6,7,9,22
```

In [9]:
json_data = [
    {"name": "Lan", "subjects": {"math": 9, "physics": 8, "chemistry": 7}},
    {"name": "Nam", "subjects": {"math": 6, "physics": 7, "chemistry": 9}}
]

import json
import pandas as pd

class Class:
    def __init__(self, student):
        self.name = student['name']
        self.math = student['subjects']['math']
        self.physics = student['subjects']['physics']
        self.chemistry = student['subjects']['chemistry']
        self.total = self.cal_total()

    def cal_total(self):
        self.total = self.math + self.physics + self.chemistry
        return self.total
    def to_dict(self):
        return {
            'name': self.name,
            'math' : self.math,
            'physics' : self.physics,
            'chemistry' : self.chemistry,
            'total' : self.total
        }

len_json = len(json_data)
data = []

for i in range(0, len_json):
    oop = Class(json_data[i])
    data.append(oop.to_dict())

df = pd.DataFrame(data)
df

Unnamed: 0,name,math,physics,chemistry,total
0,Lan,9,8,7,24
1,Nam,6,7,9,22


---

### 🔸 Bài trung bình 3:

**Đề bài:**
JSON dạng nested sâu hơn:

```json
{
    "company": "XYZ Tech",
    "employees": [
        {"id": 1, "info": {"name": "John Doe", "skills": ["Python", "SQL"]}},
        {"id": 2, "info": {"name": "Jane Smith", "skills": ["Java", "AWS", "Docker"]}}
    ]
}
```

**Yêu cầu:**

* Xuất CSV gồm: company, employee\_id, employee\_name, skills (skills là chuỗi nối bằng `|`).

**Output mẫu CSV:**

```
company,employee_id,employee_name,skills
XYZ Tech,1,John Doe,Python|SQL
XYZ Tech,2,Jane Smith,Java|AWS|Docker
```


In [13]:
json_data = {
    "company": "XYZ Tech",
    "employees": [
        {"id": 1, "info": {"name": "John Doe", "skills": ["Python", "SQL"]}},
        {"id": 2, "info": {"name": "Jane Smith", "skills": ["Java", "AWS", "Docker"]}}
    ]
}

import pandas as pd

class Company:
    def __init__(self, company, employess):
        self.company = company
        self.employee_id = employess['id']
        self.employee_name = employess['info']['name']
        self.skills = " | ".join(employess['info']['skills'])
    
    
    def to_dataframe(company, employess):
        data = []
        for emp in employess:
            obj = Company(company, emp)
            data.append({
            'company' : obj.company,
            'employee_id' : obj.employee_id,
            'employee_name': obj.employee_name,
            'skills': obj.skills
        })
        return pd.DataFrame(data)
    
df = Company.to_dataframe(json_data['company'], json_data['employees'])
df
    


Unnamed: 0,company,employee_id,employee_name,skills
0,XYZ Tech,1,John Doe,Python | SQL
1,XYZ Tech,2,Jane Smith,Java | AWS | Docker


---

# 🔴 **CẤP ĐỘ KHÓ**

### 🔸 Bài khó:

**Đề bài:**
Bạn có một file JSON phức tạp hơn, chứa nhiều đơn hàng với các sản phẩm khác nhau. Mỗi đơn hàng có thể chứa nhiều sản phẩm.

```json
[
    {
        "order_id": "O1001",
        "customer": "Minh",
        "items": [
            {"product": "Milk", "qty": 2, "unit_price": 30000},
            {"product": "Eggs", "qty": 1, "unit_price": 50000}
        ]
    },
    {
        "order_id": "O1002",
        "customer": "An",
        "items": [
            {"product": "Bread", "qty": 3, "unit_price": 20000}
        ]
    }
]
```

**Yêu cầu:**

* Dùng OOP: class `Order`, method tính tổng đơn hàng.
* Xuất CSV: order\_id, customer, total\_amount, products (các tên sản phẩm nối bằng `,`).

**Output mẫu CSV:**

```
order_id,customer,total_amount,products
O1001,Minh,110000,Milk,Eggs
O1002,An,60000,Bread
```

In [18]:
json_data = [
    {
        "order_id": "O1001",
        "customer": "Minh",
        "items": [
            {"product": "Milk", "qty": 2, "unit_price": 30000},
            {"product": "Eggs", "qty": 1, "unit_price": 50000}
        ]
    },
    {
        "order_id": "O1002",
        "customer": "An",
        "items": [
            {"product": "Bread", "qty": 3, "unit_price": 20000}
        ]
    }
]

import pandas as pd

class Order_JSON:
    def __init__(self, order):
        self.order_id = order['order_id']
        self.customer = order['customer']
        self.product = ",".join(item['product'] for item in order['items'])
        self.total_product = len(order['items'])
        self.total_amount = sum(item['qty'] * item['unit_price'] for item in order['items'])

    def to_dataframe(json_data):
        data = []

        for order in json_data:
            obj = Order_JSON(order)
            data.append({
                'order_id' : obj.order_id,
                'customer' : obj.customer,
                'total_product' : obj.total_product,
                'total_amount' : obj.total_amount,
                'products' : obj.product
            })
        return pd.DataFrame(data)
    
df = Order_JSON.to_dataframe(json_data)
df

Unnamed: 0,order_id,customer,total_product,total_amount,products
0,O1001,Minh,2,110000,"Milk,Eggs"
1,O1002,An,1,60000,Bread


In [20]:
json_data = [
    {
        "bill_id": "B001",
        "customer": "Ngoc",
        "services": [
            {"service": "Internet", "qty": 1, "unit_price": 200000},
            {"service": "TV", "qty": 2, "unit_price": 100000}
        ]
    },
    {
        "bill_id": "B002",
        "customer": "Hieu",
        "services": [
            {"service": "Internet", "qty": 1, "unit_price": 200000}
        ]
    }
]

# Output:
# bill_id,customer,total_amount,services
# B001,Ngoc,400000,Internet,TV
# B002,Hieu,200000,Internet

import pandas as pd

class Bill_Export:
    def __init__(self, bill):
        self.bill_id = bill['bill_id']
        self.customer = bill['customer']
        self.services = ", ".join(service['service'] for service in bill['services'])
        self.total_amount = sum(service['qty'] * service['unit_price'] for service in bill['services'])
    
    def to_dataframe(json_data):
        data = []

        for bill in json_data:
            obj = Bill_Export(bill)
            data.append({
                'bill_id' : obj.bill_id,
                'customer' : obj.customer,
                'total_amount' : obj.total_amount,
                "services" : obj.services
            })
        return pd.DataFrame(data)

df = Bill_Export.to_dataframe(json_data)
df

Unnamed: 0,bill_id,customer,total_amount,services
0,B001,Ngoc,400000,"Internet, TV"
1,B002,Hieu,200000,Internet
