In [297]:
import sqlite3
import pandas as pd

# Kết nối SQLite trong bộ nhớ
conn = sqlite3.connect(':memory:')
cursor = conn.cursor()

# Tạo bảng student
cursor.execute("""
CREATE TABLE student (
    student_id INTEGER PRIMARY KEY,
    name TEXT,
    class TEXT,
    course_id INTEGER,
    score REAL
);
""")

# Thêm dữ liệu vào bảng student
students = [
    (1, 'Nguyen Minh Hoang', 'May Tinh', 12, 6.7),
    (2, 'Tran Thi Lan', 'Kinh Te', 34, 9.2),
    (3, 'Pham Van Nam', 'Toan Tin', None, 7.9),
    (4, 'Le Thanh Huyen', 'Toan Tin', 20, 7.2),
    (5, 'Vu Quoc Anh', 'May Tinh', 24, 8.0),
    (6, 'Dang Thuy Linh', 'May Tinh', 24, 5.5),
    (7, 'Bui Tien Dung', 'Kinh Te', 34, 9.2),
    (8, 'Ho Ngoc Mai', 'Toan Tin', 20, 8.8),
    (9, 'Duong Huu Phuc', 'Kinh Te', None, 7.2),
    (10, 'Cao Thi Hanh', 'May Tinh', None, 7.0)
]
cursor.executemany("INSERT INTO student VALUES (?, ?, ?, ?, ?)", students)

# Tạo bảng course
cursor.execute("""
CREATE TABLE course (
    id INTEGER PRIMARY KEY,
    course_name TEXT
);
""")

# Thêm dữ liệu vào bảng course
courses = [
    (12, 'Giai tich'),
    (34, 'Thong ke'),
    (26, 'Tin hoc')
]
cursor.executemany("INSERT INTO course VALUES (?, ?)", courses)
conn.commit()

# Kiểm tra dữ liệu đã chèn
print("Bảng student:")
print(pd.read_sql("SELECT * FROM student", conn))

print("Bảng course:")
print(pd.read_sql("SELECT * FROM course", conn))


Bảng student:
   student_id               name     class  course_id  score
0           1  Nguyen Minh Hoang  May Tinh       12.0    6.7
1           2       Tran Thi Lan   Kinh Te       34.0    9.2
2           3       Pham Van Nam  Toan Tin        NaN    7.9
3           4     Le Thanh Huyen  Toan Tin       20.0    7.2
4           5        Vu Quoc Anh  May Tinh       24.0    8.0
5           6     Dang Thuy Linh  May Tinh       24.0    5.5
6           7      Bui Tien Dung   Kinh Te       34.0    9.2
7           8        Ho Ngoc Mai  Toan Tin       20.0    8.8
8           9     Duong Huu Phuc   Kinh Te        NaN    7.2
9          10       Cao Thi Hanh  May Tinh        NaN    7.0
Bảng course:
   id course_name
0  12   Giai tich
1  26     Tin hoc
2  34    Thong ke


In [299]:
# 1 Tích Descartes (CROSS JOIN)
query = """
SELECT * FROM student
CROSS JOIN course;
"""
cross_join_df = pd.read_sql_query(query, conn)
print("CROSS JOIN Result:")
display(cross_join_df)

#  INNER JOIN
query = """
SELECT * FROM student 
INNER JOIN course 
ON student.course_id = course.id;
"""
inner_join_df = pd.read_sql_query(query, conn)
print("INNER JOIN Result:")
display(inner_join_df)

#  LEFT JOIN
query = """
SELECT * FROM student 
LEFT JOIN course 
ON student.course_id = course.id;
"""
left_join_df = pd.read_sql_query(query, conn)
print("LEFT JOIN Result:")
display(left_join_df)

#  RIGHT JOIN 
query = """
SELECT * FROM course 
LEFT JOIN student 
ON student.course_id = course.id;
"""
right_join_df = pd.read_sql_query(query, conn)
print("RIGHT JOIN Result:")
display(right_join_df)

#  FULL OUTER JOIN 
query = """
SELECT * FROM student
LEFT JOIN course ON student.course_id = course.id
UNION
SELECT * FROM student
RIGHT JOIN course ON student.course_id = course.id;
"""
full_outer_join_df = pd.read_sql_query(query, conn)
print("FULL OUTER JOIN Result:")
display(full_outer_join_df)


CROSS JOIN Result:


Unnamed: 0,student_id,name,class,course_id,score,id,course_name
0,1,Nguyen Minh Hoang,May Tinh,12.0,6.7,12,Giai tich
1,1,Nguyen Minh Hoang,May Tinh,12.0,6.7,26,Tin hoc
2,1,Nguyen Minh Hoang,May Tinh,12.0,6.7,34,Thong ke
3,2,Tran Thi Lan,Kinh Te,34.0,9.2,12,Giai tich
4,2,Tran Thi Lan,Kinh Te,34.0,9.2,26,Tin hoc
5,2,Tran Thi Lan,Kinh Te,34.0,9.2,34,Thong ke
6,3,Pham Van Nam,Toan Tin,,7.9,12,Giai tich
7,3,Pham Van Nam,Toan Tin,,7.9,26,Tin hoc
8,3,Pham Van Nam,Toan Tin,,7.9,34,Thong ke
9,4,Le Thanh Huyen,Toan Tin,20.0,7.2,12,Giai tich


INNER JOIN Result:


Unnamed: 0,student_id,name,class,course_id,score,id,course_name
0,1,Nguyen Minh Hoang,May Tinh,12,6.7,12,Giai tich
1,2,Tran Thi Lan,Kinh Te,34,9.2,34,Thong ke
2,7,Bui Tien Dung,Kinh Te,34,9.2,34,Thong ke


LEFT JOIN Result:


Unnamed: 0,student_id,name,class,course_id,score,id,course_name
0,1,Nguyen Minh Hoang,May Tinh,12.0,6.7,12.0,Giai tich
1,2,Tran Thi Lan,Kinh Te,34.0,9.2,34.0,Thong ke
2,3,Pham Van Nam,Toan Tin,,7.9,,
3,4,Le Thanh Huyen,Toan Tin,20.0,7.2,,
4,5,Vu Quoc Anh,May Tinh,24.0,8.0,,
5,6,Dang Thuy Linh,May Tinh,24.0,5.5,,
6,7,Bui Tien Dung,Kinh Te,34.0,9.2,34.0,Thong ke
7,8,Ho Ngoc Mai,Toan Tin,20.0,8.8,,
8,9,Duong Huu Phuc,Kinh Te,,7.2,,
9,10,Cao Thi Hanh,May Tinh,,7.0,,


RIGHT JOIN Result:


Unnamed: 0,id,course_name,student_id,name,class,course_id,score
0,12,Giai tich,1.0,Nguyen Minh Hoang,May Tinh,12.0,6.7
1,26,Tin hoc,,,,,
2,34,Thong ke,7.0,Bui Tien Dung,Kinh Te,34.0,9.2
3,34,Thong ke,2.0,Tran Thi Lan,Kinh Te,34.0,9.2


FULL OUTER JOIN Result:


Unnamed: 0,student_id,name,class,course_id,score,id,course_name
0,,,,,,26.0,Tin hoc
1,1.0,Nguyen Minh Hoang,May Tinh,12.0,6.7,12.0,Giai tich
2,2.0,Tran Thi Lan,Kinh Te,34.0,9.2,34.0,Thong ke
3,3.0,Pham Van Nam,Toan Tin,,7.9,,
4,4.0,Le Thanh Huyen,Toan Tin,20.0,7.2,,
5,5.0,Vu Quoc Anh,May Tinh,24.0,8.0,,
6,6.0,Dang Thuy Linh,May Tinh,24.0,5.5,,
7,7.0,Bui Tien Dung,Kinh Te,34.0,9.2,34.0,Thong ke
8,8.0,Ho Ngoc Mai,Toan Tin,20.0,8.8,,
9,9.0,Duong Huu Phuc,Kinh Te,,7.2,,


In [300]:
# 2 Cập nhật course_id còn thiếu trong bảng student bằng giá trị hợp lệ từ bảng course
update_missing_course_id_query = """
UPDATE student
SET course_id = (
    SELECT id FROM course
    WHERE course.id = student.course_id
)
WHERE course_id IS NULL OR course_id NOT IN (SELECT id FROM course);
"""

conn.execute(update_missing_course_id_query)
conn.commit()
print("Đã cập nhật các giá trị course_id còn thiếu: ")

# a. Tính tổng số sinh viên và điểm trung bình của từng lớp
print("Phần A :")
class_summary_query = """
SELECT class, COUNT(*) AS total_students, AVG(score) AS average_score
FROM student
GROUP BY class;
"""
class_summary_result = pd.read_sql(class_summary_query, conn)

print("Tổng số sinh viên và điểm trung bình của từng lớ:")
print(class_summary_result)

# b. Tính tổng số sinh viên và điểm trung bình của từng môn học
print("Phần B :")
course_summary_query = """
SELECT course_name, COUNT(student_id) AS total_students, AVG(score) AS average_score
FROM student
JOIN course ON student.course_id = course.id
GROUP BY course_name;
"""
course_summary_result = pd.read_sql(course_summary_query, conn)

print("Tổng số sinh viên và điểm trung bình của từng môn học :")
print(course_summary_result)

# c. Phân loại thi đua theo điểm trung bình của từng môn học
print("Phần C:")
course_rank_query = """
SELECT course_name,
       COUNT(student_id) AS total_students,
       AVG(score) AS average_score,
       CASE
           WHEN AVG(score) >= 9.0 THEN 'Xuất sắc'
           WHEN AVG(score) >= 6.0 THEN 'Tốt'
           ELSE 'Kém'
       END AS rank
FROM student
JOIN course ON student.course_id = course.id
GROUP BY course_name;
"""
course_rank_result = pd.read_sql(course_rank_query, conn)

print("Phân loại thi đua theo điểm trung bình của từng môn học :")
print(course_rank_result)


Đã cập nhật các giá trị course_id còn thiếu: 
Phần A :
Tổng số sinh viên và điểm trung bình của từng lớ:
      class  total_students  average_score
0   Kinh Te               3       8.533333
1  May Tinh               4       6.800000
2  Toan Tin               3       7.966667
Phần B :
Tổng số sinh viên và điểm trung bình của từng môn học :
  course_name  total_students  average_score
0   Giai tich               1            6.7
1    Thong ke               2            9.2
Phần C:
Phân loại thi đua theo điểm trung bình của từng môn học :
  course_name  total_students  average_score      rank
0   Giai tich               1            6.7       Tốt
1    Thong ke               2            9.2  Xuất sắc


In [303]:
# 3
# a Xếp hạng sinh viên theo điểm số (toàn bộ danh sách)
print("Phần A :")
overall_rank_query = """
SELECT student_id, name, class, course_name, score,
       RANK() OVER (ORDER BY score DESC) AS rank
FROM student
LEFT JOIN course ON student.course_id = course.id;
"""
overall_rank_result = pd.read_sql(overall_rank_query, conn)

print("Xếp hạng sinh viên theo điểm số (Toàn bộ danh sách - 10 sinh viên) :")
print(overall_rank_result)

# Lấy top 3 sinh viên có điểm cao nhất và thấp nhất
top_3_highest = overall_rank_result.nlargest(3, 'score')
top_3_lowest = overall_rank_result.nsmallest(3, 'score')

print("\nTop 3 sinh viên đạt điểm cao nhất:")
print(top_3_highest)

print("\nTop 3 sinh viên đạt điểm thấp nhất:")
print(top_3_lowest)

# b. Xếp hạng sinh viên theo điểm số từng lớp
print("Phần B:")
class_rank_query = """
SELECT student_id, name, class, course_name, score,
       RANK() OVER (PARTITION BY class ORDER BY score DESC) AS rank
FROM student
LEFT JOIN course ON student.course_id = course.id;
"""

class_rank_result = pd.read_sql(class_rank_query, conn)

print("Xếp hạng sinh viên theo điểm số từng lớp (Toàn bộ danh sách - 10 sinh viên):")
print(class_rank_result)  
# Lấy top 3 sinh viên có điểm cao nhất theo từng lớp
top_3_class_highest = class_rank_result[class_rank_result['rank'] <= 3]

# Lấy top 3 sinh viên có điểm thấp nhất theo từng lớp 
class_rank_result['rank_lowest'] = class_rank_result.groupby('class')['score'].rank(method='dense', ascending=True)
top_3_class_lowest = class_rank_result[class_rank_result['rank_lowest'] <= 3]

print("Top 3 sinh viên đạt điểm cao nhất theo từng lớp:")
print(top_3_class_highest)

print("Top 3 sinh viên đạt điểm thấp nhất theo từng lớp:")
print(top_3_class_lowest)

# c. Xếp hạng sinh viên theo điểm số từng môn học
print("Phần C :")
course_rank_query = """
SELECT student_id, name, class, course_name, score,
       RANK() OVER (PARTITION BY course_name ORDER BY score DESC) AS rank
FROM student
LEFT JOIN course ON student.course_id = course.id;
"""
course_rank_result = pd.read_sql(course_rank_query, conn)

print("Xếp hạng sinh viên theo điểm số từng môn học (Toàn bộ danh sách - 10 sinh viên):")
print(course_rank_result)

# Lấy top 3 sinh viên có điểm cao nhất và thấp nhất theo từng môn học
top_3_course_highest = course_rank_result[course_rank_result['rank'] <= 3]
top_3_course_lowest = course_rank_result.groupby('course_name').apply(lambda x: x.nsmallest(3, 'score')).reset_index(drop=True)

print("Top 3 sinh viên đạt điểm cao nhất theo từng môn học:")
print(top_3_course_highest)

print("Top 3 sinh viên đạt điểm thấp nhất theo từng môn học:")
print(top_3_course_lowest)


Phần A :
Xếp hạng sinh viên theo điểm số (Toàn bộ danh sách - 10 sinh viên) :
   student_id               name     class course_name  score  rank
0           2       Tran Thi Lan   Kinh Te    Thong ke    9.2     1
1           7      Bui Tien Dung   Kinh Te    Thong ke    9.2     1
2           8        Ho Ngoc Mai  Toan Tin        None    8.8     3
3           5        Vu Quoc Anh  May Tinh        None    8.0     4
4           3       Pham Van Nam  Toan Tin        None    7.9     5
5           4     Le Thanh Huyen  Toan Tin        None    7.2     6
6           9     Duong Huu Phuc   Kinh Te        None    7.2     6
7          10       Cao Thi Hanh  May Tinh        None    7.0     8
8           1  Nguyen Minh Hoang  May Tinh   Giai tich    6.7     9
9           6     Dang Thuy Linh  May Tinh        None    5.5    10

Top 3 sinh viên đạt điểm cao nhất:
   student_id           name     class course_name  score  rank
0           2   Tran Thi Lan   Kinh Te    Thong ke    9.2     1
1         

In [305]:
# 4. Thêm trường graduation_date
cursor.execute("ALTER TABLE student ADD COLUMN graduation_date DATETIME")
current_time = datetime.now()
cursor.execute("SELECT student_id, score FROM student")
for student_id, score in cursor.fetchall():
    grad_date = current_time + timedelta(days=int(score * 30))
    cursor.execute("UPDATE student SET graduation_date = ? WHERE student_id = ?", (grad_date, student_id))
conn.commit()

# Kiểm tra kết quả
cursor.execute("SELECT student_id, name, graduation_date FROM student")
df_graduation = pd.DataFrame(cursor.fetchall(), columns=["student_id", "name", "graduation_date"])
print(df_graduation)

   student_id               name             graduation_date
0           1  Nguyen Minh Hoang  2025-09-26 09:08:54.180291
1           2       Tran Thi Lan  2025-12-10 09:08:54.180291
2           3       Pham Van Nam  2025-11-01 09:08:54.180291
3           4     Le Thanh Huyen  2025-10-11 09:08:54.180291
4           5        Vu Quoc Anh  2025-11-04 09:08:54.180291
5           6     Dang Thuy Linh  2025-08-21 09:08:54.180291
6           7      Bui Tien Dung  2025-12-10 09:08:54.180291
7           8        Ho Ngoc Mai  2025-11-28 09:08:54.180291
8           9     Duong Huu Phuc  2025-10-11 09:08:54.180291
9          10       Cao Thi Hanh  2025-10-05 09:08:54.180291
