In [None]:
%pip install weasyprint pdfkit


In [1]:
from langchain_google_genai import ChatGoogleGenerativeAI
import os
os.environ["GOOGLE_API_KEY"] = "AIzaSyDzyARw95GU-P6HHfAKdAicnQNLWWQHC18"
llm = ChatGoogleGenerativeAI(
    model="gemini-2.0-flash",
    temperature=0,
    max_tokens=None,
    timeout=None,
    max_retries=2,
)

In [2]:
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
from datetime import datetime
import os

class StudentReportGenerator:
    def __init__(self, llm_instance):
        self.llm = llm_instance
        self.prompt = PromptTemplate(
            input_variables=["text"],
            template="""
Bạn là một cố vấn học tập chuyên nghiệp tại trường đại học. Dựa trên thông tin học tập sau:

{text}

Hãy tạo một báo cáo đánh giá học tập hoàn chỉnh dưới dạng HTML với các yêu cầu sau:

YÊU CẦU NỘI DUNG:
1. Phân tích chi tiết xu hướng học tập qua các học kỳ (CPA, tín chỉ, cảnh báo học vụ)
2. Đánh giá tình trạng học vụ hiện tại và mức độ rủi ro
3. Phân tích điểm mạnh và điểm yếu trong học tập
4. Đưa ra khuyến nghị cụ thể và kế hoạch hành động cho học kỳ tiếp theo
5. Đề xuất các biện pháp hỗ trợ từ nhà trường

YÊU CẦU ĐỊNH DẠNG HTML:
- Trả về HTML hoàn chỉnh từ <!DOCTYPE html> đến </html>
- Sử dụng CSS inline để tạo giao diện chuyên nghiệp
- Cấu trúc báo cáo bao gồm:
  + Header: Logo và tiêu đề "BÁO CÁO ĐÁNH GIÁ HỌC TẬP SINH VIÊN"
  + Phần 1: Thông tin sinh viên (bảng được format đẹp)
  + Phần 2: Biểu đồ ASCII xu hướng CPA qua các học kỳ
  + Phần 3: Phân tích chi tiết kết quả học tập
  + Phần 4: Đánh giá tình trạng hiện tại
  + Phần 5: Khuyến nghị và kế hoạch hành động
  + Footer: Thông tin cố vấn, ngày tạo báo cáo, chữ ký

THIẾT KẾ GIAO DIỆN:
- Màu sắc chính: #2c3e50 (xanh đậm), #3498db (xanh sáng), #ffffff (trắng), #f8f9fa (xám nhạt)
- Font chữ: Arial, sans-serif cho tiêu đề; Times New Roman cho nội dung
- Layout responsive, phù hợp in A4
- Sử dụng icons Unicode đơn giản (⚠️, ✅, 📊, 💡)
- Highlighting cho các thông tin quan trọng

QUAN TRỌNG: Chỉ trả về mã HTML hoàn chỉnh, không thêm bất kỳ text giải thích nào khác.
"""
        )
        self.chain = LLMChain(llm=self.llm, prompt=self.prompt)
    
    def generate_report(self, student_data):
        try:
            html_output = self.chain.run(text=student_data)
            
            timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
            html_filename = f"bao_cao_hoc_tap_{timestamp}.html"
            
            with open(html_filename, 'w', encoding='utf-8') as f:
                f.write(html_output)
            
            print(f"✅ Đã tạo file HTML thành công: {html_filename}")
            return html_filename, html_output
            
        except Exception as e:
            print(f"❌ Lỗi tạo báo cáo HTML: {str(e)}")
            return None, None

report_generator = StudentReportGenerator(llm)

student_data = """
- Mã sinh viên: 20221234
- Họ tên: Nguyễn Văn An
- Lớp: CNTT01-K65
- Chuyên ngành: Công nghệ thông tin
- Khóa học: 2022-2026
- Email: an.nv221234@sis.hust.edu.vn
- Số điện thoại: 0987654321

THÔNG TIN HỌC TẬP:
- Số môn đã học: 28
- Số học kỳ đã hoàn thành: 5
- CPA hiện tại: 1.8
- GPA học kỳ gần nhất: 1.5
- Tổng số tín chỉ tích lũy: 68
- Tổng số tín chỉ theo kế hoạch: 75
- Cảnh báo học vụ hiện tại: Mức 2
- Tỷ lệ hoàn thành chương trình: 68/150 tín chỉ (45.3%)

CHI TIẾT THEO TỪNG HỌC KỲ:
| Học kỳ | GPA   | CPA   | Tín chỉ HK | Tín chỉ tích lũy | Cảnh báo học vụ | Ghi chú |
|--------|-------|-------|------------|------------------|------------------|---------|
| 20221  | 1.38  | 1.38  | 12         | 12.0             | Mức 0            | Thích nghi ban đầu |
| 20222  | 2.85  | 2.18  | 15         | 27.0             | Mức 0            | Cải thiện rõ rệt |
| 20231  | 0.95  | 1.67  | 14         | 41.0             | Mức 1            | Ảnh hưởng COVID-19 |
| 20232  | 2.1   | 1.75  | 13         | 54.0             | Mức 1            | Bắt đầu phục hồi |
| 20241  | 1.5   | 1.8   | 14         | 68.0             | Mức 2            | Cần can thiệp |

PHÂN TÍCH MÔN HỌC:
Môn học yếu kém:
- Toán cao cấp A1: 1.0 (F) - Thi lại 2 lần
- Vật lý đại cương: 1.2 (D) 
- Cấu trúc dữ liệu: 1.5 (D+)
- Hệ điều hành: 1.3 (D)

Môn học khá/tốt:
- Lập trình Python: 3.2 (B)
- Tiếng Anh: 2.8 (C+)
- Giáo dục thể chất: 3.5 (B+)
- Tư tưởng Hồ Chí Minh: 2.5 (C+)

TÌNH TRẠNG HIỆN TẠI:
- Đang nợ 3 môn học (cần học lại)
- Tiến độ học tập chậm so với kế hoạch
- Có nguy cơ bị buộc thôi học nếu không cải thiện
- Cần tham gia chương trình hỗ trợ học tập đặc biệt
"""

html_file, html_content = report_generator.generate_report(student_data)

if html_file:
    print(f"📄 File HTML: {html_file}")
    print(f"📏 Độ dài nội dung: {len(html_content)} ký tự")
    print("\n🔍 Preview đoạn đầu HTML:")
    print(html_content[:500] + "..." if len(html_content) > 500 else html_content)
else:
    print("❌ Không thể tạo báo cáo HTML")


  chain = LLMChain(llm=llm, prompt=prompt)
  output = chain.run(text=input_text)


Dưới đây là đánh giá và đề xuất dựa trên thông tin học tập đã cung cấp:

**Nhận xét về kết quả học tập của sinh viên:**

*   **Biến động CPA:** Kết quả học tập có sự biến động lớn giữa các học kỳ. Sau học kỳ đầu tiên có CPA thấp (1.38), sinh viên đã có sự cải thiện đáng kể ở học kỳ 20222 (CPA 2.18). Tuy nhiên, CPA lại giảm xuống ở các học kỳ tiếp theo, cho thấy sự thiếu ổn định trong quá trình học tập.
*   **Cảnh báo học vụ:** Tình trạng cảnh báo học vụ leo thang từ Mức 0 lên Mức 2, sau đó giảm xuống Mức 1, cho thấy sinh viên đang gặp khó khăn trong việc duy trì kết quả học tập ổn định. CPA hiện tại (1.5) thấp hơn so với yêu cầu thông thường để không bị cảnh báo học vụ.
*   **Tín chỉ tích lũy:** Số lượng tín chỉ tích lũy cho thấy sinh viên vẫn đang tiến triển theo lộ trình học tập, tuy nhiên, cần cải thiện điểm số để đảm bảo tiến độ tốt nghiệp.

**Đề xuất các hướng phát triển cho sinh viên:**

*   **Xác định nguyên nhân:** Cần xác định rõ nguyên nhân dẫn đến sự biến động trong kết quả 

In [None]:
import weasyprint
from weasyprint import HTML, CSS
import pdfkit
import logging

class PDFConverter:
    def __init__(self):
        self.logger = logging.getLogger(__name__)
    
    def convert_html_to_pdf(self, html_filename, output_path=None):
        if not html_filename:
            print("❌ Không có file HTML để chuyển đổi")
            return None
        
        try:
            pdf_filename = output_path or html_filename.replace('.html', '.pdf')
            
            print(f"🔄 Đang chuyển đổi {html_filename} sang PDF...")
            
            css_styles = CSS(string='''
                @page { 
                    size: A4 portrait; 
                    margin: 1.5cm; 
                    @top-center {
                        content: "BÁO CÁO ĐÁNH GIÁ HỌC TẬP SINH VIÊN";
                        font-size: 10pt;
                        font-weight: bold;
                        color: #2c3e50;
                        border-bottom: 1px solid #ddd;
                        padding-bottom: 5px;
                    }
                    @bottom-right {
                        content: "Trang " counter(page) " / " counter(pages);
                        font-size: 9pt;
                        color: #666;
                    }
                    @bottom-left {
                        content: "Tạo bởi Hệ thống Quản lý Sinh viên";
                        font-size: 9pt;
                        color: #666;
                    }
                }
                
                body { 
                    font-family: 'Times New Roman', 'DejaVu Serif', serif; 
                    line-height: 1.5; 
                    color: #333;
                    font-size: 11pt;
                    margin: 0;
                    padding: 0;
                }
                
                h1 { 
                    color: #2c3e50; 
                    font-size: 18pt; 
                    text-align: center;
                    margin-bottom: 20px;
                    page-break-after: avoid;
                }
                
                h2 { 
                    color: #2c3e50; 
                    font-size: 14pt; 
                    margin-top: 20px;
                    margin-bottom: 10px;
                    page-break-after: avoid;
                    border-bottom: 2px solid #3498db;
                    padding-bottom: 5px;
                }
                
                h3 { 
                    color: #2c3e50; 
                    font-size: 12pt; 
                    margin-top: 15px;
                    margin-bottom: 8px;
                    page-break-after: avoid;
                }
                
                table {
                    border-collapse: collapse;
                    width: 100%;
                    margin: 10px 0 20px 0;
                    page-break-inside: avoid;
                    font-size: 10pt;
                }
                
                th, td {
                    border: 1px solid #ddd;
                    padding: 8px;
                    text-align: left;
                    vertical-align: top;
                }
                
                th {
                    background-color: #f8f9fa;
                    font-weight: bold;
                    color: #2c3e50;
                }
                
                .warning {
                    background-color: #fff3cd;
                    border-left: 4px solid #ffc107;
                    padding: 10px;
                    margin: 10px 0;
                    page-break-inside: avoid;
                }
                
                .success {
                    background-color: #d4edda;
                    border-left: 4px solid #28a745;
                    padding: 10px;
                    margin: 10px 0;
                    page-break-inside: avoid;
                }
                
                .info {
                    background-color: #d1ecf1;
                    border-left: 4px solid #17a2b8;
                    padding: 10px;
                    margin: 10px 0;
                    page-break-inside: avoid;
                }
                
                .page-break {
                    page-break-before: always;
                }
                
                .no-break {
                    page-break-inside: avoid;
                }
                
                .chart {
                    font-family: 'Courier New', monospace;
                    background-color: #f8f9fa;
                    padding: 15px;
                    border-radius: 5px;
                    margin: 15px 0;
                    font-size: 9pt;
                    line-height: 1.2;
                    page-break-inside: avoid;
                }
                
                .footer-info {
                    margin-top: 30px;
                    padding-top: 15px;
                    border-top: 1px solid #ddd;
                    font-size: 10pt;
                    color: #666;
                    page-break-inside: avoid;
                }
                
                ul, ol {
                    margin: 10px 0;
                    padding-left: 20px;
                }
                
                li {
                    margin: 5px 0;
                }
                
                strong {
                    color: #2c3e50;
                }
                
                .signature-area {
                    margin-top: 40px;
                    display: flex;
                    justify-content: space-between;
                    page-break-inside: avoid;
                }
                
                .signature-box {
                    text-align: center;
                    width: 45%;
                    padding-top: 20px;
                }
            ''')
            
            HTML(filename=html_filename).write_pdf(
                pdf_filename,
                stylesheets=[css_styles]
            )
            
            print(f"✅ Chuyển đổi thành công bằng WeasyPrint: {pdf_filename}")
            return pdf_filename
            
        except Exception as e:
            print(f"⚠️ WeasyPrint thất bại ({str(e)}), thử pdfkit...")
            
            try:
                pdf_filename = output_path or html_filename.replace('.html', '.pdf')
                
                options = {
                    'page-size': 'A4',
                    'margin-top': '1.5cm',
                    'margin-right': '1.5cm',
                    'margin-bottom': '1.5cm',
                    'margin-left': '1.5cm',
                    'encoding': "UTF-8",
                    'no-outline': None,
                    'enable-local-file-access': None,
                    'print-media-type': None,
                    'disable-smart-shrinking': None,
                    'header-center': 'BÁO CÁO ĐÁNH GIÁ HỌC TẬP SINH VIÊN',
                    'header-font-size': '10',
                    'header-spacing': '5',
                    'footer-right': 'Trang [page] / [topage]',
                    'footer-left': 'Hệ thống Quản lý Sinh viên',
                    'footer-font-size': '9',
                    'footer-spacing': '5'
                }
                
                pdfkit.from_file(html_filename, pdf_filename, options=options)
                print(f"✅ Chuyển đổi thành công bằng pdfkit: {pdf_filename}")
                return pdf_filename
                
            except Exception as e2:
                print(f"❌ Cả WeasyPrint và pdfkit đều thất bại:")
                print(f"   WeasyPrint: {str(e)}")
                print(f"   pdfkit: {str(e2)}")
                print("💡 Hướng dẫn cài đặt:")
                print("   - WeasyPrint: pip install weasyprint")
                print("   - pdfkit: pip install pdfkit + cài wkhtmltopdf")
                return None
    
    def create_complete_report(self, student_data, custom_filename=None):
        try:
            html_file, _ = report_generator.generate_report(student_data)
            
            if not html_file:
                return None, None
            
            pdf_file = self.convert_html_to_pdf(html_file, custom_filename)
            
            return html_file, pdf_file
            
        except Exception as e:
            print(f"❌ Lỗi tạo báo cáo hoàn chỉnh: {str(e)}")
            return None, None

pdf_converter = PDFConverter()

if 'html_file' in globals() and html_file:
    print("\n" + "="*60)
    print("🔄 CHUYỂN ĐỔI HTML SANG PDF")
    print("="*60)
    
    pdf_file = pdf_converter.convert_html_to_pdf(html_file)
    
    if pdf_file:
        print(f"\n✅ BÁO CÁO HOÀN TẤT:")
        print(f"   📄 HTML: {html_file}")
        print(f"   📰 PDF:  {pdf_file}")
        
        import os
        if os.path.exists(pdf_file):
            file_size = os.path.getsize(pdf_file) / 1024
            print(f"   📊 Kích thước PDF: {file_size:.1f} KB")
        
        print(f"\n💡 Có thể mở file bằng:")
        print(f"   - Trình duyệt: {html_file}")
        print(f"   - PDF Reader: {pdf_file}")
    else:
        print("❌ Không thể chuyển đổi sang PDF")
        print("📄 Vẫn có thể sử dụng file HTML để xem")
else:
    print("⚠️ Chưa có file HTML để chuyển đổi")
    print("Vui lòng chạy cell tạo HTML trước")
