In [7]:
import matplotlib.pyplot as plt
import seaborn as sns
from reportlab.lib import colors
from reportlab.lib.pagesizes import letter
from reportlab.platypus import SimpleDocTemplate, Paragraph, Spacer, Image, Table, TableStyle
from reportlab.lib.styles import getSampleStyleSheet, ParagraphStyle
from reportlab.lib.units import inch
import pandas as pd
import numpy as np
from datetime import datetime
import os
from reportlab.pdfbase import pdfmetrics
from reportlab.pdfbase.ttfonts import TTFont

In [11]:
def create_presentation():
    # Регистрируем шрифт для поддержки кириллицы
    try:
        pdfmetrics.registerFont(TTFont('Arial', 'arial.ttf'))
        font_name = 'Arial'
    except:
        font_name = 'Helvetica'
    
    # Создаем директорию для презентации
    if not os.path.exists('presentation'):
        os.makedirs('presentation')
    
    # Проверяем наличие графиков
    required_images = [
        'results/class_distribution.png',
        'results/correlation_matrix.png',
        'results/feature_importance.png',
        'results/model_metrics_comparison.png',
        'results/roc_curves.png',
        'results/pr_curves.png',
        'results/best_model_confusion_matrix.png',
        'results/prediction_distribution.png',
        'results/training_time.png'
    ]
    
    missing_images = [img for img in required_images if not os.path.exists(img)]
    if missing_images:
        print("Отсутствуют следующие графики:")
        for img in missing_images:
            print(f"- {img}")
        print("\nПожалуйста, сначала запустите model_new.py для создания графиков.")
        return
    
    # Создаем PDF документ
    doc = SimpleDocTemplate(
        f"presentation/model_analysis_{datetime.now().strftime('%Y%m%d_%H%M%S')}.pdf",
        pagesize=letter,
        rightMargin=30,
        leftMargin=30,
        topMargin=30,
        bottomMargin=30
    )
    
    # Стили для текста
    styles = getSampleStyleSheet()
    title_style = ParagraphStyle(
        'CustomTitle',
        parent=styles['Heading1'],
        fontSize=24,
        spaceAfter=30,
        alignment=1,
        fontName=font_name
    )
    subtitle_style = ParagraphStyle(
        'CustomSubtitle',
        parent=styles['Heading2'],
        fontSize=18,
        spaceAfter=20,
        fontName=font_name
    )
    text_style = ParagraphStyle(
        'CustomText',
        parent=styles['Normal'],
        fontSize=12,
        spaceAfter=10,
        fontName=font_name,
        leading=14
    )
    bullet_style = ParagraphStyle(
        'CustomBullet',
        parent=styles['Normal'],
        fontSize=12,
        spaceAfter=5,
        fontName=font_name,
        leftIndent=20,
        bulletIndent=10,
        bulletFontName=font_name,
        bulletFontSize=12
    )
    
    # Содержимое презентации
    story = []
    
    # Титульный слайд
    story.append(Paragraph("Анализ и обучение моделей машинного обучения", title_style))
    story.append(Spacer(1, 20))
    story.append(Paragraph(f"Дата создания: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}", text_style))
    story.append(Spacer(1, 30))
    
    # Содержание
    story.append(Paragraph("Содержание", subtitle_style))
    content = [
        "1. Обзор проекта",
        "2. Анализ данных",
        "3. Предобработка данных",
        "4. Обучение моделей",
        "5. Метрики и оценка",
        "6. Результаты",
        "7. Выводы"
    ]
    for item in content:
        story.append(Paragraph(item, bullet_style))
    story.append(Spacer(1, 30))
    
    # Обзор проекта
    story.append(Paragraph("1. Обзор проекта", subtitle_style))
    story.append(Paragraph("Цель проекта:", text_style))
    story.append(Paragraph("• Разработка системы машинного обучения для классификации данных", bullet_style))
    story.append(Paragraph("• Оптимизация процесса обучения моделей", bullet_style))
    story.append(Paragraph("• Обеспечение интерпретируемости результатов", bullet_style))
    story.append(Spacer(1, 30))
    
    # Анализ данных
    story.append(Paragraph("2. Анализ данных", subtitle_style))
    story.append(Paragraph("Используемые данные:", text_style))
    story.append(Paragraph("• Промышленные данные о производстве продукции", bullet_style))
    story.append(Paragraph("• Временные ряды параметров производства", bullet_style))
    story.append(Paragraph("• Категориальные и числовые признаки", bullet_style))
    story.append(Paragraph("• Целевая переменная: качество продукции (0 - брак, 1 - годная продукция)", bullet_style))
    story.append(Spacer(1, 20))
    
    # Добавляем графики
    story.append(Image('results/class_distribution.png', width=6*inch, height=4*inch))
    story.append(Paragraph("Рисунок 1. Распределение классов в данных", text_style))
    story.append(Spacer(1, 20))
    
    story.append(Image('results/correlation_matrix.png', width=6*inch, height=4*inch))
    story.append(Paragraph("Рисунок 2. Матрица корреляций признаков", text_style))
    story.append(Spacer(1, 20))
    
    story.append(Image('results/feature_importance.png', width=6*inch, height=4*inch))
    story.append(Paragraph("Рисунок 3. Важность признаков", text_style))
    story.append(Spacer(1, 30))
    
    # Предобработка данных
    story.append(Paragraph("3. Предобработка данных", subtitle_style))
    story.append(Paragraph("Этапы предобработки:", text_style))
    story.append(Paragraph("• Очистка данных от пропущенных значений", bullet_style))
    story.append(Paragraph("• Кодирование категориальных признаков (One-Hot Encoding)", bullet_style))
    story.append(Paragraph("• Масштабирование числовых признаков (StandardScaler)", bullet_style))
    story.append(Paragraph("• Балансировка классов:", bullet_style))
    story.append(Paragraph("  - SMOTE", bullet_style))
    story.append(Paragraph("  - ADASYN", bullet_style))
    story.append(Paragraph("  - RandomUnderSampler", bullet_style))
    story.append(Spacer(1, 30))
    
    # Обучение моделей
    story.append(Paragraph("4. Обучение моделей", subtitle_style))
    story.append(Paragraph("Сравнение метрик моделей:", text_style))
    story.append(Image('results/model_metrics_comparison.png', width=6*inch, height=4*inch))
    story.append(Paragraph("Рисунок 4. Сравнение метрик качества моделей", text_style))
    story.append(Spacer(1, 20))
    
    story.append(Image('results/roc_curves.png', width=6*inch, height=4*inch))
    story.append(Paragraph("Рисунок 5. ROC-кривые моделей", text_style))
    story.append(Spacer(1, 30))
    
    # Результаты
    story.append(Paragraph("5. Результаты", subtitle_style))
    story.append(Image('results/best_model_confusion_matrix.png', width=6*inch, height=4*inch))
    story.append(Paragraph("Рисунок 6. Матрица ошибок лучшей модели", text_style))
    story.append(Spacer(1, 20))
    
    story.append(Image('results/training_time.png', width=6*inch, height=4*inch))
    story.append(Paragraph("Рисунок 7. Время обучения моделей", text_style))
    story.append(Spacer(1, 30))
    
    # Выводы
    story.append(Paragraph("6. Выводы", subtitle_style))
    story.append(Paragraph("Основные результаты:", text_style))
    story.append(Paragraph("• Лучшая модель: Extra Trees", bullet_style))
    story.append(Paragraph("• Метод балансировки: ADASYN", bullet_style))
    story.append(Paragraph("• ROC AUC: 0.979", bullet_style))
    story.append(Paragraph("• F1-score: 0.995", bullet_style))
    story.append(Paragraph("• Precision: 0.995", bullet_style))
    story.append(Paragraph("• Recall: 0.995", bullet_style))
    story.append(Spacer(1, 20))
    
    
    # Создаем PDF
    try:
        doc.build(story)
        print("Презентация успешно создана в директории presentation/")
    except Exception as e:
        print(f"Ошибка при создании презентации: {str(e)}")

if __name__ == "__main__":
    create_presentation() 

Презентация успешно создана в директории presentation/
