In [4]:
pip install reportlab

Collecting reportlab
  Obtaining dependency information for reportlab from https://files.pythonhosted.org/packages/52/15/4702e132ae36beb8daf3e20a92f166451148c4a89650cc9d3f19b3c66714/reportlab-4.4.0-py3-none-any.whl.metadata
  Downloading reportlab-4.4.0-py3-none-any.whl.metadata (1.8 kB)
Collecting chardet (from reportlab)
  Obtaining dependency information for chardet from https://files.pythonhosted.org/packages/38/6f/f5fbc992a329ee4e0f288c1fe0e2ad9485ed064cac731ed2fe47dcc38cbf/chardet-5.2.0-py3-none-any.whl.metadata
  Downloading chardet-5.2.0-py3-none-any.whl.metadata (3.4 kB)
Downloading reportlab-4.4.0-py3-none-any.whl (2.0 MB)
   ---------------------------------------- 0.0/2.0 MB ? eta -:--:--
   - -------------------------------------- 0.1/2.0 MB 2.3 MB/s eta 0:00:01
   --- ------------------------------------ 0.2/2.0 MB 2.0 MB/s eta 0:00:01
   ----- ---------------------------------- 0.3/2.0 MB 2.0 MB/s eta 0:00:01
   ------- -------------------------------- 0.4/2.0 MB 2.4 MB/

In [3]:
import matplotlib.pyplot as plt
import seaborn as sns
from reportlab.lib import colors
from reportlab.lib.pagesizes import letter
from reportlab.platypus import SimpleDocTemplate, Paragraph, Spacer, Image, Table, TableStyle
from reportlab.lib.styles import getSampleStyleSheet, ParagraphStyle
from reportlab.lib.units import inch
import pandas as pd
import numpy as np
from datetime import datetime
import os

ModuleNotFoundError: No module named 'reportlab'

In [2]:
def create_presentation():
    # Создаем директорию для презентации, если её нет
    if not os.path.exists('presentation'):
        os.makedirs('presentation')
    
    # Создаем PDF документ
    doc = SimpleDocTemplate(
        f"presentation/model_analysis_{datetime.now().strftime('%Y%m%d_%H%M%S')}.pdf",
        pagesize=letter,
        rightMargin=30,
        leftMargin=30,
        topMargin=30,
        bottomMargin=30
    )
    
    # Стили для текста
    styles = getSampleStyleSheet()
    title_style = ParagraphStyle(
        'CustomTitle',
        parent=styles['Heading1'],
        fontSize=24,
        spaceAfter=30,
        alignment=1
    )
    subtitle_style = ParagraphStyle(
        'CustomSubtitle',
        parent=styles['Heading2'],
        fontSize=18,
        spaceAfter=20
    )
    text_style = ParagraphStyle(
        'CustomText',
        parent=styles['Normal'],
        fontSize=12,
        spaceAfter=10
    )
    
    # Содержимое презентации
    story = []
    
    # Титульный слайд
    story.append(Paragraph("Анализ и Оптимизация Моделей Машинного Обучения", title_style))
    story.append(Spacer(1, 20))
    story.append(Paragraph(f"Дата создания: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}", text_style))
    story.append(Spacer(1, 20))
    
    # Содержание
    story.append(Paragraph("Содержание", subtitle_style))
    content = [
        "1. Обзор проекта",
        "2. Анализ данных",
        "3. Предобработка данных",
        "4. Обучение моделей",
        "5. Метрики и оценка",
        "6. Результаты",
        "7. Выводы"
    ]
    for item in content:
        story.append(Paragraph(item, text_style))
    story.append(Spacer(1, 20))
    
    # Обзор проекта
    story.append(Paragraph("1. Обзор проекта", subtitle_style))
    story.append(Paragraph("Цель проекта:", text_style))
    story.append(Paragraph("- Разработка системы машинного обучения для классификации данных", text_style))
    story.append(Paragraph("- Оптимизация процесса обучения моделей", text_style))
    story.append(Paragraph("- Обеспечение интерпретируемости результатов", text_style))
    story.append(Spacer(1, 20))
    
    # Анализ данных
    story.append(Paragraph("2. Анализ данных", subtitle_style))
    story.append(Paragraph("Используемые данные:", text_style))
    story.append(Paragraph("- Промышленные данные о производстве", text_style))
    story.append(Paragraph("- Временные ряды параметров производства", text_style))
    story.append(Paragraph("- Категориальные и числовые признаки", text_style))
    story.append(Spacer(1, 20))
    
    # Добавляем графики анализа данных
    if os.path.exists('results/class_distribution.png'):
        story.append(Image('results/class_distribution.png', width=6*inch, height=4*inch))
        story.append(Spacer(1, 20))
    
    if os.path.exists('results/correlation_matrix.png'):
        story.append(Image('results/correlation_matrix.png', width=6*inch, height=4*inch))
        story.append(Spacer(1, 20))
    
    if os.path.exists('results/feature_importance.png'):
        story.append(Image('results/feature_importance.png', width=6*inch, height=4*inch))
        story.append(Spacer(1, 20))
    
    # Предобработка данных
    story.append(Paragraph("3. Предобработка данных", subtitle_style))
    story.append(Paragraph("Этапы предобработки:", text_style))
    story.append(Paragraph("- Очистка данных от пропущенных значений", text_style))
    story.append(Paragraph("- Обработка выбросов", text_style))
    story.append(Paragraph("- Кодирование категориальных признаков", text_style))
    story.append(Paragraph("- Масштабирование числовых признаков", text_style))
    story.append(Paragraph("- Балансировка классов", text_style))
    story.append(Spacer(1, 20))
    
    # Обучение моделей
    story.append(Paragraph("4. Обучение моделей", subtitle_style))
    story.append(Paragraph("Используемые модели:", text_style))
    
    # Создаем таблицу моделей
    models_data = [
        ['Модель', 'Описание'],
        ['Logistic Regression', 'Линейная модель для бинарной классификации'],
        ['Random Forest', 'Ансамбль решающих деревьев'],
        ['Gradient Boosting', 'Бустинг на основе градиентного спуска'],
        ['SVM', 'Метод опорных векторов'],
        ['XGBoost', 'Градиентный бустинг с регуляризацией']
    ]
    
    models_table = Table(models_data)
    models_table.setStyle(TableStyle([
        ('BACKGROUND', (0, 0), (-1, 0), colors.grey),
        ('TEXTCOLOR', (0, 0), (-1, 0), colors.whitesmoke),
        ('ALIGN', (0, 0), (-1, -1), 'CENTER'),
        ('FONTNAME', (0, 0), (-1, 0), 'Helvetica-Bold'),
        ('FONTSIZE', (0, 0), (-1, 0), 14),
        ('BOTTOMPADDING', (0, 0), (-1, 0), 12),
        ('BACKGROUND', (0, 1), (-1, -1), colors.beige),
        ('TEXTCOLOR', (0, 1), (-1, -1), colors.black),
        ('FONTNAME', (0, 1), (-1, -1), 'Helvetica'),
        ('FONTSIZE', (0, 1), (-1, -1), 12),
        ('ALIGN', (0, 0), (-1, -1), 'CENTER'),
        ('GRID', (0, 0), (-1, -1), 1, colors.black)
    ]))
    story.append(models_table)
    story.append(Spacer(1, 20))
    
    # Метрики и оценка
    story.append(Paragraph("5. Метрики и оценка", subtitle_style))
    story.append(Paragraph("Используемые метрики:", text_style))
    story.append(Paragraph("- ROC AUC (Area Under Curve)", text_style))
    story.append(Paragraph("- F1-score (баланс между точностью и полнотой)", text_style))
    story.append(Paragraph("- Precision (точность)", text_style))
    story.append(Paragraph("- Recall (полнота)", text_style))
    story.append(Spacer(1, 20))
    
    # Добавляем графики метрик
    if os.path.exists('results/model_metrics_comparison.png'):
        story.append(Image('results/model_metrics_comparison.png', width=6*inch, height=4*inch))
        story.append(Spacer(1, 20))
    
    if os.path.exists('results/roc_curves.png'):
        story.append(Image('results/roc_curves.png', width=6*inch, height=4*inch))
        story.append(Spacer(1, 20))
    
    # Результаты
    story.append(Paragraph("6. Результаты", subtitle_style))
    story.append(Paragraph("Сравнение моделей:", text_style))
    
    if os.path.exists('results/best_model_confusion_matrix.png'):
        story.append(Image('results/best_model_confusion_matrix.png', width=6*inch, height=4*inch))
        story.append(Spacer(1, 20))
    
    if os.path.exists('results/training_time.png'):
        story.append(Image('results/training_time.png', width=6*inch, height=4*inch))
        story.append(Spacer(1, 20))
    
    # Выводы
    story.append(Paragraph("7. Выводы", subtitle_style))
    story.append(Paragraph("Основные результаты:", text_style))
    story.append(Paragraph("- Лучшая модель: {best_result['model']}", text_style))
    story.append(Paragraph("- Метод балансировки: {best_result['sampling']}", text_style))
    story.append(Paragraph("- ROC AUC: {best_result['roc_auc']:.3f}", text_style))
    story.append(Paragraph("- F1-score: {best_result['f1']:.3f}", text_style))
    story.append(Paragraph("- Время обучения: {best_result['training_time']:.1f} сек", text_style))
    story.append(Spacer(1, 20))
    
    story.append(Paragraph("Рекомендации:", text_style))
    story.append(Paragraph("- Использование лучшей модели в production", text_style))
    story.append(Paragraph("- Дальнейшая оптимизация параметров", text_style))
    story.append(Paragraph("- Улучшение балансировки классов", text_style))
    story.append(Paragraph("- Добавление новых признаков", text_style))
    
    # Создаем PDF
    doc.build(story)
    
    print("Презентация успешно создана в директории presentation/")

if __name__ == "__main__":
    create_presentation() 

NameError: name 'os' is not defined