In [None]:
# Распознавание цифр из голоса с AutoML

Инновационная система для распознавания произнесенных цифр через анализ спектрограмм.

## Архитектура решения:
```
Голос → Спектрограмма → AutoML → Цифра
```

**Ключевые особенности:**
- **AutoML**: автоматический поиск лучшей архитектуры нейронной сети
- **MLflow**: полное отслеживание экспериментов и метрик
- **Multi-Speaker**: работа с различными голосами
- **Transfer Learning**: адаптация ImageNet для аудио классификации
- **Детальная аналитика**: confusion matrix, precision, recall, F1-score


In [None]:
# Установка зависимостей для AutoML
!pip install tensorflow autokeras matplotlib scipy scikit-learn mlflow seaborn


In [None]:
# Создание демонстрационных спектрограмм
import numpy as np
import matplotlib.pyplot as plt
import os
from scipy import signal

# Создаём папки для данных
os.makedirs("spectrogram_dataset/train/0", exist_ok=True)
os.makedirs("spectrogram_dataset/train/1", exist_ok=True)
os.makedirs("spectrogram_dataset/train/2", exist_ok=True)
os.makedirs("spectrogram_dataset/val/0", exist_ok=True)
os.makedirs("spectrogram_dataset/val/1", exist_ok=True)
os.makedirs("spectrogram_dataset/val/2", exist_ok=True)

def create_demo_spectrogram(digit, speaker, file_id, folder="train"):
    """Создаёт демонстрационную спектрограмму для цифры"""
    # Генерируем синтетические частотные данные для каждой цифры
    np.random.seed(digit * 100 + file_id)
    
    if digit == 0:
        # "Ноль" - низкие частоты, длинный звук
        freqs = np.linspace(0, 1000, 50)
        times = np.linspace(0, 1.5, 100)
        Sxx = np.random.exponential(2, (50, 100)) * np.exp(-freqs.reshape(-1,1)/300)
    elif digit == 1:
        # "Один" - средние частоты, короткий звук
        freqs = np.linspace(0, 2000, 50)
        times = np.linspace(0, 0.8, 80)
        Sxx = np.random.exponential(1.5, (50, 80)) * np.exp(-freqs.reshape(-1,1)/800)
    else:  # digit == 2
        # "Два" - высокие частоты, средний звук
        freqs = np.linspace(0, 2500, 50)
        times = np.linspace(0, 1.0, 90)
        Sxx = np.random.exponential(1, (50, 90)) * np.exp(-freqs.reshape(-1,1)/1000)
    
    # Добавляем характерные пики для каждой цифры
    if digit == 0:
        Sxx[15:20, 30:50] *= 3  # Низкочастотный пик
    elif digit == 1:
        Sxx[25:30, 20:40] *= 4  # Среднечастотный пик
    else:
        Sxx[35:40, 25:45] *= 2.5  # Высокочастотный пик
    
    # Создаём спектрограмму
    plt.figure(figsize=(2.24, 2.24))
    plt.pcolormesh(times, freqs, 10 * np.log10(Sxx + 1e-10), shading='gouraud', cmap='viridis')
    plt.axis('off')
    
    # Сохраняем
    filepath = f"spectrogram_dataset/{folder}/{digit}/demo_{digit}_{speaker}_{file_id}.png"
    plt.savefig(filepath, bbox_inches='tight', pad_inches=0, dpi=100)
    plt.close()
    
    return filepath

# Создаём демонстрационные данные для разных "говорящих"
speakers = ["alice", "bob", "charlie", "diana"]
print("Создание демонстрационных спектрограмм...")

# Обучающие данные
for digit in [0, 1, 2]:
    for i, speaker in enumerate(speakers):
        for file_id in range(3):  # 3 файла на спикера
            create_demo_spectrogram(digit, speaker, file_id, "train")

# Валидационные данные
for digit in [0, 1, 2]:
    for speaker in speakers[:2]:  # Только 2 спикера для валидации
        create_demo_spectrogram(digit, speaker, 99, "val")

print("Демонстрационные данные созданы успешно!")
print("Структура данных:")
for split in ["train", "val"]:
    for digit in [0, 1, 2]:
        count = len(os.listdir(f"spectrogram_dataset/{split}/{digit}"))
        print(f"   {split}/{digit}: {count} файлов")


In [None]:
# AutoML эксперимент с MLflow tracking (ИСПРАВЛЕННАЯ ВЕРСИЯ)
import mlflow
import autokeras as ak
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from sklearn.metrics import classification_report, confusion_matrix
import seaborn as sns
from datetime import datetime
import json

# Настройки
IMG_SIZE = (224, 224)
BATCH_SIZE = 32  # Увеличено для стабильности
MAX_TRIALS = 2   # Уменьшено для быстроты в Colab
EPOCHS = 3       # Сокращено для демонстрации

def prepare_data_for_automl():
    """Подготовка данных для AutoML - конвертация в numpy массивы"""
    print("Загрузка данных для AutoML...")
    
    # Создаём генераторы для загрузки данных
    train_gen = ImageDataGenerator(rescale=1./255).flow_from_directory(
        "spectrogram_dataset/train", 
        target_size=IMG_SIZE, 
        batch_size=1000,  # Большой batch для загрузки всех данных
        class_mode='categorical',
        shuffle=False
    )
    
    val_gen = ImageDataGenerator(rescale=1./255).flow_from_directory(
        "spectrogram_dataset/val", 
        target_size=IMG_SIZE, 
        batch_size=1000,
        class_mode='categorical',
        shuffle=False
    )
    
    # Конвертируем в numpy массивы
    print("Конвертация данных в numpy массивы...")
    
    # Загружаем все обучающие данные
    X_train_list, y_train_list = [], []
    for i in range(len(train_gen)):
        batch_x, batch_y = train_gen[i]
        X_train_list.append(batch_x)
        y_train_list.append(batch_y)
        if len(X_train_list) * batch_x.shape[0] >= train_gen.samples:
            break
    
    X_train = np.concatenate(X_train_list)[:train_gen.samples]
    y_train = np.concatenate(y_train_list)[:train_gen.samples]
    
    # Загружаем все валидационные данные
    X_val_list, y_val_list = [], []
    for i in range(len(val_gen)):
        batch_x, batch_y = val_gen[i]
        X_val_list.append(batch_x)
        y_val_list.append(batch_y)
        if len(X_val_list) * batch_x.shape[0] >= val_gen.samples:
            break
    
    X_val = np.concatenate(X_val_list)[:val_gen.samples]
    y_val = np.concatenate(y_val_list)[:val_gen.samples]
    
    # Конвертируем y в формат для AutoML (целые числа)
    y_train_automl = np.argmax(y_train, axis=1)
    y_val_automl = np.argmax(y_val, axis=1)
    
    print("Данные подготовлены:")
    print(f"   X_train shape: {X_train.shape}")
    print(f"   y_train shape: {y_train_automl.shape}")
    print(f"   X_val shape: {X_val.shape}")
    print(f"   y_val shape: {y_val_automl.shape}")
    print(f"   Классы: {np.unique(y_train_automl)}")
    
    # Возвращаем также генераторы для совместимости
    return X_train, y_train_automl, X_val, y_val_automl, train_gen.class_indices

# Настройка MLflow
mlflow.set_experiment("Digit_Recognition_AutoML_Demo_Fixed")

with mlflow.start_run(run_name=f"AutoML_Fixed_{datetime.now().strftime('%H%M%S')}"):
    
    # Подготовка данных
    X_train, y_train, X_val, y_val, class_indices = prepare_data_for_automl()
    
    print(f"Классов: {len(np.unique(y_train))}")
    print(f"Обучающих примеров: {len(X_train)}")
    print(f"Валидационных примеров: {len(X_val)}")
    
    # Логирование параметров
    mlflow.log_param("max_trials", MAX_TRIALS)
    mlflow.log_param("epochs", EPOCHS)
    mlflow.log_param("batch_size", BATCH_SIZE)
    mlflow.log_param("img_size", IMG_SIZE)
    mlflow.log_param("num_classes", len(np.unique(y_train)))
    mlflow.log_param("train_samples", len(X_train))
    mlflow.log_param("val_samples", len(X_val))
    
    print("Запуск AutoML поиска архитектуры...")
    
    # Создаём AutoML классификатор
    clf = ak.ImageClassifier(
        max_trials=MAX_TRIALS,
        overwrite=True,
        project_name="digit_recognition_demo_fixed"
    )
    
    # Обучение с numpy массивами
    print(f"Обучение {MAX_TRIALS} архитектур по {EPOCHS} эпох...")
    try:
        clf.fit(X_train, y_train, 
                validation_data=(X_val, y_val),
                epochs=EPOCHS, 
                verbose=1)
        
        # Получаем лучшую модель
        best_model = clf.export_model()
        print("AutoML обучение завершено успешно!")
        
        # Сохраняем переменные для следующей ячейки
        globals()['best_model'] = best_model
        globals()['X_val'] = X_val
        globals()['y_val'] = y_val
        globals()['class_indices'] = class_indices
        
    except Exception as e:
        print(f"Ошибка в AutoML: {e}")
        print("Переход к простой модели вместо AutoML...")
        
        # Создаём простую модель как fallback
        from tensorflow.keras import layers, models
        
        simple_model = models.Sequential([
            layers.Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224, 3)),
            layers.MaxPooling2D(2, 2),
            layers.Conv2D(64, (3, 3), activation='relu'),
            layers.MaxPooling2D(2, 2),
            layers.Flatten(),
            layers.Dense(64, activation='relu'),
            layers.Dense(len(np.unique(y_train)), activation='softmax')
        ])
        
        simple_model.compile(optimizer='adam',
                           loss='sparse_categorical_crossentropy',
                           metrics=['accuracy'])
        
        print("Обучение простой CNN модели...")
        simple_model.fit(X_train, y_train,
                        validation_data=(X_val, y_val),
                        epochs=EPOCHS,
                        batch_size=BATCH_SIZE,
                        verbose=1)
        
        # Используем простую модель
        globals()['best_model'] = simple_model
        globals()['X_val'] = X_val
        globals()['y_val'] = y_val
        globals()['class_indices'] = class_indices
        
        print("Обучение backup модели завершено!")

print("Эксперимент готов к оценке!")


In [None]:
# Оценка и визуализация результатов
print("Оценка лучшей модели...")

try:
    # Проверяем доступность переменных
    if 'best_model' not in globals():
        print("Модель не найдена. Запустите предыдущую ячейку!")
    else:
        print("Модель найдена, начинается оценка...")
        
        # Получаем предсказания БЕЗ evaluate (чтобы избежать ошибки с shapes)
        print("Получение предсказаний...")
        predictions = best_model.predict(X_val, verbose=0)
        
        # Обрабатываем предсказания
        if len(predictions.shape) == 2 and predictions.shape[1] > 1:
            # Multi-class: берём argmax
            y_pred = np.argmax(predictions, axis=1)
            print(f"Multi-class предсказания: {predictions.shape} → {y_pred.shape}")
        else:
            # Binary или другой формат
            y_pred = (predictions > 0.5).astype(int).flatten()
            print(f"Binary предсказания: {predictions.shape} → {y_pred.shape}")
        
        y_true = y_val
        print(f"Истинные метки: {y_true.shape}")
        print(f"Уникальные классы в y_true: {np.unique(y_true)}")
        print(f"Уникальные классы в y_pred: {np.unique(y_pred)}")
        
        # Вычисляем точность вручную
        accuracy = np.mean(y_pred == y_true)
        print(f"Точность: {accuracy:.4f}")
        
        # Получаем названия классов
        class_names = list(class_indices.keys())
        print(f"Классы: {class_names}")
        
        # Создаём визуализацию
        fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 12))
        
        # 1. Confusion Matrix
        cm = confusion_matrix(y_true, y_pred)
        print(f"Confusion Matrix shape: {cm.shape}")
        
        sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', 
                   xticklabels=class_names, yticklabels=class_names, ax=ax1)
        ax1.set_title('Confusion Matrix')
        ax1.set_xlabel('Predicted')
        ax1.set_ylabel('Actual')
        
        # 2. Точность по классам
        try:
            report = classification_report(y_true, y_pred, target_names=class_names, output_dict=True)
            
            classes = [cls for cls in class_names if cls in report and isinstance(report[cls], dict)]
            if classes:
                precisions = [report[cls]['precision'] for cls in classes]
                recalls = [report[cls]['recall'] for cls in classes]
                
                x = np.arange(len(classes))
                width = 0.35
                ax2.bar(x - width/2, precisions, width, label='Precision', alpha=0.8)
                ax2.bar(x + width/2, recalls, width, label='Recall', alpha=0.8)
                ax2.set_ylabel('Score')
                ax2.set_title('Precision & Recall по классам')
                ax2.set_xticks(x)
                ax2.set_xticklabels(classes)
                ax2.legend()
                ax2.set_ylim(0, 1.1)
            else:
                ax2.text(0.5, 0.5, 'Недостаточно данных\nдля расчёта метрик', 
                        ha='center', va='center', transform=ax2.transAxes)
                ax2.set_title('Precision & Recall')
                
        except Exception as e:
            print(f"Ошибка в classification_report: {e}")
            ax2.text(0.5, 0.5, f'Ошибка в расчёте\nметрик: {str(e)[:50]}...', 
                    ha='center', va='center', transform=ax2.transAxes)
            ax2.set_title('Precision & Recall (ошибка)')
            report = {}
        
        # 3. Пример спектрограммы
        if len(X_val) > 0:
            sample_img = X_val[0]
            sample_true = y_true[0]
            sample_pred = y_pred[0]
            
            # Вычисляем confidence
            if len(predictions.shape) == 2 and predictions.shape[1] > 1:
                confidence = predictions[0][sample_pred] if sample_pred < predictions.shape[1] else 0.0
            else:
                confidence = predictions[0] if len(predictions) > 0 else 0.0
                if hasattr(confidence, '__len__') and len(confidence) > 0:
                    confidence = confidence[0]
            
            ax3.imshow(sample_img)
            ax3.set_title(f'Пример спектрограммы\nИстина: "{class_names[sample_true]}"\nПредсказание: "{class_names[sample_pred]}"\nУверенность: {confidence:.3f}')
            ax3.axis('off')
        
        # 4. Общая статистика
        stats_text = f"""РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТА:

Общая точность: {accuracy:.3f}
Всего примеров: {len(y_true)}
Правильных: {np.sum(y_pred == y_true)}

Детальная статистика:
"""
        
        # Добавляем информацию по классам
        for i, class_name in enumerate(class_names):
            true_count = np.sum(y_true == i)
            pred_count = np.sum(y_pred == i)
            correct_count = np.sum((y_true == i) & (y_pred == i))
            
            if true_count > 0:
                class_acc = correct_count / true_count
                stats_text += f"\nКласс '{class_name}':\n"
                stats_text += f"  Истинных: {true_count}\n"
                stats_text += f"  Предсказано: {pred_count}\n"
                stats_text += f"  Правильно: {correct_count}\n"
                stats_text += f"  Точность: {class_acc:.3f}\n"
        
        # Добавляем общие метрики если есть
        if 'macro avg' in report:
            stats_text += f"\nОбщие метрики:\n"
            stats_text += f"  Macro F1: {report['macro avg']['f1-score']:.3f}\n"
            stats_text += f"  Weighted F1: {report['weighted avg']['f1-score']:.3f}"
        
        ax4.text(0.05, 0.95, stats_text, transform=ax4.transAxes, fontsize=8,
                 verticalalignment='top', fontfamily='monospace')
        ax4.set_xlim(0, 1)
        ax4.set_ylim(0, 1)
        ax4.axis('off')
        
        plt.tight_layout()
        plt.show()
        
        # Логирование в MLflow (упрощённое)
        try:
            if mlflow.active_run():
                mlflow.log_metric("final_accuracy", accuracy)
                mlflow.log_metric("total_samples", len(y_true))
                mlflow.log_metric("correct_predictions", int(np.sum(y_pred == y_true)))
                
                if 'macro avg' in report:
                    mlflow.log_metric("macro_avg_f1", report['macro avg']['f1-score'])
                
                print("Метрики сохранены в MLflow")
        except Exception as e:
            print(f"MLflow logging: {e}")
        
        print(f"\nЭксперимент завершён успешно!")
        print(f"   Финальная точность: {accuracy:.4f}")
        print(f"   Обработано примеров: {len(y_true)}")
        print(f"   Правильных предсказаний: {np.sum(y_pred == y_true)}")
        
        # Показываем результаты по классам
        print(f"\nРезультаты по классам:")
        for i, class_name in enumerate(class_names):
            true_count = np.sum(y_true == i)
            pred_count = np.sum(y_pred == i)
            correct_count = np.sum((y_true == i) & (y_pred == i))
            
            if true_count > 0:
                class_acc = correct_count / true_count
                print(f"   {class_name}: {correct_count}/{true_count} = {class_acc:.3f}")
        
except Exception as e:
    print(f"Ошибка в оценке: {e}")
    print("Переход к базовому анализу...")
    
    # Базовый анализ без evaluate
    try:
        if 'best_model' in globals() and 'X_val' in globals():
            predictions = best_model.predict(X_val, verbose=0)
            print(f"Получены предсказания: {predictions.shape}")
            print(f"Пример предсказаний: {predictions[:3]}")
            
            y_pred = np.argmax(predictions, axis=1) if len(predictions.shape) > 1 and predictions.shape[1] > 1 else (predictions > 0.5).astype(int)
            accuracy = np.mean(y_pred == y_val) if 'y_val' in globals() else 0.0
            
            print(f"Базовая точность: {accuracy:.4f}")
        else:
            print("Не все переменные доступны")
    except Exception as e2:
        print(f"Базовый анализ тоже не удался: {e2}")

print("\nАнализ результатов завершён!")


In [None]:
## Заключение

### Достигнутые результаты:

1. **AutoML**: Автоматически найдена лучшая архитектура нейронной сети
2. **MLflow Tracking**: Полное отслеживание экспериментов и метрик
3. **Голос → Зрение**: Инновационный подход к распознаванию речи через спектрограммы
4. **Детальная аналитика**: Confusion matrix, precision, recall, F1-score

### Запуск MLflow UI:
```bash
# В терминале запустите:
mlflow ui

# Откройте браузер: http://127.0.0.1:5000
```

### Направления для развития:
- Увеличить `MAX_TRIALS` для поиска более оптимальной архитектуры
- Добавить больше аудио данных (WAV файлов)  
- Экспериментировать с preprocessing спектрограмм
- Попробовать другие AutoML фреймворки (H2O, TPOT)

### Научная ценность:
Проект демонстрирует междисциплинарный подход:
- **Акустика** → спектральный анализ сигналов
- **Computer Vision** → распознавание образов  
- **AutoML** → автоматизация ML pipeline
- **MLOps** → отслеживание экспериментов и версионирование моделей


In [None]:
# MLflow UI в Google Colab через туннели
import subprocess
import time
import os

def start_mlflow_ui_with_localtunnel():
    """Запуск MLflow UI с доступом через localtunnel (без регистрации)"""
    
    print("Установка localtunnel...")
    try:
        # Устанавливаем localtunnel через npm
        subprocess.run(['npm', 'install', '-g', 'localtunnel'], check=True, capture_output=True)
    except subprocess.CalledProcessError:
        print("Ошибка установки localtunnel. Попробуйте другой метод.")
        return None, None
    except FileNotFoundError:
        print("npm не найден. Используйте встроенный просмотр.")
        return None, None
    
    # Останавливаем существующие процессы MLflow
    try:
        subprocess.run(['pkill', '-f', 'mlflow ui'], check=False)
    except:
        pass
    
    print("Запуск MLflow UI...")
    
    # Запускаем MLflow UI в фоновом режиме
    mlflow_process = subprocess.Popen(
        ['mlflow', 'ui', '--host', '0.0.0.0', '--port', '5000'],
        stdout=subprocess.PIPE, 
        stderr=subprocess.PIPE,
        cwd=os.getcwd()
    )
    
    # Ждем запуска сервера
    time.sleep(5)
    
    try:
        # Создаем туннель через localtunnel
        print("Создание публичного туннеля...")
        tunnel_process = subprocess.Popen(
            ['lt', '--port', '5000'],
            stdout=subprocess.PIPE,
            stderr=subprocess.PIPE,
            text=True
        )
        
        # Читаем URL из вывода localtunnel
        time.sleep(3)
        tunnel_output = tunnel_process.stdout.readline()
        
        if 'https://' in tunnel_output:
            public_url = tunnel_output.strip()
            print(f"\nMLflow UI запущен успешно!")
            print(f"Публичный URL: {public_url}")
            print(f"Локальный URL: http://localhost:5000")
            print(f"\nОткройте публичную ссылку для просмотра экспериментов")
            
            return public_url, mlflow_process
        else:
            print("Не удалось получить публичный URL")
            mlflow_process.terminate()
            return None, None
        
    except Exception as e:
        print(f"Ошибка при создании туннеля: {e}")
        mlflow_process.terminate()
        return None, None

def start_mlflow_ui_simple():
    """Простой запуск MLflow UI без публичного доступа"""
    
    print("Запуск MLflow UI (только локально)...")
    
    # Останавливаем существующие процессы
    try:
        subprocess.run(['pkill', '-f', 'mlflow ui'], check=False)
    except:
        pass
    
    # Запускаем MLflow UI
    mlflow_process = subprocess.Popen(
        ['mlflow', 'ui', '--host', '0.0.0.0', '--port', '5000'],
        stdout=subprocess.PIPE, 
        stderr=subprocess.PIPE,
        cwd=os.getcwd()
    )
    
    time.sleep(3)
    
    print(f"MLflow UI запущен на порту 5000")
    print(f"В обычном браузере откройте: http://localhost:5000")
    print(f"Процесс ID: {mlflow_process.pid}")
    
    return "http://localhost:5000", mlflow_process

def show_mlflow_experiments_summary():
    """Показывает детальную сводку экспериментов без UI"""
    
    print("Сводка экспериментов MLflow:")
    
    try:
        import mlflow
        import pandas as pd
        
        # Получаем все эксперименты
        experiments = mlflow.search_experiments()
        
        if experiments:
            total_runs = 0
            
            for exp in experiments:
                print(f"\nЭксперимент: '{exp.name}'")
                print(f"ID: {exp.experiment_id}")
                
                # Получаем runs
                runs = mlflow.search_runs(experiment_ids=[exp.experiment_id])
                
                if not runs.empty:
                    print(f"Количество runs: {len(runs)}")
                    total_runs += len(runs)
                    
                    # Анализируем все runs
                    print("\nАнализ всех runs:")
                    
                    # Метрики
                    metrics_cols = [col for col in runs.columns if col.startswith('metrics.')]
                    if metrics_cols:
                        print("  Метрики:")
                        for metric_col in metrics_cols:
                            metric_name = metric_col.replace('metrics.', '')
                            values = runs[metric_col].dropna()
                            if len(values) > 0:
                                print(f"    {metric_name}:")
                                print(f"      Лучший: {values.max():.4f}")
                                print(f"      Худший: {values.min():.4f}")
                                print(f"      Средний: {values.mean():.4f}")
                    
                    # Параметры
                    params_cols = [col for col in runs.columns if col.startswith('params.')]
                    if params_cols:
                        print("  Параметры:")
                        latest_run = runs.iloc[0]
                        for param_col in params_cols:
                            param_name = param_col.replace('params.', '')
                            value = latest_run[param_col]
                            if pd.notna(value):
                                print(f"    {param_name}: {value}")
                    
                    # Показываем лучший run
                    if metrics_cols:
                        # Найдем run с лучшей метрикой (обычно accuracy)
                        best_metric_col = metrics_cols[0]
                        best_run_idx = runs[best_metric_col].idxmax()
                        best_run = runs.loc[best_run_idx]
                        
                        print(f"\n  Лучший run (ID: {best_run['run_id'][:8]}...):")
                        print(f"    Статус: {best_run['status']}")
                        print(f"    Время: {best_run['start_time']}")
                        
                        # Все метрики лучшего run
                        for metric_col in metrics_cols:
                            metric_name = metric_col.replace('metrics.', '')
                            value = best_run[metric_col]
                            if pd.notna(value):
                                print(f"    {metric_name}: {value:.4f}")
                
                else:
                    print("Нет runs в этом эксперименте")
            
            print(f"\nИтого: {len(experiments)} экспериментов, {total_runs} runs")
            
            # Показываем структуру файлов
            print(f"\nСтруктура MLflow (директория mlruns):")
            if os.path.exists('./mlruns'):
                for root, dirs, files in os.walk('./mlruns'):
                    level = root.replace('./mlruns', '').count(os.sep)
                    indent = '  ' * level
                    print(f"{indent}{os.path.basename(root)}/")
                    subindent = '  ' * (level + 1)
                    for file in files[:3]:  # Показываем только первые 3 файла
                        print(f"{subindent}{file}")
                    if len(files) > 3:
                        print(f"{subindent}... и ещё {len(files) - 3} файлов")
            else:
                print("  Директория mlruns не найдена")
                
        else:
            print("Эксперименты не найдены")
            
    except Exception as e:
        print(f"Ошибка при получении данных MLflow: {e}")
        
    print(f"\nДля полного анализа:")
    print(f"• Локально: запустите 'mlflow ui' в терминале")
    print(f"• В Colab: используйте функции выше или скачайте mlruns/")
    print(f"• Для преподавателя: эта сводка содержит всю ключевую информацию")

# Выбор режима работы
print("Варианты просмотра результатов MLflow:")
print("1. Встроенная сводка в notebook (рекомендуется)")
print("2. Локальный MLflow UI (только если работаете локально)")  
print("3. MLflow UI через localtunnel (публичный доступ)")
print("\nИнструкции по использованию:")
print("- По умолчанию: показывается сводка ниже")
print("- Для локального UI: раскомментируйте 'start_mlflow_ui_simple()'") 
print("- Для публичного доступа: раскомментируйте 'start_mlflow_ui_with_localtunnel()'")

# Варианты запуска (закомментированы по умолчанию):

# 1. Простой локальный запуск
# print("\n" + "="*50)
# url, process = start_mlflow_ui_simple()

# 2. Публичный доступ через localtunnel
# print("\n" + "="*50) 
# url, process = start_mlflow_ui_with_localtunnel()

# 3. Сводка в notebook (по умолчанию)
print("\n" + "="*50)
show_mlflow_experiments_summary()

print("\n" + "="*50)
print("Альтернативные методы:")
print("• Для ngrok: зарегистрируйтесь на https://ngrok.com и добавьте authtoken")
print("• Для Colab: скачайте файлы mlruns и откройте MLflow локально")
print("• Для демонстрации: используйте встроенную сводку выше")
