Это приложение предназначено для работы с табличными данными с помощью AutoML (AutoGluon) и удобного веб-интерфейса. Поддерживается загрузка данных из файлов и из базы данных, гибкая настройка моделей, автоматическая обработка пропусков, анализ данных и экспорт результатов.
git clone <your_repository_url>
cd my_tabular_app
docker-compose up --build
- После сборки и запуска:
- Frontend будет доступен по адресу: http://localhost:4173
- Backend (API) — http://localhost:8000
После первого открытия приложения настройте секретное слово. Оно будет использоваться для настройки подключения к БД в дальнейшем. Для этого выберите настройки для продвинутых пользователей, настройки подключения к БД и введите секретное слово.
- Установите Python 3.10+ и Node.js 18+.
- Установите зависимости:
- Backend:
pip install -r backend/requirements.txt
- Frontend:
cd frontend && npm install && npm run build-only
- Backend:
- Запустите backend:
cd backend/app uvicorn main:app --host 0.0.0.0 --port 8000
- Запустите frontend:
cd frontend npm run preview -- --host --port 4173
- Docker Compose — самый быстрый способ запуска для теста и продакшена.
- Секретное слово — обязательно сохраните, оно потребуется для работы с БД.
- Поддержка форматов: CSV, Excel, PostgreSQL.
- Данные для обучения должны быть размещены на первом листе Excel-файла.
- В первой строке — названия всех колонок (features и целевая переменная).
- Данные начинаются со второй строки (первая строка — только заголовки).
- В каждой колонке — значения одного типа (числа, строки, даты и т.д.).
- Не допускаются объединённые ячейки, скрытые строки/столбцы, формулы и другие листы с данными.
- Файл не должен содержать пустых строк между заголовком и данными.
- Рекомендуется использовать расширения .xlsx или .xls.
- Содержит все признаки (features) и целевую переменную (target).
- В каждой строке должны быть заполнены значения и для признаков, и для целевой переменной.
- Целевая переменная указана в первой строке (заголовке) вместе с остальными колонками.
- Содержит те же признаки (features), что и файл для обучения.
- Колонка с целевой переменной может отсутствовать или быть пустой.
- Порядок и названия колонок должны совпадать с файлом для обучения (кроме целевой переменной).
-
Подключение к базе данных (необязательно)
- Для загрузки данных из/в базу данных подключитесь к БД через интерфейс приложения (иконка базы данных в правом верхнем углу, введите логин и пароль Postgres).
-
Загрузка данных для обучения и прогноза
- Выберите два файла:
- С компьютера: "Выбрать файл" → выбрать файл → "Загрузить данные из файла".
- Из базы данных: после подключения появится опция "Загрузить данные из БД" → выбрать схему и таблицу.
- Выберите два файла:
-
Выбор целевой колонки и типа задачи
- Обязательно выберите целевую колонку для обучения.
- Выберите тип задачи:
auto
— автоматическое определение (рекомендуется)binary
— бинарная классификацияmulticlass
— многоклассовая классификацияregression
— регрессия
-
Дополнительные настройки (необязательно)
- Обработка пропусков: по умолчанию "mean" (заполнение средними).
- Метрика: выберите метрику для обучения (accuracy, f1, r2 и др.).
- Модели: выберите модели для обучения.
- Пресет AutoGluon: выберите стратегию обучения (medium_quality, good_quality, high_quality, best_quality, optimize_for_deployment, experimental).
- Лимит времени: можно установить лимит времени на обучение.
-
Запуск обучения и прогнозирования
- Нажмите "Начать обучение". Если выбрана опция "Обучение, сохранение и прогноз", после обучения автоматически будет сделан прогноз, который можно скачать или загрузить в БД.