Skip to content

mihnin/my_tabular_app

Repository files navigation

📊 Приложение для работы с табличными данными

📝 Описание

Это приложение предназначено для работы с табличными данными с помощью AutoML (AutoGluon) и удобного веб-интерфейса. Поддерживается загрузка данных из файлов и из базы данных, гибкая настройка моделей, автоматическая обработка пропусков, анализ данных и экспорт результатов.


🚀 Быстрый старт через Docker Compose

1. Клонируйте репозиторий и перейдите в папку проекта

git clone <your_repository_url>
cd my_tabular_app

2. Запустите все сервисы командой:

docker-compose up --build

После первого открытия приложения настройте секретное слово. Оно будет использоваться для настройки подключения к БД в дальнейшем. Для этого выберите настройки для продвинутых пользователей, настройки подключения к БД и введите секретное слово.


🛠️ Ручной запуск (альтернатива)

  1. Установите Python 3.10+ и Node.js 18+.
  2. Установите зависимости:
    • Backend: pip install -r backend/requirements.txt
    • Frontend: cd frontend && npm install && npm run build-only
  3. Запустите backend:
    cd backend/app
    uvicorn main:app --host 0.0.0.0 --port 8000
  4. Запустите frontend:
    cd frontend
    npm run preview -- --host --port 4173

💡 Советы и FAQ

  • Docker Compose — самый быстрый способ запуска для теста и продакшена.
  • Секретное слово — обязательно сохраните, оно потребуется для работы с БД.
  • Поддержка форматов: CSV, Excel, PostgreSQL.

Работа с табличными данными

Требования к формату Excel для обучения

  • Данные для обучения должны быть размещены на первом листе Excel-файла.
  • В первой строке — названия всех колонок (features и целевая переменная).
  • Данные начинаются со второй строки (первая строка — только заголовки).
  • В каждой колонке — значения одного типа (числа, строки, даты и т.д.).
  • Не допускаются объединённые ячейки, скрытые строки/столбцы, формулы и другие листы с данными.
  • Файл не должен содержать пустых строк между заголовком и данными.
  • Рекомендуется использовать расширения .xlsx или .xls.

Файл для обучения

  • Содержит все признаки (features) и целевую переменную (target).
  • В каждой строке должны быть заполнены значения и для признаков, и для целевой переменной.
  • Целевая переменная указана в первой строке (заголовке) вместе с остальными колонками.

Файл для прогноза

  • Содержит те же признаки (features), что и файл для обучения.
  • Колонка с целевой переменной может отсутствовать или быть пустой.
  • Порядок и названия колонок должны совпадать с файлом для обучения (кроме целевой переменной).

Инструкция по обучению и прогнозу на табличных данных

  1. Подключение к базе данных (необязательно)

    • Для загрузки данных из/в базу данных подключитесь к БД через интерфейс приложения (иконка базы данных в правом верхнем углу, введите логин и пароль Postgres).
  2. Загрузка данных для обучения и прогноза

    • Выберите два файла:
      • С компьютера: "Выбрать файл" → выбрать файл → "Загрузить данные из файла".
      • Из базы данных: после подключения появится опция "Загрузить данные из БД" → выбрать схему и таблицу.
  3. Выбор целевой колонки и типа задачи

    • Обязательно выберите целевую колонку для обучения.
    • Выберите тип задачи:
      • auto — автоматическое определение (рекомендуется)
      • binary — бинарная классификация
      • multiclass — многоклассовая классификация
      • regression — регрессия
  4. Дополнительные настройки (необязательно)

    • Обработка пропусков: по умолчанию "mean" (заполнение средними).
    • Метрика: выберите метрику для обучения (accuracy, f1, r2 и др.).
    • Модели: выберите модели для обучения.
    • Пресет AutoGluon: выберите стратегию обучения (medium_quality, good_quality, high_quality, best_quality, optimize_for_deployment, experimental).
    • Лимит времени: можно установить лимит времени на обучение.
  5. Запуск обучения и прогнозирования

    • Нажмите "Начать обучение". Если выбрана опция "Обучение, сохранение и прогноз", после обучения автоматически будет сделан прогноз, который можно скачать или загрузить в БД.

About

Streamlit application for tabular data prediction

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •