PredictiveAnalyticsApp — это удобное настольное приложение, разработанное для упрощения процессов загрузки, редактирования и анализа данных из файлов .csv
, а также последующего построения мощных предиктивных моделей.
Больше нет необходимости писать код для базового анализа или предобработки данных. Наше приложение позволяет быстро подготовить данные и получить прогноз, будь то прогноз погоды, вероятность получения оценки школьником, шансы на успех стартапа или что-то еще, что вы можете себе представить!
- 📝 Встроенный CSV-редактор: Интуитивно понятный интерфейс для просмотра, редактирования, сортировки и удаления ненужных столбцов непосредственно в приложении.
- ⚙️ Гибкие инструменты предобработки:
- Сортировка: Сортируйте данные по одному или нескольким столбцам.
- Объединение: Объединяйте данные из нескольких
.csv
файлов в один. - Удаление столбцов: Легко удаляйте нерелевантные столбцы для очистки данных.
- 🔮 Предиктивное моделирование:
- Загружайте подготовленные наборы данных.
- Выбирайте целевые переменные для прогнозирования.
- Используйте встроенные алгоритмы машинного обучения для построения предиктивных моделей и получения прогнозов.
- ☁️ Прогноз погоды: Загрузите исторические данные о погоде (температура, влажность, давление), чтобы предсказать вероятность дождя завтра.
- 🧑🎓 Образование: Анализируйте данные об успеваемости студентов, чтобы спрогнозировать вероятность получения высокой оценки на предстоящем экзамене.
- 📈 Успех в бизнесе: Оценивайте рыночные данные и прогнозируйте вероятность успеха нового стартапа.
Для установки приложения клонируйте репозиторий:
git clone https://github.com/Birewon/PredictiveAnalyticsApp.git
cd PredictiveAnalyticsApp
Затем установите все необходимые зависимости с помощью pip:
pip install -r requirements.txt
После установки зависимостей запустите приложение из корневой директории проекта:
python main.py
Ниже представлен обзор текущего статуса и планов на будущее для PredictiveAnalyticsApp.
- ✅ Загрузка CSV-файлов: Возможность загружать один или два файла
.csv
в приложение. - ✅ Выбор директории для сохранения: Функциональность для выбора директории, куда будут сохраняться обработанные файлы.
- ✅ Базовая конкатенация CSV: Объединение двух загруженных
.csv
файлов в один выходной файл. - ✅ Отчеты о статусе: Отображение обновлений в реальном времени и сообщений об ошибках в пользовательском интерфейсе.
- ⏳ Расширенная предобработка CSV:
- Сортировка данных по выбранным столбцам.
- Слияние/объединение CSV-файлов на основе общих столбцов (типы объединения:
inner
,outer
,left
,right
). - Выбор и удаление столбцов.
- Обработка пропущенных значений (импутация, удаление строк/столбцов).
- ⏳ Интерфейс для построения предиктивных моделей:
- Выбор целевых (зависимых) и признаковых (независимых) переменных.
- Выбор распространенных алгоритмов машинного обучения (например, Линейная регрессия, Логистическая регрессия, Деревья решений).
- Настройка разделения данных на обучающую и тестовую выборки.
- ⏳ Оценка и визуализация моделей:
- Отображение метрик производительности модели (например, точность, полнота, F1-мера, R-квадрат).
- Визуализации для распределения данных и прогнозов модели.
- ⏳ Сохранение/загрузка моделей: Возможность сохранять обученные модели для дальнейшего использования и загружать предварительно обученные модели.
- ⏳ Интерактивная визуализация данных: Базовые графики (гистограммы, диаграммы рассеяния) загруженных данных.
- 🐍 Python: Основной язык программирования.
- 🎨 PyQt5: Для создания графического пользовательского интерфейса.
- 🐼 pandas: Для эффективной обработки и манипулирования данными
.csv
. - 🤖 scikit-learn: Для реализации различных алгоритмов предиктивного моделирования.
Мы приветствуем идеи и предложения! Если у вас есть какие-либо замечания или вы хотите внести свой вклад, пожалуйста, создайте Issue или Pull Request на GitHub.