Репозиторий содержит выполненные проекты по машинному обучению, сгруппированные по типам используемых данных. Каждый проект представляет собой самостоятельный пример применения моделей и методов ML к соответствующему типу данных.
| № | Наименование проекта | Описание | Тип данных | Стек |
|---|---|---|---|---|
| 1 | Выбираем производительных коров со вкусным молоком | Анализ характеристик животных и построение модели для отбора наиболее продуктивных коров по качеству молока | Табличные данные | Python, Pandas, NumPy, scikit-learn, Seaborn, Matplotlib, Phik |
| 2 | Выбор региона для бурения нефтяной скважины | Прогнозирование прибыльности регионов с учётом статистических рисков и анализа Bootstrap | Табличные данные | Python, Pandas, NumPy, Scikit-learn, Matplotlib, Seaborn |
| 3 | Предсказание виновности водителя в ДТП при аренде автомобиля | Модель оценки вероятности ДТП по вине водителя до начала поездки | Табличные данные | Python, Pandas, NumPy, Scikit-learn, CatBoost, LightGBM, PyTorch, Phik, Matplotlib, Seaborn, SQL |
| 4 | Предсказание медианной стоимости дома в Калифорнии | Прогноз рыночной стоимости жилья по социально-географическим данным | Табличные данные | Python, PySpark, Pandas, Numpy, Seaborn, Scikit-learn |
| 5 | Предсказание снижения покупательской активности | Модель прогнозирования снижения активности клиентов и сегментация для персональных предложений | Табличные данные | Python, Pandas, Scikit-learn, SHAP, Phik, Seaborn |
| 6 | Предсказание стоимости автомобиля | Прогноз рыночной стоимости авто по характеристикам и комплектации | Табличные данные | Python, Pandas, Scikit-learn, LightGBM, CatBoost, SHAP |
| 7 | Предсказание температуры звезды по физическим характеристикам | Нейросеть для оценки температуры звёзд по физическим параметрам | Табличные данные | Python, Pandas, NumPy, Scikit-learn, PyTorch, Seaborn, Matplotlib, Phik |
| 8 | Прогноз оттока клиентов телеком-компании | Модель для выявления клиентов с высоким риском оттока по данным договоров и услуг | Табличные данные | Python, Pandas, NumPy, Scikit-learn, LightGBM, PyTorch, Seaborn, Matplotlib, SHAP, Phik, SQL, Optuna |
| 9 | Прогноз удовлетворённости и вероятности увольнения сотрудников | Система для оценки удовлетворённости персонала и вероятности увольнения | Табличные данные | Python, Pandas, NumPy, Scikit-learn, Seaborn, Matplotlib, SHAP, Phik |
| 10 | Определение возраста по фотографии | Компьютерное зрение: классификация возраста по изображению лица | Компьютерное зрение | Python, TensorFlow, Keras, NumPy, Pandas, Matplotlib, Seaborn |
| 11 | Классификация токсичных комментариев | Текстовая классификация комментариев на токсичные и нетоксичные с использованием BERT | Тексты | Python, Scikit-learn, PyTorch, Transformers, Pandas, NumPy, Matplotlib, NLTK, SpaCy |
| 12 | Прогнозирование заказов такси | Прогнозирование спроса на такси по временным рядам | Временные ряды | Python, Pandas, NumPy, Scikit-learn, LightGBM, PyTorch, Matplotlib |
| 13 | Оценка соответствия изображений и текстов | Мультимодальная модель для определения семантической связи между текстом и изображением | Мультимодальные данные | Python, PyTorch, Transformers, TensorFlow, Keras, LightGBM, Scikit-learn, Optuna, Pandas, NumPy, Matplotlib, Seaborn |
| 14 | Веб-приложение для перевода текста (FastAPI + Docker) | Минималистичное приложение для перевода текста с русского на английский через API MyMemory. Реализовано на FastAPI и упаковано в Docker-контейнер | Веб-приложения | Python, FastAPI, Docker, Requests, HTML, JavaScript |
| 15 | LLM about LLM — Fine-Tuning Atlas | Системное руководство по всем современным методам адаптации LLM: Full FT, LoRA, QLoRA, RLHF, RAG. Содержит диаграммы, таблицы сравнения и философию обучения моделей | Обзор / Исследование | Markdown, Mermaid, Hugging Face PEFT, Transformers |