# ТЕМА ПРОЕКТА: Прогнозирование температуры стали на металлургическом комбинате 

# Часть 0. Описание проекта и План 

# Описание проекта 

Чтобы оптимизировать производственные расходы, металлургический комбинат ООО «Так закаляем сталь» решил уменьшить потребление электроэнергии на этапе обработки стали. Вам предстоит построить модель, которая предскажет температуру стали.

**Постановка задачи:** 

Создать математическую модель, имитирующую технологический процесс производства стали. Это позволит воспроизводить эксперименты в цифровом виде и тестировать только лучшие результаты на реальном производсве. Также можно выявить параметры, оказывают наибольшее влияние на нагрев стали. 
Модель должна предсказывать конечную температуру стали. 
Данная работа позволит сократить количество итерций нагрева стали и, следовательно, снизить потребление энергии. 

![003.jpg](attachment:003.jpg)

**Этапы обработки стали**

Сталь обрабатывают в металлическом ковше вместимостью около 100 тонн. Чтобы ковш выдерживал высокие температуры, изнутри его облицовывают огнеупорным кирпичом. Расплавленную сталь заливают в ковш и подогревают до нужной температуры графитовыми электродами. Они установлены в крышке ковша. 

Из сплава выводится сера (десульфурация), добавлением примесей корректируется химический состав и отбираются пробы. Сталь легируют — изменяют её состав — подавая куски сплава из бункера для сыпучих материалов или проволоку через специальный трайб-аппарат (англ. tribe, «масса»).

Перед тем как первый раз ввести легирующие добавки, измеряют температуру стали и производят её химический анализ. Потом температуру на несколько минут повышают, добавляют легирующие материалы и продувают сплав инертным газом. Затем его перемешивают и снова проводят измерения. Такой цикл повторяется до достижения целевого химического состава и оптимальной температуры плавки.

Тогда расплавленная сталь отправляется на доводку металла или поступает в машину непрерывной разливки. Оттуда готовый продукт выходит в виде заготовок-слябов (англ. *slab*, «плита»).

***Схема электродуговой печи*** 

![steelmelt2.jpg](attachment:steelmelt2.jpg)

**Пути снижения затрат энергии в электросталеплавильном производстве:** 

- сокращение длительности плавки путем повышения удельной мощности трансформатора;
- уменьшение продолжительности заправки, доводки с выносом операций легирования, раскисления, модифицирования и десульфурации в агрегаты внепечной обработки;
- предварительный подогрев шихты и использование ВЭР (тепло отходящих газов, охлаждающей воды, и жидких шлаков). В частности, подогрев лома отходящими газами позволяет экономить до 40% электроэнергии;
- продувка металла инертными газами через донные фурмы и использование устройств электромагнитного перемешивания позволяет сократить цикл плавки;
- увеличение высоты стенок печи позволяет производить однократную загрузку шихты только одной бадьей с металлоломом;
- использование дополнительно природного газа, сжигаемого в газокислородных горелках, позволяет снизить общий расход энергии до 10%.

 <a id='описание_данных'></a>
 **Описание данных**

Данные состоят из файлов, полученных из разных источников:

- `data_arc_new.csv` — данные об электродах;
- `data_bulk_new.csv` — данные о подаче сыпучих материалов (объём);
- `data_bulk_time_new.csv` *—* данные о подаче сыпучих материалов (время);
- `data_gas_new.csv` — данные о продувке сплава газом;
- `data_temp_new.csv` — результаты измерения температуры;
- `data_wire_new.csv` — данные о проволочных материалах (объём);
- `data_wire_time_new.csv` — данные о проволочных материалах (время).

Во всех файлах столбец `key` содержит номер партии. В файлах может быть несколько строк с одинаковым значением `key`: они соответствуют разным итерациям обработки.


![steel-1.jpg](attachment:steel-1.jpg)

# План работы 

**I. Исследовательский анализ данных (знакомство с данными). Уточнение задачи и составление плана.**

- Изучаем основную информацию (методами describe() и info()),  типы данных, наличие и характер пропусков и выбросов (гистограмм и диаграммы размаха) 
- Установливаем и описываем взяимосвязь между датасетами и данными в них 
- Делаем выводы по проделанному анализу
- Составляем список уточняющих вопросов заказчику и план работы 

**II. Предобработка данных и разработка модели.** 

1. Предобработка данных
- Пропуски в датасетах заменяем нулевыми значениями
- Удаляем аномалии
- Удаляем ключи (и относящиеся к ним строки) с одним замером 
- Генерируем новые/дополнительне признаки
- Создаем итоговую таблицу данных 
- Исследуем корреляцию данных
- Выводы по разделу

2. Разработка модели 

- Делим общий датасет на обучающую и тест выборки
- Создаем функции для моделей линейной регресси и бустинга с подбором параметров с использованием гридсерч
- Обучаем модели и выбираем наилучшую 
- Проверяем лучшую модель на тестовой выборке 
- Проверяем модель на адекватность (сравнение с дамми моделью)
- Выявляем параметры, оказывающие наибольшее влияние на нагрев стали (наиболее важне признаки)
- Выводы по разделу

**III. Подготовка отчёта по проекту** 
Общий ввод по проекту: описываем, какие шаги бли выполнены, какие результаты получены. 
- Описваем, какие особенности были в исходных данных и какие преобразования были сделаны 
- Указываем рерультаты обучения и проверки модели на тесте относительно требуемых значений метрики MAE 
- Составляем рекомендации для клиента, основанные на результатах модели и выявленных наиболее значимых признаках  