Чтобы оптимизировать производственные расходы, металлургический комбинат ООО «Так закаляем сталь» решил уменьшить потребление электроэнергии на этапе обработки стали. Вам предстоит построить модель, которая предскажет температуру стали.
Сталь обрабатывают в металлическом ковше вместимостью около 100 тонн. Чтобы ковш выдерживал высокие температуры, изнутри его облицовывают огнеупорным кирпичом. Расплавленную сталь заливают в ковш и подогревают до нужной температуры графитовыми электродами. Они установлены в крышке ковша.
Из сплава выводится сера (десульфурация), добавлением примесей корректируется химический состав и отбираются пробы. Сталь легируют — изменяют её состав — подавая куски сплава из бункера для сыпучих материалов или проволоку через специальный трайб-аппарат (англ. tribe, «масса»).
Перед тем как первый раз ввести легирующие добавки, измеряют температуру стали и производят её химический анализ. Потом температуру на несколько минут повышают, добавляют легирующие материалы и продувают сплав инертным газом. Затем его перемешивают и снова проводят измерения. Такой цикл повторяется до достижения целевого химического состава и оптимальной температуры плавки.
Тогда расплавленная сталь отправляется на доводку металла или поступает в машину непрерывной разливки. Оттуда готовый продукт выходит в виде заготовок-слябов (англ. slab, «плита»).
Данные состоят из файлов, полученных из разных источников:
data_arc.csv
— данные об электродах;data_bulk.csv
— данные о подаче сыпучих материалов (объём);data_bulk_time.csv
— данные о подаче сыпучих материалов (время);data_gas.csv
— данные о продувке сплава газом;data_temp.csv
— результаты измерения температуры;data_wire.csv
— данные о проволочных материалах (объём);data_wire_time.csv
— данные о проволочных материалах (время).
Во всех файлах столбец key
содержит номер партии. В файлах может быть несколько строк с одинаковым значением key
: они соответствуют разным итерациям обработки.
-
Описание проекта, задачи
-
Изучение и подготовка данных:
- Выгрузка данных
- Инициализация данных
- Анализ данных
- Описание данных
- Предобработка данных:
- Проверка типов данных
- Работа с проспусками
- Подготовка данных:
- Проверка на мультиколлинеарность
- Формирование итоговых датафреймов
- Формирование целевого и остальных признаков
- Формирвоание обучающих, валид и тест выборок
- Обучение моделей:
- 3-4 модели
- Тестирование моделей:
- Анализ важности факторов
- Итоговый вывод