# Прогнозирование конечных свойств композиционных материалов  

Предоставленный dataset со свойствами композитов необходимо объеденить по индексу типа объединения <b>INNER</b>

<b>Задачи:</b>
<p>1.Обучить алгоритм машинного обучения, который будет определять значения:
<b><p>* Модуль упругости при растяжении, ГПа</p>
<p>* Прочность при растяжении, МПа<b></p></p> 
<p>2.Написать нейронную сеть, которая будет рекомендовать:
<p>* <b>Соотношение матрица-наполнитель</b><p> </p> 

In [2]:
#Подключаем необходимые библиотеки
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.dummy import DummyRegressor
from sklearn.neighbors import KNeighborsRegressor
from sklearn.linear_model import LinearRegression
from sklearn.svm import SVR
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import r2_score, mean_absolute_error, mean_squared_error
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.preprocessing import MinMaxScaler, LabelEncoder

from tensorflow import keras
from keras import layers

<p> <b>Разведочный анализ данных </b> </p>


In [9]:
#загружаем файлы X_bp.xlsx, X_nup.xlsx

path_bp = 'C:/Users/Alexey/PycharmProjects/VKR_Mastiugin/data/X_bp.xlsx'
path_nup = 'C:/Users/Alexey/PycharmProjects/VKR_Mastiugin/data/X_nup.xlsx'

data_bp = pd.read_excel(path_bp,index_col=0)
data_nup = pd.read_excel(path_nup,index_col=0)

print('Строк в  bp - ', data_bp.shape)
print('Строк в nup - ', data_nup.shape)

Строк в  bp -  (1023, 10)
Строк в nup -  (1040, 3)


In [7]:
# файлы из dataset имееют разную длину строк.
# выводим первые 5 строк из X_bp.xlsx и X_nup.xlsx
data_nup.head()

Unnamed: 0,"Угол нашивки, град",Шаг нашивки,Плотность нашивки
0,0,4.0,57.0
1,0,4.0,60.0
2,0,4.0,70.0
3,0,5.0,47.0
4,0,5.0,57.0


In [8]:
data_bp.head()

Unnamed: 0,Соотношение матрица-наполнитель,"Плотность, кг/м3","модуль упругости, ГПа","Количество отвердителя, м.%","Содержание эпоксидных групп,%_2","Температура вспышки, С_2","Поверхностная плотность, г/м2","Модуль упругости при растяжении, ГПа","Прочность при растяжении, МПа","Потребление смолы, г/м2"
0,1.857143,2030.0,738.736842,30.0,22.267857,100.0,210.0,70.0,3000.0,220.0
1,1.857143,2030.0,738.736842,50.0,23.75,284.615385,210.0,70.0,3000.0,220.0
2,1.857143,2030.0,738.736842,49.9,33.0,284.615385,210.0,70.0,3000.0,220.0
3,1.857143,2030.0,738.736842,129.0,21.25,300.0,210.0,70.0,3000.0,220.0
4,2.771331,2030.0,753.0,111.86,22.267857,284.615385,210.0,70.0,3000.0,220.0


In [10]:
#Объединяем данные по индексу, тип INNER
dataset = pd.merge(data_bp,data_nup,how='inner',left_index=True,right_index=True)
print('Строк в объединенном dataset - ', dataset.shape)
dataset.head()

Строк в объединенном dataset -  (1023, 13)


Unnamed: 0,Соотношение матрица-наполнитель,"Плотность, кг/м3","модуль упругости, ГПа","Количество отвердителя, м.%","Содержание эпоксидных групп,%_2","Температура вспышки, С_2","Поверхностная плотность, г/м2","Модуль упругости при растяжении, ГПа","Прочность при растяжении, МПа","Потребление смолы, г/м2","Угол нашивки, град",Шаг нашивки,Плотность нашивки
0,1.857143,2030.0,738.736842,30.0,22.267857,100.0,210.0,70.0,3000.0,220.0,0,4.0,57.0
1,1.857143,2030.0,738.736842,50.0,23.75,284.615385,210.0,70.0,3000.0,220.0,0,4.0,60.0
2,1.857143,2030.0,738.736842,49.9,33.0,284.615385,210.0,70.0,3000.0,220.0,0,4.0,70.0
3,1.857143,2030.0,738.736842,129.0,21.25,300.0,210.0,70.0,3000.0,220.0,0,5.0,47.0
4,2.771331,2030.0,753.0,111.86,22.267857,284.615385,210.0,70.0,3000.0,220.0,0,5.0,57.0


In [12]:
#В объединенном dataset получили 13 призанков, для наглядности их выводим на печать
dataset.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 1023 entries, 0 to 1022
Data columns (total 13 columns):
 #   Column                                Non-Null Count  Dtype  
---  ------                                --------------  -----  
 0   Соотношение матрица-наполнитель       1023 non-null   float64
 1   Плотность, кг/м3                      1023 non-null   float64
 2   модуль упругости, ГПа                 1023 non-null   float64
 3   Количество отвердителя, м.%           1023 non-null   float64
 4   Содержание эпоксидных групп,%_2       1023 non-null   float64
 5   Температура вспышки, С_2              1023 non-null   float64
 6   Поверхностная плотность, г/м2         1023 non-null   float64
 7   Модуль упругости при растяжении, ГПа  1023 non-null   float64
 8   Прочность при растяжении, МПа         1023 non-null   float64
 9   Потребление смолы, г/м2               1023 non-null   float64
 10  Угол нашивки, град                    1023 non-null   int64  
 11  Шаг нашивки      

In [14]:
#Подсчитываем количество уникальных значений по каждому из признаков
dataset.nunique()

Соотношение матрица-наполнитель         1014
Плотность, кг/м3                        1013
модуль упругости, ГПа                   1020
Количество отвердителя, м.%             1005
Содержание эпоксидных групп,%_2         1004
Температура вспышки, С_2                1003
Поверхностная плотность, г/м2           1004
Модуль упругости при растяжении, ГПа    1004
Прочность при растяжении, МПа           1004
Потребление смолы, г/м2                 1003
Угол нашивки, град                         2
Шаг нашивки                              989
Плотность нашивки                        988
dtype: int64

In [15]:
#Для признака "Угол нашивки, град" подсчитаем количество вхождений значений
dataset['Угол нашивки, град'].value_counts()

0     520
90    503
Name: Угол нашивки, град, dtype: int64