In [None]:
from google.colab import drive
drive.mount("/content/drive")
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Загрузим файл Excel
file_path = "14377959_1309152X_bp.xlsx"
data = pd.read_excel(file_path)

# Предварительная обработка данных
# Переименуем столбцы для удобства
data.columns = ["id", "Соотношение матрица-наполнитель", "Плотность кг/м3", "Модуль упругости, ГПа",
                "Количество отвердителя, м.%", "Содержание эпоксидных групп,%_2",
                "Температура вспышки, С_2", "Поверхностная плотность, г/м2",
                "Модуль упругости при растяжении, ГПа", "Прочность при растяжении, МПа",
                "Потребление смолы, г/м2"]

# 1. Статистические метрики
summary = data.describe()

# 2. Визуализация данных
data.hist(figsize=(12, 8))
plt.suptitle("Гистограммы признаков", y=1.02)
plt.show()

# 3. Анализ корреляции
correlation_matrix = data.corr()
plt.figure(figsize=(10, 8))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', fmt=".2f")
plt.title("Тепловая карта корреляции")
plt.show()

# Дополнительные анализы можно добавить по необходимости.

# Не забудьте заменить '14377959_1309152X_bp.xlsx' на фактический путь к файлу.


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [None]:
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.preprocessing import StandardScaler

# Создайте список всех признаков, которые не являются целевой переменной
features = ["Соотношение матрица-наполнитель",
            "Количество отвердителя, м.%", "Содержание эпоксидных групп,%_2",
            "Температура вспышки, С_2", "Поверхностная плотность, г/м2",
            "Потребление смолы, г/м2"]

# Создайте экземпляр стандартизатора для нормализации данных
scaler = StandardScaler()

# Цикл по всем признакам
for feature in features:
    # Начало исходных графиков
    plt.figure(figsize=(12, 4))

    # Гистограмма до нормализации
    plt.subplot(1, 2, 1)
    plt.title(f"Распределение {feature} (до нормализации)")
    data[feature].hist()
    plt.xlabel(feature)

    # Нормализация признака
    data[feature] = scaler.fit_transform(data[feature].values.reshape(-1, 1))

    # Гистограмма после нормализации
    plt.subplot(1, 2, 2)
    plt.title(f"Распределение {feature} (после нормализации)")
    data[feature].hist()
    plt.xlabel(feature)

    # Вывод максимального и минимального значения
    max_value = data[feature].max()
    min_value = data[feature].min()
    print(f"{feature}: Максимальное значение = {max_value}, Минимальное значение = {min_value}")

    # Завершение и отображение графиков
    plt.show()

# Сохраните обновленные данные с нормализованными признаками
data.to_excel("normalized_data.xlsx", index=False)
