# ТЕМА 4. МОДЕЛИРОВАНИЕ И ОЦЕНКА РЕЗУЛЬТАТОВ ПРЕДИКТИВНОГО АНАЛИЗА

Цель: разработать алгоритм, позволяющий диагностировать эмоции обучаемых по их голосу.

**Задачи:**

1. **Сбор и подготовка данных:**
   - Изучить и загрузить наборы данных, отражающие эмоции по голосу (например, TESS и SAVEE) и по видео (например, FER2013 или другой подходящий набор данных).
   - Преобразовать аудиофайлы в мел-кепстральные коэффициенты (MFCC) для последующего анализа.
   - Обработать видеоданные, выделив ключевые признаки (например, с использованием метода гистограммы ориентированных градиентов (HOG) или другого подходящего метода).

2. **Разработка и обучение моделей для аудиоданных:**
   - Обучить модель для предсказания эмоций по тембру голоса, используя алгоритмы машинного обучения (например, SVM, Random Forest) или нейронные сети (например, LSTM).
   - Провести сравнение результатов моделей и выбрать наиболее подходящую.

3. **Разработка и обучение моделей для видеоданных:**
   - Обучить модель для предсказания эмоций по видеоизображению лица, используя сверточные нейронные сети (CNN).
   - Провести сравнение результатов моделей и выбрать наиболее подходящую.

4. **Оценка и тестирование:**
   - Провести тестирование каждой модели на различных наборах данных для оценки точности и производительности.
   - Разработать два отдельных пользовательских интерфейса (веб-сервис или мобильное приложение), отображающих результаты предсказания эмоций в реальном времени для аудио и видео.

Данные:
1. набор данных TESS, отражает каждую из семи эмоций (гнев,
отвращение, страх, счастье, приятный сюрприз, грусть, нейтральный).
Женская озвучка.
https://www.kaggle.com/ejlok1/toronto-emotional-speech-set-tess

2. набор данных SAVEE, отражает каждую из семи эмоций (гнев,
отвращение, страх, счастье, приятный сюрприз, грусть, нейтральный).
Мужская озвучка.


In [1]:
import os
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import time
import librosa as lr

## TESS

Преобразование аудиофайлов в мел-кепстральные коэффициенты (MFCC):

In [2]:
path = '/Users/oudzhi/PycharmProjects/BigData_Prediction/Lab_4/TESS Toronto emotional speech set data'
start = time.time()

data = []

# Проходит по всем подкаталогам и файлам в указанном пути
for subdir, dirs, files in os.walk(path):
    
        # Проходит по всем файлам в текущем каталоге.
        for file in files:
            print(file)
            target = str(file.split('_')[2])[:-4] # Извлекает целевую метку из имени файла. Предполагается, что имя файла имеет формат с '_'.
            
            y, sr = lr.load(os.path.join(subdir, file), res_type='kaiser_fast') # Загружает аудиофайл и получает временной ряд y и частоту дискретизации sr.
            mfccs = np.mean(lr.feature.mfcc(y=y, sr=sr, n_mfcc=30).T, axis=0) # Вычисляет MFCC (мел-кепстральные коэффициенты) и берёт среднее значение по времени.
            sample = mfccs, target # Создаёт кортеж из MFCC и целевой метки.
            data.append(sample) # Добавляет кортеж в список данных.

# Вычисляет и печатает время выполнения кода.    
end = time.time()
print(f'Writing ended in {end - start} seconds')

YAF_date_disgust.wav
YAF_rag_disgust.wav
YAF_raise_disgust.wav
YAF_ditch_disgust.wav
YAF_door_disgust.wav
YAF_note_disgust.wav
YAF_pearl_disgust.wav
YAF_search_disgust.wav
YAF_late_disgust.wav
YAF_peg_disgust.wav
YAF_ring_disgust.wav
YAF_tool_disgust.wav
YAF_puff_disgust.wav
YAF_dip_disgust.wav
YAF_walk_disgust.wav
YAF_lot_disgust.wav
YAF_knock_disgust.wav
YAF_jug_disgust.wav
YAF_home_disgust.wav
YAF_dab_disgust.wav
YAF_tire_disgust.wav
YAF_road_disgust.wav
YAF_burn_disgust.wav
YAF_make_disgust.wav
YAF_mood_disgust.wav
YAF_mess_disgust.wav
YAF_cab_disgust.wav
YAF_shawl_disgust.wav
YAF_wife_disgust.wav
YAF_chain_disgust.wav
YAF_base_disgust.wav
YAF_judge_disgust.wav
YAF_came_disgust.wav
YAF_rat_disgust.wav
YAF_beg_disgust.wav
YAF_choice_disgust.wav
YAF_hit_disgust.wav
YAF_hole_disgust.wav
YAF_time_disgust.wav
YAF_five_disgust.wav
YAF_sheep_disgust.wav
YAF_half_disgust.wav
YAF_hush_disgust.wav
YAF_whip_disgust.wav
YAF_pick_disgust.wav
YAF_voice_disgust.wav
YAF_jar_disgust.wav
YAF_numb_di

После выполнения данного кода у нас будет двумерный список «data»,
каждый элемент которого будет содержать два объекта: набор mfcc и
название эмоции, которую этот набор описывает. Преобразуем список в
следующий датафрейм:

In [3]:
X, y = zip(*data)
dataset_TESS = pd.DataFrame(list(X))
dataset_TESS['target'] = y

dataset_TESS

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,...,21,22,23,24,25,26,27,28,29,target
0,-434.340637,61.547073,-5.816717,41.895260,-12.912008,-0.060510,-15.045928,-8.992117,-12.555533,-5.649084,...,1.866011,-3.498047,2.035084,-1.075615,-0.173851,-2.168725,3.232147,-0.763888,5.738414,disgust
1,-388.402496,85.914452,-16.238209,19.381401,-13.622484,-6.053656,-18.407581,-6.018507,-14.872563,2.884473,...,-2.231792,-3.592348,-1.095985,-2.304485,1.372704,-0.156101,5.546880,3.325720,6.670145,disgust
2,-413.214386,68.448608,1.465215,22.411884,-10.718844,-3.159256,-15.495169,-8.715068,-17.975111,0.635281,...,1.670562,-5.863880,-1.098587,-2.014703,0.226381,-1.058726,1.536796,-1.322571,5.006320,disgust
3,-435.537689,54.987972,-7.957160,36.719688,-15.102768,5.779552,-17.170855,-5.765754,-10.755696,5.679981,...,0.781165,-1.524035,4.259491,-1.669771,1.811984,-1.599473,1.886942,1.856663,3.851156,disgust
4,-414.583313,85.459770,8.327278,5.927553,-8.868082,2.478487,-12.364786,-10.949556,-12.616245,3.694977,...,-1.210028,-4.725624,2.897235,-0.756395,2.379811,1.900689,3.940629,0.582157,2.477091,disgust
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
5595,-557.691895,76.261505,26.812920,21.027248,9.985358,14.419414,-14.963044,-6.008372,-13.508571,11.069414,...,-3.428458,-3.801969,-0.604161,-6.935909,3.016991,-2.804477,2.066132,-1.778984,3.492822,sad
5596,-542.254028,80.854744,26.794289,22.868090,12.850275,23.111471,-0.070058,-7.567317,-11.388879,8.127281,...,-1.323574,-2.059865,3.436770,-4.668593,1.770577,-4.130288,5.103843,0.001028,5.543193,sad
5597,-510.305267,92.528488,19.663439,15.178706,9.632703,15.001949,-16.474386,-10.300098,-11.535367,6.177837,...,-4.933882,-2.598806,-0.573230,-5.639939,2.249171,3.928517,8.045011,6.947206,9.110233,sad
5598,-546.374329,101.403427,30.319857,8.416925,5.852256,15.537525,-18.954216,-9.493547,-13.774308,9.489421,...,-0.755956,-2.935819,-0.871827,-1.787528,-2.288879,2.201672,1.396853,-3.230258,4.245613,sad


In [4]:
dataset_TESS['target'].value_counts()

target
disgust    800
ps         800
happy      800
sad        800
neutral    800
fear       800
angry      800
Name: count, dtype: int64

Перекодируем target (эмоцию) в число

In [5]:
# Создаем словарь, где ключами были – числовые значения, а словами – наши эмоции из столбца target.

emotions = {
    '00': 'neutral',
    '01': 'happy',
    '02': 'sad',
    '03': 'angry',
    '04': 'fear',
    '05': 'disgust',
    '06': 'ps',
}

In [6]:
# Поменяем в словаре слова и ключи местами, чтобы по названию эмоции мне выдавало ее числовое значение. И прошелся по уже готовому двумерному списку “data” меняя каждое название эмоции на ее числовое значение, затем снова преобразуем в новый датасет:

X, y = zip(*data)
Y = []
emotions_inv ={value: key for key, value in emotions.items()}
for i in range(len(y)):
    Y.append(emotions_inv[y[i]])

In [7]:
dataset = pd.DataFrame(X, (Y))
dataset['target'] = Y
dataset

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,...,21,22,23,24,25,26,27,28,29,target
05,-434.340637,61.547073,-5.816717,41.895260,-12.912008,-0.060510,-15.045928,-8.992117,-12.555533,-5.649084,...,1.866011,-3.498047,2.035084,-1.075615,-0.173851,-2.168725,3.232147,-0.763888,5.738414,05
05,-388.402496,85.914452,-16.238209,19.381401,-13.622484,-6.053656,-18.407581,-6.018507,-14.872563,2.884473,...,-2.231792,-3.592348,-1.095985,-2.304485,1.372704,-0.156101,5.546880,3.325720,6.670145,05
05,-413.214386,68.448608,1.465215,22.411884,-10.718844,-3.159256,-15.495169,-8.715068,-17.975111,0.635281,...,1.670562,-5.863880,-1.098587,-2.014703,0.226381,-1.058726,1.536796,-1.322571,5.006320,05
05,-435.537689,54.987972,-7.957160,36.719688,-15.102768,5.779552,-17.170855,-5.765754,-10.755696,5.679981,...,0.781165,-1.524035,4.259491,-1.669771,1.811984,-1.599473,1.886942,1.856663,3.851156,05
05,-414.583313,85.459770,8.327278,5.927553,-8.868082,2.478487,-12.364786,-10.949556,-12.616245,3.694977,...,-1.210028,-4.725624,2.897235,-0.756395,2.379811,1.900689,3.940629,0.582157,2.477091,05
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
02,-557.691895,76.261505,26.812920,21.027248,9.985358,14.419414,-14.963044,-6.008372,-13.508571,11.069414,...,-3.428458,-3.801969,-0.604161,-6.935909,3.016991,-2.804477,2.066132,-1.778984,3.492822,02
02,-542.254028,80.854744,26.794289,22.868090,12.850275,23.111471,-0.070058,-7.567317,-11.388879,8.127281,...,-1.323574,-2.059865,3.436770,-4.668593,1.770577,-4.130288,5.103843,0.001028,5.543193,02
02,-510.305267,92.528488,19.663439,15.178706,9.632703,15.001949,-16.474386,-10.300098,-11.535367,6.177837,...,-4.933882,-2.598806,-0.573230,-5.639939,2.249171,3.928517,8.045011,6.947206,9.110233,02
02,-546.374329,101.403427,30.319857,8.416925,5.852256,15.537525,-18.954216,-9.493547,-13.774308,9.489421,...,-0.755956,-2.935819,-0.871827,-1.787528,-2.288879,2.201672,1.396853,-3.230258,4.245613,02


In [8]:
# Сброс колонки с индексами
df = dataset.reset_index(drop=True)

In [9]:
df

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,...,21,22,23,24,25,26,27,28,29,target
0,-434.340637,61.547073,-5.816717,41.895260,-12.912008,-0.060510,-15.045928,-8.992117,-12.555533,-5.649084,...,1.866011,-3.498047,2.035084,-1.075615,-0.173851,-2.168725,3.232147,-0.763888,5.738414,05
1,-388.402496,85.914452,-16.238209,19.381401,-13.622484,-6.053656,-18.407581,-6.018507,-14.872563,2.884473,...,-2.231792,-3.592348,-1.095985,-2.304485,1.372704,-0.156101,5.546880,3.325720,6.670145,05
2,-413.214386,68.448608,1.465215,22.411884,-10.718844,-3.159256,-15.495169,-8.715068,-17.975111,0.635281,...,1.670562,-5.863880,-1.098587,-2.014703,0.226381,-1.058726,1.536796,-1.322571,5.006320,05
3,-435.537689,54.987972,-7.957160,36.719688,-15.102768,5.779552,-17.170855,-5.765754,-10.755696,5.679981,...,0.781165,-1.524035,4.259491,-1.669771,1.811984,-1.599473,1.886942,1.856663,3.851156,05
4,-414.583313,85.459770,8.327278,5.927553,-8.868082,2.478487,-12.364786,-10.949556,-12.616245,3.694977,...,-1.210028,-4.725624,2.897235,-0.756395,2.379811,1.900689,3.940629,0.582157,2.477091,05
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
5595,-557.691895,76.261505,26.812920,21.027248,9.985358,14.419414,-14.963044,-6.008372,-13.508571,11.069414,...,-3.428458,-3.801969,-0.604161,-6.935909,3.016991,-2.804477,2.066132,-1.778984,3.492822,02
5596,-542.254028,80.854744,26.794289,22.868090,12.850275,23.111471,-0.070058,-7.567317,-11.388879,8.127281,...,-1.323574,-2.059865,3.436770,-4.668593,1.770577,-4.130288,5.103843,0.001028,5.543193,02
5597,-510.305267,92.528488,19.663439,15.178706,9.632703,15.001949,-16.474386,-10.300098,-11.535367,6.177837,...,-4.933882,-2.598806,-0.573230,-5.639939,2.249171,3.928517,8.045011,6.947206,9.110233,02
5598,-546.374329,101.403427,30.319857,8.416925,5.852256,15.537525,-18.954216,-9.493547,-13.774308,9.489421,...,-0.755956,-2.935819,-0.871827,-1.787528,-2.288879,2.201672,1.396853,-3.230258,4.245613,02


In [10]:
df.dtypes

0         float32
1         float32
2         float32
3         float32
4         float32
5         float32
6         float32
7         float32
8         float32
9         float32
10        float32
11        float32
12        float32
13        float32
14        float32
15        float32
16        float32
17        float32
18        float32
19        float32
20        float32
21        float32
22        float32
23        float32
24        float32
25        float32
26        float32
27        float32
28        float32
29        float32
target     object
dtype: object

In [11]:
# df['target'] = pd.to_numeric(df['target'], errors='coerce')

In [12]:
df.isna().sum()

0         0
1         0
2         0
3         0
4         0
5         0
6         0
7         0
8         0
9         0
10        0
11        0
12        0
13        0
14        0
15        0
16        0
17        0
18        0
19        0
20        0
21        0
22        0
23        0
24        0
25        0
26        0
27        0
28        0
29        0
target    0
dtype: int64

## Разбиваем выборку на трейн и тест

In [13]:
from sklearn.model_selection import train_test_split

In [14]:
x_train, x_test = train_test_split(df, test_size=0.2, random_state=1) # сплитим на полный обучающий и тестовый

In [15]:
# Принимает столбец с целевой переменной churn и сохраняет его за пределами датафрейма
y_train = x_train.target.values
y_test = x_test.target.values

In [16]:
# Удаляем столбцы churn из обоих df для гарантии того, что мы случайно не используем переменную target в качестве признака при обучении
del x_train['target']
del x_test['target']

## Random_Forest

In [17]:
from sklearn.ensemble import RandomForestClassifier

model = RandomForestClassifier()
model.fit(x_train, y_train)

In [18]:
# Предсказание меток на тестовом наборе
y_pred = model.predict(x_test)

In [19]:
from sklearn.metrics import classification_report

def my_classification_report(y_test, y_pred):
    # Метрики classification_report
    report = classification_report(y_true=y_test, y_pred=y_pred, target_names=['00', '01', '02', '03', '04', '05', '06'])
    print(report)

In [20]:
y_test

array(['04', '02', '06', ..., '02', '06', '00'], dtype=object)

In [21]:
y_pred

array(['04', '02', '06', ..., '02', '06', '00'], dtype=object)

In [22]:
print(my_classification_report(y_test, y_pred))

              precision    recall  f1-score   support

          00       1.00      1.00      1.00       153
          01       0.99      1.00      0.99       170
          02       1.00      1.00      1.00       153
          03       1.00      0.99      0.99       179
          04       1.00      1.00      1.00       155
          05       1.00      1.00      1.00       138
          06       1.00      1.00      1.00       172

    accuracy                           1.00      1120
   macro avg       1.00      1.00      1.00      1120
weighted avg       1.00      1.00      1.00      1120

None


## Нейронная сеть

Нормализация данных

In [23]:
# ШКАЛИРУЕМ ТОЛЬКО ПРИЗНАКИ
from sklearn.preprocessing import MinMaxScaler

# Создаем объект MinMaxScaler для масштабирования признаков
scaler_x = MinMaxScaler().fit(x_train)
x_train_norm = scaler_x.transform(x_train)
x_test_norm = scaler_x.transform(x_test)


Обучение 

In [25]:
from sklearn.neural_network import MLPClassifier

model_neural = MLPClassifier(hidden_layer_sizes=(100,50), # 100 - количество нейронов в скрытом слое
                      activation ='relu',  # активационная функция
                      solver = 'adam', #алгоритм обучения
                      #tol=0.000001, # критерий остановки / предел ошибки
                      max_iter = 50, # максимальное число эпох
                      verbose = True).fit(x_train_norm, y_train)

Iteration 1, loss = 1.84370388
Iteration 2, loss = 1.57517441
Iteration 3, loss = 1.25335690
Iteration 4, loss = 0.93107975
Iteration 5, loss = 0.68460059
Iteration 6, loss = 0.51877325
Iteration 7, loss = 0.40796562
Iteration 8, loss = 0.33095397
Iteration 9, loss = 0.28107535
Iteration 10, loss = 0.23832636
Iteration 11, loss = 0.20861433
Iteration 12, loss = 0.18401607
Iteration 13, loss = 0.16568745
Iteration 14, loss = 0.14929725
Iteration 15, loss = 0.14117157
Iteration 16, loss = 0.12616351
Iteration 17, loss = 0.11560109
Iteration 18, loss = 0.10761286
Iteration 19, loss = 0.10056046
Iteration 20, loss = 0.09349788
Iteration 21, loss = 0.08723823
Iteration 22, loss = 0.08130566
Iteration 23, loss = 0.07685005
Iteration 24, loss = 0.07112921
Iteration 25, loss = 0.06738089
Iteration 26, loss = 0.06402664
Iteration 27, loss = 0.06055383
Iteration 28, loss = 0.05729362
Iteration 29, loss = 0.05413511
Iteration 30, loss = 0.05070977
Iteration 31, loss = 0.04769696
Iteration 32, los



In [26]:
predict_train_norm = model_neural.predict(x_train_norm)
predict_test_norm = model_neural.predict(x_test_norm)

In [31]:
# Преобразуем предсказания в pandas.Series и применим value_counts()
predict_train_norm_series = pd.Series(predict_train_norm)
predict_test_norm_series = pd.Series(predict_test_norm)

# Получаем количество уникальных значений
print(predict_train_norm_series.value_counts())
print(predict_test_norm_series.value_counts())

05    662
02    647
00    647
04    645
06    630
01    628
03    621
Name: count, dtype: int64
03    177
06    172
01    172
04    155
02    153
00    153
05    138
Name: count, dtype: int64


In [38]:
def my_classification_report(y_test, y_pred):
    # Метрики classification_report
    report = classification_report(y_true=y_test, y_pred=predict_test_norm, target_names=['00', '01', '02', '03', '04', '05', '06'])
    print(report)

In [36]:
y_test

array(['04', '02', '06', ..., '02', '06', '00'], dtype=object)

In [37]:
predict_test_norm

array(['04', '02', '06', ..., '02', '06', '00'], dtype='<U2')

In [39]:
print(my_classification_report(y_test, predict_test_norm_series))

              precision    recall  f1-score   support

          00       1.00      1.00      1.00       153
          01       0.99      1.00      0.99       170
          02       1.00      1.00      1.00       153
          03       1.00      0.99      0.99       179
          04       1.00      1.00      1.00       155
          05       1.00      1.00      1.00       138
          06       1.00      1.00      1.00       172

    accuracy                           1.00      1120
   macro avg       1.00      1.00      1.00      1120
weighted avg       1.00      1.00      1.00      1120

None


In [40]:
def compare_arrays(y_true, y_pred):
    """
    Функция сравнивает два массива и вычисляет процент соответствия.
    
    :param y_true: Массив истинных меток
    :param y_pred: Массив предсказанных меток
    :return: Процент соответствия
    """
    # Проверяем, что оба массива имеют одинаковую длину
    if len(y_true) != len(y_pred):
        raise ValueError("Массивы y_true и y_pred должны иметь одинаковую длину")
    
    # Подсчитываем количество совпадений
    matches = np.sum(y_true == y_pred)
    
    # Вычисляем процент соответствия
    accuracy = (matches / len(y_true)) * 100
    
    return accuracy

# Пример использования функции
accuracy = compare_arrays(y_test, predict_test_norm)
print(f"Процент соответствия: {accuracy:.2f}%")

Процент соответствия: 99.82%
