1. Можно ли использовать полносвязные сети для работы со временными данными?
    Ответ: 
    Можно, но есть ряд недостатков:
     - Потеря контекста:FCN обрабатывают данные как независимые точки
     - Фиксированная длина входа:FCN требуют статической размерности данных.
     - Для длинных последовательностей количество параметров FCN растет пропорционально длине

2. Опишите особенности рекуррентных сетей по сравнению с полносвязными и сверточными сетями.
    Ответ: 

    **Рекуррентные сети** (RNN) предназначены для работы с последовательностями данных, где порядок элементов важен. Они имеют внутреннюю память, которая сохраняет информацию о предыдущих шагах. Это позволяет им учитывать временные зависимости. Примеры применения: обработка естественного языка (NLP), временные ряды.

    **Полносвязные сети (FCN)** обрабатывают входные данные как независимые векторы без учета их порядка. Каждый нейрон связан со всеми нейронами следующего слоя. Подходят для задач, где данные не имеют пространственной или временной структуры.

    **Сверточные сети (CNN)** используют ядра свертки для извлечения локальных паттернов в данных с пространственной структурой (изображения, временные ряды). Они эффективно снижают количество параметров за счет разделяемых весов и иерархического обучения признаков.

   
3. Для каких задач используются рекуррентные сети?

Рекуррентные нейронные сети (RNN) идеально подходят для работы с последовательными данными. Вот несколько основных задач, для которых они часто используются:

Обработка естественного языка (NLP): RNN хорошо справляются с задачами, связанными с текстом, такими как перевод языков, генерация текста, анализ настроений и распознавание речи. Они могут "помнить" предшествующие слова в предложении, что важно для понимания контекста.

- Временные ряды: RNN применяются для предсказания временных рядов, таких как прогнозирование финансовых показателей, температуры или потребления энергии. Они используют информацию о предыдущих временных интервалах для прогнозирования будущих значений.

- Музыкальная композиция: RNN могут генерировать музыку, обучаясь на мелодиях и ритмах предыдущих произведений, чтобы создавать новые музыкальные последовательности.

- Анализ видео: Для задач, связанных с видео, RNN могут использоваться для распознавания действий в последовательностях кадров, так как видео является последовательностью изображений во времени.

- Диалоговые системы и чат-боты: Рекуррентные сети помогают обрабатывать и генерировать ответы в реальном времени, учитывая предыдущие сообщения в разговоре.

Основная особенность RNN — это их способность обрабатывать последовательные данные благодаря внутреннему состоянию, которое позволяет запоминать информацию на разных временных этапах.

4. Что такое "Базовое решение"?

"Базовое решение" (или "baseline solution") в контексте машинного обучения и научных исследований — это простейшая модель или метод, к которому сравниваются более сложные модели. Оно служит в качестве отправной точки для оценки производительности новых алгоритмов или моделей.




In [None]:
                                                    """ 5. Как в Keras создать рекуррентную сеть с ячейками LSTM? """
import numpy as np         
from keras.models import Sequential  # Для последовательного создания модели
from keras.layers import LSTM, Dense, Dropout  # Различные слои для модели

# Этап 1: Подготовка данных
# Генерация случайных данных для упрощения примера
# X - входные данные, y - целевые значения
X = np.random.rand(10, 5, 1)  # 10 выборок, 5 временных шагов, 1 признак
y = np.random.rand(10, 1)      # Целевые значения

# Этап 2: Создание модели LSTM
# Инициализируем последовательную модель
model = Sequential()

# Добавляем первый LSTM слой
# 'return_sequences=True' означает, что мы хотим вернуть последовательные выходные данные для следующего слоя
model.add(LSTM(50, return_sequences=True, input_shape=(5, 1)))
# Добавляем слой Dropout, чтобы предотвратить переобучение
model.add(Dropout(0.2))

# Добавляем второй LSTM слой без возвращения последовательностей
model.add(LSTM(50, return_sequences=False))
# Добавляем еще один слой Dropout
model.add(Dropout(0.2))

# Добавляем выходной слой Dense с 1 нейроном для предсказания
model.add(Dense(1))

# Этап 3: Компиляция модели
# Используем оптимизатор Adam и среднеквадратичную ошибку в качестве функции потерь
model.compile(optimizer='adam', loss='mean_squared_error')

# Этап 4: Обучение модели
model.fit(X, y, epochs=100, batch_size=16)

# Этап 5: Предсказания
# Используем обученную модель для предсказаний на тех же входных данных
predictions = model.predict(X)

# Выводим предсказания
print(predictions)


6. Опишите средства борьбы с переобучением в рекуррентных сетях.

   1) Регуляризация:
   L1 и L2 регуляризация: Добавление штрафа за слишком большие веса в модель может помочь предотвратить переобучение. В L1 регуляризации штрафуется сумма абсолютных значений весов, а в L2 — сумма квадратов весов.
   Dropout: Это техника, которая случайным образом исключает некоторые нейроны во время обучения, что помогает предотвратить зависимость модели от конкретных нейронов и улучшает обобщение.
   2) Раннее остановка (Early Stopping):
   Это метод, при котором обучение модели прекращается, как только производительность на валидационном наборе начинает ухудшаться, несмотря на улучшение на тренировочном наборе. Это помогает предотвратить избыточное подстраивание модели.
   3) Увеличение данных (Data Augmentation):
   Создание дополнительных обучающих примеров путем применения различных преобразований к существующим данным. Это может включать в себя изменения временных рядов или добавление случайного шума, что повышает разнообразие данных для обучения.

1. Определите задачу для прогнозирования временных данных: например предсказание спроса на товары, прогнозирование очередей в магазинах, предсказание погоды и т.п.
2. Используйте один из подходов машинного обучения для прогнозирования: Логистическая регрессия, случайные леса, наивный подход.
3. Создайте последовательную модель глубокого обучения для прогнозирования временных данных и обучите сеть на том же наборе данных.
4. Создайте рекуррентную модель, обучите её и сравните точность/ошибку обучения.
5. Сравните эффективность ячеек LSTM, GRU, SimpleRNN, Bidirectional.
6. Постройте граф одной из моделей.

In [4]:
# Импорт необходимых библиотек
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_absolute_error, mean_squared_error
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split
from keras.models import Sequential
from keras.layers import Dense, LSTM, GRU, SimpleRNN, Bidirectional
from keras.utils import plot_model

# Загрузка данных из CSV
def load_data():
    data = pd.read_csv('weatherHistory.csv')
    return data

# Загружаем данные
data = load_data()

In [5]:
# Предобработка данных: удаляем ненужные столбцы и обрабатываем категориальные признаки
def preprocess_data(data):
    data = data.drop('Daily Summary', axis=1)  # Удаление столбца Daily Summary
    data['Precip Type'] = data['Precip Type'].fillna('None')  # Заполнение пропусков
    data = pd.get_dummies(data, columns=['Summary', 'Precip Type'])  # One-Hot Encoding для категорий
    data['Formatted Date'] = pd.to_datetime(data['Formatted Date'], utc=True)  # Преобразование даты
    data.set_index('Formatted Date', inplace=True)
    data.sort_index(inplace=True)
    return data

# Обработка данных
data_processed = preprocess_data(data)


In [6]:
# Создание лаговых признаков для целевой переменной
def create_lags(data, target_col, n_lags=3):
    for i in range(1, n_lags + 1):
        data[f'{target_col}_lag_{i}'] = data[target_col].shift(i)
    return data.dropna()

# Определяем целевую переменную
target = 'Temperature (C)'
data_with_lags = create_lags(data_processed, target)


In [7]:
# Разделение данных
X = data_with_lags.drop(target, axis=1)  # Признаки
y = data_with_lags[target]               # Целевая переменная

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, shuffle=False)


In [8]:
# Обучение модели случайного леса
rf_model = RandomForestRegressor(n_estimators=100, random_state=42)
rf_model.fit(X_train, y_train)
rf_pred = rf_model.predict(X_test)

# Оценка модели
print("Random Forest Results:")
print(f"MAE: {mean_absolute_error(y_test, rf_pred):.2f}")
print(f"MSE: {mean_squared_error(y_test, rf_pred):.2f}")


Random Forest Results:
MAE: 0.02
MSE: 0.01


In [9]:
# Масштабирование данных для нейронных сетей
scaler = MinMaxScaler()
X_scaled = scaler.fit_transform(X)
y_scaled = scaler.fit_transform(y.values.reshape(-1, 1))

# Создание последовательностей для RNN
def create_sequences(data, target, n_steps=3):
    X, y = [], []
    for i in range(len(data) - n_steps):
        X.append(data[i:i + n_steps])
        y.append(target[i + n_steps])
    return np.array(X), np.array(y)

n_steps = 3
X_seq, y_seq = create_sequences(X_scaled, y_scaled, n_steps)

# Разделение на train/test для RNN
split = int(0.8 * len(X_seq))
X_train_seq, X_test_seq = X_seq[:split], X_seq[split:]
y_train_seq, y_test_seq = y_seq[:split], y_seq[split:]


In [10]:
# Создание модели MLP
mlp_model = Sequential([
    Dense(64, activation='relu', input_shape=(X_train.shape[1],)),
    Dense(32, activation='relu'),
    Dense(1)
])

mlp_model.compile(optimizer='adam', loss='mse')
mlp_history = mlp_model.fit(
    X_train, y_train,
    epochs=20,
    batch_size=32,
    validation_split=0.2,
    verbose=0
)


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


In [None]:
# Функция для создания рекуррентной модели 
def build_rnn(model_type):
    model = Sequential()
    
    # Отдельная обработка Bidirectional
    if model_type == Bidirectional:
        # Оборачиваем LSTM в Bidirectional
        model.add(Bidirectional(LSTM(50, activation='tanh'), 
                               input_shape=(n_steps, X_train_seq.shape[2])))
    else:
        # Обычные RNN-слои
        model.add(model_type(50, activation='tanh', 
                            input_shape=(n_steps, X_train_seq.shape[2])))
    
    model.add(Dense(1))
    model.compile(optimizer='adam', loss='mse')
    return model

# Обучение различных рекуррентных моделей 
for rnn_type in [LSTM, GRU, SimpleRNN, Bidirectional]:  # Bidirectional теперь обрабатывается отдельно
    model = build_rnn(rnn_type)
    history = model.fit(X_train_seq, y_train_seq, 
                       epochs=10, 
                       batch_size=32, 
                       validation_split=0.2, 
                       verbose=0)
    
    # Прогноз и оценка
    pred = model.predict(X_test_seq)
    pred = scaler.inverse_transform(pred)
    y_true = scaler.inverse_transform(y_test_seq.reshape(-1, 1))
    
    results[rnn_type.__name__] = {
        'mae': mean_absolute_error(y_true, pred),
        'mse': mean_squared_error(y_true, pred)
    }


  super().__init__(**kwargs)


KeyboardInterrupt: 

In [None]:
# График обучения MLP
plt.figure(figsize=(12, 6))
plt.plot(mlp_history.history['loss'], label='MLP Train Loss')
plt.plot(mlp_history.history['val_loss'], label='MLP Val Loss')
plt.title('Model Training History')
plt.ylabel('Loss')
plt.xlabel('Epoch')
plt.legend()
plt.show()

# Визуализация архитектуры модели
plot_model(mlp_model, to_file='model.png', show_shapes=True)


In [None]:
# Пример прогноза
plt.figure(figsize=(12, 6))
plt.plot(y_test.values[:100], label='True')
plt.plot(rf_pred[:100], label='Random Forest')
plt.title('Temperature Prediction Comparison')
plt.legend()
plt.show()