# Моделирование Монте-Карло

## Принципы моделирования Монте-Карло

##### Основы метода Монте-Карло и его применения в бизнес-аналитике

Метод Монте-Карло — это численный метод моделирования, который использует многократное случайное симулирование для оценки вероятностных исходов. Он широко применяется для оценки рисков, прогнозирования и анализа неопределенностей в различных сценариях. В бизнес-аналитике метод Монте-Карло помогает моделировать потенциальные финансовые результаты, оценивать инвестиционные риски, оптимизировать производственные процессы и планировать проекты в условиях неопределенности.

## Виды распределений, которые можно моделировать

Моделирование Монте-Карло основано на генерации случайных чисел с использованием различных статистических распределений. Выбор распределения зависит от характера данных или предполагаемой модели. Вот основные типы распределений:

1. **Нормальное распределение (Gaussian)**:
   - Это наиболее распространенное распределение, которое часто используется для моделирования случайных процессов с симметричным распределением данных относительно среднего значения.
   - Пример: ошибки в измерениях или изменения цен акций.

2. **Равномерное распределение (Uniform)**:
   - Все значения в заданном диапазоне имеют одинаковую вероятность.
   - Пример: длительность задачи в проекте, если нет предположений о вероятностях.

3. **Экспоненциальное распределение (Exponential)**:
   - Моделирует время между независимыми случайными событиями, которые происходят с постоянной интенсивностью.
   - Пример: время до следующего отказа оборудования.

4. **Логнормальное распределение (Log-normal)**:
   - Если логарифм переменной имеет нормальное распределение, то сама переменная имеет логнормальное распределение.
   - Пример: моделирование цен на акции или доходов компаний.

5. **Бета-распределение (Beta)**:
   - Моделирует вероятности для величин, ограниченных интервалом [0, 1].
   - Пример: вероятность завершения проекта в срок или оценка успеха маркетинговой кампании.

## Пример генерации случайных чисел для разных распределений

```python
import numpy as np
import matplotlib.pyplot as plt

# Количество симуляций
n_simulations = 1000

# Нормальное распределение
normal_data = np.random.normal(100, 15, n_simulations)

# Равномерное распределение
uniform_data = np.random.uniform(50, 150, n_simulations)

# Экспоненциальное распределение
exponential_data = np.random.exponential(10, n_simulations)

# Логнормальное распределение
lognormal_data = np.random.lognormal(4, 0.25, n_simulations)

# Построение графиков распределений
plt.figure(figsize=(10, 6))

plt.subplot(2, 2, 1)
plt.hist(normal_data, bins=30, color='blue', edgecolor='black')
plt.title('Нормальное распределение')

plt.subplot(2, 2, 2)
plt.hist(uniform_data, bins=30, color='green', edgecolor='black')
plt.title('Равномерное распределение')

plt.subplot(2, 2, 3)
plt.hist(exponential_data, bins=30, color='red', edgecolor='black')
plt.title('Экспоненциальное распределение')

plt.subplot(2, 2, 4)
plt.hist(lognormal_data, bins=30, color='purple', edgecolor='black')
plt.title('Логнормальное распределение')

plt.tight_layout()
plt.show()
```

## Выявление и определение распределения в реальных исторических данных

В реальных сценариях моделирования важно правильно определить, какое распределение наиболее точно описывает ваши исторические данные. Для этого необходимо:

1. **Визуализация данных**: Гистограммы и графики плотности помогают визуально определить форму распределения.
2. **Статистические тесты**: Тесты, такие как тест Колмогорова-Смирнова или тест Андерсона-Дарлинга, могут помочь определить, насколько данные соответствуют конкретному распределению.
3. **Подбор параметров распределений**: Использование методов максимального правдоподобия для оценки параметров (например, среднее и стандартное отклонение для нормального распределения).

##### Пример: Определение распределения для реальных данных

```python
import seaborn as sns
from scipy import stats

# Генерация случайных данных с нормальным распределением
data = np.random.normal(100, 15, 1000)

# Построение гистограммы с плотностью распределения
sns.histplot(data, kde=True)
plt.title('Гистограмма и плотность распределения')

# Тест Колмогорова-Смирнова для проверки соответствия нормальному распределению
k2, p_value = stats.kstest(data, 'norm', args=(np.mean(data), np.std(data)))
print(f'Колмогоров-Смирнов тест: статистика={k2}, p-значение={p_value}')
```

### Подбор распределения 

```python
size=1000 #количество данных
data_sim = np.random.normal( loc= data.mean(), scale = data.std(), size = size)
plt.hist(data_sim)
```

## Моделирование одновременно нескольких независимых величин в модели Монте-Карло

В бизнес-аналитике часто встречаются задачи, где необходимо моделировать несколько независимых переменных одновременно. Например, можно моделировать колебания спроса и цены на продукт для оценки возможных доходов.

#### Пример: Моделирование зависимости между спросом и ценой

```python
# Генерация случайных данных для спроса и цены
demand = np.random.normal(3000, 500, n_simulations)  # Спрос
price = np.random.uniform(20, 50, n_simulations)  # Цена

# Моделирование доходов
revenue = demand * price

# Моделирование затрат (фиксированные + случайные)
fixed_costs = 50000  # Фиксированные затраты
variable_costs = np.random.normal(15, 2, n_simulations) * demand  # Переменные затраты
total_costs = fixed_costs + variable_costs

# Моделирование прибыли
profit = revenue - total_costs

# Построение гистограммы прибыли
plt.hist(profit, bins=50, color='blue', edgecolor='black')
plt.title('Распределение прибыли по результатам моделирования Монте-Карло')
plt.xlabel('Прибыль (USD)')
plt.ylabel('Частота')
plt.show()

# Вывод ключевых статистических показателей
print(f'Средняя прибыль: {np.mean(profit):.2f} USD')
print(f'Минимальная прибыль: {np.min(profit):.2f} USD')
print(f'Максимальная прибыль: {np.max(profit):.2f} USD')
```

## Примеры использования на практике

1. **Финансовый анализ**:
   - Прогнозирование движения цен активов с учетом волатильности.
   - Оценка финансовых рисков с учетом вероятностных сценариев изменения процентных ставок или курса валют.

2. **Оценка производственных затрат**:
   - Моделирование затрат на производство в зависимости от переменных издержек и объема производства.
   - Оценка вероятности превышения бюджета проекта.

3. **Оптимизация запасов**:
   - Моделирование колебаний спроса для определения оптимального уровня запасов, минимизирующего риск дефицита или переизбытка товаров.

4. **Прогнозирование завершения проекта**:
   - Использование метода Монте-Карло для оценки вероятности завершения проекта в срок с учетом неопределенности в длительности задач.

## Заключение

Моделирование Монте-Карло — это мощный инструмент для оценки рисков и неопределенностей. Оно позволяет:
- Оценивать вероятностные исходы на основе исторических данных.
- Учитывать множество независимых переменных для прогнозирования сложных бизнес-процессов.
- Использовать различные распределения для более точного моделирования реальных данных.

Применение метода Монте-Карло в бизнесе позволяет более точно прогнозировать возможные исходы и принимать обоснованные решения в условиях неопределенности.

## Пример: Моделирование Монте-Карло с двумя случайными величинами

Допустим, мы хотим смоделировать доход компании, которая продает товары. На доход компании влияют две основные случайные переменные:
1. **Спрос** на товар (количество проданных единиц), который может варьироваться в зависимости от сезонности, цен и других факторов.
2. **Цена** на товар, которая также варьируется в зависимости от рыночных условий, конкуренции и других факторов.

Мы будем моделировать следующие параметры:
- Спрос распределен нормально с математическим ожиданием 3000 единиц и стандартным отклонением 500.
- Цена на товар распределена равномерно от 20 до 50 долларов за единицу.

Также мы добавим переменные издержки:
- **Фиксированные затраты**: 50,000 долларов.
- **Переменные затраты**: зависят от объема производства и распределены нормально с математическим ожиданием 15 долларов за единицу и стандартным отклонением 2 доллара.

Цель: смоделировать 1000 возможных сценариев и оценить распределение прибыли компании.

#### Код для моделирования:

```python
import numpy as np
import matplotlib.pyplot as plt

# Количество симуляций
n_simulations = 1000

# Генерация случайных данных для спроса и цены
demand = np.random.normal(3000, 500, n_simulations)  # Спрос
price = np.random.uniform(20, 50, n_simulations)  # Цена

# Моделирование доходов
revenue = demand * price

# Моделирование затрат (фиксированные + переменные затраты)
fixed_costs = 50000  # Фиксированные затраты
variable_costs = np.random.normal(15, 2, n_simulations) * demand  # Переменные затраты
total_costs = fixed_costs + variable_costs

# Моделирование прибыли
profit = revenue - total_costs

# Построение гистограммы прибыли
plt.hist(profit, bins=50, color='blue', edgecolor='black')
plt.title('Распределение прибыли по результатам моделирования Монте-Карло')
plt.xlabel('Прибыль (USD)')
plt.ylabel('Частота')
plt.show()

# Вывод ключевых статистических показателей
print(f'Средняя прибыль: {np.mean(profit):.2f} USD')
print(f'Минимальная прибыль: {np.min(profit):.2f} USD')
print(f'Максимальная прибыль: {np.max(profit):.2f} USD')
print(f'90-й перцентиль прибыли: {np.percentile(profit, 90):.2f} USD')
```

### Пояснение:
1. **Спрос (demand)** генерируется с использованием нормального распределения, так как мы предполагаем, что среднее значение спроса составляет 3000 единиц с колебаниями ±500.
2. **Цена (price)** генерируется с использованием равномерного распределения в диапазоне от 20 до 50 долларов за единицу.
3. **Доход (revenue)** рассчитывается как произведение спроса на цену.
4. **Издержки** включают фиксированные затраты (50000 долларов) и переменные издержки, которые зависят от объема спроса (нормально распределены со средним 15 долларов на единицу).
5. **Прибыль (profit)** рассчитывается как разница между доходом и общими затратами.

### Интерпретация результатов:

1. **Средняя прибыль**: средняя прибыль по результатам 1000 симуляций.
2. **Минимальная и максимальная прибыль**: крайние значения прибыли, что позволяет оценить возможные риски.
3. **90-й перцентиль прибыли**: значение, выше которого будет находиться прибыль в 10% лучших случаев (важно для оценки вероятности достижения высоких результатов).

### Пример применения:

Такой подход может быть полезен для компании, чтобы оценить диапазон возможных финансовых результатов в зависимости от неопределенных факторов, таких как спрос и цена. Это помогает в планировании и принятии решений о производственных объемах, маркетинговых кампаниях и управлении запасами.

# Задание: Модель Монте-Карло для оценки риска проекта

**Цель задания:**  
Научиться использовать метод Монте-Карло для оценки возможных исходов и рисков на основе случайных распределений.

#### Описание задачи:

Представьте, что вы управляете проектом с неизвестной продолжительностью. Ваши эксперты оценили длительность выполнения различных этапов проекта, и на основе этих оценок необходимо спрогнозировать общую продолжительность проекта с учетом неопределенности.

Для каждой стадии проекта даны следующие оценки времени выполнения (в днях):
1. **Этап 1**: от 5 до 15 дней.
2. **Этап 2**: от 10 до 20 дней.
3. **Этап 3**: от 20 до 40 дней.

Необходимо использовать метод Монте-Карло для моделирования продолжительности проекта, выполненного 10,000 раз, чтобы оценить возможные исходы. Мы сгенерируем случайные значения продолжительности для каждого этапа на основе равномерного распределения и посмотрим на итоговое распределение общей продолжительности проекта.

#### Инструкция по выполнению задания:

1. **Сгенерируйте случайные данные для каждого этапа проекта** на основе равномерного распределения с помощью функции `numpy.random.uniform()`.
   
2. **Смоделируйте 10,000 сценариев** с использованием метода Монте-Карло.
   
3. **Рассчитайте общую продолжительность проекта** для каждого сценария (сумма всех трех этапов).
   
4. Постройте **гистограмму** распределения возможных значений продолжительности проекта.
   
5. Определите **вероятность**, что проект завершится за 60 дней.

#### Шаги для выполнения задания:

```python
import numpy as np
import matplotlib.pyplot as plt

# Количество симуляций
n_simulations = 10000

# Генерация случайных значений для каждого этапа на основе равномерного распределения
stage_1 = np.random.uniform(5, 15, n_simulations)
stage_2 = np.random.uniform(10, 20, n_simulations)
stage_3 = np.random.uniform(20, 40, n_simulations)

# Рассчет общей продолжительности проекта (сумма всех этапов)
total_duration = stage_1 + stage_2 + stage_3

# Построение гистограммы распределения
plt.hist(total_duration, bins=50, edgecolor='black')
plt.title('Распределение продолжительности проекта (Метод Монте-Карло)')
plt.xlabel('Продолжительность (дни)')
plt.ylabel('Частота')
plt.show()

# Оценка вероятности завершения проекта за 60 дней
probability = np.mean(total_duration <= 60)
print(f"Вероятность завершения проекта за 60 дней: {probability:.2%}")
```

#### Что нужно сделать:
1. Сгенерируйте случайные данные для каждой стадии.
2. Смоделируйте 10,000 возможных исходов общей продолжительности проекта.
3. Постройте график распределения.
4. Рассчитайте вероятность завершения проекта за 60 дней.

#### Ожидаемый результат:
Вы получите гистограмму распределения общей продолжительности проекта и точную вероятность того, что проект будет завершен за 60 дней.

Этот пример покажет, как метод Монте-Карло помогает оценивать риски и планировать проект с учетом неопределенности.