In [1]:
# Байесовский подход

# Данные конкурента
total_prototypes_competitor = 1000
successful_prototypes_competitor = 5

# Данные нашей компании
total_prototypes_our = 200
successful_prototypes_our = 0

# Априорная вероятность успеха (исходя из данных конкурента)
alpha_prior = successful_prototypes_competitor + 1
beta_prior = total_prototypes_competitor - successful_prototypes_competitor + 1

# Обновление априорной вероятности с учетом наших данных
alpha_posterior = alpha_prior + successful_prototypes_our
beta_posterior = beta_prior + total_prototypes_our - successful_prototypes_our

# Оценка апостериорной вероятности успеха следующего прототипа
posterior_mean = alpha_posterior / (alpha_posterior + beta_posterior)

posterior_mean

0.004991680532445923

In [2]:
# Метод максимального правдоподобия

# Оценка параметра вероятности успеха прототипа (p) для конкурента
p_estimate = successful_prototypes_competitor / total_prototypes_competitor

p_estimate

0.005

In [4]:
# Монте-Карло симуляция

import numpy as np

# Параметры симуляции
p_success = 0.005  # Вероятность успеха прототипа, оцененная ранее
n_simulations = 1000000  # Количество симуляций

# Генерация случайных исходов
np.random.seed(0)  # Установка случайного зерна для воспроизводимости результатов
successes = np.random.binomial(1, p_success, n_simulations)

# Расчет вероятности успеха следующего прототипа
probability_of_success = np.mean(successes)
probability_of_success

0.005022

In [3]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
from sklearn.preprocessing import StandardScaler, OneHotEncoder

# Генерация фиктивных данных
np.random.seed(0)
n_samples = 200
data = {
    "genre": np.random.choice(["action", "strategy", "puzzle", "adventure", "simulation"], n_samples),
    "team_size": np.random.randint(1, 20, n_samples),
    "development_time": np.random.randint(1, 24, n_samples),
    "budget": np.random.uniform(0.5, 20.0, n_samples),
    "early_feedback": np.random.randint(1, 11, n_samples),
    "success": np.random.randint(0, 2, n_samples)
}

df = pd.DataFrame(data)

# Преобразование категориальных данных в числовые
encoder = OneHotEncoder(sparse_output=False)
genre_encoded = encoder.fit_transform(df[['genre']])

# Создание нового DataFrame с преобразованными данными
encoded_df = pd.DataFrame(genre_encoded, columns=encoder.get_feature_names_out(['genre']))
df_encoded = pd.concat([df.drop('genre', axis=1), encoded_df], axis=1)

# Разделение данных на признаки и целевую переменную
X = df_encoded.drop('success', axis=1)
y = df_encoded['success']

# Разделение данных на обучающую и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)

# Масштабирование признаков
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Обучение модели логистической регрессии
model = LogisticRegression(random_state=0)
model.fit(X_train_scaled, y_train)

# Проверка точности модели на тестовых данных
y_pred = model.predict(X_test_scaled)
accuracy = accuracy_score(y_test, y_pred)

# Вывод результатов
print(f"Accuracy of the logistic regression model: {accuracy:.3f}")

Accuracy of the logistic regression model: 0.517
