# Лабораторная работа 1: Генератор псевдослучайных чисел Лемера

## Задачи:
1. Подобрать параметры генератора, который дает максимальный период
2. Для сгенерированной выборки построить гистограмму (20+ интервалов)
3. Используя критерии хи-квадрат и КС, подтвердить гипотезу о равномерности последовательности
4. Отобразить результаты графически
5. Сделать вывод о согласованности аналитических расчетов и визуализации


In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
import math
import sys
import os

# Добавляем путь к utils
sys.path.insert(0, os.path.join(os.getcwd(), 'utils'))
from entities import LehmerGenerator, OptimalLehmerGenerator

plt.rcParams['figure.figsize'] = (12, 8)
plt.rcParams['font.size'] = 12


## 1. Подбор параметров генератора с максимальным периодом


### Условия максимального периода

Чтобы получить период максимальной длины m, множитель a и приращение c в линейном конгруэнтном датчике должны удовлетворять следующим условиям:

1. **c и m - взаимно простые числа** (gcd(c, m) = 1)
2. **b = a - 1 кратно p** для любого простого p, являющегося делителем m
3. **b кратно 4**, если m кратно 4

Эти условия обеспечивают полный период генератора, равный m.


In [None]:
def get_prime_factors(n):
    """Получение простых делителей числа"""
    factors = []
    d = 2
    while d * d <= n:
        while n % d == 0:
            if d not in factors:
                factors.append(d)
            n //= d
        d += 1
    if n > 1:
        factors.append(n)
    return factors

def check_period_conditions(a, c, m):
    """
    Проверка условий для максимального периода m
    
    Returns:
        dict: результаты проверки каждого условия
    """
    import math
    
    results = {}
    b = a - 1  # b = a - 1
    
    # Условие 1: gcd(c, m) = 1
    gcd_cm = math.gcd(c, m)
    condition1 = gcd_cm == 1
    results['condition1'] = condition1
    results['gcd_cm'] = gcd_cm
    
    # Условие 2: b кратно p для любого простого p, являющегося делителем m
    prime_factors = get_prime_factors(m)
    condition2 = all(b % p == 0 for p in prime_factors)
    results['condition2'] = condition2
    results['prime_factors'] = prime_factors
    results['b'] = b
    
    # Условие 3: b кратно 4, если m кратно 4
    if m % 4 == 0:
        condition3 = b % 4 == 0
        results['condition3_applicable'] = True
    else:
        condition3 = True  # Условие не применимо
        results['condition3_applicable'] = False
    
    results['condition3'] = condition3
    
    # Все условия выполнены
    results['all_conditions_met'] = condition1 and condition2 and condition3
    results['expected_period'] = m if results['all_conditions_met'] else "< m"
    
    return results

# Анализируем доступные оптимальные параметры с проверкой условий
print("АНАЛИЗ ПАРАМЕТРОВ ДЛЯ МАКСИМАЛЬНОГО ПЕРИОДА")
print("=" * 60)

max_period = 0
best_config = None
analysis_results = {}

for gen_type, params in OptimalLehmerGenerator.OPTIMAL_PARAMS.items():
    a, c, m = params['a'], params['c'], params['m']
    period = params['period']
    
    print(f"\n{gen_type.upper()}:")
    print(f"  Параметры: a = {a:,}, c = {c:,}, m = {m:,}")
    print(f"  Заявленный период = {period:,}")
    
    if c != 0:  # Только для смешанных генераторов проверяем условия
        conditions = check_period_conditions(a, c, m)
        analysis_results[gen_type] = conditions
        
        print(f"  Проверка условий:")
        print(f"    1. gcd(c, m) = gcd({c}, {m}) = {conditions['gcd_cm']} → {'✓' if conditions['condition1'] else '✗'}")
        print(f"    2. b = a-1 = {conditions['b']}, простые делители m: {conditions['prime_factors']}")
        
        for p in conditions['prime_factors']:
            divisible = conditions['b'] % p == 0
            print(f"       b mod {p} = {conditions['b'] % p} → {'✓' if divisible else '✗'}")
        
        if conditions['condition3_applicable']:
            print(f"    3. m кратно 4, b mod 4 = {conditions['b'] % 4} → {'✓' if conditions['condition3'] else '✗'}")
        else:
            print(f"    3. m не кратно 4, условие не применимо")
        
        print(f"  Все условия выполнены: {'✓' if conditions['all_conditions_met'] else '✗'}")
        print(f"  Ожидаемый период: {conditions['expected_period']}")
    else:
        print(f"  Тип: мультипликативный генератор (c = 0)")
        print(f"  Максимальный период для мультипликативного: m - 1 = {m - 1:,}")
    
    if period > max_period:
        max_period = period
        best_config = gen_type

print(f"\nЛУЧШИЙ ВЫБОР: {best_config}")
print(f"МАКСИМАЛЬНЫЙ ПЕРИОД: {max_period:,}")


In [None]:
# Создаем генератор с максимальным периодом
generator = OptimalLehmerGenerator(seed=12345, generator_type=best_config)

print(f"Выбранный генератор: {generator}")
print(f"Теоретический период: {generator.get_theoretical_period():,}")

# Параметры для анализа
sample_size = 50000
bins = 25  # 25 интервалов (>20)

print(f"\nПараметры анализа:")
print(f"Размер выборки: {sample_size:,}")
print(f"Количество интервалов: {bins}")


## 2. Генерация выборки и построение гистограммы


In [None]:
# Генерируем выборку
generator.reset()
sample = generator.generate_float_sequence(sample_size)

print(f"Сгенерировано {len(sample)} чисел")
print(f"Первые 10 значений: {[f'{x:.6f}' for x in sample[:10]]}")
print(f"Диапазон: [{min(sample):.6f}, {max(sample):.6f}]")


In [None]:
# Построение гистограммы
plt.figure(figsize=(14, 6))

# Основная гистограмма
plt.subplot(1, 2, 1)
counts, bin_edges, patches = plt.hist(sample, bins=bins, density=True, 
                                     alpha=0.7, color='skyblue', 
                                     edgecolor='black', linewidth=0.5)

# Теоретическая линия равномерного распределения
plt.axhline(y=1.0, color='red', linestyle='--', linewidth=2, 
           label='Теоретическое равномерное распределение')

plt.xlabel('Значение')
plt.ylabel('Плотность')
plt.title(f'Гистограмма распределения ({bins} интервалов)')
plt.legend()
plt.grid(True, alpha=0.3)

# Гистограмма частот
plt.subplot(1, 2, 2)
freq_counts, _, _ = plt.hist(sample, bins=bins, alpha=0.7, color='lightgreen', 
                            edgecolor='black', linewidth=0.5)

# Ожидаемая частота
expected_freq = sample_size / bins
plt.axhline(y=expected_freq, color='red', linestyle='--', linewidth=2, 
           label=f'Ожидаемая частота = {expected_freq:.1f}')

plt.xlabel('Значение')
plt.ylabel('Частота')
plt.title('Гистограмма частот')
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print(f"Наблюдаемые частоты: {freq_counts}")
print(f"Ожидаемая частота: {expected_freq:.1f}")


## 3. Критерий хи-квадрат


In [None]:
# Критерий хи-квадрат
alpha = 0.05  # уровень значимости

# Наблюдаемые частоты
observed_frequencies = freq_counts

# Ожидаемые частоты для равномерного распределения
expected_frequencies = np.full(bins, sample_size / bins)

# Статистика хи-квадрат
chi2_stat = np.sum((observed_frequencies - expected_frequencies)**2 / expected_frequencies)

# Степени свободы
degrees_of_freedom = bins - 1

# Критическое значение
chi2_critical = stats.chi2.ppf(1 - alpha, degrees_of_freedom)

# p-value
p_value_chi2 = 1 - stats.chi2.cdf(chi2_stat, degrees_of_freedom)

# Принятие/отклонение гипотезы
hypothesis_accepted_chi2 = chi2_stat < chi2_critical

print("КРИТЕРИЙ ХИ-КВАДРАТ")
print("=" * 50)
print(f"H₀: распределение равномерное")
print(f"H₁: распределение не равномерное")
print(f"Уровень значимости α = {alpha}")
print()
print(f"Количество интервалов: {bins}")
print(f"Степени свободы: {degrees_of_freedom}")
print(f"Статистика χ²: {chi2_stat:.4f}")
print(f"Критическое значение χ²₍₀.₀₅₎: {chi2_critical:.4f}")
print(f"p-value: {p_value_chi2:.6f}")
print()
print(f"Условие: χ² < χ²₍₀.₀₅₎ → {chi2_stat:.4f} < {chi2_critical:.4f} → {hypothesis_accepted_chi2}")
print(f"Условие: p-value > α → {p_value_chi2:.6f} > {alpha} → {p_value_chi2 > alpha}")
print()
if hypothesis_accepted_chi2:
    print("ВЫВОД: Гипотеза H₀ ПРИНИМАЕТСЯ")
    print("Данные согласуются с равномерным распределением")
else:
    print("ВЫВОД: Гипотеза H₀ ОТКЛОНЯЕТСЯ")
    print("Данные НЕ согласуются с равномерным распределением")


## 4. Критерий Колмогорова-Смирнова


In [None]:
# Критерий Колмогорова-Смирнова
ks_stat, p_value_ks = stats.kstest(sample, 'uniform', args=(0, 1))

# Критическое значение для КС теста
n = len(sample)
ks_critical = 1.36 / math.sqrt(n)  # Приближенное критическое значение для α=0.05

# Принятие/отклонение гипотезы
hypothesis_accepted_ks = ks_stat < ks_critical

print("КРИТЕРИЙ КОЛМОГОРОВА-СМИРНОВА")
print("=" * 50)
print(f"H₀: распределение равномерное [0,1]")
print(f"H₁: распределение не равномерное")
print(f"Уровень значимости α = {alpha}")
print()
print(f"Размер выборки: {n:,}")
print(f"Статистика D: {ks_stat:.6f}")
print(f"Критическое значение D₍₀.₀₅₎: {ks_critical:.6f}")
print(f"p-value: {p_value_ks:.6f}")
print()
print(f"Условие: D < D₍₀.₀₅₎ → {ks_stat:.6f} < {ks_critical:.6f} → {hypothesis_accepted_ks}")
print(f"Условие: p-value > α → {p_value_ks:.6f} > {alpha} → {p_value_ks > alpha}")
print()
if hypothesis_accepted_ks:
    print("ВЫВОД: Гипотеза H₀ ПРИНИМАЕТСЯ")
    print("Данные согласуются с равномерным распределением")
else:
    print("ВЫВОД: Гипотеза H₀ ОТКЛОНЯЕТСЯ")
    print("Данные НЕ согласуются с равномерным распределением")


## 5. Графическое отображение результатов


In [None]:
# Создаем комплексную визуализацию
fig, axes = plt.subplots(2, 2, figsize=(16, 12))
fig.suptitle(f'Статистический анализ генератора {best_config}', fontsize=16)

# 1. Гистограмма плотности
ax1 = axes[0, 0]
ax1.hist(sample, bins=bins, density=True, alpha=0.7, color='skyblue', 
         edgecolor='black', linewidth=0.5)
ax1.axhline(y=1.0, color='red', linestyle='--', linewidth=2, 
           label='Теоретическое равномерное')
ax1.set_xlabel('Значение')
ax1.set_ylabel('Плотность')
ax1.set_title(f'Гистограмма плотности ({bins} интервалов)')
ax1.legend()
ax1.grid(True, alpha=0.3)

# 2. Эмпирическая функция распределения
ax2 = axes[0, 1]
sorted_sample = np.sort(sample)
empirical_cdf = np.arange(1, len(sorted_sample) + 1) / len(sorted_sample)
theoretical_cdf = sorted_sample  # Для равномерного [0,1]: F(x) = x

ax2.plot(sorted_sample, empirical_cdf, 'b-', linewidth=2, label='Эмпирическая CDF')
ax2.plot(sorted_sample, theoretical_cdf, 'r--', linewidth=2, label='Теоретическая CDF')
ax2.set_xlabel('Значение')
ax2.set_ylabel('F(x)')
ax2.set_title('Функции распределения')
ax2.legend()
ax2.grid(True, alpha=0.3)

# 3. Q-Q график
ax3 = axes[1, 0]
theoretical_quantiles = np.linspace(0.001, 0.999, len(sample))
empirical_quantiles = np.sort(sample)

ax3.scatter(theoretical_quantiles, empirical_quantiles, alpha=0.6, s=1, color='blue')
ax3.plot([0, 1], [0, 1], 'r--', linewidth=2, label='Идеальная линия')
ax3.set_xlabel('Теоретические квантили')
ax3.set_ylabel('Эмпирические квантили')
ax3.set_title('Q-Q график')
ax3.legend()
ax3.grid(True, alpha=0.3)

# 4. Результаты тестов
ax4 = axes[1, 1]
ax4.axis('off')

# Вычисляем статистики
mean = np.mean(sample)
std = np.std(sample)
variance = np.var(sample)
theoretical_mean = 0.5
theoretical_std = math.sqrt(1/12)
theoretical_variance = 1/12

# Текстовая информация о результатах
results_text = f"""РЕЗУЛЬТАТЫ СТАТИСТИЧЕСКИХ ТЕСТОВ

Размер выборки: {n:,}
Количество интервалов: {bins}

КРИТЕРИЙ ХИ-КВАДРАТ:
χ² = {chi2_stat:.4f}
χ²₍₀.₀₅₎ = {chi2_critical:.4f}
p-value = {p_value_chi2:.6f}
Результат: {'ПРИНЯТА' if hypothesis_accepted_chi2 else 'ОТКЛОНЕНА'}

КРИТЕРИЙ КОЛМОГОРОВА-СМИРНОВА:
D = {ks_stat:.6f}
D₍₀.₀₅₎ = {ks_critical:.6f}
p-value = {p_value_ks:.6f}
Результат: {'ПРИНЯТА' if hypothesis_accepted_ks else 'ОТКЛОНЕНА'}

ОПИСАТЕЛЬНАЯ СТАТИСТИКА:
Среднее: {mean:.6f} (теор: 0.500000)
СКО: {std:.6f} (теор: {theoretical_std:.6f})
Дисперсия: {variance:.6f} (теор: {theoretical_variance:.6f})"""

ax4.text(0.05, 0.95, results_text, transform=ax4.transAxes, fontsize=10,
         verticalalignment='top', fontfamily='monospace',
         bbox=dict(boxstyle='round', facecolor='lightgray', alpha=0.8))

plt.tight_layout()
plt.show()


## 6. Вывод о согласованности аналитических расчетов и визуализации


In [None]:
# Анализ согласованности
print("АНАЛИЗ СОГЛАСОВАННОСТИ АНАЛИТИЧЕСКИХ РАСЧЕТОВ И ВИЗУАЛИЗАЦИИ")
print("=" * 80)

# Проверяем различные аспекты согласованности
mean_consistent = abs(mean - theoretical_mean) < 0.01
std_consistent = abs(std - theoretical_std) < 0.01
variance_consistent = abs(variance - theoretical_variance) < 0.01

# Согласованность статистических тестов
tests_consistent = hypothesis_accepted_chi2 and hypothesis_accepted_ks

# Визуальная согласованность
density_deviations = np.abs(counts - 1.0)
max_density_deviation = np.max(density_deviations)
visual_consistent = max_density_deviation < 0.2  # Порог 20%

print("1. СОГЛАСОВАННОСТЬ ОПИСАТЕЛЬНОЙ СТАТИСТИКИ:")
print(f"   Среднее значение: {mean:.6f} vs {theoretical_mean:.6f} → {'✓' if mean_consistent else '✗'}")
print(f"   Отклонение: {abs(mean - theoretical_mean):.6f} {'< 0.01' if mean_consistent else '>= 0.01'}")
print()
print(f"   Стандартное отклонение: {std:.6f} vs {theoretical_std:.6f} → {'✓' if std_consistent else '✗'}")
print(f"   Отклонение: {abs(std - theoretical_std):.6f} {'< 0.01' if std_consistent else '>= 0.01'}")
print()
print(f"   Дисперсия: {variance:.6f} vs {theoretical_variance:.6f} → {'✓' if variance_consistent else '✗'}")
print(f"   Отклонение: {abs(variance - theoretical_variance):.6f} {'< 0.01' if variance_consistent else '>= 0.01'}")
print()

print("2. СОГЛАСОВАННОСТЬ СТАТИСТИЧЕСКИХ ТЕСТОВ:")
print(f"   Критерий хи-квадрат: {'ПРИНЯТ' if hypothesis_accepted_chi2 else 'ОТКЛОНЕН'} (p = {p_value_chi2:.6f})")
print(f"   Критерий Колмогорова-Смирнова: {'ПРИНЯТ' if hypothesis_accepted_ks else 'ОТКЛОНЕН'} (p = {p_value_ks:.6f})")
print(f"   Общая согласованность тестов: {'✓' if tests_consistent else '✗'}")
print()

print("3. СОГЛАСОВАННОСТЬ ВИЗУАЛИЗАЦИИ:")
print(f"   Максимальное отклонение плотности от 1.0: {max_density_deviation:.4f}")
print(f"   Визуальная согласованность: {'✓' if visual_consistent else '✗'} (порог < 0.2)")
print(f"   Q-Q график: линейная зависимость {'наблюдается' if visual_consistent else 'нарушена'}")
print(f"   Эмпирическая CDF близка к теоретической: {'✓' if ks_stat < 0.05 else '✗'}")
print()

# Общая оценка согласованности
consistency_score = sum([mean_consistent, std_consistent, variance_consistent, 
                        tests_consistent, visual_consistent])
total_criteria = 5

print("4. ОБЩАЯ ОЦЕНКА СОГЛАСОВАННОСТИ:")
print(f"   Выполнено критериев: {consistency_score}/{total_criteria}")
print(f"   Процент согласованности: {(consistency_score/total_criteria)*100:.1f}%")
print()

if consistency_score >= 4:
    overall_conclusion = "ВЫСОКАЯ СОГЛАСОВАННОСТЬ"
    quality_assessment = "ОТЛИЧНОЕ качество генератора"
elif consistency_score >= 3:
    overall_conclusion = "ХОРОШАЯ СОГЛАСОВАННОСТЬ"
    quality_assessment = "ХОРОШЕЕ качество генератора"
elif consistency_score >= 2:
    overall_conclusion = "УДОВЛЕТВОРИТЕЛЬНАЯ СОГЛАСОВАННОСТЬ"
    quality_assessment = "УДОВЛЕТВОРИТЕЛЬНОЕ качество генератора"
else:
    overall_conclusion = "НИЗКАЯ СОГЛАСОВАННОСТЬ"
    quality_assessment = "НЕУДОВЛЕТВОРИТЕЛЬНОЕ качество генератора"

print(f"ИТОГОВЫЙ ВЫВОД: {overall_conclusion}")
print(f"ОЦЕНКА КАЧЕСТВА: {quality_assessment}")
print()

best_params = OptimalLehmerGenerator.OPTIMAL_PARAMS[best_config]
print("ЗАКЛЮЧЕНИЕ:")
print(f"Генератор {best_config} с параметрами:")
print(f"a = {best_params['a']:,}, c = {best_params['c']:,}, m = {best_params['m']:,}")
print(f"демонстрирует {overall_conclusion.lower()} между:")
print("- Теоретическими расчетами (максимальный период, статистические характеристики)")
print("- Эмпирическими данными (описательная статистика выборки)")
print("- Статистическими тестами (критерии хи-квадрат и Колмогорова-Смирнова)")
print("- Графической визуализацией (гистограмма, Q-Q график, функции распределения)")
print()
print("Генератор подходит для использования в статистическом моделировании.")
