## Моделирование цепи с фиксированным валентным углом

Существует несколько континуальных моделей макромолекул: свободно-сочлененная цепь, цепь с фиксированным валентным углом, цепь с фиксированным валентным углом и заторможенным внутренним вращением. Краткий обзор этих моделей приведен в учебнике [1] (с. 36–41). Настоящий спецпрактикум посвящен рассмотрению модели цепи с фиксированным валентным углом.

<div><br/>
    <img src="assets/fixed_angle_chain_2.png" width="180rem"/>
    <center style="font-size: 0.9em">Рис. 1. Модель цепи с фиксированным валентным углом [2]</center>
</div>

Построение модели осуществляется следующим образом.

Выбирают длину звена $b$ и угол $\theta$ (см. рис. 1). Из начала координат строят первое звени цепи, $\vec{r_1}$, заданной длины $b$, обозначив его конец как $A_1$. Поскольку цепь генерируется согласно модели с фиксированным валентным углом, конец следующего звена, $\vec{r_2}$, лежит на окружности, удовлетворяющей следующим условиям:

- точки окружности лежат на расстоянии $b$ от $A_1$;
- любой вектор, соединяющий конец $\vec{r_1}$ с точкой на окружности, образует угол $\pi - \theta$ с $\vec{r_1}$.

Чтобы найти такую окружность, нужно определить координаты её центра, нормаль (вектор, задающий её ориентацию в пространстве) и радиус. Нормалью к искомой окружности является, очевидно, вектор $\vec{r_1}$. Поскольку точки окружности лежат на расстоянии $b$ от $A_1$, она является сечением сферы радиуса $b$ вокруг $A_1$. Построив сечение этой сферы, содержащее $\vec{r_1}$, легко убедиться в том, что центр искомой окружности лежит на прямой, содержащей $\vec{r_1}$, на удалении $b\cos{\theta}$ от $A_1$, а радиус её равен $b\sin{\theta}$.

Теперь можно задать окружность с помощью [параметрического уравнения](https://ru.wikipedia.org/wiki/Параметрическое_представление):

\begin{equation}
X(t) = C+r(\cos{t})\vec{u}+r(\sin{t})\vec{v},
\end{equation}

где $C$ — координаты центра окружности, $r$ — её радиус, а $\vec{u}$ и $\vec{v}$ — пара ортогональных векторов единичной длины, оба из которых ортогональны вектору, являющемуся нормалью к плоскости окружности (в данном случае $\vec{r_1}$), а $t$ — действительный параметр. Множество значений этого выражения при всех $t$ составляет искомую окружность.

Для того, чтобы найти вектора $\vec{u}$ и $\vec{v}$, поступают так:

- находят вектор, ортогональный $\vec{r_1}$, пользуясь свойством векторного произведения, и нормируют его, чтобы его длина составляла 1:

\begin{equation}
\vec{u} = \frac{\vec{r_1} \times \vec{i}}{\|\vec{r_1} \times \vec{i}\|}, где\: \vec{i}\: —\: единичный\: вектор\: (1, 0, 0);
\end{equation}

- аналогично находят вектор, ортогональный $\vec{r_1}$ и полученному $\vec{u}$:

\begin{equation}
\vec{v} = \frac{\vec{r_1} \times \vec{u}}{\|\vec{r_1} \times \vec{u}\|}.
\end{equation}

Поскольку нам нужна не вся эта окружность, а одна случайно выбранная на ней точка, использование параметрического представления очень удобно. Из свойств тригонометрических функций следует, что период этой функции относительно $t$ равен $2\pi$. Это значит, что если $t$ "пробегает" полуинтервал $[0; 2\pi)$, $X(t)$ "пробегает" полный круг по заданной окружности, поэтому, подставив в выражение значение $t$, равномерно случайно распределенное на этом интервале, мы получим случайную точку на этой окружности, причем её распределение также будет равномерным.

Получив так точку $A_2$, строят к ней вектор из $A_1$. Таким образом, получен вектор $\vec{r_2}$ — следующее звено моделируемой цепи. Описанные шаги повторяют для каждого звена.

Это — среда Jupyter Notebook, веб-интерфейс интерактивного интерпретатора языка Python. Программа, исходный код которой вводится здесь, исполняется на удаленном сервере, а результаты выполнения отображаются на этой странице.

На первом шаге мы подготовим интерпретатор для выполнения моделирования: импортируем нужные модули, определим функции и константы.

Нажмите кнопку ▶▮ (*Run this cell*) слева от участка кода ниже, чтобы исполнить шаг, после чего прокрутите ниже, к следующему фрагменту текста.

In [None]:
%matplotlib notebook

import math
from math import sin, cos, tan, asin, acos, atan2, pi, sqrt
import random
from statistics import mean

import numpy as np
from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt


# Число мономерных звеньев / сегментов полимерной цепи
SEGMENT_COUNT = 200

# Валентный угол
ANGLE_DEG = 109


def normalize(v):
    norm = np.linalg.norm(v)
    return v / norm

LENGTH = 1
angle = math.radians(ANGLE_DEG)
i_vector = np.array([1, 0, 0])

assert angle > 0
assert angle < pi

r = LENGTH
theta = pi - angle

def calc():
    points = [np.array([0, 0, 0]), np.array([0.1, 0.1, math.sqrt(0.98)])]
    for index in range(SEGMENT_COUNT - 1):
        prev_point = points[index]
        curr_point = points[index + 1]
        prev_vector = curr_point - prev_point
        circle_center = curr_point + prev_vector * cos(theta)
        circle_radius = LENGTH * sin(theta)

        u = normalize(np.cross(prev_vector, i_vector))
        v = normalize(np.cross(prev_vector, u))
        t = random.uniform(0, 2 * pi)
        next_point = circle_center + circle_radius * cos(t) * u + circle_radius * sin(t) * v
        points.append(next_point)

    distance = np.linalg.norm(points[0] - points[-1])
    return points, distance

def draw():
    get_ipython().magic('matplotlib notebook')
    points, distance = calc()
    fig = plt.figure(figsize=[10, 6], dpi=80)
    ax = fig.add_subplot(111, projection='3d')

    for idx, point in enumerate(points):
        ax.scatter(*point, c='b', marker='o')
        if idx != 0:
            ax.plot([points[idx - 1][0], points[idx][0]],
                    [points[idx - 1][1], points[idx][1]],
                    zs=[points[idx - 1][2], points[idx][2]],
                    color='blue')

    ax.scatter(*points[0], c='r', marker='o')
    ax.scatter(*points[-1], c='r', marker='o')
    ax.plot([points[-1][0], points[0][0]],
            [points[-1][1], points[0][1]],
            zs=[points[-1][2], points[0][2]],
            dashes=(1, 3),
            color='red')

    min_x = min(a[0] for a in points)
    min_y = min(a[1] for a in points)
    min_z = min(a[2] for a in points)
    max_x = max(a[0] for a in points)
    max_y = max(a[1] for a in points)
    max_z = max(a[2] for a in points)
    avg_x = np.mean([a[0] for a in points])
    avg_y = np.mean([a[1] for a in points])
    avg_z = np.mean([a[2] for a in points])
    max_scale_length = max([max_x - min_x, max_y - min_y, max_z - min_z])
    ax.set_xlim3d([avg_x - 0.4 * max_scale_length, avg_x + 0.4 * max_scale_length])
    ax.set_ylim3d([avg_y - 0.4 * max_scale_length, avg_y + 0.4 * max_scale_length])
    ax.set_zlim3d([avg_z - 0.4 * max_scale_length, avg_z + 0.4 * max_scale_length])
    
    return distance

def draw_1d_scatter(points):
    get_ipython().magic('matplotlib inline')
    fig, ax = plt.subplots(figsize=(8, 1))
    ax.scatter(points, np.zeros_like(points), s=200, marker='|')
    ax.get_yaxis().set_visible(False)
    ax.spines['top'].set_visible(False)
    ax.spines['right'].set_visible(False)
    ax.spines['bottom'].set_visible(False)
    ax.spines['left'].set_visible(False)
    return ax

distances = []

Отлично! Теперь можно переходить непосредственно к моделированию — нажмите ▶▮ возле ячейки ниже, и будет сгенерирована и отображена случайная макромолекула согласно созданной модели.

In [None]:
distance = draw()
distances.append(distance)
print('R = {}'.format(distance))

Мы смоделировали одну макромолекулу (модель можно вращать с помощью мыши). Конформация цепи характеризуется вектором $R$, соединяющим её концы — на изображении он показан красной пунктирной линией. Его длина выведена под изображением.

Попробуйте ещё несколько раз выполнить последний шаг, чтобы сгенерировать несколько разных макромолекул.

После этого давайте посмотрим на распределение получившихся расстояний между концами цепи — для этого запустите следующий шаг.

In [None]:
draw_1d_scatter(distances)
plt.show()

Если вы запускали моделирование не слишком много раз, скорее всего, полученное распределение выглядит, как не подчиняющееся какому-то закону: слишком велика роль случайности. Давайте попробуем сгенерировать 100 макромолекул и выведем получившееся распределение:

In [None]:
NUMBER_OF_SIMULATIONS = 100
distances = [calc()[1] for _ in range(NUMBER_OF_SIMULATIONS)]
draw_1d_scatter(distances)
plt.show()

Теперь видно, что распределение тяготеет к определенному среднему значению (можно запустить шаг еще несколько раз и убедиться). Поскольку все ориентации сегментов равноправны, $\overline{R} = 0$, поэтому размеры клубка обычно характеризуют среднеквадратичным расстоянием между концами цепи — $\sqrt{\overline{R^2}}$.

Чтобы вычислить $\overline{R^2}$, обозначим через $х_{i}$ радиус-вектор начала $i$-гo сегмента,
радиус-вектор его конца будет $x_{i+1}$. Введем также «векторы
связей» $u_i = x_{i+1} - x_i$. Тогда вектор расстояния между концами цепи равен

\begin{equation}
R = \sum_{i=1}^N u_i,
\end{equation}

поэтому

\begin{equation}
\overline{R^2} = \overline{\left(\sum_{i=1}^N u_i\right)^2} = \sum_{i=1}^N \overline{u_i^2} + 2\mathop{\sum\sum}_{1\leq i<j\leq N} \overline{u_i u_j}
\end{equation}

Для цепи с фиксированными валентными углами [1]:

\begin{equation}
\overline{R^2} = Nb^2 + 2b^2 \sum_{i=1}^N \sum_{k=1}^{N-i} \overline{cos\alpha_{i, i+k}} = Nb^2 + 2b^2 \sum_{i=1}^N \sum_{k=1}^{N-i} \left(cos\theta\right)^k
\end{equation}

Просуммировав геометрическую прогрессию, получим:

\begin{equation}
\overline{R^2} = Nb^2\left[\frac{1+\cos\theta}{1-\cos\theta} - \frac{2}{N}\cos\theta\frac{1-(\cos\theta)^N}{(1-\cos\theta)^2}\right] \tag{1}
\end{equation}

Нетрудно заметить, что при $N\to\infty$ выражение $\frac{2}{N}\cos\theta\frac{1-(\cos\theta)^N}{(1-\cos\theta)^2} \to 0$, что позволяет записать выражение для среднеквадратичного расстояния между концами цепи в виде:

\begin{equation}
\overline{R^2} \cong Nb^2\frac{1+\cos\theta}{1-\cos\theta} \tag{2}
\end{equation}

\begin{equation}
\sqrt{\overline{R^2}} \cong \sqrt{N} b \sqrt{\frac{1+\cos\theta}{1-\cos\theta}} \tag{3}
\end{equation}

Давайте рассчитаем получившееся среднеквадратичное расстояние между концами сгенерированных нами 100 цепей:

\begin{equation}
\sqrt{\overline{R^2}} = \sqrt{\frac{\sum_{i=1}^{N}R_i^2}{N}},
\end{equation}

и сравним его со значениями, рассчитанными согласно выражениям (1) и (3) на основе использованных валентного угла и длины сегмента:

In [None]:
calculated_mean_distance = sqrt(mean([x**2 for x in distances]))

a = (1 + cos(theta)) / (1 - cos(theta))
theoretical_mean_distance = sqrt(SEGMENT_COUNT * (LENGTH ** 2) * a)

b = 2 / SEGMENT_COUNT * cos(theta) * (1 - (cos(theta) ** SEGMENT_COUNT)) / (1 - cos(theta)) ** 2
precise_theoretical_mean_distance = sqrt(SEGMENT_COUNT * (LENGTH ** 2) * (a - b))

print("Получено:      ", calculated_mean_distance)
print("Теор. (≈, N→∞):", theoretical_mean_distance)
print("Теор. (точно): ", precise_theoretical_mean_distance)

ax = draw_1d_scatter(distances)
ax.scatter(calculated_mean_distance, 0, s=2000, color='red', marker='|')
ax.scatter(precise_theoretical_mean_distance, 0, s=2000, color='green', marker='|')
plt.show()

Отлично — благодаря тому, что сгенерировано достаточно много цепей, такое экспериментальное среднеквадратичное значение, скорее всего, близко к предсказанному теоретически. Красной чертой на графике отмечено среднеквадратичное значение, определенное на основе смоделированных макромолекул, а зеленой — вычисленное согласно выражению (3). Подобный способ вычисления значения, основанный на многократном расчете согласно некоторой модели и вычислении вероятностных характеристик рассматриваемого процесса на основании полученных данных, называют __методом Монте-Карло__.

Увеличив число моделируемых цепей (`NUMBER_OF_SIMULATIONS`) в коде предыдущего шага, можно еще повысить точность вычисляемого значения.

Теперь изучим распределение подробнее: дополнительно к вычислению среднего попробуем найти функцию, описывающую плотность вероятности этого распределения.

Пусть $P_n(R)$ — плотность вероятности того, что вектор, соединяющий концы N-звенной цепи, равен $R$. Для свободно-сочлененной цепи вектор $R$ равен сумме $N$ независимых случайных (по направлению) вкладов $u_i$. Согласно [центральной предельной теореме](https://ru.wikipedia.org/wiki/Центральная_предельная_теорема) распределение такой величины стремится к гауссову при $N\to\infty$. Другие модели идеальных цепей с различными механизмами
гибкости и без свободных сочленений сложнее, потому что последовательные элементарные сегменты в них не независимы друг от
друга по направлениям. Однако корреляция направлений очень
быстро, экспоненциально, убывает с расстоянием [2]. При экспоненциальном затухании корреляций центральная предельная теорема сохраняет силу, и представление любого идеального полимера в виде эффективной свободно-сочлененной цепи из куновских сегментов дает правильный результат для распределения вероятностей расстояния между концами цепи:

\begin{aligned}
P_n(R) &= \left(\frac{3}{2\pi Ll}\right)^{3/2}\exp{\left(-\frac{3R^2}{2Ll}\right)} = \\\\
&= \left(\frac{3}{2\pi\overline{R^2}}\right)^{3/2}\exp{\left(-\frac{3R^2}{2\overline{R^2}}\right)}
\end{aligned}

Гауссово распределение составляет, пожалуй, важнейшее и самое
характерное свойство идеального полимерного клубка. В этой связи
сам клубок часто называют гауссовым и даже идеальную цепь
называют гауссовой цепью.

Компоненты вектора $R$ ($R_x$, $R_y$, $R_z$) также подчиняются гауссову распределению, поэтому распределению квадрата расстояния между концами цепи $R^2 = R_x^2 + R_y^2 + R_z^2$ соответствует [распределение $\chi^2$](https://ru.wikipedia.org/wiki/Распределение_хи-квадрат) с тремя степенями свободы, а расстоянию между концами цепи $\|R\| = \sqrt{R_x^2 + R_y^2 + R_z^2}$ — [$\chi$-распределение](https://en.wikipedia.org/wiki/Chi_distribution) с тем же $k=3$, также известное как [распределение Максвелла](https://en.wikipedia.org/wiki/Maxwell–Boltzmann_distribution):

\begin{equation}
P_n\left(\|R\|\right) = \sqrt{\frac{2}{\pi}} \frac{x^2 \exp(-x^2/2a^2)}{a^3} \tag{4}
\end{equation}

Второй момент этого распределения, т. е. мат. ожидание величины $R^2$, равен $3a^2$. Приравнивая его к $R^2$, вычисленному согласно выражению (2), получим:

\begin{aligned}
3a^2 &= R^2 \\\\
a &= \frac{\sqrt{R^2}}{\sqrt3}
\end{aligned}

Теперь можно вычислить плотность вероятности (4) и сравнить её с гистограммой распределения расстояния между концами цепи, полученной в результате моделирование. Запустите следующий шаг, чтобы смоделировать 1000 макромолекул и отобразить гистограмму (это может занять несколько десятков секунд).

In [None]:
NUMBER_OF_SIMULATIONS = 1000
NUMBER_OF_HISTOGRAM_BINS = 20

def pdf(r):
    scale = sqrt(3 / mean([x**2 for x in distances]))
    x = r * scale
    return sqrt(2/pi) * x**2 * math.exp(-x**2/2) * scale

distances = [calc()[1] for _ in range(NUMBER_OF_SIMULATIONS)]

fig, ax = plt.subplots()
n, bins, patches = ax.hist(distances, NUMBER_OF_HISTOGRAM_BINS)
theoretical_pdf = [pdf(b) * NUMBER_OF_SIMULATIONS * (bins[1] - bins[0])
                   for b in range(int(bins[-1]) + 1)]
ax.plot(range(int(bins[-1]) + 1), theoretical_pdf, color='red', linestyle='dashed')
ax.set_xlabel('Среднеквадратичное расстояние между концами цепи')
ax.set_ylabel('Число макромолекул')
ax.set_title('Распределение макромолекул по размерам')
plt.show()

Синяя гистограмма — данные, полученные путем компьютерного моделирования, а красная кривая — плотность вероятности, рассчитанная на основе заданных длины и числа сегментов и валентного угла. Вы можете изменить число моделируемых макромолекул (`NUMBER_OF_SIMULATIONS`) и посмотреть, как это повлияет на то, насколько хорошо гистограмма будет соответствовать расчетному распределению (будьте готовы к тому, что вычисления могут занять больше времени при увеличении количества генерируемых цепей).

Теперь вы можете изменить длину (степень полимеризации) макромолекулы или валентный угол и посмотреть, как при этом будет изменяться вид и расстояние между концами макромолекулы. Для этого измените значения переменных `SEGMENT_COUNT` (число мономерных звеньев / сегментов) и `ANGLE_DEG` (валентный угол) в начале кода первого шага и заново выполните первый шаг и последующий.

[1] Высокомолекулярные соединения под ред. Зезина.

[2] Frielinghaus. Flexible Polymers / Lecture manuscripts of the 35th Spring School 2004: "Physics meets Biology - From Soft Matter to Cell Biology".

[1] Гросберг, Хохлов. Статистическая физика макромолекул.

[2] Хохлов, Кучанов. Лекции по физической химии полимеров.

[3] Френкель, Смит. Принципы компьютерного моделирования молекулярных систем.