# Сеть Эрдёша-Реньи

Рассмотрим сеть Эрдёша-Реньи с $N = 3000$ узлов, соединённых друг с другом с вероятностью $p = 10^{-3}$. Ответим на поставленные вопросы.

---

### (a) **Ожидаемое число связей, $\langle L \rangle$**

Ожидаемое число связей в сети Эрдёша-Реньи вычисляется по формуле:

$$
\langle L \rangle = \binom{N}{2} \cdot p
$$

Для $N = 3000$ и $p = 10^{-3}$:

$$
\binom{N}{2} = \frac{N(N-1)}{2} \approx \frac{3000 \cdot 2999}{2} = 4,498,500
$$

Следовательно:

$$
\langle L \rangle = 4,498,500 \cdot 10^{-3} = 4,498.5
$$

**Ответ**: Ожидаемое число связей $\langle L \rangle = 4,498.5$.

---

### (b) **Режим сети**

Режим сети определяется соотношением между $p$ и $N$:

- **Разреженный режим**: если $p \sim \frac{1}{N}$.
- **Плотный режим**: если $p \sim 1$.

В нашем случае $p = 10^{-3}$, а $\frac{1}{N} = \frac{1}{3000} \approx 3.33 \times 10^{-4}$. Поскольку $p$ немного больше $\frac{1}{N}$, сеть находится в **разреженном режиме**.

**Ответ**: Сеть находится в разреженном режиме.

---

### (c) **Критическая вероятность связи $p_c$**

Критическая точка наступает, когда средняя степень узла $\langle k \rangle = 1$. Средняя степень вычисляется как:

$$
\langle k \rangle = pN
$$

На критической точке:

$$
p_cN = 1 \implies p_c = \frac{1}{N}
$$

Для $N = 3000$:

$$
p_c = \frac{1}{3000} \approx 3.33 \times 10^{-4}
$$

**Ответ**: Критическая вероятность связи $p_c = 3.33 \times 10^{-4}$.

---

### (d) **Критическое число узлов $N_{cr}$ при $p = 10^{-3}$**

В критической точке $\langle k \rangle = 1$. Используем формулу для средней степени:

$$
\langle k \rangle = pN_{cr} = 1 \implies N_{cr} = \frac{1}{p}
$$

Для $p = 10^{-3}$:

$$
N_{cr} = \frac{1}{10^{-3}} = 1000
$$

**Ответ**: Критическое число узлов $N_{cr} = 1000$.

---

### (e) **Средняя степень $\langle k_{cr} \rangle$ и среднее расстояние $\langle d \rangle$**

1. **Средняя степень $\langle k_{cr} \rangle$:**

В критической точке средняя степень:

$$
\langle k_{cr} \rangle = 1
$$

2. **Среднее расстояние $\langle d \rangle$:**

Для сети в критической точке среднее расстояние между двумя узлами масштабируется как:

$$
\langle d \rangle \sim N^{1/3}
$$

Для $N = N_{cr} = 1000$:

$$
\langle d \rangle \sim 1000^{1/3} \approx 10
$$

**Ответ**: Средняя степень $\langle k_{cr} \rangle = 1$, среднее расстояние $\langle d \rangle \sim 10$.

---

### (f) **Распределение степеней $p_k$ (приближение Пуассона)**

Распределение степеней в сети Эрдёша-Реньи подчиняется биномиальному закону. Для больших $N$ и малых $p$ его можно приближать распределением Пуассона:

$$
p_k = \frac{\langle k \rangle^k e^{-\langle k \rangle}}{k!}
$$

В критической точке $\langle k \rangle = 1$. Таким образом:

$$
p_k = \frac{1^k e^{-1}}{k!} = \frac{e^{-1}}{k!}
$$

Для $k = 0, 1, 2, \dots$ расчёты:

- $p_0 = e^{-1} \approx 0.3679$
- $p_1 = \frac{e^{-1}}{1!} = 0.3679$
- $p_2 = \frac{e^{-1}}{2!} \approx 0.1839$
- $p_3 = \frac{e^{-1}}{3!} \approx 0.0613$

**Ответ**: Распределение степеней:

$$
p_k = \frac{e^{-1}}{k!}
$$

Это распределение Пуассона со средним значением $\langle k \rangle = 1$.


# Генерация сетей Эрдёша-Реньи.  

Используя модель \( G(N, p) \), сгенерируйте на компьютере три сети с количеством узлов \( N = 500 \) и средними степенями:  
- $ \langle k \rangle = 0.8 $,  
- $ \langle k \rangle = 1 $,  
- $ \langle k \rangle = 8 $.  

Визуализируйте эти сети

In [1]:
import networkx as nx
import matplotlib.pyplot as plt

# Parameters
N = 500
average_degrees = [0.8, 1, 8]

# Calculate probabilities for G(N, p) model
probabilities = [k / (N - 1) for k in average_degrees]

# Generate and visualize networks
for i, p in enumerate(probabilities):
    G = nx.erdos_renyi_graph(N, p)
    plt.figure(figsize=(8, 6))
    nx.draw(
        G, pos=nx.spring_layout(G), node_size=10, edge_color="gray", node_color="blue"
    )
    plt.title(f"Erd\u0151s-R\u00e9nyi Network: N={N}, <k>={average_degrees[i]}, p={p:.4f}")
    plt.show()


ModuleNotFoundError: No module named 'networkx'

# Круговая сеть

Рассмотрите сеть, состоящую из $N$ узлов, расположенных на окружности, так что каждый узел соединён с $m$ соседями с каждой стороны (соответственно, степень каждого узла равна $2m$). На изображении показан пример такой сети с $m = 2$ и $N = 20$.

Вам нужно вычислить средний коэффициент кластеризации $\langle C \rangle$ и среднюю длину кратчайшего пути $\langle d \rangle$ для этой сети. Для упрощения предположим, что $N$ и $m$ выбраны так, что $(N - 1) / 2m$ является целым числом. 

Вопросы:
1. Что произойдет с $\langle C \rangle$, если $N >> 1$?
2. Что произойдет с $\langle d \rangle$, если $N >> 1$?

In [2]:
import networkx as nx
import numpy as np

def create_circle_network(N, m):
    """
    Create a circle network with N nodes where each node connects to m neighbors on each side.
    
    Parameters:
        N (int): Number of nodes
        m (int): Number of neighbors on each side
    
    Returns:
        G (networkx.Graph): The generated circle network
    """
    G = nx.Graph()
    for i in range(N):
        for j in range(1, m + 1):
            G.add_edge(i, (i + j) % N)  # Connect to m neighbors on the right
            G.add_edge(i, (i - j) % N)  # Connect to m neighbors on the left
    return G

def analyze_circle_network(N, m):
    """
    Analyze the circle network for average clustering coefficient and average shortest path.
    
    Parameters:
        N (int): Number of nodes
        m (int): Number of neighbors on each side
    
    Returns:
        avg_clustering (float): Average clustering coefficient
        avg_shortest_path (float): Average shortest path length
    """
    G = create_circle_network(N, m)
    avg_clustering = nx.average_clustering(G)
    avg_shortest_path = nx.average_shortest_path_length(G)
    return avg_clustering, avg_shortest_path

# Example usage
N = 20  # Number of nodes
m = 2   # Number of neighbors on each side
avg_clustering, avg_shortest_path = analyze_circle_network(N, m)

print(f"Average clustering coefficient (C): {avg_clustering}")
print(f"Average shortest path length (d): {avg_shortest_path}")

# As N >> 1, analyze behavior
large_N = 1000
avg_clustering_large, avg_shortest_path_large = analyze_circle_network(large_N, m)
print(f"For N >> 1 (N={large_N}):")
print(f"Average clustering coefficient (C): {avg_clustering_large}")
print(f"Average shortest path length (d): {avg_shortest_path_large}")


Average clustering coefficient (C): 0.5
Average shortest path length (d): 2.8947368421052633
For N >> 1 (N=1000):
Average clustering coefficient (C): 0.5
Average shortest path length (d): 125.37537537537537


# Дерево Кэли

**Задача**

Дерево Кэли — это симметричное дерево, построенное, начиная с центрального узла степени $k$. Каждый узел на расстоянии $d$ от центрального узла имеет степень $k$, пока мы не достигнем узлов на расстоянии $P$, которые имеют степень $1$ и называются листьями.

- Рассчитайте количество узлов, достижимых за $t$ шагов от центрального узла.
- Определите распределение степеней в сети.
- Вычислите диаметр $d_{max}$.
- Найдите выражение для диаметра $d_{max}$ в терминах общего количества узлов $N$.
- Показывает ли сеть свойство маломирности?

## Решение задачи в общем виде

1. **Количество узлов, достижимых за $t$ шагов от центрального узла**:
   Общее количество узлов, достижимых за $t$ шагов, можно рассчитать по формуле:
   $$
   N_t = \sum_{p=1}^t k \cdot (k-1)^{p-1} + 1,
   $$
   где $k$ — степень центрального узла, $t$ — количество шагов, а $+1$ добавляется для учета центрального узла.

2. **Распределение степеней**:
   - Центральный узел имеет степень $k$.
   - Узлы на уровне $d = 1, \dots, P-1$ имеют степень $k$.
   - Листовые узлы (на уровне $d = P$) имеют степень $1$.

   Распределение степеней можно представить как:
   - Количество узлов степени $k$:
     $$
     N_k = 1 + \sum_{p=1}^{P-1} k \cdot (k-1)^{p-1}.
     $$
   - Количество узлов степени $1$ (листьев):
     $$
     N_1 = k \cdot (k-1)^{P-1}.
     $$

3. **Диаметр дерева $d_{max}$**:
   Диаметр дерева определяется как максимальное расстояние между двумя узлами. Для дерева Кэли это значение равно удвоенной глубине дерева:
   $$
   d_{max} = 2P.
   $$

4. **Выражение для $d_{max}$ в терминах общего количества узлов $N$**:
   Общее количество узлов в дереве Кэли:
   $$
   N = \sum_{p=1}^P k \cdot (k-1)^{p-1} + 1.
   $$
   Решая это уравнение относительно $P$, можно выразить $d_{max}$:
   $$
   P = \log_{k-1}\left(\frac{N-1}{k}\right) + 1, \quad d_{max} = 2P.
   $$

5. **Свойство маломирности**:
   Сеть не демонстрирует свойства маломирности, так как диаметр $d_{max}$ растет логарифмически с увеличением общего количества узлов $N$, что не соответствует критерию маломирности (диаметр должен расти медленно, пропорционально логарифму от логарифма числа узлов).

Таким образом, дерево Кэли обладает строгой структурой и не удовлетворяет свойству маломирности, хотя его диаметр логарифмически зависит от числа узлов.

![image.png](attachment:image.png)


In [2]:
import math

def cayley_tree_properties(k, P):
    """
    Calculate properties of a Cayley tree.

    Args:
        k (int): Branching factor (degree of central node).
        P (int): Maximum distance from the central node.

    Returns:
        dict: Contains reachable nodes, degree distribution, diameter, total nodes, and small-world property.
    """
    # Calculate total number of nodes in the tree
    total_nodes = sum(k * (k - 1) ** (p - 1) for p in range(1, P + 1)) + 1

    # Diameter of the tree (max distance between any two nodes)
    diameter = 2 * P

    # Small-world property (in Cayley tree, not present because diameter grows logarithmically with number of nodes)
    small_world = "No"

    # Degree distribution (node degree vs. count)
    degree_distribution = {
        1: k * (k - 1) ** (P - 1)  # Leaf nodes
    }
    degree_distribution[k] = 1  # Central node
    for p in range(1, P):
        degree_distribution[k] = degree_distribution.get(k, 0) + k * (k - 1) ** (p - 1)

    # Reachable nodes in t steps from central node
    def reachable_nodes(t):
        if t > P:
            t = P
        return sum(k * (k - 1) ** (p - 1) for p in range(1, t + 1)) + 1

    return {
        "total_nodes": total_nodes,
        "diameter": diameter,
        "small_world_property": small_world,
        "degree_distribution": degree_distribution,
        "reachable_nodes_function": reachable_nodes
    }

# Example usage
k = 3  # Degree of the central node
P = 5  # Maximum distance
properties = cayley_tree_properties(k, P)

print("Total number of nodes:", properties["total_nodes"])
print("Diameter:", properties["diameter"])
print("Small-world property:", properties["small_world_property"])
print("Degree distribution:", properties["degree_distribution"])

# Reachable nodes in t steps from the central node
t = 3
print(f"Nodes reachable in {t} steps:", properties["reachable_nodes_function"](t))


Total number of nodes: 94
Diameter: 10
Small-world property: No
Degree distribution: {1: 48, 3: 46}
Nodes reachable in 3 steps: 22


## Часть A. Базовая «снобистская» сеть

Предположим:

- Имеется \(N\) **красных** узлов и \(N\) **синих** узлов, всего \(2N\) узлов.  
- Каждая пара узлов **одинакового** цвета (оба красные или оба синие) соединяется с вероятностью $p$.  
- Каждая пара узлов **разного** цвета (красный и синий) соединяется с вероятностью $q$.  
- Сеть называется «снобистской», если $p > q$ (то есть существует тенденция соединяться с узлами своего цвета).

---

### 1. Средняя степень в «синей» подсети и в полной сети

1. **Средняя степень в синей подсети**  
   - Рассматриваем только $N$ синих узлов.  
   - Каждый синий узел соединяется с каждым другим синим узлом (их $N-1$) с вероятностью $p$.  
   - Следовательно, ожидаемая (средняя) степень одного синего узла **внутри синей подсети**:
     $$
     k_{\text{blue-sub}} = p \,(N - 1).
     $$

2. **Средняя степень в полной сети**  
   - Возьмём типичный синий узел.  
   - У него есть $N - 1$ синих «соседей» (каждый появляется с вероятностью $p$) и $N$ красных (каждый с вероятностью $q$).  
   - Тогда ожидаемая суммарная степень синего узла **во всей сети**:
     $$
     k_{\text{full}} = p \,(N - 1) + q \, N.
     $$
   - По симметрии, тот же результат верен и для красного узла (просто «синий» и «красный» меняются местами).

Итого получаем:
$$
k_{\text{blue-sub}} = p\,(N - 1), 
\quad
k_{\text{full}} = p\,(N - 1) + q\,N.
$$

---

### 2. Минимальные $p$ и $q$ для связности (одна компонента) с высокой вероятностью

Чтобы вся сеть из $2N$ узлов **с высокой вероятностью** (whp) была связна (была одной компонентой), необходимо:

1. **Связность внутри каждого цвета**  
   - Подсеть из $N$ красных узлов (случайный граф $G(N, p)$) должна быть связной или хотя бы иметь гигантскую компоненту.  
   - Известный порог для $G(N, p)$: 
     $$
     p \;\gtrsim\; \frac{\ln N}{N}.
     $$
   - Ниже этого значения подсеть, скорее всего, распадается; выше — почти наверняка связна.

2. **Достаточно мостов между красными и синими**  
   - Всего возможных «межцветных» рёбер $N \times N = N^2$.  
   - Каждое возникает с вероятностью $q$.  
   - Ожидаемое число таких рёбер равно $q \, N^2$.  
   - Чтобы с высокой вероятностью межцветных рёбер хватило «склеить» красную и синюю компоненты, нужно:
     $$
     q \, N^2 \;\gtrsim\; \ln N
     \quad\Longrightarrow\quad
     q \;\gtrsim\; \frac{\ln N}{N^2}.
     $$

Отсюда пороги (с точностью до констант):
$$
p \;\gtrsim\; \frac{\ln N}{N}, 
\quad
q \;\gtrsim\; \frac{\ln N}{N^2}.
$$

---

### 3. Свойство «малого мира» даже при сильной «снобистскости»

Сеть обладает свойством «малого мира», если типичное расстояние между двумя узлами (средняя длина кратчайшего пути) растёт не быстрее, чем порядка $\ln(2N)$.

Даже если $p \gg q$ (сеть очень «снобистская»), достаточно, чтобы:

1. Каждая подсеть (красная и синяя) была «выше порога гигантской компоненты» ($p \, N \gtrsim 1$) и, значит, имела диаметр порядка $\log N$ или меньше.  
2. Межцветных связей было достаточно ($q \, N^2 \gtrsim 1$), чтобы связать две крупные компоненты.

Тогда расстояние между любыми двумя узлами (даже разных цветов) остаётся порядка $\log N$. Иными словами, сеть сохранит «малый мир» несмотря на сильную гомофилию ($p \gg q$).

---

## Часть B. «Снобистские» соцсети с «пурпурными» узлами

Теперь рассмотрим модель:

- Имеется $2N$ «основных» узлов, разделённых поровну на $N$ красных и $N$ синих.  
- Некоторая доля $f$ (из всех $2N$) является **пурпурными** (purple).  
- При этом:
  - Красные и синие **не** соединяются напрямую ($q = 0$).  
  - Красные соединяются с красными с вероятностью $p$.  
  - Синие соединяются с синими с вероятностью $p$.  
  - **Пурпурные** соединяются и с красными, и с синими (всё та же вероятность $p$).

То есть пурпурные узлы играют роль единственного «моста» между красными и синими.

---

### 1. Когда красное и синее сообщества «интерактивны»?

> **Определение**:  
> Красное и синее сообщества *интерактивны*, если типичный красный узел отстоит всего на два шага от синего (и наоборот).

Иными словами, для **типичной** пары $(r, b)$ «красный–синий» существует **хотя бы один** пурпурный узел, связанный и с $r$, и с $b$. Значит, мы хотим, чтобы:

$$
\mathrm{dist}(r, b) = 2
$$

(с высокой вероятностью).

- Общее число пурпурных узлов: $f \cdot (2N)$.  
- Каждый пурпурный узел соединяется с данным красным узлом с вероятностью $p$ и с данным синим узлом с вероятностью $p$ (независимо).  
- Вероятность того, что **конкретный** пурпурный узел **не** является общим соседом пары $(r, b)$, равна $1 - p^2$.  
- Тогда вероятность, что **ни один** из $f (2N)$ пурпурных узлов не связывает $r$ и $b$, равна:
  $$
  (1 - p^2)^{\,f (2N)}.
  $$
- Хотим, чтобы эта вероятность была очень мала. Приблизительно это достигается, когда:
  $$
  f (2N) \, p^2 \;\gtrsim\; 1
  \quad\Longrightarrow\quad
  f \;\gtrsim\; \frac{1}{2N \, p^2}.
  $$

Следовательно, **критическая доля** $f$ пурпурных узлов, необходимая для того, чтобы любой красный был всего в двух шагах от любого синего (и наоборот), оценивается как:

$$
f_{\text{critical}} \;\sim\; \frac{1}{N\,p^2}.
$$

(Пропуская постоянные факторы.)

---

### 2. Размер пурпурного сообщества при $\langle k \rangle \gg 1$

Пусть средняя степень $\langle k \rangle$ (для красного или синего узла) в своих подсетях велика. Тогда:

$$
\langle k \rangle \;=\; p\,N \;\gg\; 1
\quad\Longrightarrow\quad
p \;\gg\; \frac{1}{N}.
$$

В таком случае:

$$
f_{\text{critical}} 
\;\sim\; \frac{1}{p^2 \, N}
\;\ll\; 1,
$$

если $p\,N \gg 1$. То есть если каждая подсеть (красная или синяя) уже сама по себе хорошо связана, то даже **очень малая** доля $f$ пурпурных узлов гарантирует, что любой красный и любой синий окажутся всего в двух шагах друг от друга.

---

### 3. Выводы о структуре реальных (социальных и не только) сетей

Даже при сильной гомофилии (когда $q = 0$ и красные/синие не имеют прямых рёбер) **небольшое** число «двуязычных» (пурпурных) узлов может **радикально уменьшить** расстояния между двумя большими сообществами:

- Достаточно сравнительно маленькой фракции «брокерских» пурпурных узлов, чтобы все красные и синие оказались на расстоянии двух-трёх шагов друг от друга.  
- Это согласуется с наблюдениями в реальных сетях: группы (по географии, профессии и т. п.) обычно тесно связаны внутри себя и редко связываются с «чужими», однако наличие крохотного «моста» (пурпурные узлы, обладающие связями с обеими группами) обеспечивает короткие пути в масштабе всей сети — «эффект малого мира».

В социальном контексте (в духе «слабых связей» Грановеттера и феномена «шести рукопожатий») даже ярко выраженная гомофилия может сочетаться с очень малыми расстояниями, если существует крошечная прослойка «мостовых» индивидуумов, связывающих разные кластеры.

---

## Итоговые ключевые моменты

1. **Базовая двуцветная «снобистская» модель**  
   - Средняя степень синего узла *внутри* синей подсети: $p\,(N - 1)$.  
   - Средняя степень (учитывая и потенциальных красных соседей): $p\,(N - 1) + q\,N$.  
   - Чтобы сеть была связна (одна компонента) с высокой вероятностью, нужно примерно:
     $$
     p \;\gtrsim\; \frac{\ln N}{N}, 
     \quad
     q \;\gtrsim\; \frac{\ln N}{N^2}.
     $$
   - При $p\,N \gg 1$ и $q\,N^2 \gtrsim 1$ сеть обладает свойством «малого мира» (расстояния порядка $\log N$) даже при $p \gg q$.

2. **Модель с пурпурными узлами**  
   - $q = 0$ (никаких прямых связей между красными и синими).  
   - Пурпурные узлы соединяются с красными и с синими с вероятностью $p$.  
   - «Интерактивность» красного и синего сообществ (расстояние 2 между любым красным и любым синим) достигается, если:
     $$
     f \,(2N)\,p^2 \;\gtrsim\; 1
     \quad\Longrightarrow\quad
     f \;\gtrsim\; \frac{1}{2N\,p^2}.
     $$
   - Если $\langle k \rangle = p\,N \gg 1$, то даже **очень малая** доля $f$ позволяет «пробросить мост» между всеми красными и синими узлами.  
   - **Социальный (и общий) смысл**: сильная гомофилия вполне совместима с «малым миром», если есть пусть и маленькая прослойка «пурпурных» узлов (брокеров, двуязычных, связанных с обеими группами).