## Задача: Критический порог случайного удаления узлов \(f_c\) для различных распределений

Нам нужно вычислить критический порог фрагментации сети 
\[
f_c \;=\; 1 \;-\; \frac{1}{\frac{\langle k^2 \rangle}{\langle k \rangle} \;-\; 1}
\]
для трёх случаев:

1. **Степенной закон с экспоненциальной отсечкой** (power law with exponential cutoff).  
2. **Логнормальное распределение** (lognormal).  
3. **Дельта-распределение** (все узлы имеют одинаковую степень).  

При этом:
- Сети считаются **бесконечными** и **некоррелированными** (отсутствует корреляция между степенями соседних узлов).
- \(\langle k \rangle\) и \(\langle k^2 \rangle\) обозначают соответственно первый и второй моменты распределения степеней.

Ниже приводятся ключевые формулы, а также обсуждается, как полученные результаты влияют на робастность сети.

---

### Общая формула для \(f_c\)

Для сети с заданным распределением степеней \(p_k\) в рамках *теории перколяции* показывается, что при **случайном** удалении узлов сеть теряет связность (распадается на множество кластеров) после удаления доли
\[
f_c \;=\; 1 \;-\;
\frac{1}{\bigl(\tfrac{\langle k^2\rangle}{\langle k\rangle}\bigr) - 1}.
\]
Эквивалентно это можно переписать в виде:
\[
f_c \;=\; 1 \;-\; \frac{\langle k \rangle}{\langle k^2 \rangle \;-\; \langle k \rangle}.
\]
Таким образом, **ключом** к нахождению \(f_c\) является соотношение между \(\langle k \rangle\) и \(\langle k^2 \rangle\).

---

## 1. Степенной закон с экспоненциальной отсечкой

**Форма распределения.** Пусть
\[
p_k \; \sim \; k^{-\gamma}\, e^{-\,\frac{k}{k_c}},
\]
где \(\gamma>1\) и \(k_c\) — характерная «экспоненциальная» шкала («cutoff»).

1. **Моменты** \(\langle k\rangle\) и \(\langle k^2\rangle\) в такой модели, в отличие от «чисто степенного» распределения, **конечны** благодаря экспоненциальной отсечке:
   \[
   \langle k^m\rangle \;=\;
   \sum_{k=1}^{\infty} k^m\,k^{-\gamma}\,e^{-\,k/k_c}
   \;\;\approx\;\;
   \int_{1}^{\infty} x^{m-\gamma}\,e^{-\,x/k_c}\,dx,
   \]
   что сходится для любых \(\gamma\) при \(k_c>0\).

2. **Критический порог** \(f_c\).  
   Поскольку \(\langle k^2\rangle\) конечно, то величина
   \(\frac{\langle k^2\rangle}{\langle k\rangle}\) **не бесконечна**, а значит,
   \[
   f_c \;=\; 1 \;-\;
   \frac{1}{\bigl(\frac{\langle k^2 \rangle}{\langle k \rangle}\bigr) - 1}
   \]
   будет **конечным числом** строго меньше 1.

**Вывод по робастности.**  
Для сети со степенным законом и экспоненциальной отсечкой всегда существует **ненулевой конечный** порог \(f_c\). Сеть **не обладает** «безграничной» устойчивостью к случайным отказам (в отличие от «идеального» scale-free при \(\gamma < 3\) без отсечки). То есть, удалив некоторую конечную долю узлов, мы гарантированно фрагментируем сеть.

---

## 2. Логнормальное распределение (lognormal)

**Форма распределения.** Пусть
\[
p_k \;\sim\; \frac{1}{k\,\sigma\,\sqrt{2\pi}}
\;\exp\!\Bigl(\,-\,\frac{(\ln k - \mu)^2}{2\,\sigma^2}\Bigr),
\]
при \(k=1,2,\dots\)

1. **Моменты**. Логнормальное распределение обладает **всеми конечными моментами**:
   \[
   \langle k^m\rangle \;=\; 
   \exp\!\Bigl(m\,\mu \;+\; \tfrac{m^2\,\sigma^2}{2}\Bigr),
   \]
   (здесь мы используем непрерывную аппроксимацию для наглядности). Это означает, что
   \(\langle k \rangle\) и \(\langle k^2\rangle\) вполне конечны.

2. **Критический порог** \(f_c\) снова вычисляется по общей формуле. Поскольку
   \(\langle k^2 \rangle / \langle k\rangle\) конечно, мы имеем
   \[
   f_c \;=\; 1 \;-\; \frac{1}{\bigl(\tfrac{\langle k^2\rangle}{\langle k\rangle}\bigr) \;-\; 1},
   \]
   и это число, как и в предыдущем случае, строго меньше 1.

**Вывод по робастности.**  
Сеть с логнормальным распределением степеней ведёт себя «похожим» образом на сети с другими распределениями, у которых второй момент конечен: имеется **конечный** \(f_c\). Следовательно, **случайные отказы** крупной, но конечной доли узлов могут разрушить гигантскую компоненту.

---

## 3. Дельта-распределение (все узлы имеют одну и ту же степень)

**Форма распределения.** Пусть
\[
p_k \;=\; \delta_{k,\,k_0},
\]
то есть **каждый** узел в сети имеет одинаковую степень \(k_0\).

1. **Моменты**:
   \[
   \langle k \rangle \;=\; k_0, 
   \quad
   \langle k^2 \rangle \;=\; k_0^2.
   \]
   Тогда
   \(\tfrac{\langle k^2\rangle}{\langle k\rangle} = \tfrac{k_0^2}{k_0} = k_0.\)

2. **Критический порог**:
   \[
   f_c 
   \;=\;
   1 \;-\;
   \frac{1}{\frac{\langle k^2\rangle}{\langle k\rangle} - 1}
   \;=\;
   1 \;-\;
   \frac{1}{k_0 - 1}
   \;=\;
   \frac{k_0 - 2}{\,k_0 - 1\,}.
   \]
   - Если \(k_0=2\), то \(f_c = 0\). Это означает, что удаление **любой** доли узлов (сколь угодно малой, но \(>0\)) фрагментирует «цепочку» из трёх и более узлов.
   - Если \(k_0>2\), тогда \(f_c>0\), и нужно удалить уже некоторую конечную долю узлов, чтобы разрушить гигантскую компоненту.

**Вывод по робастности.**  
При дельта-распределении сеть — это **регулярный граф** степени \(k_0\). У него существует чёткая «точка перелома» при \(\frac{k_0 - 2}{k_0 - 1}\). Чем больше \(k_0\), тем выше \(f_c\), и тем прочнее сеть при случайном удалении.

---

## Обсуждение и сравнительный итог

1. **Фактор \(\langle k^2\rangle\).** Во всех трёх случаях (степенной с отсечкой, логнормальный, дельта-распределение) второй момент \(\langle k^2\rangle\) **конечен**. Следовательно, всегда есть **конечный** критический порог \(f_c < 1\).

2. **Сравнение с «чисто» scale-free (\(\gamma < 3\) без отсечки).** Там \(\langle k^2\rangle \to \infty\), что в пределе ведёт к \(f_c \to 1\). То есть такая сеть может «держаться» практически до полного удаления узлов. Но малейшая целенаправленная атака по хабам её быстро разрушает (так называемая «Ахиллесова пята»).

3. **Практические следствия.** 
   - **Power law + cutoff** и **lognormal** часто встречаются в реальных данных (например, если есть «длинные хвосты», но не настолько тяжёлые, чтобы делать \(\langle k^2\rangle\) бесконечным). Для них характерен **ненулевой** \(f_c\); сеть рушится, если удалить достаточно большую, но конечную фракцию узлов.
   - **Дельта-распределение** — идеализированный случай регулярного графа. С ростом \(k_0\) такая сеть становится весьма устойчивой к случайным поломкам (порог \(f_c\) растёт).
   - При этом, если бы мы обсуждали **целевые атаки** (targeted attacks), то во всех моделях удаление главных «центральных» узлов (при их наличии) дало бы пониженную устойчивость. Но здесь задача касалась именно **случайных** отказов.

Таким образом, **если второй момент конечен**, сеть обладает **конечным** порогом фрагментации \(0 < f_c < 1\). Это значит, что при случайном удалении достаточно большой (но всё же меньшей 100%) доли узлов система распадётся на множество несвязанных компонент. Это контрастирует с «чистыми» масштабными сетями (\(\gamma < 3\) без отсечки), которые формально имеют \(f_c = 1\) и демонстрируют «анomalous robustness» к случайным сбоям.

**Решение задачи: Критический порог в коррелированных сетях**

Ниже приводится логика и общая структура решения задачи. Предполагается, что у нас есть доступ к программе (скрипту) для генерации трёх различных типов сетей — ассоциативной, дисассоциативной и «нейтральной» (без заметной ассортативности/дисассортативности). Мы хотим:

1. Сгенерировать три сети по алгоритму Xalvi-Brunet & Sokolov (или похожему методу), которые удовлетворяют:
   - \( N = 10^4 \) узлов.
   - Распределение степеней \(\;p(k) \sim k^{-\gamma}\), где \(\gamma = 2.2\).
2. Для каждой сети:
   - **Последовательно** удалять случайную долю узлов \(f\).
   - На каждом шаге вычислять 
     \[
       \frac{P_{\infty}(f)}{P_{\infty}(0)},
     \]
     то есть относительный размер гигантской компоненты. \(P_{\infty}(0)\) — размер гигантской компоненты без удаления узлов (при \(f=0\)), а \(P_{\infty}(f)\) — размер гигантской компоненты при удалении доли \(f\) узлов.
3. Сравнить кривые \(\;P_{\infty}(f) / P_{\infty}(0)\;\) для трёх типов сетей и определить, какая сеть наиболее робастна к **случайным** (random) отказам/удалениям узлов.

---

## 1. Генерация коррелированных сетей (Xalvi-Brunet & Sokolov)

**Цель:** получить три сети (assortative, disassortative, neutral) с одинаковым степенным распределением \(\gamma=2.2\), но с разными **корреляционными свойствами**.

Алгоритм Xalvi-Brunet & Sokolov (XBS) в упрощённом виде:
1. Сначала генерируем желаемое распределение степеней (например, по конфигурационной модели): выбираем для каждого узла \(i\) его степень \(k_i\) так, чтобы суммарное число полу-рёбер (stub) было чётным.
2. Далее — «перестановки рёбер» (edge rewiring) с дополнительным критерием, регулирующим уровень ассортативности/дисассортативности.  
   - Ассортативность (\(+\)): узлы с высокой степенью предпочитают связываться с узлами тоже высокой степени.  
   - Дисассортативность (\(-\)): узлы с высокой степенью хотят связываться с узлами низкой степени, и наоборот.  
   - Нейтральный вариант (0): нет предпочтения в соединениях, сохраняется изначально заданная (практически случайная) структура.

При этом важно «заморозить» распределение степеней \(p(k)\), чтобы оно оставалось степенным. Меняем только то, **как** эти степени «сопрягаются» между собой.

---

## 2. Проверка робастности к случайным отказам

1. **Удаление узлов**  
   Случайно выбираем узлы, пока их доля \(f\) не будет удалена.  
2. **Измеряем \(P_{\infty}(f)\)**  
   - На каждом шаге считаем компоненту наибольшего размера (giant component).  
   - Нормируем её на исходный размер \(\;P_{\infty}(0)\).  
3. **Получаем кривые**  
   \[
     \frac{P_{\infty}(f)}{P_{\infty}(0)} \quad \text{vs.} \quad f
   \]
   для каждой из трёх сетей.

---

## 3. Сравнение ассортативной, дисассортативной и нейтральной сетей

В общем виде (и согласно результатам ряда исследований) **ассортативные** сети обычно **менее робастны** к случайным отказам по сравнению с **дисассортативными** — но это «правило» может меняться в зависимости от конкретных \(\gamma\) и других деталей. Однако наиболее часто встречающийся итог таков:

- **Ассортативная** (assortative) сеть:  
  Узлы с большим \(k\) склонны соединяться друг с другом. При случайном удалении узлов есть вероятность, что мы всё-таки начинаем бить по группам «высокостепенных» узлов: сеть может фрагментироваться, когда эти кластеры высокостепенных узлов «отваливаются» целиком.

- **Дисассортативная** (disassortative) сеть:  
  «Хабы» предпочитают связываться с узлами низкой степени. Это часто порождает «звездообразные» или «центр-периферийные» структуры (на интуитивном уровне), что, как ни странно, повышает **устойчивость к случайному удалению** (потому что удаление любого одного маленького узла почти не влияет на связанность, а удаление большого узла маловероятно, если узлов много).

- **Нейтральная** (neutral) сеть:  
  Ближе всего к обычной «случайной» конфигурационной модели (configuration model) без особых корреляций. Её кривая будет где-то посередине.

**В большинстве работ** отмечено, что **дисассортативные** сети показывают **бóльшую робастность** при случайном удалении, чем ассортативные или нейтральные.  
Причина упрощённо в том, что при дисассортативности большая часть «массы» хвостов распределения степеней «связана» с малостепенными узлами, формируя структуры, которые не так просто «порушить» случайным удалением (особенно если степень распределения \(\gamma \approx 2\)).

---

## 4. Итоговый ответ

1. **Какая сеть наиболее робастна?**  
   Как правило, **дисассортативная** (disassortative) сеть для \(\gamma=2.2\) покажет **самую пологую** кривую \(\;P_{\infty}(f)/P_{\infty}(0)\;\) (то есть гигантская компонента падает медленнее всего). Значит, она наиболее устойчива к случайному удалению.  
2. **Почему?**  
   - При дисассортативности хабы по большей части «соединяются» со слабо связанными узлами. При **случайном** удалении большая часть убираемых узлов — это именно «мелкие», и потеря связи с мелким узлом не так критична.  
   - В ассортативной сети, если из кластера хабов случайно выпадает даже небольшой процент крупных узлов, то целый «элитный субкластер» может фрагментироваться.  

Таким образом, **дисассортативная сеть оказывается самой робастной** к случайным отказам среди трёх, сгенерированных при \(\gamma=2.2\).

Below is a typical workflow and illustrative example of how one can estimate the **number of nodes** that must fail (be removed at random) to fragment each of the real networks in Table 4.1, under the assumptions:

1. Each network is **uncorrelated** (no degree–degree correlations).  
2. Node failures are **random** (i.e., each node is equally likely to fail).  
3. We use the standard percolation (configuration-model) formula for the **critical fraction** of failed nodes, \( f_c \).  

---

## 1. Формула для критического порога \(f_c\)

Для случайного удаления узлов в больших некоррелированных сетях (configuration model) справедливо (см. главу о перколяции и робастности):

\[
f_c \;=\; 1 
\;-\;
\frac{1}{\bigl(\tfrac{\langle k^2\rangle}{\langle k\rangle}\bigr) \;-\; 1}.
\]

- \(\langle k\rangle\) — средняя степень.
- \(\langle k^2\rangle\) — второй момент распределения степеней.  
- \(\tfrac{\langle k^2\rangle}{\langle k\rangle}\) можно интерпретировать как «эффективную степень» (среднее число соседей у конца произвольного ребра).

### Число узлов, которое нужно удалить

1. Сначала вычисляем \(f_c\).  
2. Затем умножаем \(f_c\) на общее число узлов \(N\):

\[
\text{(число отказавших узлов)} 
\;=\;
f_c \,\times\, N.
\]

Если доля удалённых (случайно отказавших) узлов **превысит** \(f_c\), гигантская компонента сети распадается, то есть сеть «теряет» свою глобальную связность.

---

## 2. Пример вычислений для сетей из Table 4.1

Ниже приведён **пример** с ориентировочными данными по десяти реальным сетям (сводные данные близки к тем, что приводятся у Barabási *et al.* в “Network Science”):

| **Network**               | **\(N\)**     | **\(\langle k^2\rangle/\langle k\rangle\)** | **\(f_c\)**                                 | **\(\#\text{ of failed nodes} \approx f_c \times N\)**             |
|:--------------------------|--------------:|--------------------------------------------:|:--------------------------------------------|:--------------------------------------------------------------------|
| **Internet** (router)     |   192,244     | 37.91                                       | \(1 - 1/(37.91-1) \approx 0.972\)           | \(\approx 0.972 \times 192{,}244 \;\approx 186{,}800\)             |
| **WWW**                   |   325,729     | 63.65                                       | \(\approx 0.984\)                           | \(\approx 0.984 \times 325{,}729 \;\approx 320{,}900\)             |
| **Power Grid**            |     4,941     | 8.18                                        | \(\approx 1 - 1/7.18 \approx 0.861\)        | \(\approx 0.861 \times 4{,}941 \;\approx 4{,}255\)                  |
| **Mobile Phone**          | 5,203,841     | 18.0                                        | \(1 - 1/(18-1) = 1 - 1/17 \approx 0.941\)   | \(\approx 4{,}900{,}000\)                                          |
| **Email**                 |    53,771     | 15.0                                        | \(1 - 1/(15-1) = 1 - 1/14 \approx 0.929\)   | \(\approx 49{,}900\)                                               |
| **Science Collaboration** |   231,286     | 19.0                                        | \(1 - 1/(19-1) = 1 - 1/18 \approx 0.944\)   | \(\approx 218{,}400\)                                              |
| **Actor network**         |   449,913     | \(\sim 500\)                                | \(1 - 1/(500-1)\approx 0.998\)             | \(\approx 0.998 \times 449{,}913 \approx 448{,}900\)               |
| **Citation network**      |   449,673     | \(\sim 80\)                                 | \(1 - 1/(80-1) \approx 0.987\)              | \(\approx 444{,}000\)                                              |
| **E. coli** (metabolism)  |       417     | \(\sim 37\)                                 | \(\approx 1 - 1/36 = 0.972\)                | \(\approx 405\)                                                    |
| **Protein Interactions**  |     2,115     | \(\sim 16\)                                 | \(\approx 1 - 1/15 = 0.933\)                | \(\approx 1{,}973\)                                                |

> **Примечание.** Числовые значения \(\langle k^2\rangle/\langle k\rangle\) и \(N\) могут отличаться в разных работах и картах сети; выше даны **приблизительные** оценки в духе тех, что обычно публикуются для соответствующих реальных сетей.

---

### Как интерпретировать результаты

- Во многих реальных сетях \(\langle k^2\rangle/\langle k\rangle\) **значительно превышает** 2. Следовательно, величина \(f_c\) часто оказывается **близка к 1** (0.9–0.98). Это означает, что, если узлы выходят из строя **случайно**, нужно удалить (или потерять) большую часть узлов (90–98%) прежде чем сеть окончательно распадётся на мелкие компоненты.
- Таким образом, **масштабно-инвариантная** (или «длиннохвостая») топология придаёт сетям высокую устойчивость к **случайным** сбоям.  
- Однако, как показано в главе про атаки, **направленное (таргетированное) удаление** хабов существенно снижает требуемый порог (сеть разваливается, удалив всего несколько процентов самых связных узлов).

---

## Краткий ответ

1. **Формула** для доли отказавших узлов:  
   \[
     f_c \;=\; 1 
     \;-\; 
     \frac{1}{\tfrac{\langle k^2\rangle}{\langle k\rangle} \;-\; 1}.
   \]

2. **Число** таких узлов:
   \[
     N_\text{fail} \;=\; f_c \,\times\, N.
   \]

3. Подставляя известные \(\langle k^2\rangle/\langle k\rangle\) и \(N\) для каждой сети (из Table 4.1), мы получаем конкретные числа (см. таблицу выше). Во многих случаях это составляет **от 80% до 98%** всех узлов для полного распада сети под случайным удалением.

Below is an outline of how one might approach and interpret these simulations and questions.

---

## 1. Общая постановка задачи

В условном «обществе Большого Брата» полиция хочет фрагментировать социальную сеть (разделить её на множество изолированных компонент) с помощью **таргетированной** атаки. Они собираются «изъять» (арестовать/удалить) узлы, обладающие **наибольшим числом друзей** (высокая степень) или **наибольшим кластерным коэффициентом** (друзья данного человека тесно связаны между собой).

С вашей стороны (Сопротивление) есть ограниченные ресурсы, чтобы «защитить» часть узлов. Нужно понять, какие именно характеристики сети (степень или кластерный коэффициент) **важнее** скрыть от полиции, дабы минимизировать урон.

---

## 2. Методика сравнения: две атаки

Для ответа проводят **два сценария**:

1. **Атака по кластерному коэффициенту**  
   - Сортируем узлы по убыванию \(C_i\) (коэффициент кластеризации).  
   - По очереди удаляем те, у кого \(C_i\) максимально.

2. **Атака по степени**  
   - Сортируем узлы по убыванию степени \(k_i\).  
   - По очереди удаляем хабы — самые высокостепенные узлы.

При этом изучают, как быстро уменьшается **гигантская компонента** \(P_{\infty}(f)\) в зависимости от доли \(f\) удалённых узлов.

---

## 3. Две разные модели сетей

1. **Конфигурационная модель с распределением степеней \(\gamma=2.5\)**  
   - Генерируется сеть из \(N=10^4\) узлов, распределение степеней \(p(k)\sim k^{-2.5}\).  
   - Такая сеть (scale-free, но не слишком «жёсткая», поскольку \(\gamma>2\)) обычно **чувствительна** к удалению самых связных узлов (largest degree).  
   - При этом средний кластерный коэффициент может быть относительно невысоким, а его распределение — не обязательно указывает на структурные «мосты» сети.

2. **Иерархическая модель** (см. Image 9.16 и ADVANCED TOPIC 9.B)  
   - Тоже \(N=10^4\), но сеть имеет выраженную модульность и иерархию.  
   - Здесь могут существовать «локальные кластеры» с высокой внутрикластерной связанностью (то есть многие узлы будут иметь **большой** clustering coefficient).  
   - Удаление узлов с высокой кластеризацией может эффективнее разбивать сеть на отдельные модули, особенно если эти узлы являются «шлюзами» между сообществами.

---

## 4. Результаты атак: что обычно наблюдается?

1. **В scale-free сети** (конфигурационная модель с \(\gamma=2.5\))  
   - **Атака по степени**:  
     - Очень быстро разрушает целостность. Это классический результат: удаление хабов приводит к серьёзной фрагментации.  
   - **Атака по кластерному коэффициенту**:  
     - Как правило, даёт **меньший** эффект, ведь узел может иметь высокий \(C_i\), но при этом не быть ключевым «мостом» или хабом (особенно в случайно сгенерированных сетях).  
     - Гигантская компонента падает медленнее, чем при удалении по степени.

2. **В иерархической сети**  
   - Здесь, помимо узлов с высокой степенью, могут быть узлы с **очень высокой** локальной кластеризацией, в то же время связывающие разные подгруппы.  
   - Однако даже в «иерархических» сетях **удаление хабов** остаётся (как правило) более действенным способом вызвать глобальную фрагментацию, если уж эти хабы действительно высокостепенны и отвечают за «дальние» связи.  
   - Бывают специфические случаи, когда узлы с высоким \(C_i\) оказываются «центрами» локальных сообществ, и их таргетированное удаление разрушает именно эту модульную/иерархическую структуру. Тем не менее в большинстве моделей при \(\gamma=2\!-\!3\) **степень** остаётся «чувствительнее» для общей связанности.

---

## 5. Ответ на вопросы

### 5.1 Какой параметр «опаснее» раскрывать?

- **Чаще всего — степень** (degree) оказывается самым «чувствительным» параметром.  
- Почему? Потому что **хабы** отвечают за значительную часть «дальнобойных» связей в сети. Их удаление быстро рвёт сеть на части.

В частности, для **scale-free** (даже при \(\gamma=2.5\)) известно, что таргетированное удаление по \(k\) (attack on hubs) приводит к резкому сокращению гигантской компоненты. Удаление по \(C_i\) обычно слабее фрагментирует.

В более «иерархической» сети вклад высококластеризованных узлов может тоже быть существенным. Однако, когда мы смотрим на вопрос *«какая информация, если её раскрыть полиции, принесёт наибольший урон?»*, в большинстве случаев ответ остаётся тем же: **информация о степени** даёт наиболее эффективный путь «разбить» сеть.

### 5.2 Стоит ли скрывать любую топологическую информацию?

- **Чем меньше полиция знает, тем хуже она может таргетировать**.  
- Если у нападающих **нет** точных сведений о степенях узлов, то атака превращается в «случайное удаление», под которое (особенно в scale-free сетях) нужно удалить очень **большую** долю узлов, прежде чем сеть распадётся.  
- Если же они **точно знают** степень, кластеризацию и другие меры, они могут комбинировать стратегии (например, сначала убрать узлы с самыми высокими \(k\), а затем — с самыми важными локальными мостами или с особыми паттернами кластеризации). Это приведёт к более эффективному «divide and conquer».

Итак, **лучше скрыть все** индивидуальные характеристики (будь то степень, кластерный коэффициент, центральности и т.д.). Но если приходится выбирать, **степень** остаётся самым критически важным параметром.

---

## 6. Краткое резюме

1. **В большинстве случаев степень (degree) важнее для целостности сети**, чем кластерный коэффициент. Если полиция выбирает «самых высокостепенных» узлов, сеть разваливается быстрее, чем если бы они удаляли «самых высококластеризованных».  
2. **Даже в иерархических сетях** узлы с самой высокой степенью часто выполняют роль связующих «коридоров» между кластерами, их исчезновение гораздо сильнее бьёт по связности.  
3. **Если возможно**, лучше **скрывать всю топологическую информацию** (особенно \(\deg\) и \(C\)), так как, не зная этих данных, «агрессор» будет вынужден действовать вслепую, а случайное удаление узлов требует куда большей фракции \(f\), чтобы сеть распалась.  

Таким образом, **степень** остаётся «самой чувствительной» метрикой: если её не удаётся спрятать, то сеть под ударом.

Below is an outline of how one might implement and interpret the avalanche experiment on two different networks—an Erdős-Rényi (ER) random graph and a scale-free (SF) network—under the specified toppling (sandpile-like) dynamics.

---

## 1. Постановка задачи

1. **Сеть**  
   - **Erdős-Rényi \(G(N,p)\)**:  
     \(\quad N = 10^3\) узлов, средняя степень \(\langle k \rangle = 2\).  
     По формуле \(\langle k \rangle = p(N-1)\), получаем \(p \approx \frac{\langle k \rangle}{N-1} \approx \frac{2}{999}\).
   - **Scale-free (конфигурационная модель)**:  
     \(\quad N = 10^3\), \(\langle k \rangle = 2\).  
     Генерация: задаём желаемое степенное распределение \(p(k) \sim k^{-\gamma}\) (например, \(\gamma \approx 2.5\)) с некоторым \(k_{\min}\) и \(k_{\max}\), и затем соединяем «стабы» (конфигурационная модель). При этом нормируем так, чтобы \(\langle k \rangle \approx 2\).

2. **«Ведёрки» (bucket sizes)**  
   - Каждый узел \(i\) имеет ёмкость для зерна, равную своей степени \(k_i\).  
   - Иными словами, если узел имеет степень \(k_i\), он «ломается» (становится неустойчивым) при \(k_i\) накопленных зернах (или если число зерен \(\ge k_i\)).

3. **Процесс**  
   1. **Добавляем** одно зерно на случайно выбранный узел \(i\).  
   2. Если у узла \(i\) после добавления зерна число зерен \(\ge k_i\), узел **становится неустойчивым**, и все зерна \(m_i\) (часто \(m_i = k_i\) или чуть больше) «обсыпаются» к соседям.  
   3. **Топплинг (toppling)**: обрушение может вызвать лавину — если любой из соседей после получения «лишних» зёрен тоже превысит свой предел, он тоже «рушится» и передаёт зерна дальше.  
   4. **Аваланш (avalanche)** заканчивается, когда больше нет неустойчивых узлов. Размер лавины \(s\) — это **число узлов**, которые в ходе этой цепной реакции «стали неустойчивыми».

4. **«Утечка» (dissipation)**  
   - Условие задачи: «at each time step a fraction \(10^{-4}\) of sand grains is lost in the transfer».  
   - Это нужно, чтобы сеть не «переполнилась» зерном. При каждом топплинге какая-то крошечная часть зерен исчезает, в итоге система колеблется в стационарном режиме, а не накапливает бесконечно много зёрен.

5. **Сбор статистики**  
   - Повторяем шаги (1)–(4) **\(10^4\) раз**.  
   - Для **каждой** добавленной песчинки (каждый time step) определяем размер лавины \(s\).  
   - Строим эмпирическое распределение \(P(s)\): вероятность, что лавина имеет размер \(s\).

---

## 2. Ключевые аспекты моделирования

1. **Инициализация**  
   - Сначала у всех узлов число зерен = 0.  
   - Можно «пропустить» несколько сотен/тысяч бросков зерна (т. н. burn-in), прежде чем начинать собирать статистику, чтобы система вышла на стационарный режим.

2. **Перенос зерен (toppling)**  
   - Реализуется через очередь (FIFO) или рекурсию:
     - Помечаем узел \(i\), который стал неустойчивым, как «topple-активный».  
     - Переносим все его зерна к соседям (с учётом небольшого \(\alpha = 10^{-4}\) диссипации).  
     - Если у соседа \(j\) теперь зерен \(\ge k_j\), он тоже становится «активным».  
     - Процесс идёт, пока нет активных узлов.

3. **Потери зерен (dissipation)**  
   - При каждом перебросе зерен от узла \(i\) к его \(k_i\) соседям можно либо:
     - Уменьшить общее число зерен на долю \(\alpha\), либо
     - При передаче каждому соседу передавать слегка меньше зерен, так что общая потеря \(\alpha \cdot m_i\) зерен «исчезает».

4. **Регистрация** лавины  
   - Счётчик \(s=0\) в начале каждого шага добавления зерна.  
   - Каждый раз, когда новый узел становится неустойчивым, делаем \(s \leftarrow s + 1\).  
   - После успокоения записываем \(s\).

---

## 3. Ожидаемые результаты: \(P(s)\)

### 3.1 Распределение размеров лавин

1. **Erdős-Rényi \(G(N,p)\)**  
   - Традиционно в таких «не скоррелированных» сетях без «жирных хвостов» степеней мы ожидаем (при должном подборе параметров, приближении к «критическому» состоянию и проч.) *примерно* **степенной** закон вида \(P(s) \sim s^{-\tau}\) с \(\tau \approx 1.5\) (или 1.6–2.0), если система находится «близко к критичности».  
   - На практике, поскольку \(\langle k \rangle = 2\) довольно низкая, мы можем увидеть экспоненциальный «срез» или смешанное поведение «power-law + cutoff».

2. **Scale-free сеть** (\(\gamma \approx 2.5\))  
   - В масштабно-инвариантной топологии с \(\langle k \rangle = 2\) есть узлы с достаточно большими степенями, что может приводить к более массивным и реже встречающимся «супер-лавинам».  
   - Часто теоретические модели (ветвящаяся модель, sandpile на scale-free) говорят, что при \(2 < \gamma < 3\) возможны более пологие хвосты распределения (т. е. **чаще большие лавины**).  
   - Можно получить степенной хвост \(P(s) \sim s^{-\alpha}\) c \(\alpha < 2\). Однако точное значение зависит от деталей реализации, диссипации и т. д.

### 3.2 Сравнение двух сетей

- **ER-сеть** (средний \(\langle k \rangle=2\)):  
  - Чаще даёт **небольшие лавины**, так как нет сильно связанных «хабов».  
  - В хвосте \(P(s)\) может быть экспоненциальный спад.

- **Scale-free**:  
  - Может иметь **редкие, но очень крупные** лавины, когда зерно попадает на/или добирается до «хабового» узла, который запускает «цепную» реакцию среди его многочисленных соседей.  
  - Распределение \(P(s)\) характеризуется более тяжёлым хвостом и зачастую ближе к степенному распаду.

---

## 4. Итоговая интерпретация

1. **Вся модель** — это пример «сандпайл» (sandpile) динамики на графе, где система благодаря диссипации балансирует в квазистационарном режиме.  
2. **Распределения лавин** \(P(s)\) обычно указывают на:
   - **Критическое** (или субкритическое) поведение, если распределения близки к степенным законам.  
   - **Зависимость от топологии**: масштабно-инвариантные сети более склонны к «большим, редким» событиям.  
3. **Практическое замечание**: подобная модель иллюстрирует возникновение «каскадов» в разных системах, от электрических сетей до финансовых систем. В scale-free топологиях существует «Ахиллесова пята» в виде хабов, которые провоцируют крупные события.

---

## 5. Краткий ответ на задачу

- **Реализация**: сгенерировать две сети \((N=10^3, \langle k \rangle=2)\), задать bucket size = степень узла, делать итерации по добавлению зерна, топплингу и диссипации.
- **Наблюдение**:
  - Для **Erdős-Rényi** \(G(N,p)\) с \(p \approx 2/999\) мы получим **более «узкое»** распределение размеров лавин (\(P(s)\)), зачастую с экспоненциальным срезом.  
  - Для **scale-free** сети (\(\gamma \approx 2.5\)) распределение \(P(s)\) имеет «тяжёлый хвост» и **выше вероятность больших лавин**.  
- **Главная причина**: наличие хабов в scale-free сети создаёт высокую вероятность цепных реакций, затрагивающих много узлов.

Таким образом, при сравнении \(P(s)\) в логарифмических осях (лог–лог-график) вы увидите, что для ER-графа кривая спадает сравнительно быстро, а для scale-free возможны более пологие хвосты, отражающие внезапные крупные лавины.