# 模型基本原理

## SAOM模型简介

SIENA（Simulation Investigation for Empirical Network Analysis）是一个统计工具，适用于分析纵向网络数据。其主要运用的是一种动态网络模型：随机行动者导向模型（Stochastic Actor-Oriented Model，SAOM）。为方便表述，我们通常将在SIENA中实现的SAOM称为“SIENA模型”。

SAOM模型的主要特点是其“行动者导向”的特性，意味着模型从行动者（即网络节点）的视角来模拟变化。在网络演化中，行动者可能建立、维持或终止与其他行动者的关系。研究者通常假设，行动者的这些决策会受到网络本身的结构、行动者自身以及网络中其他行动者的特性和行为的影响。SAOM模型为我们提供了一种手段，可以量化这些因素在不同观测时期的网络演化中所起的作用及其相关的不确定性。

SAOM模型可以被视为一个基于行动者的网络演化仿真模型。在该模型中，相邻时点的变化被称为“最小步骤”，一个行动者可以创建或终止一个外向的关系。这些最小步骤是依序并且基于概率进行的。通过大量的这样的最小步骤，我们可以观察到从一个时间点到另一个时间点的网络演化。行动者的决策将受到当前网络状态的影响，且每一次最小步骤的发生都可能改变网络的状态。这种机制使得模型能够反映出网络动态中典型的反馈过程。

尽管SIENA模型是行动者导向的，但并不意味着行动者需要在任何实际意义上做出决策。这只是意味着网络的变化是由网络中的节点来驱动的。SAOM模型的主要目标是帮助研究者通过探索个体、环境和社会因素在网络变化中的相对重要性，以进一步发展他们的行动理论。虽然SAOM模型无法解决所有的因果问题，但是，由于其纵向设计，SAOM模型在处理一些与因果关系相关的问题上可能提供一定的帮助。

## SAOM模型类型

SIENA不仅可以分析单一网络的演化，而且有多种随机行动者导向模型的变体，适用于更复杂的数据结构。这些选项的可用性取决于研究问题以及可用数据的数量和类型。本部分将简要讨论当前已实现的模型类型，以帮助研究者确定他们能够利用随机行动者导向模型进行哪种类型的分析。

适合使用RSiena进行分析的最小数据集包括在同一节点集上定义的单个网络的两次观察。在这种情况下，我们能够测试网络结构如何促进其自身的演化。然而，根据可用的数据，可能适用更多的建模选项。目前已实现的随机行动者导向模型适用于以下分析：

1. **单模网络的演化**：分析有向或无向单模网络的演化，例如一个班级中的友谊网络（Snijders, 2001）。
2. **双模网络的演化**：分析双模网络的演化，例如一个班级中的社团成员关系：第一模式是由学生组成，第二模式是由社团组成（Koskinen和Edling, 2012）。
3. **个体行为的演化**：分析个体行为（如吸烟）的演化。
4. **单模网络、双模网络和个体行为的共演化**：分析单模网络、双模网络和个体行为的共同演化，例如友谊和吸烟，或友谊和社团成员关系的共同演化（Steglich et al., 2010; Snijders et al., 2013）。

在所有这些情况下，数据也可以包括协变量：影响动态的观察变量，但其值本身不被建模。

在前两种情况下，可以使用RSiena评估给定单模或双模网络的变化在多大程度上取决于网络结构本身和协变量。第三种选项，即模拟个体行为本身的变化，而不考虑其在网络中的嵌入性，使用较少。对于这类数据，存在许多其他的纵向建模技术。

因此，第四种模型类型已广泛应用。分析网络和行为的共同演化允许研究者解决与选择和影响过程相关的问题，例如，是否吸烟者倾向于成为朋友，或者朋友是否倾向于在吸烟习惯上变得相似。SIENA共演化模型的强大之处在于，可以同时考虑网络结构对网络演化、行为实际水平对行为变化、网络结构对行为变化、以及行为实际水平对网络演化的影响。除了网络和行为的共演化，

这类随机行动者导向模型还允许对多个网络（例如友谊和建议，友谊和不喜欢，或者它们三者）的联合分析，以及有序多网络（一个网络中的联系假设另一个网络中的联系存在，例如在友谊和最好的朋友关系中）的分析。


# SAOM模型规范


## 研究准备

在进行SAOM(Stochastic Actor-Oriented Models)模型研究之前,需要设置好R环境并安装RSiena库。RSiena是一个在R环境中运行的软件包,专门用于分析SAOM模型。

```R
# 安装RSiena
install.packages("RSiena") 

# 加载RSiena库
library(RSiena)
```

## 网络要求

SAOM模型中对于网络主要有以下基本要求:

- **二值网络**:SAOM模型适用于二值网络,即网络连接状态为存在(1)或不存在(0)的网络。

- **至少两期**:使用SAOM模型至少需要两个时间点的观察数据。

## 数据准备

在使用SAOM模型前,需要把数据准备成适用于R的格式。以下是一些基本的R函数:

```R
# 读取文件中的数据为数据框
df <- read.table(file, header = TRUE, sep = ",")

# 将数据框转换为矩阵 
matrix <- as.matrix(df)

# 检查对象的类别
class(object)

# 检查矩阵维度 
dim(matrix)
```

## 变量设定

### 因变量设定

#### 网络因变量设定

| t1 | t2 |  |
| :----: | :----: | :----: |
| i &nbsp; &nbsp; j| i -> j |creation of a tie|
| i -> j| i -> j |maintenance of a tie|
| i -> j| i &nbsp; &nbsp; j |termination of a tie|
| i &nbsp; &nbsp; j| i &nbsp; &nbsp; j |maintenance of a ‘no-tie’|


对于一个二值网络的两次观测，单个网络连接变量可以有四种模式，如上表所示。在SAOM模型中,连结的变化被定义为三种方式:

- 创建(creation):建立先前不存在的连结
- 维持(endowment):维持现有连结 
- 评估(evaluation):不区分创建或维持,仅评估连结的存在

这三个可能的连结变化值构成了网络演化模型的因变量。模型化创建、维持或存在网络连结的概率（更准确地说，它们是对数概率的线性预测器的组成部分）是不同的效应（effect）。下表可以帮助理解每种情况下概率是如何参照的：比较绿色案例的概率和蓝色案例的概率。

![%E5%9B%BE1.png](attachment:%E5%9B%BE1.png)

这三个可能的连结变化构成了网络演化模型的因变量。它们通过三个函数在RSiena中进行建模:

```R
# 评估函数 
my_model <- setEffect(my_model, effectName = "evaluation", ...) 

# 创建函数
my_model <- setEffect(my_model, effectName = "creation", ...)

# 维持函数
my_model <- setEffect(my_model, effectName = "endowment", ...)  
```
效应可以作为一个模型中一个或两个这些函数的组成部分出现，但不能在所有三个中都出现（这将导致完全共线）。只使用评估效应假设创建效应和维持效应是相等的（并等于评估效应）。每个效应的估计参数应被解释为对数概率比（类似于来自逻辑回归的对数优势比；因为这里的选择是多项的而不是二元的，所以正确的术语是概率比）。从实践的角度看，除非人们对分析的数据集中的连接创建和维持可能有怎样的不同有一个清晰的想法，开始建模时使用评估效应是更便利的。如果一个给定的效应对连结的创建和维持同样强烈，将一个效应的贡献分解为两个函数需要更多的数据，那么统计效力将由于这种分解而减小。出于这些原因，大多数研究将他们的注意力放在在评估效应上。然而，如果有足够的数据，连接的创建和维持之间的区别可以产生不同角度的解释观点。

#### 行为因变量设定

在行为演化模型中,行为变化的值是因变量。行为变量通过两个函数在RSiena中进行建模:

- 评估函数(evaluation):模拟化行为变化为0的概率
- 变化函数(change):模拟行为变化不为0的概率

```R 
# 评估函数
my_model <- setEffect(my_model, effectName = "evaluation", ..., behavior = TRUE)

# 变化函数 
my_model <- setEffect(my_model, effectName = "change", ..., behavior = TRUE)
```

### 协变量设定
SAOM模型允许加入不同类型的协变量来控制网络或行为变化中的其他因素。协变量是影响网络或行为动态但本身不被建模的观察变量。协变量可以是一元或二元,不变或变化的：
* 一元协变量vs二元协变量:一元协变量描述行动者的特征,二元协变量描述行动者对之间的关系。
* 不变协变量vs变化协变量:不变协变量在观测时期保持恒定,变化协变量在不同观测时期发生变化。
* 行为协变量:用于控制行为变化的协变量。
* 通过加入不同类型的协变量,研究者可以区分网络结构效应和协变量效应对网络或行为变化的影响,得到更准确的模型结果。

RSiena中定义协变量的函数包括:

```R
# 定义行动者集
sienaNodeSet(data, actorSet)

# 定义行为变量  
sienaDependent(data, varName)

# 定义一元不变协变量
coCovar(data, varName) 

# 定义一元变化协变量
varCovar(data, varName)

# 定义二元不变协变量
coDyadCovar(data, varName)

# 定义二元变化协变量
varDyadCovar(data, varName)
```
另外，
* sienaComposition()用于处理网络中的组合变化,即同时发生的多重关系变化。它可以区分单独关系变化和组合变化的效应。
* sienaDataCreate()将各个数据源组合成一个SIENA数据对象,该对象包含所有模型所需的数据。dataList是矩阵、数组和向量的列表。
* sienaGroupCreate()定义网络中的群组结构。groupList指定每个行动者属于哪个群组。


## 模型设定

模型设定涉及选择影响网络和行为变化的效应。

**1. 选择效应**

可以使用`getEffects()`查看所有内置效应,并使用`includeEffects()`选择加入模型的效应。

```R
# 查看效应列表
eff <- getEffects()

# 选择效应
my_model <- includeEffects(my_model, c("effect1", "effect2")) 
```

**2. 设置效应参数**

使用`setEffect()`可以修改或添加效应的参数。

```R 
# 设置效应参数
my_model <- setEffect(my_model, effectName, parameters)
```

**3. 添加交互效应**

使用`includeInteraction()`在模型中加入交互效应。

```R
# 添加交互效应
my_model <- includeInteraction(my_model, interaction)
```

## 模型估计
* print01Report
* sienaAlgorithmCreate
* siena07
## 结果解读
* print.sienaFit
* summary.sienaFit
* xtable.sienaFit