# HW-01:在 VScode 中运行 Stata 命令
- 谢颂凯
- 23327087
- 简介:通过stata代码生成模拟数据，进行一系列数据分析

## 生成模拟数据
生成模拟数据：N = 500，包含 2 个变量 (x1, x2)，x1 ~ N(0, 1)，x2 ~ N(3, 1.5)，corr(x1, x2) = 0.4。
1. 存入一个名为 `simu_01.dta` 的数据文件中。
2. 种子值为：087
编写上述stata代码

In [None]:
// 1. 清除内存中的现有数据
clear

// 2. 设置样本量为 500
set obs 500

// 3. 设置随机数种子以保证结果可重复
set seed 087

// 4. 定义均值向量 (means vector)
//    x1 的均值为 0, x2 的均值为 3
matrix m = (0, 3)

// 5. 定义协方差矩阵 (covariance matrix)
//    V = [var(x1), cov(x1,x2); cov(x1,x2), var(x2)]
//    其中:
//    var(x1) = 1*1 = 1
//    var(x2) = 1.5 (根据 N(μ, σ²) 表示法，1.5是方差)
//    sd(x2) = sqrt(1.5)
//    cov(x1,x2) = corr(x1,x2) * sd(x1) * sd(x2) = 0.4 * 1 * sqrt(1.5)
matrix V = (1, 0.4*sqrt(1.5) \ 0.4*sqrt(1.5), 1.5)

// 6. 使用 drawnorm 命令生成变量 x1 和 x2
drawnorm x1 x2, means(m) cov(V)

// 7. (可选) 验证生成的数据是否符合要求
summarize x1 x2
correlate x1 x2

// 8. 将数据保存到名为 simu_01.dta 的文件中
//    replace 选项表示如果文件已存在，则覆盖它
save simu_01.dta, replace

## 呈现 `simu_01.dta` 数据的前 5 行

In [8]:
use simu_01.dta, clear
list in 1/5


     +----------------------+
     |        x1         x2 |
     |----------------------|
  1. | -.8034894   2.429288 |
  2. | -1.435991   3.386871 |
  3. |  .2313487    2.81246 |
  4. |  .0261813   1.177852 |
  5. | -1.181219   2.619012 |
     +----------------------+


simu_01.dta 数据的前 5 行:
```stata
     +----------------------+
     |        x1         x2 |
     |----------------------|
  1. | -.8034894   2.429288 |
  2. | -1.435991   3.386871 |
  3. |  .2313487    2.81246 |
  4. |  .0261813   1.177852 |
  5. | -1.181219   2.619012 |
     +----------------------+
```

## 描述性统计

In [9]:
summarize x1 x2, detail


                             x1
-------------------------------------------------------------
      Percentiles      Smallest
 1%     -2.12617      -2.951128
 5%    -1.563986      -2.540977
10%     -1.28319      -2.351074       Obs                 500
25%    -.6986496      -2.280713       Sum of wgt.         500

50%    -.0011425                      Mean           -.022554
                        Largest       Std. dev.      .9576662
75%     .5673724       2.339435
90%     1.204286       2.375871       Variance       .9171245
95%     1.593007       2.661858       Skewness       .0358253
99%     2.167189       2.787422       Kurtosis       2.887577

                             x2
-------------------------------------------------------------
      Percentiles      Smallest
 1%    -.0667188      -.6384518
 5%     .8367096      -.4681826
10%     1.303884      -.4197974       Obs                 500
25%     2.075824      -.2873194       Sum of wgt.         500

50%     2.931678          

simu_01.dta 的描述性统计:
```stata
                             x1
-------------------------------------------------------------
      Percentiles      Smallest
 1%     -2.12617      -2.951128
 5%    -1.563986      -2.540977
10%     -1.28319      -2.351074       Obs                 500
25%    -.6986496      -2.280713       Sum of wgt.         500

50%    -.0011425                      Mean           -.022554
                        Largest       Std. dev.      .9576662
75%     .5673724       2.339435
90%     1.204286       2.375871       Variance       .9171245
95%     1.593007       2.661858       Skewness       .0358253
99%     2.167189       2.787422       Kurtosis       2.887577

                             x2
-------------------------------------------------------------
      Percentiles      Smallest
 1%    -.0667188      -.6384518
 5%     .8367096      -.4681826
10%     1.303884      -.4197974       Obs                 500
25%     2.075824      -.2873194       Sum of wgt.         500

50%     2.931678                      Mean           2.898204
                        Largest       Std. dev.      1.242615
75%      3.71045       6.035809
90%     4.464235       6.102357       Variance       1.544093
95%     4.990766       6.257462       Skewness      -.0163623
99%     5.940177       6.634243       Kurtosis       3.025088
```

## 呈现 x1 的直方图

In [None]:
histogram x1, normal title("Histogram of x1")
graph export "histogram_x1.svg", replace

以下为 x1 的直方图

![x1的直方图](./histogram_x1.svg)

## 导出 x1 和 x2 的密度函数图

In [None]:

twoway (kdensity x1) (kdensity x2), ///
    title("Kernel Density Plots") ///
    legend(label(1 "Density of x1") label(2 "Density of x2"))
graph export "density_plots.svg", replace

密度函数图

!['density_plots'](density_plots.svg)

## 在同一幅图中绘制 x1 和 x2 的箱线图

In [None]:
graph box x1 x2, title("Box Plots of x1 and x2")
graph export "box_plots.svg", replace

x1 和 x2 的箱型图

![箱型图](box_plots.svg)

## 生成 x1 和 x2 的小提琴

In [None]:
/* capture ssc install vioplot */
vioplot x1 x2, title("Violin Plots of x1 and x2")
graph export "violin_plots.svg", replace

小提琴图

![小提琴图](violin_plots.svg)

## 计算 x1 和 x2 的相关系数

In [None]:
correlate x1 x2

相关系数为:

```stata
(obs=500)

             |       x1       x2
-------------+------------------
          x1 |   1.0000
          x2 |   0.4032   1.0000
```

## x1 和 x2 的散点图

In [None]:
twoway (scatter x2 x1) (lfitci x2 x1), ///
    title("Scatter Plot of x2 vs x1 with Regression Line") ///
    ytitle("Variable x2") ///
    xtitle("Variable x1")
graph export "scatter_plot.svg", replace

散点图

![散点图](scatter_plot.svg)