# 구조방정식(Structural equation model) Python Example

In [1]:
#!/usr/bin/python3.5
# -*- coding: utf-8 -*-
from semopy import Model
from semopy import Optimizer
from pandas import read_csv
from semopy.inspector import inspect
import semopy_visualization as sv

## Model Define
- Model은 Lavaan Syntax 기준으로 좌변수(left variable), 우변수(left variable) 사이의 관계식으로 설정
- 참고 링크 : [Lavaan Syntax](https://lavaan.ugent.be/tutorial/syntax1.html) 

Formula type | Operator |  mnemonic
------------ | ------------- | -------------
latent variable | =~ | is measured by
regression | ~ | is regressed on
(residual) (co)variance | ~~ |	is correlated with
intercept|	~ 1|	intercept

In [2]:
# The first step : model define

mod = """ x1 ~ x2 + x3
          x3 ~ x2 + eta1
          eta1 =~ y1 + y2 + y3
          eta1 ~ x1
      """
model = Model(mod)

In [3]:
# The second step : data retrieve

data = read_csv("example_data.txt", index_col=0)
print(data)
model.load_dataset(data)

       y1        y2         y3         y4         y5        y6        y7  \
1    2.50  0.000000   3.333333   0.000000   1.250000  0.000000  3.726360   
2    1.25  0.000000   3.333333   0.000000   6.250000  1.100000  6.666666   
3    7.50  8.800000   9.999998   9.199991   8.750000  8.094061  9.999998   
4    8.90  8.800000   9.999998   9.199991   8.907948  8.127979  9.999998   
5   10.00  3.333333   9.999998   6.666666   7.500000  3.333333  9.999998   
6    7.50  3.333333   6.666666   6.666666   6.250000  1.100000  6.666666   
7    7.50  3.333333   6.666666   6.666666   5.000000  2.233333  8.271257   
8    7.50  2.233333   9.999998   1.496333   6.250000  3.333333  9.999998   
9    2.50  3.333333   3.333333   3.333333   6.250000  3.333333  3.333333   
10  10.00  6.666666   9.999998   8.899991   8.750000  6.666666  9.999998   
11   7.50  3.333333   9.999998   6.666666   8.750000  3.333333  9.999998   
12   7.50  3.333333   6.666666   6.666666   8.750000  3.333333  6.666666   
13   7.50  3

## 모델 최적화
- semopy는 파라미터 추정을 위해 3가지 objective (loss) functions을 제공함.
- ULS : Unweighted least squares
- GLS : General least squares
- MLW : Wishart likelihood function
- fucntion의 자세한 식은 [semopy article](https://arxiv.org/abs/1905.09376) 10 page 참고

In [4]:
opt = Optimizer(model)
opt.optimize(objective='ULS')
# opt.optimize(objective='GLS')
# opt.optimize(objective='MLW')
objective_function_value = opt.optimize()

## 결과
- lval : left value
- op : operator
- rval : right val
- Value : operator에 따른 Parameter
- SE : Standard Error of estimator
![SE](../assets/images/standard_error.png)

결과에 대한 해석은 lval, rval 사이의 operator를 lavaan syntax에 대입하고 rval 의 estimator coef. 가 value, 유의성은 p-value

In [5]:
result = inspect(opt)
print(result)

    lval  op  rval     Value        SE    Z-score       P-value
5   eta1  =~    y1  1.053550  0.178346   5.907321  3.477162e-09
6   eta1  =~    y2  1.061686  0.201272   5.274887  1.328379e-07
0   eta1   ~    x1  1.323118  0.409606   3.230220  1.236949e-03
2     x1   ~    x2  0.370266  0.047764   7.751993  9.103829e-15
1     x1   ~    x3  0.080493  0.051691   1.557190  1.194255e-01
3     x3   ~  eta1 -0.031663  0.042231  -0.749754  4.534027e-01
4     x3   ~    x2  0.808921  0.061476  13.158324  0.000000e+00
7   eta1  ~~  eta1  4.586809  1.382771   3.317115  9.095223e-04
8     x1  ~~    x1  0.103132  0.016847   6.121586  9.264842e-10
9     x3  ~~    x3  0.538175  0.088033   6.113324  9.757679e-10
10    y1  ~~    y1  0.700324  0.772179   0.906946  3.644356e-01
11    y2  ~~    y2  9.191003  1.707046   5.384158  7.278472e-08
12    y3  ~~    y3  5.137345  1.093482   4.698151  2.625278e-06


## Visualization
core semopy는 시각화기능을 제공하지 않기 때문에 graphviz를 이용한 외부 예제를 차용

In [6]:
sv.visualize(opt, measurement_part=True, show_coef=True, view=False, filename="graph", title='')

![Sempath plot](graph.jpg)