# 01. 탐색적 연구와 확증적 연구

- **구조방정식모형 (SEM, structural equation model)은 관심 영역 속에 있는 인과변수들간의 구조적 관계를 일련의 선형방정식들의 항목으로 정식화 한 것**
    - 인과모형 (causal model)또는 공분산구조모형 (covariance structure model)등으로 불림
    
<br>

## 01-01. 탐색적 연구와 확증적 연구
- **확증적 연구(confirmatory study)에서는 연구자가 기존의 이론이나 경험적 연구결과로부터 구조에 관한 어떤 사전지식을 가지고 있어, 그 내용을 가설의 형식으로 공식화하고 실제 데이터를 통해 가설을 확증하려는 위치**
    - 대규모 데이터에 바탕을 둔 사전 연구결과 등
    - **확증적 인자분석 (confirmatory factor analysis)에서는 인자의 개수, 인자의 개념적 의미 등이 관련된 모수들의 추정에 앞서 가정** $\rightarrow$ 
        - 인자적재행렬에 있는 일부 원소의 값을 제약하는 형식의 가설로 나타나며, 구축된 가설을 실제 얻어진 데이터가 얼마나 확증 내지 지지해 주는가를 통상적인 적합도(goodness-of-fit)를 통해 평가
        
- **탐색적 연구 (exploratory study)에서는 위와 같은 유형의 사전지식을 가정하지 않고, 단지 얻어진 데이터를 더듬어 탐색하고 데이터에 대한 가치 있는 정보를 탐구하여 관심형상을 간결하게 기술하고 의미 있는 해석을 구함**
    - 예 : **탐색적 인자분석 (explatory foctor analysis)에서는 전통적으로 잠재변수가 되는 공통인자의 구조 등에 대한 가설을 고려하지 않음** $\rightarrow$ 관찰변수들의 상관관계를 재생성시킬 수 있는 최소 개수의 인자를 탐색하는 것이 목적
        - 인자의 해석은 인자와 관찰변수 사이의 관계를 나타내는 인자적재행렬 등을 데이터로부터 일단 추정한 이후 탐색적으로 진행
        
<br>

#### **그러나 실제 연구에서는 위 두 가지가 구별되어 진행되기 보다는 복합적으로 진행**
- 이론에 따른 모형의 구착 $\rightarrow$ 실제 데이터를 통한 통계적 추론 $\rightarrow$ 추론결과에 바탕을 둔 모형수정 등

In [24]:
library(lavaan)
library(sem)
library(semPlot)
library(semptools)

<br>

## 01-03. 변수의 유형

<br>

### 관찰변수와 잠재변수
- **관찰변수** : 정의가 명확하게 내려져 있어 직접 측정이나 관찰이 가능한 변수
- **잠재변수** : 직접 측정이나 관찰이 불가능하고 관찰변수들의 저변에 잠재되어 있는 변수

**관찰변수는 저변에 깔려 있는 잠재변수의 내용이 외부에 표출된 것**

<br>

### 외생변수와 내생변수
**모형내 인관관계에서의 역할에 따라 변수들이 구분**

- **외생변수 (exogenous variable)** : 다른 변수의 변화에 원인이나 동기의 역할을 하는 변수,
    - 외생변수의  변이는 인과모형의 외부에 있는 다른 원인에 의함
    - 일반적으로 모든 외생변수들 간에는 서로 연관관계가 있는 것으로 가정
    
- **내생변수 (endogenous variable)** : 외생변수나 다른 내생변수에 의해서 영향을 받는 변수
    - 내생변수의 변이는 모형을 통해 적극적으로 설명
    
<br>

### 오차변수
- **오차변수** : 모형에 포함되어 있는 인과관계로는 설명될 수 없으나, 내생변수의 변이는 발생시키는 하나의 원인으로써 모형에 도입되는 일종의 외생변수
    - 일반적으로 오차변수들이 서로 독립인 것으로 가정
    
<br> 

#### 경로도 작성
- **경로도 (path diagram)** 변수들 간의 안과관계 및 연관관계를 그림으로 표현한 것

<br>

#### LISREL 표기법 : 경로도나 수식에 의한 모형의 표현에서 변수 및 계수 등 모수들을 영문자와 그리스문자로 표현
- 관찰변수는 직사각형으로 표시
- 잠재변수는 원으로 표시
- 오차변수도 일종의 잠재변수이므로 원으로 표시, (또는 원을 표시하지 않음)
- 인과관계는 한방향 화살표 ($\rightarrow$또는 $\leftarrow$)
- 연관관계는 양방향 화살표 ($\leftrightarrow$)

**변수**

|구분 | 원소 | 행렬 | 이름 | 내용 | 
| - | - | - | - | - |
| 잠재변수 | $\xi$ | **$\xi$** | xi  | 외생잠재변수 |
| 잠재변수 | $\eta$ | **$\eta$** | eta  | 내생잠재변수 |
| 관찰변수 | $x$ | **$x$** | x  | $\xi$와 관련된 관찰변수 |
| 관찰변수 | $y$ | **$y$** | y  | $\eta$와 관련된 관찰변수 |
| 오차변수 | $\delta$ | **$\delta$** | delta  | $x$에 대응되는 오차변수 |
| 오차변수 | $\epsilon$ | **$\epsilon$** | epsilon  | $y$에 대응되는 오차변수 |
| 오차변수 | $\zeta$ | **$\zeta$** | zeta  | $\eta$에 대응되는 오차변수 |

**경로계수 (인과관계)**

|구분 | 원소 | 행렬 | 이름 | 내용 | 
| - | - | - | - | - |
| 측정모형 | $\lambda^x$ | **$\Lambda ^x$** | lambda-x  | $\xi$와 $x$의 인과관계 |
| 측정모형 | $\lambda^y$ | **$\Lambda^y$** | lambda-y  | $\eta$와 $y$의 인과관계 |
| 구조모형 | $\gamma$ | **$\Gamma$** | gamma  | $\xi$와 $\eta$의 인과관계 |
| 구조모형 | $\beta$ | **$B$** | beta  | $\eta$들 간의 인과관계 |

**공분산 (연관관계)**

|구분 | 원소 | 행렬 | 이름 | 내용 | 
| - | - | - | - | - |
| 오차변수 | $\theta^\delta$ | **$\Theta_\delta$** | theta-delta  | $\delta$들간의 연관관계 |
| 오차변수 | $\theta^\epsilon$ | **$\Theta_\epsilon$** | theta-delta  | $\epsilon$들 간의 연관관계 |
| 오차변수 | $\psi$ | **$\Psi$** | psi | $\zeta$들 간의 연관관계 |
| 잠재변수 | $\phi$ | **$\Phi$** | phi | $\xi$들 간의 연관관계 |

<br>

#### **구조방정식은 잠재변수가 하나도 없는 경우 / 잠재변수가 존재하는 경우로 분류**


1. 잠재변수가 없는 모형 (관찰변수만 있는 모형)
- 잠재변수가 존재하지 않고 외생 관찰변수($x$)와 내생 관찰변수 ($y$)만 존재하는 모형
- 경로분석, 계량경제 모형, 다변량 회귀분석 등

<br>

2. 외생 잠재변수만 존재하는 모형
- 외생 잠재변수($\xi$) 및 이와 관련된 관찰변수($x$), 오차변수 ($\delta$)만 존재하는 모형
- 잠재변수들 간에 연관관계(양방향 화살표)만 존재하고 인과관계(단방향 화살표)는 존재하지 않음
- 동종측정모형 (congeneric measurement model), 확증적 인자분석 모형(confirmatory factor analysis model) 등

<br>


3. 외생 잠재변수에 대한 관찰변수가 없는 모형
- 외생 잠재변수($\xi$)및 내생 잠재변수 ($\eta$) 그리고 내생 잠재변수와 관련된 관찰변수($y$)만 존재하며, 외생 잠재변수와 관련된 관찰변수($x$)가 존재하지 않는 모형
- 심플렉스 모형 (simplex model), 2단계 인자분석 모형(second-order factor analysis model) 등

<br>


4. 외생, 내생 잠재변수가 모두 있는 모형
- 외생 잠재변수($\xi$)와 관련된 관찰변수($x$), 내생 잠재변수($\eta$\)와 관련된 관찰변수($y$) 등이 모두 존재하는 모형
- FULL LISREL 모형 등

<br>

## 01-06. 동치모형
- **동치모형 (equivalent model)** : **변수들 간에 설정된 경로는 다르지만 동일한 추정 공분산행렬을 산출하는 모형**
    - 동치모형은 동일한 적합도와 자유도를 가지므로 적합도 측면에서 동일한 성능을 가진다고 할 수있음
    - **동치관계를 가지는 모형들 간 선택은, 연구자의 이론적 정당성에 근거하여 설정**

<br>

#### 연구모형을 구축할 때 가장 중요한 것은 관련 분야의 이론과 실제에 대한 식견

<br>

## 01-07. 통제변수, 매개변수, 조절변수
- **연구자의 관점에 따라 서로 다른 역할을 하는 개념변수가 존재**

<br>

#### 통제변수 (Control Variable)
- 연구의 주 관심변수는 아니지만, 외생변수와 내생변수에 영향을 주기 때문에 그 영향력을 통제할 목적으로 모형에 도입되는 변수
- 일반적으로 경로도에서 외생변수로 도입

<br>

#### 매개변수 (Mediator Variable)
- 다른 변수들의 인과관계 사이에 존재하는 변수
- 매개변수의 효과는 간접효과 (indirect effect)에 의하여 추정됨

<br>

#### 조절변수 (Moderator Variable)
- 변수들 간의 인과관계의 크기에 영향을 미치는 제 3의 변수
- 조졀변수로 인하여 인과관계가 강해지거나 약해질 수 있고, 부호가 바뀔 수 있음
- 조절벼수의 효과는 다중집단분석(multi-group analysis)나 상호작용(interaction)변수를 통해 분석

<br>

## 01-08. 구조방정식모형의 구축 및 분석 절차

<br>

#### 1. 연구문제 설정
#### 2. 가설설정 및 모형구축
#### 3. 데이터 수집
#### 4. 데이터 탐색 및 처리
#### 5. 통계분석 수행
#### 6. 결론 도출 및 보고서 작성