# 옵티마이저(Optimizer)

- 옵티마이저는 SQL을 어떻게 실행할 것인지를 게획하고 실행하는 데이터베이스 관리 시스템의 소프트웨어
- 옵티마이저의 실행 계획은 SQL 성능에 아주 중요한 영향을 끼침
- 데이터 딕셔너리에 있는 오브젝트 통계, 시스템 통계 등의 정보를 사용해 예상되는 비용을 산정
- 여러 개의 실행 계획 중에서 최저 비용을 가지고 있는 계획을 선택해서 SQL을 실행

## 옵티마이즈 실행 계획 확인 

```SQL
DESC PLAN_TABLE;
```

## 옵티마이저 실행 방법

1. 파싱(Parsing)을 실행해서 SQL 문법 검사 및 구문분석을 시행
2. 규칙 기반 혹은 비용 기반으로 실행 계획을 수립
3. 통계정보를 활용해서 최적의 실행 계획을 수립
4. SQL을 실행하고 데이터를 Fetch함

## 옵티마이저 우선순위 

1. ROWID를 사용한 단일 행인 경우
2. 클러스터 조인에 의한 단일 행인 경우
3. 유일하거나 기본키를 가진 해시 클러스터 키에 의한 단일 행인 경우
4. 유일하거나 기본키에 의한 단일 행인 경우
5. 클러스터 조인인 경우
6. 해시 클러스터 조인인 경우
7. 인덱스 클러스터 키인 경우
8. 복합 컬럼 인덱스인 경우
9. 단일 컬럼 인덱스인 경우
10. 인덱스가 구성된 컬럼에서 제한된 범위를 검색하는 경우
11. 인덱스가 구성된 컬럼에서 무제한 범위를 검색하는 경우
12. 정렬-병합 조인인 경우
13. 인덱스가 구성된 컬럼에서 MAX 혹은 MIN을 구하는 경우
14. 인덱스가 구성된 컬럼에서 ORDER BY를 실행하는 경우
15. 전체 테이블을 스캔(FULL TABLE SCAN)하는 경우

## Optimizer Hint

HINT는 SQL 튜닝의 핵심 부분으로 일종의 지시 구문이다. 즉, 오라클 옵티마이저(Optimizer)에게 SQL문 실행을 위한 데이터를 스캐닝하는 경로, 조인하는 방법 등을 알려주기 위해 SQL 사용자가 SQL 구문에 작성하는 것을 뜻함. 즉, 직접 최적 실행 경로를 작성해 주는 것.

```SQL
SELECT /*+ RULE */ * FROM EMP
 FROM ROWID = 'AAAAHFGHTPASHFASFDS';
```

# 인덱스(Index)

- 인덱스(Index)는 데이터를 빠르게 검색할 수 있는 기준을 제공
- 인덱스 키에 내림차순 정렬되어있기 때문에 데이터를 빠르게 조회 가능
- 하나의 테이블에 여러 개의 인덱스를 생성하고 하나의 인덱스는 여러개의 컬럼으로 구성될 수 있음
- 테이블의 기본키는 자동으로 인덱스로 지정되어 있음
- 인덱스의 구조는 Root Block, Branch Blcok, Leaf Block으로 구성되어 Root Block은 인덱스 트리에서 가장 상위에 있는 노드를, Branch Blcok은 다음 단계의 주소를 가지고 있는 포인터로 구성되어 있음
- Leaf Block은 인덱스 키와 ROW ID 로 구성되어 정렬되어 있음

## 인덱스 생성

```SQL
CREATE INDX [index_name] ON [table]([col] DESC, [col] ASC);
```

## 인덱스 스캔 

**1. 인덱스 유일 스캔(Index Unique Scan)**
- 인덱스의 키 값이 중복되지 않은 경우, 해당 인덱스를 사용할 때 발생됨

```SQL
SELECT * FROM EMP WHERE EMPNO = 1000;
```

**2. 인덱스 범위 스캔(Index Range Scan)**
- SELECT 문에서 특정 범위를 조회하는 WHERE 문을 사용할 때 발생 
- Leaf Block의 특정 범위를 스캔 

```SQL
SELECT EMPNO FROM EMP
 WHERE EMPNO >= 1000; 
```

**3. 인덱스 전체 스캔(Index Full Scan)**
- 인덱스에서 검색되는 인덱스 키가 많은 경우에 처음부터 끝까지 전체를 읽음
- 문자열 검색에 대해 %와 같은 wildcard 사용시 발생

```SQL
SELECT ENAME, SAL FROM EMP
 WHERE ENAME LIKE '%' AND SAL > 0;
```

## 인덱스 종류 

**1. CLUSTERED**
- 인덱스의 리프데이터가 곧 데이터 페이지임 

**2. B-Tree**
- 프랜치 블록과 리프 블록으로 구성되며 프랜치 블록은 분기를 목적으로 하고 리프 블록은 인덱스를 구성하는 컬럼의 값으로 정렬

**3. BitMap**
- 하나의 인덱스 키 엔트리가 많은 행에 대한 포인터를 저장하는 구조
- 시스템에서 사용될 질의를 시스템 구현 시에 모두 알 수 없는 경우인 DW 및 AD-HOC 질의 환경을 위해 설계

## 실행 계획 

```SQL
SELECT * FROM EMP, DEPT
 WHERE EMP.DEPTNO = DEPT.DETPNO AND ENP.DEPTNO = 10;

/* Query Plan */ 
NESTED LOOPS
 TABLE ACCESS BY INDEX ROWID TABLE LIMBEST.DEPT
 INDEX UNIQUE SCAN INDEX (UNIQUE) LIMBEST.SYS_C007959
 TABLE ACCESS FULL TABLE LIMBEST.EMP
```

1. DEPT 테이블의 SYS_C007959 인덱스를 유일하게 조회
2. INDEX에서 DEPT 테이블 ROWID를 사용해서 조회
3. EMP 테이블을 FULL SCAN
4. DEPT 테이블과 EMP 테이블을 Nested Loop 방식으로 조인

# 옵티마이저 조인

## Nested Loop 조인 
- 하나의 테이블에서 데이터를 먼저 찾고 그 다음 테이블을 조인하는 방식
- 먼저 조회되는 테이블을 외부 테이블이라고 하고 그 다음 조회되는 테이블을 내부 테이블이라고 함
- 외부 테이블의 크기가 작은 것을 먼저 찾는 것이 중요함
- Nested Loop는 Random Access가 발생하여 성능 지연이 발생함

```SQL
SELECT /*+ ordered use_nl(b) */ *
  FROM EMP a, DEPT b
 WHERE a.DEPTNO = b.DEPTNO AND a.DEPTNO = 10;
```

## Sort Merge 조인 
- 두 개의 테이블을 SORT_AREA라는 메모리 공간에 모두 로딩하고 SORT를 수행 
- SORT가 완료되면 두 개의 테이블을 병합함
- 데이터 양이 많아지면 성능 저하가 발생 

```SQL
SELECT /*+ ordered use_merge(b) */ *
 FROM EMP a, DEPT b
WHERE a.DEPTNO = b.DEPTNO
 AND a.DEPTNO = 10;
```

## Hash 조인 
- 두 개의 테이블 중에서 작은 테이블을 HASH 메모리에 로딩하고 두 개의 테이블의 조인 키를 사용해서 해시 테이블을 생성
- 해시 함수를 사용해서 주소를 계산하고 해당 주소를 사용해서 테이블을 조인하기 때문에 CPU 연산이 많이 필요함
- 조인 작업을 수행할 때는 결과 행의 수가 적은 테이블을 선행 테이블로 사용하는 것이 좋음
- 조인 컬럼의 인덱스 존재하지 않을 경우에도 사용할 수 있는 기법
- 해시 함수를 이용하여 조인을 수행하기 때문에 '='로 수행하는 조인인 동등 조건에만 사용가능
- 동일한 값을 항상 같은 값으로 해시됨을 보장함

```SQL
SELECT /*+ ordered use_hash(b) */ *
  FROM EMP a, DEPT b
 WHERE a.DEPTNO = b.DEPTNO
   AND a.DEPTNO = 10;
```