# 데이터베이스 설계와 이용
## 데이터베이스 설계
    * 저장공간 설계
        * 테이블
            * 테이블(Table)
                - HEAP-ORGANIZED TABLE
                - CLUSTERED INDEX TABLE
                - PARTITIONED TABLE
                - EXTERNAL TABLE
                - TEMPORARY TABLE
            * 칼럼(Column)
                - 칼럼 순서 조정
                    - 고정 길이 칼럼이고 NOT NULL인 칼럼은 선두에 정의한다. 
                    - 가변 길이 칼럼을 뒤편으로 배치한다. 
                    - NULL 값이 많을 것으로 예상되는 칼럼을 뒤편으로 배치한다. 
                - 데이터 타입과 길이 지정시 고려 사항
                    - 가변 길이 데이터 타입은 예상되는 최대 길이로 정의한다. 
                    - 고정 길이 데이터 타입은 최소의 길이를 지정한다. 
                    - 소수점 이하 자리 수의 정의는 반올림되어 저장되므로 정확성을 확인하고 정의한다. 
            * 테이블 설계시 고려사항
                - 칼럼 데이터 길이 합이 1블록 사이즈보다 큰 경우 수직 분할을 고려한다. 1 블록 사이즈보다 크면 체인이 발생하여 속도 
                  저하현상을 유발한다. 
                - 칼럼 길이가 길고 특정 컬럼의 사용 빈도 차이가 심한 경우이거나 각기 다른 사용자 그룹이 특정 칼럼만을 사용하고 
                  같이 처리되는 경우가 드문 경우는 수직 분할을 고려한다. 
                - 수직 분할을 고려할 때는 분할되는 테이블이 하나의 트랜잭션에 의해 동시에 처리되는 경우나 조인이 빈번히 발생되는 
                  경우가 없어야 한다. 
                - "주문일자", "계약일자"등과 같이 검색 조건으로 빈번하게 사용되는 칼럼은 시간 데이터 타입을 사용하면 비교 연산을 
                  하거나 조인일 때 동일 데이터 타입으로 가공하는 경우가 일어날 수 있으므로 액세스 측면만 고려한다면 문자 타입을 
                  사용하는 것이 더 효율적이다
                - 사건의 일자나 시간을 기록하는 속성을 문자 타입으로 정의하면 일자 범위를 벗어나는 값이 입력 될 수 있으므로 처리시
                  문제가 발생하지 않도록 하려면 오류 데이터들을 클린징하거나 제외하기 위한 복잡한 로직을 추가해야 한다.
                  이러한 문제와 더불어 데이터 품질의 중요성이 대두되면서 최근에는 시간을 기록하는 속성인 경우, 시간 데이터 타입을
                  선택하는 추세이다. 
        * 테이블과 테이블스페이스
            - 일반적인 데이터용/인덱스용 테이블스페이스 설계 유형
                - 테이블이 저장되는 테이블 스페이스는 업무별로 지정한다. 
                - 대용량 테이블은 독립적인 테이블 스페이스를 지정한다. 
                - 테이블과 인덱스는 분리하여 저장한다. 
                - LOB 타입 데이터는 독립적인 공간을 지정한다. 
        * 용량 설계
            - 용량 설계 목적
                - 정확한 데이터 용량을 예측하여 저장 공간을 효과적인 사용과 저장 공간에 대한 확장성을 보장하여 가용성을 높이기 위함
                - H/W 특성을 고려하여 디스크 채널 병목을 최소화하기 위함
                - 디스크 I/O를 분산하여 접근 성능을 향상하기 위함 
                - 테이블이나 인덱스에 맞는 저장 옵션을 지정하기 위함
            - 테이블 저장 옵션에 대한 고려사항 
                - 초기 사이즈, 증가 사이즈
                - 트랜잭션 관련 옵션
                - 최대 사이즈와 자동 증가
            - 저장 용량 설계 절차
                - 용량 분석 - 데이터 증가 예상 건수, 주기, 로우 길이등을 고려함
                - 오브젝트별 용량 산정 - 테이블, 인덱스에 대한 크기
                - 테이블스페이스별 용량 산정 - 테이블스페이별 오브젝트 용량의 합계
                - 디스크 용량 산정 - 테이블스페이스에 따른 디스크 용량과 I/O 분산 설계
    * 무결성 설계
        * 데이터 무결성
            * 데이터 무결성 종류
                - 실체 무결성
                    - 실체는 각 인스턴스를 유일하게 식별할 수 있는 속성이나 속성 그룹을 가져야 한다. 
                - 영역 무결성
                    - 칼럼 데이터 타입, 길이, 유효 값이 일관되게 유지되어야 한다. 
                - 참조 무결성
                    - 데이터 모델에서 정의된 실체 간의 관계 조건을 유지하는 것이다. 
                - 사용자 정의 무결성
                    - 다양하게 정의될 수 있는 비즈니스 규칙이 데이터적으로 일관성을 유지하는 것이다. 
            * 데이터 무결성 강화 방법
                - 애플리케이션
                    - 데이터를 조작하는 프로그램 내에 데이터 생성, 수정, 삭제 시 무결성 조건을 검증하는 코드를 추가함
                - 데이터베이스 트리거
                    - 트리거 이벤트 시 저장 SQL을 실행하여 무결성 조건을 실행함
                - 제약 조건
                    - 데이터베이스 제약 조건 기능을 선언하여 무결성을 유지함
                - 무결성 강화 방법에 따른 장단점 
                    - 애플리케이션
                        - 장점
                            - 사용자 정의 같은 복잡한 무결성조건을 구현함
                        - 단점
                            - 소스코드에 분산되어 관리의 어려움이 있음
                            - 개별적으로 시행되므로 적정성 검토에 어려움
                    - 데이터베이스 트리거
                        - 장점
                            - 통합 관리가 가능함
                            - 복잡한 요건 구현 가능
                        - 단점
                            - 운영 중 변경이 어려움
                            - 사용상 주의가 필요함
                    - 제약조건
                        - 장점
                            - 통합 관리가 가능함
                            - 간단한 선언으로 구현 가능
                            - 변경이 용이하고 유효/무효 상태 변경이 가능함
                            - 원천적으로 잘못된 데이터 발생을 막을 수 있음
                        - 단점
                            - 복잡한 제약 조건이 구현이 불가능
                            - 예외적인 처리가 불가능
        * 실체 무결성
            - 기본키 제약
            - UNIQUE 제약
            - 식별자 설계 - 채번
        * 영역 무결성
            - 데이터 타입 & 길이 
            - 유효 값
            - NOT NULL 
        * 참조 무결성
            - 입력 참조 무결성
                - DEPENDENT
                - AUTOMATIC
                - DEFAULT
                - CUSTOMIZED
                - NULL
                - NO EFFECT
            - 수정 삭제 참조 무결성
                - RESTRICT
                - CASCADE
                - DEFAULT
                - CUSTOMIZED
                - NULL
                - NO EFFECT 
            - 디폴트 규칙 정의의 필요성
            - 모델상에서 슈퍼타입-서브타입 관계 
    * 인덱스 설계
        * 인덱스 기능
        * 인덱스 설계 절차
            * 접근 경로 수집
                - 반복 수행되는 접근 경로
                - 분포도가 양호한 컬럼
                - 조회 조건에 사용되는 칼럼
                - 자주 결합되어 사용되는 칼럼
                - 데이터 정렬 순서와 그룹핑 칼럼
                - 일련번호를 부여한 칼럼
                - 통계 자료 추출 조건
                - 조회 조건이나 조인 조건 연산자 
            * 분포도 조사에 의한 후보 컬럼 선정
                - 일반적으로 분포도가 10 ~ 15% 정도이면 인덱스 칼럼 후부로 사용한다. 
                - 분포도는 단일 컬럼을 대상으로 조사한다. 
                - 단일 칼럼으로 만족하지 않는 경우 검색 조건을 좁히기 위해 결합 칼럼들에 대한 분포도 조사를 실시한다. 
                - 분포도 조사 결과를 만족하는 칼럼은 인덱스 후보로 선정하고 인덱스 후보 목록을 작성한다. 
                - 기형적으로 분포도가 불규칙한 경우는 별도 표시하여 접근 형태에 따라 대책을 마련해야 한다. 
                - 빈번히 변경이 발생하는 칼럼은 인덱스 후보에서 제외한다. 
            * 접근 경로 결정
                - 인덱스 후보 목록을 이용하여 접근 유형에 따라 어떤 인덱스 후보를 사용할 것인가를 결정한다. 
            * 칼럼 조합 및 순서 결정
                - 항상 상요되는 칼럼을 선두 칼럼으로 한다. 
                - 등치(=) 조건으로 사용되는 칼럼을 선행 칼럼으로 한다. 
                    - 인덱스가 COL1 + COL2로 구성된 경우는 A100으로 시작하는 모든 일자에 대한 인덱스를 검색한다. 
                    - 인덱스가 COL2 + COL1로 구성된 경우는 '20051010'을 만족하는 데이터 중 A100으로 시작 된 데이터만 인덱스를 검색 
                - 분포도가 좋은 칼럼을 선행 칼럼으로 한다. 
                - ORDER BY, GROUP BY 순서를 적용한다. 
            * 적용 시험
                - 설계된 인덱스를 적용하고 접근 경로별로 인덱스가 사용되는지 시험할 필요가 있다. 
        * 인덱스 구조
            * 트리 기반 인덱스 
                - 대부분의 상용 DBMS에서는 트리 구조를 기반으로 하는 B+ 트리 인덱스를 주로 사용한다. 
            * 비트맵 인덱스
                - 비트맵 인덱스는 '0'혹은 '1'로 이루어진 비트맵만 가지고 있기 때문에 이 정보로부터 실제 로우가 저장되어 있는 물리적인
                  위치를 아는 것은 불가능해 보인다.
            * 함수 기반 인덱스
            * 비트맵 조인 인덱스
                - 비트맵 조인 인덱스는 단일 객체로만 구성되었던 기존 인덱스와 달리 여러 객체의 구성 요소로 인덱스 생성이 이뤄지므로
                  기존의 인덱스와 테이블 액세스 방법과는 구조가 다르다. 
            * 도메인 인덱스
                - 데이터베이스에는 아직 존재하지도 않는 새로운 구조의 인덱스 타입을 자신이 스스로 정의하여 DBMS에서 지원하는
                  인덱스처럼 사용할 수 있다. 
    * 분산 설계
        * 분산 데이터베이스 개요
            - 하나의 논리적 데이터베이스가 네트워크상에서 여러 컴퓨터에 물리적으로 분산되어 있지만 사용자가 하나의 데이터베이스처럼
              인식할 수 있도록 논리적으로 통합되어 공유되는 데이터베이스를 분산 데이터베이스라 한다. 
        * 분산 데이터베이스 관리 시스템
            - 분할 투명성
            - 위치 투명성
            - 중복 투명성
            - 장해 투명성
            - 병행 투명성
        * 분산 설계 전략
            - 중앙 집중형 데이터베이스처럼 한 컴퓨터에서만 데이터베이스를 관리하고 여러 지역에서 접근할 수 있도록 하는 방식
            - 지역 데이터베이스에 데이터를 복제하고 실시간으로 복제본을 갱신하는 방식 
            - 지역 데이터베이스에 데이터를 복제하고 주기적으로 복제본을 갱신하는 방식
            - 데이터 분할 시 전체 지역 데이터베이스를 하나의 논리적 데이터베이스로 유지하는 방식 
            - 데이터 분할 시 각각의 지역 데이터베이스들을 독립된 데이터베이스로 유지하는 방식
        * 분산 설계 방식
            * 테이블 위치 분산
            * 분할(Fragmentation)
                - 완전성
                - 재구성
                - 상호 중첩 배제
                - 수평 분할
                - 수직 분할
            * 할당(Allocation)
                - 할당은 동일한 분할을 복수 서버에 생성하는 분산 방법
                - 부분 복제
                    - 전역 서버 테이블의 일부 데이터를 지역 서버에 복제하는 방식
                - 광역 복제 
                    - 전역 서버 테이블의 전체를 지역 서버에 복제하는 방식
        * 데이터 통합
            - 통합 방식은 DW를 이용하는 방법과 EAI를 이용하는 방법, 두 가지를 혼합해 통합하는 방법이 있다. 
    * 보안 설계
        * 데이터베이스 보안
            - 데이터베이스 정보가 비인가자에 의해 노출, 변조, 파괴되는 것을 막는 것 
            - 데이터베이스 보안 정책 요구 사항 
                - 자원에 접근하는 사용자 식별 및 인증 - 사용자 비밀번호, 사용자 그룹
                - 보안 규칙 또는 권한 규칙에 대한 정의
                - 사용자의 접근 요청에 대한 보안 규칙 검사 구현 - 보안 관리 시스템 구현
        * 접근 통제 기능
            - 임의적 접근 통제
            - 강제적 접근 통제
        * 보안 모델
            * 접근 통제 행렬(Access control matrix)
                - 주체
                    - 데이터베이스에 접근할 수 있는 조직의 개체
                - 객체
                    - 보호되고 접근이 통제되어야 하는 데이터베이스의 개체 
                - 규칙
                    - 주체가 객체에 대하여 수행하는 데이터베이스의 조작으로, 입력, 수정, 삭제, 읽기와 객체의 생성과 파괴 등이 존재
            * 기밀성 모델
                - 단순 보안 규칙
                    - 주체는 자신보다 높은 등급의 객체를 읽을 수 없다.
                - *(스타)-무결성 규칙
                    - 주체는 자신보다 낮은 등급의 객체에 정보를 쓸 수 없다. 
                - 강한 *(스타) 보안 규칙 
                    - 주체는 자신과 등급이 다른 객체에 대하여 읽거나 쓸 수 없다. 
            * 무결성 모델
                - 단순 보안 규칙
                    - 주체는 자신보다 낮은 등급의 객체를 읽을 수 없다. 
                - *(스타)-무결성 규칙
                    - 주체는 자신보다 높은 등급의 객체에 정보를 쓸 수 없다. 
        * 접근 통제 정책
            - 신분-기반 정책
                - 개인 또는 그들이 속해 있는 그룹들의 신분에 근거하여 객체에 대한 접근을 제한하는 방법
            - 규칙-기반 정책
                - 강제적 접근 통제와 동일한 개념으로, 주체가 갖는 권한에 근거하여 객체에 대한 접근을 제한한다. 
            - 역할-기반 정책 
                - 역할-기반 정책은 GBP의 한 변형된 형태로 생각할 수 있다. 
        * 접근 통제 매커니즘
            - 패스워드 
            - 암호화
            - 접근 통제 목록 
            - 능력 리스트
            - 보안 등급
            - 통합 정보 매커니즘
        * 접근 통제 조건
            - 값 종속 통제 
            - 다중 사용자 통제 
            - 컨텍스트 기반 통제 
        * 감사 추적
            - 애플리케이션 및 사용자가 데이터베이스에 수행한 모든 활동을 일련의 기록으로 남기는 기능
    
## 데이터베이스 이용
    * 데이터베이스 관리 시스템(DBMS)
        * 개념적 데이터베이스 관리 시스템 아키텍처
        * 데이터베이스 서버 시작과 종료
            * 데이터베이스 서버 시작
        * 데이터베이스 구조
            * 데이터 딕셔너리
            * 데이터베이스, 테이블 스페이스 및 데이터 파일
            * 데이터 블록, 확장 영역 및 세그먼트 간의 관계
        * 메모리 구조
        * 프로세스 구조
    * 데이터 액세스
        * 실행 구조
            * 옵티마이저 
            * SQL 실행 단계
        * 명령어 
            * 데이터 정의 언어(DDL)
            * 데이터 조작 언어(DML)
            * 제어 명령어(COntrol Statement)
        * 저장 프로시저
            * 저장 프로시저 설계 지침
            * 저장 프로시저의 장점
        * 트리거
            * 트리거 사용
            * 트리거 유형
            * 트리거링 이벤트와 제한 조건
    * 트랜잭션
        * 트랜잭션 관리
        * 트랜잭션 특성
        * 트랜잭션의 일관성
            * 낮은 단계 트랜잭션 고립화 수준에 발생할 수 있는 현상들
            * 트랜잭션 고립화 수준
        * 동시성 제어
            * 낙관적 동시성 제어
            * 비관적 동시성 제어
        * 동시성 제어 기능
        * 동시성 구현 사례
        * 고장 회복
        * 로킹 지속 시간
    * 백업 및 복구
        * 장애 유형
        * 로그 파일
        * 데이터베이스 복구 알고리즘
        * 백업 종류
        * 데이터베이스 백업 가이드 라인
        
## 데이터베이스 성능 개선
    * 성능 개선 방법론
        * 성능 개선 목표
        * 성능 개선 절차
            * 분석
            * 이행
            * 평가
        * 성능 개선 접근방법
        * SQL 성능 분석
        * 실행 계획 분석 사례
        * 성능 개선 도구
            * Oracle
            * IBM UDB
    * 조인(Join)
        * Nested-Loop 조인
        * Sort-Merge 조인
        * Hash 조인
        * Hybrid 조인
    * 애플리케이션 성능 개선
        * 온라인 프로그램 성능 개선
        * 온라인 프로그램의 성능 개선 사례
            * 상수 바인딩에 의해 발생되는 파싱 부하 
            * 웹 게시글 형태의 인터페이스 시 부분 범위 처리
            * 과다한 함수 사용으로 인한 부하 발생
        * 배치 프로그램의 성능 개선
            * 절차적인 처리 방식의 비효율
            * 절차적인 처리방식의 보완 요소
            * 집합적인 처리방식의 고려사항
        * 배치 프로그램의 성능 개선 방안
            * 분석 함수를 통한 성능 개선 방안 
            * 파티션 스토리지 전략을 통한 성능 향상 방안
    * 서버 성능 개선
        * 객체 튜닝
        * 인스턴스 튜닝
        * 환경 튜닝