# 데이터베이스 설계와 이용
* 데이터베이스 설계
    * 저장공간 설계
        * 테이블
            * 테이블(Table)
                - HEAP-ORGANIZED TABLE
                - CLUSTERED INDEX TABLE 
                - PARTITIONED TABLE 
                - EXTERNAL TABLE
                - TEMPORARY TABLE 
            * 칼럼(Column)
                - 순서
                    - 고정 길이 칼럼이고 NOT NULL인 컬럼은 선두에 정의한다. 
                    - 가변 길이 칼럼을 뒤편으로 배치한다. 
                    - NULL 값이 많을 것으로 예상되는 컬럼을 뒤편으로 배치한다. 
                - 데이터 타입
                    - 가변 길이 데이터 타입은 예상되는 최대 길이로 정의한다. 
                    - 고정 길이 데이터 타입은 최소의 길이를 지정한다. 
                    - 소수점 이하 자리 수의 정의는 반올림되어 저장되므로 정확성을 확인하고 정의한다. 
            * 테이블 설계시 고려사항
                - 칼럼 데이터 길이 합이 1블록 사이즈보타 큰 경우 수직 분할을 고려한다. 1 블록 사이즈보다 크면 체인이 발생하여
                  속도 저하 현상을 유발한다. 
                - 칼럼 길이가 길고 특정 칼럼의 사용 빈도 차이가 심한 경우이거나 각기 다른 사용자 그룹이 특정 칼럼만을 사용하고
                  같이 처리되는 경우가 드문 경우는 수직 분할을 고려한다. 
                - 수직 분할을 고려할 때는 분할되는 테이블이 하나의 트랜잭션에 의해 동시에 처리되는 경우나 조인이 빈번히
                  발생되는 경우가 없어야 한다. 
                - "주문일자", "계약일자" 등과 같이 검색 조건으로 빈번하게 사용되는 칼럼은 시간 데이터 타입을 사용하면 비교 연산을
                  하거나 조인일 때 동일 데이터 타입으로 가공하는 경우가 일어날 수 있으므로 액세스 측면만 고려한다면
                  문자 타입을 사용하는 것이 더 효율적이다. 
                - 사건의 일자나 시간을 기록하는 속성을 문자 타입으로 정의하면 일자 범위를 벗어나는 값이 입력 될 수 있으므로 처리 시
                  문제가 발생하지 않도록 하려면 오류 데이터들을 클린징하거나 제외하기 위한 복잡한 로직을 추가해야 한다. 
                  이러한 문제와 더불어 데이터 품질의 중요성이 대두되면서 최근에는 시간을 기록하는 속성인 경우, 시간 데이터 타입을 선택
        * 테이블과 테이블스페이스
            - 테이블 스페이스 설계 유형
                - 테이블이 저장되는 테이블 스페이스는 업무별로 지정한다. 
                - 대용량 테이블은 독립적인 테이블 스페이스를 지정한다. 
                - 테이블과 인덱스는 분리하여 저장한다. 
                - LOB 타입 데이터는 독립적인 공간을 지정한다. 
        * 용량 설계
            - 목적 
                - 정확한 데이터 용량을 예측하여 저장 공간을 효과적인 사용과 저장 공간에 대한 확장성을 보장하여 가용성을 높이기 위함
                - H/W 특성을 고려하여 디스크 채널 병목을 최소화하기 위함
                - 디스크 I/O를 분산하여 접근 성능을 최소화하기 위함
                - 테이블이나 인덱스에 맞는 저장 옵션을 지정하기 위함
            - 고려사항
                - 초기 사이즈, 증가 사이즈 
                - 트랜잭션 관련 옵션
                - 최대 사이즈와 자동 증가
            - 저장 용량 설계 절차
                - 용량 분석 - 데이터 증가 예상 건수, 주기, 로우 길이등을 고려함
                - 오브젝트별 용량 산정 - 테이블, 인덱스에 대한 크기
                - 테이블스페이스별 용량 산정 - 테이블스페이스별 오브젝트 용량의 합계
                - 디스크 용량 산정 - 테이블스페이스에 따른 디스크 용량과 I/O 분산 설계
    * 무결성 설계
        * 데이터 무결성
            * 데이터 무결성 종류
                - 실제 무결성
                    - 실체는 각 인스턴스를 유일하게 식별할 수 있는 속성이나 속성 그룹을 가져야 한다. 
                - 영역 무결성
                    - 칼럼 데이터 타입, 길이, 유효 값이 일관되게 유지되어야 한다. 
                - 참조 무결성
                    - 데이터 모델에서 정의된 실체 간의 관계 조건을 유지하는 것이다. 
                - 사용자 정의 무결성 
                    - 다양하게 정의될 수 있는 비즈니스 규칙이 데이터적으로 일관성을 유지하는 것이다. 
            * 데이터 무결성 강화 방법
                - 애플리케이션
                    - 데이터를 조작하는 프로그램 내에 데이터 생성, 수정, 삭제 시 무결성 조건을 검증하는 코드를 추가함
                    - 장점: 사용자 정의 같은 복잡한 무결성조건을 구현함
                    - 단점: 소스코드에 분산되어 관리의 어려움이 있다, 개별적으로 시행되므로 적정성 검토에 어려움
                - 데이터베이스 트리거
                    - 트리거 이벤트 시 저장 SQL을 실행하여 무결성 조건을 실행함
                    - 장점: 통합 관리가 가능함, 복잡한 요건 구현 가능 
                    - 단점: 운영 중 변경이 어려움, 사용상 주의가 필요함
                - 제약 조건
                    - 데이터베이스 제약 조건 기능을 선언하여 무결성을 유지함
                    - 장점: 통합 관리가 가능함, 간단한 선언으로 구현 가능, 변경이 용이하고 유효/무효 상태 변경이 가능함
                            원천적으로 잘못된 데이터 발생을 막을 수 있음
                    - 단점: 복잡한 제약 조건 구현이 불가능, 예외적인 처리가 불가능
        * 실체 무결성
            - 기본키 제약 
            - UNIQUE 제약
            - PK 제약 조건
            - 식별자 설계 - 채번
        * 영역 무결성
            - 데이터 타입 & 길이 
            - 유효 값(CHECK)
            - NOT NULL 
        * 참조 무결성
            - 입력 참조 무결성
                - DEPENDENT
                - AUTOMATIC
                - DEFAULT
                - CUSTOMIZED
                - NULL
                - NO EFFECT
            - 수정 삭제 참조 무결성
                - RESTRICT 
                - CASCADE
                - DEFAULT
                - CUSTOMIZED
                - NULL
                - NO EFFECT 
            - 디폴트 규칙 정의의 필요성
            - 모델상에서 슈퍼타입-서브타입 관계
    * 인덱스 설계
        * 인덱스 기능
            - 인덱스는 어떤 종류의 검색 연산을 최적화하기 위해 데이터베이스 상에 로우들의 정보를 구성하는 데이터 구조
        * 인덱스 설계 절차
            * 접근 경로 수집
                - 반복 수행되는 접근 경로
                - 분포도가 양호한 컬럼 
                - 조회 조건에 사용되는 컬럼
                - 자주 결합되어 사용되는 컬럼 
                - 데이터 정렬 순서와 그룹핑 컬럼
                - 일련번호를 부여한 컬럼 
                - 통계 자료 추출 조건 
                - 조회 조건이나 조인 조건 연산자 
            * 분포도 조사에 의한 후보 컬럼 선정
                - 일반적으로 분포도가 10 ~ 15% 정도이면 인덱스 컬럼 후보로 사용한다. 
                - 분포도는 단일 컬럼을 대상으로 조사한다. 
                - 단일 컬럼으로 만족하지 않는 경우 검색 조건을 좁히기 위해서 결합 컬럼들에 대한 분포도 조사를 실시한다. 
                - 분포도 조사 결과를 만족하는 컬럼은 인덱스 후보로 선정하고 인덱스 후보 목록을 작성한다. 
                - 기형적으로 분포도가 불규칙한 경우는 별도 표시하여 접근 형태에 따라 대책을 마련해야 한다. 
                - 빈번히 변경이 발생하는 컬럼은 인덱스 후보에서 제외한다. 
            * 접근 경로 결정
                - 인덱스 후보 목록을 이용하여 접근 유형에 따라 어떤 인덱스 후보를 사용할 것인가를 결정한다. 
            * 칼럼 조합 및 순서 결정
                - 항상 사용되는 컬럼을 선두 컬럼으로 한다. 
                - 등치(=) 조건으로 사용되는 컬럼을 선행 컬럼으로 한다. 
                - 분포도가 좋은 컬럼을 선행 컬럼으로 한다. 
                - ORDER BY, GROUP BY 순서를 적용한다. 
            * 적용 시험
        * 인덱스 구조
            * 트리 기반 인덱스 
                - B+ 트리의 탐색 성능은 전체 로우 수보다 이분화해 가는 깊이에 더 많은 영향을 받는다. 
            * 비트맵 인덱스
                - 비트맵 인덱스는 '0' 혹은 '1'로 이루어진 비트맵만 가지고 있기 때문에 이정보로부터 실제 로우가 저장되어
                  있는 물리적인 위치를 아는 것은 불가능해 보인다.
                - DW, Mart 
            * 함수 기반 인덱스
            * 비트맵 조인 인덱스
            * 도메인 인덱스
    * 분산 설계
        * 분산 데이터베이스 개요
        * 분산 데이터베이스 관리 시스템
            - 분할 투명성
            - 위치 투명성
            - 중복 투명성
            - 장해 투명성
            - 병행 투명성
        * 분산 설계 전략
            - 중앙 집중형 데이터베이스처럼 한 컴퓨터에서만 데이터베이스를 관리하고 여러 지역에서 접근할 수 있도록 하는 방식
            - 지역 데이터베이스에 데이터를 복제하고 실시간으로 복제본을 갱신하는 방식
            - 지역 데이터베이스에 데이터를 복제하고 주기적으로 복제본을 갱신하는 방식 
            - 데이터 분할 시 전체 지역 데이터베이스를 하나의 논리적 데이터베이스로 유지하는 방식 
            - 데이터 분할 시 각각의 지역 데이터베이스들을 독립된 데이터베이스로 유지하는 방식
        * 분산 설계 방식
            * 테이블 위치 분산
            * 분할(Fragmentation)
                - 완전성
                - 재구성 
                - 상호 중첩 배제
                - 수평 분할
                - 수직 분할
            * 할당(Allocation)
                - 부분 복제 
                - 광역 복제 
        * 데이터 통합
    * 보안 설계
        * 데이터베이스 보안
            - 자원에 접근하는 사용자 식별 및 인증 - 사용자, 비밀번호, 사용자 그룹 
            - 보안 규칙 또는 권한 규칙에 대한 정의 
            - 사용자의 접근 요청에 대한 보안 규칙 검사 구현 - 보안 관리 시스템 구현
        * 접근 통제 기능
            - 임의적 접근 통제(DAC)
            - 강제적 접근 통제(MAC)
        * 보안 모델
            * 접근 통제 행렬(Access control matrix)
                - 주체
                - 객체 
                - 규칙
            * 기밀성 모델
                - 단순 보안 규칙 
                - *(스타)-무결성 규칙
                - 강한 *(스타) 보안 규칙
            * 무결성 모델
                - 단순 보안 규칙
                - *(스타)-무결성 규칙
        * 접근 통제 정책
            - 신분-기반 정책
            - 규칙-기반 정책
            - 역할-기반 정책
        * 접근 통제 매커니즘
            - 패스워드
            - 암호화
            - 접근 통제 목록
            - 능력 리스트
            - 보안 등급
            - 통합 정보 매커니즘
        * 접근 통제 조건
            - 값 종속 통제
            - 다중 사용자 통제
            - 컨텍스트 기반 통제
        * 감사 추적
* 데이터베이스 이용
    * 데이터베이스 관리 시스템(DBMS)
        * 개념적 데이터베이스 관리 시스템 아키텍처
        * 데이터베이스 서버 시작과 종료
            - 초기화 매개변수
                - 파일과 같은 항목에 이름을 지정하는 매개변수
                - 최대 값과 같은 한계를 설정하는 매개변수
                - 메모리 크기와 같은 용량에 영향을 주는 매개변수(가변 매개변수라고 함)
                - 인스턴스를 시작할 데이터베이스 이름
                - 로그 파일의 처리 방법
                - 데이터베이스 제어 파일의 이름과 위치
            * 데이터베이스 서버 시작
                - 인스턴스 시작
                - 데이터베이스 닫기 
                - 마운트 해제 
                - 인스턴스 종료
        * 데이터베이스 구조
            * 데이터 딕셔너리
                - 데이터베이스의 모든 스키마 객체 정보 
                - 스키마 객체에 대해 할당된 영역의 사이즈와 현재 사용 중인 영역의 사이즈 
                - 열에 대한 기본 값
                - 무결성 제약 조건에 대한 정보 
                - 사용자 이름, 사용자에게 부여된 권한과 열할
                - 기타 일반적인 데이터베이스 정보
            * 데이터베이스, 테이블 스페이스 및 데이터 파일
            * 데이터 블록, 확장 영역 및 세그먼트 간의 관계
                - 데이터 블록
                - 데이터 확장 영역(EXTENT)
                - 세그먼트(SEGMENT)
        * 메모리 구조
            - DBMS 정보 저장 
                - 실행되는 프로그램 코드
                - 현재 사용하지 않더라도 접속되어 있는 세션 정보
                - 프로그램 실행되거나 교환되는 정보 
                - 보조 메모리에 영구적으로 저장된 캐시 데이터
            - 데이터베이스 버퍼(BUFFER)
                - 데이터베이스 사용자 프로세스가 데이터를 요구할 때 데이터베이스 버퍼에 있는 데이터를 검색한다. 
                - 데이터를 찾으면 메모리에서 직접 데이터를 읽는다. 
                - 데이터베이스 버퍼에 없으면 데이터 블록을 디스크의 데이터 파일에서 버퍼로 복사한다. 
            - 로그 버퍼(LOG BUFFER)
            - 공유 풀(SHARED POOL)
            - 정렬 영역(SORT AREA)
        * 프로세스 구조
            - 사용자 프로세스
            - 서버 프로세스
            - 백그라운드 프로세스
                - PMON (process monitor)
                    - 사용자 프로세스에 장애가 발생하면 프로세스 복구를 수행
                - SMON (system monitor)
                    - 인스턴스 시작 시 필요한 경우 고장 복구를 수행, 임시 세그먼트 정리 수행 
                - BDWn (Database Writers)
                    - 버퍼의 내용을 데이터 파일에 기록 
                - CKPT (checkpoint)
                    - 체크 포인트가 발생하면 데이터 파일의 헤더를 갱신
                - LGWR (Log Writer) 
                    - 로그 버퍼를 관리하여 로그 버퍼를 디스크의 로그 파일에 기록
    * 데이터 액세스
        * 실행 구조
            * 옵티마이저 
            * SQL 실행 단계
        * 명령어 
            * 데이터 정의 언어(DDL)
            * 데이터 조작 언어(DML)
            * 제어 명령어(COntrol Statement)
        * 저장 프로시저
            * 저장 프로시저 설계 지침
            * 저장 프로시저의 장점
        * 트리거
            * 트리거 사용
            * 트리거 유형
            * 트리거링 이벤트와 제한 조건
    * 트랜잭션
        * 트랜잭션 관리
        * 트랜잭션 특성
        * 트랜잭션의 일관성
            * 낮은 단계 트랜잭션 고립화 수준에 발생할 수 있는 현상들
            * 트랜잭션 고립화 수준
        * 동시성 제어
            * 낙관적 동시성 제어
            * 비관적 동시성 제어
        * 동시성 제어 기능
        * 동시성 구현 사례
        * 고장 회복
        * 로킹 지속 시간
    * 백업 및 복구
        * 장애 유형
        * 로그 파일
        * 데이터베이스 복구 알고리즘
        * 백업 종류
        * 데이터베이스 백업 가이드 라인
* 데이터베이스 성능 개선
    * 성능 개선 방법론
        * 성능 개선 목표
        * 성능 개선 절차
            * 분석
            * 이행
            * 평가
        * 성능 개선 접근방법
        * SQL 성능 분석
        * 실행 계획 분석 사례
        * 성능 개선 도구
            * Oracle
            * IBM UDB
    * 조인(Join)
        * Nested-Loop 조인
        * Sort-Merge 조인
        * Hash 조인
        * Hybrid 조인
    * 애플리케이션 성능 개선
        * 온라인 프로그램 성능 개선
        * 온라인 프로그램의 성능 개선 사례
            * 상수 바인딩에 의해 발생되는 파싱 부하 
            * 웹 게시글 형태의 인터페이스 시 부분 범위 처리
            * 과다한 함수 사용으로 인한 부하 발생
        * 배치 프로그램의 성능 개선
            * 절차적인 처리 방식의 비효율
            * 절차적인 처리방식의 보완 요소
            * 집합적인 처리방식의 고려사항
        * 배치 프로그램의 성능 개선 방안
            * 분석 함수를 통한 성능 개선 방안 
            * 파티션 스토리지 전략을 통한 성능 향상 방안
    * 서버 성능 개선
        * 객체 튜닝
        * 인스턴스 튜닝
        * 환경 튜닝