# 이상현상

## 정의

* 데이터 중복으로 인한 릴레이션의 삽입, 삭제, 갱신 시 발생하는 오류현상

## 발생원인

* 속성간에 존재하는 여러가지 데이터 종속관계(함수종속성)를 무리하게 하나의 릴레이션으로 표현하려 하기 때문에 발생함

|종류|주요내용|
|----|----|
|삽입이상<br>(Insertion Anomaly)|데이터를 삽입할 경우 원하지 않는 정보까지 삽입해야하고, 그렇지 않은 경우 삽입되지 않는 현상|
|삭제이상<br>(Deletion bnoamly)|릴레이션 R에 특정 속성을 삭제하는 경우 원하지 않는 정보까지 삭제되는 현상(하나만 갱신될 때의 모순성)|
|갱신이상<br>(Update Anomaly)|중복된 튜플 중에서 일부값만 갱신되고, 나머지는 갱신되지 않아 발생하는 데이터 불일치 현상|

![image.png](attachment:image.png)

![image.png](attachment:image.png)

# 데이터 정규화

## 정의

* 이상현상을 야기하는 종속관계를 분석하여, 속성간의 종속성을 One-Relation, One-Dependency로 표현 되도록 무손실 분배하는 스키마 변환 과정

|원리|내용|
|---|---|
|정보 표현의 무손실|변환된 스키마는 보다 바람직한 구조와 이전 스키마가 표현하는 정보를 모두 포함|
|최소의 데이터 중복성|데이터 중복의 최소화(이상현상 제거)|
|분리의 원칙|하나의 독립된 관계성은 별도의 릴레이션으로 분리 표현<br>(릴레이션을 독립적으로 처리 가능)|

* 정규화 단계

![image.png](attachment:image.png)

## 함수종속성(FD: Functional Dependency)

* 어떤 릴레이션 R에서 X와 Y를 각 R의 속성 집합의 부분집합이라고 정의 시, 속성 X의 값 각각에 대해 시간에 관계없이 항상 속성 Y의 값이 오직 하나만 연관되어 있을 때, Y는 X에 함수종속이라 하고, X -> Y로 표기

![image.png](attachment:image.png)

### 제 1정규형(1NF)
* 복수의 속성값을 가지는 속성을 분리

![image.png](attachment:image.png)

### 제 2정규형(2NF)
* 부분함수 종속 제거

![image.png](attachment:image.png)

### 제 3정규형(3NF)
* 이행함수 종속 제거

![image.png](attachment:image.png)

### Boyce-Codd 정규형(BCNF)
* 모든 결정자는 후보키가 되도록 함

![image.png](attachment:image.png)

![image.png](attachment:image.png)

### 제 4정규형(4NF)
* 함수종속이 아닌 다치종속 제거
* 다치종속: A, B, C를 릴레이션 R의 부분집합이라 할 때, 애트리뷰트 쌍 (A, C)의 값에 대응되는 B의 값이 집합의 A에만 종속되고 C에는 독립적인 관계

![image.png](attachment:image.png)

![image.png](attachment:image.png)

### 제 5정규형(5NF)
* 후보키를 통하지 않는 조인종속 제거
* 조인종속: 어떤 릴레이션 R의 애트리뷰트에 대한 n개의 부분집합 A1, A2, ..., An이 있을때, 공통키를 기준으로 다시 조인되어 원래의 관계를 복원할 수 있는 관계

![image.png](attachment:image.png)

![image.png](attachment:image.png)

![image.png](attachment:image.png)

# 반정규화

# 정의

* 적정 수준의 정규화 이후, 질의 성능 향상을 위해, 일부의 데이터에 대해 중복을 허용하는 정규화의 역작업

## 테이블 반정규화

* 테이블 반정규화, 테이블 분할(ex. 기본정보와 부가정보로 분할), 테이블 추가(ex. 이력 등)

## 컬럼 반정규화

* 컬럼 중복, 컬럼 추가

## 관계 반정규화

* 중복 관계 추가

# 연결 함정(Connection Trap)

## 정의

* ER모델링 시, 정규화를 수행하게 됨으로써 원래 가지고 있던 정보를 잃어버리거나 개체간의 관계나 업무적 연관성이 애매해지는 현상

## 부채꼴 함정(Fan Trap)

* 개체간의 관계모델 설계를 잘못하여 연계된 정보 Tracing이 불가능한 현상
* 한 개의 개체집합(Entity Set)이 둘 이상의 1:n 관계성 집합을 갖는 경우 발생

![image.png](attachment:image.png)

## 균열 함정(Chasm Trap)

* 관계성이 정의되어 있으나 일부 객체간에는 관계가 존재하지 않는 경우
* 개체집합(Entity Set)들이 부분 관계성 집합으로 연결된 경우 발생

![image.png](attachment:image.png)

# 데이터 무결성

## 정의

* 데이터베이스에 저장된 값과 현실세계의 실제값이 일치하는 정확성(accuracy)
* 데이터 무효 갱신으로부터 데이터를 보호하여 정확성, 유효성, 일관성, 안전성을 유지하려는 성질

|종류|내용|
|---|---|
|개체 무결성<br>(Entity Integrity)|- 기본키(Primary Key)는 Null을 가질 수 없음|
|참조 무결성<br>(Referential Integrity)|- 기본키와 외래키간의 관계<br> - 외래키(Foreign Key)가 있는 테이블의 경우, 외래키의 값은 NULL이거나 관련 테이블에 대응하는 기본키가 있어야 하는 특성|
|속성 무결성<br>(Domain Integrity)|- 데이터 형태, 범위, 기본 값, 유일성에 관한 제한<br> - 주어진 속성(Attribute)의 값이 그 속성(Attribute)이 정의된 도메인에 속한 값이어야 함|
|사용자 무결성<br>(Business Integrity)|- 업무적인 규칙에 따른 비즈니스적인 제한 조건|
|외래키<br>(Foreigh Key)|- 어느 한 릴레이션 속성의 집합이 다른 릴레이션 기본키로 이용되는 키|

## 무결성 제약방법

![image.png](attachment:image.png)

# ERD(Entity-Relation Diagram)

* 참고 사이트: https://inpa.tistory.com/entry/DB-%F0%9F%93%9A-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%AA%A8%EB%8D%B8%EB%A7%81-1N-%EA%B4%80%EA%B3%84-%F0%9F%93%88-ERD-%EB%8B%A4%EC%9D%B4%EC%96%B4%EA%B7%B8%EB%9E%A8#2._%EA%B0%9C%EB%85%90%EC%A0%81_%EB%8D%B0%EC%9D%B4%ED%84%B0_%EB%AA%A8%EB%8D%B8%EB%A7%81

## 정의

* 테이블간의 관계를 설명해주는 다이어그램

### 개념적 데이터 모델링
* 해당 조직의 업무요건을 충족하기 위해서 주제영역과 핵심 데이터 집합간의 관계를 정의하는 상위 수준의 개략적 데이터 설계 작업, 즉, 데이터 간의 관계를 구상하는 단계

### 논리적 데이터 모델링
* 개념적 모델링 단계에서 정의된 객체, 속성, 관계를 목표 DBMS에 맞는 논리적 데이터베이스 구조를 변환하는 과정
* 구체화된 업무 중심의 데이터 모델을 생성
* 데이터 타입 명시, 각 데이터간의 관계와 테이블의 키(key) 지정

### 물리적 데이터 모델링
* 논리 데이터 모델을 DBMS의 특성을 고려하여 데이터베이스 저장 구조로 변환하는 과정
* 최종적으로 데이터를 관리할 데이터베이스 선택, 선택한 데이터베이스에 실제 테이블을 만드는 작업

## ERD표기법

* 피터 첸 표기법(Peter Chen Notaition)

![image-2.png](attachment:image-2.png)

![image.png](attachment:image.png)

## IE/Crow's foot

![image.png](attachment:image.png)

## 논리 ERD 예시

![image.png](attachment:image.png)

## 물리 ERD 예시

![image.png](attachment:image.png)