# 데이터 모델링의 이해 

## 데이터 모델링 

- 데이터 모델은 현실세계를 데이터베이스로 표현하기 위한 추상화 작업
- 고객의 업무 프로세스에 대한 이해는 필수적임
- 업무 프로세스에 대한 이해를 토대로 모델링 표기법을 사용해서 모델링을 해야 함 

## 데이터 모델링 특징 

- 추상화(Abstraction) : 현실세계를 간략하게 표현한다. 
- 단순화(Simplication) : 누구나 쉽게 이해할 수 있도록 표현한다. 
- 명확성(Clarity) : 명확하게 의미가 해석되어야 하고 한가지 의미를 가져야 한다.

## 데이터 모델링 단계 

**1) 개념적 모델링(Conceptual Data Modeling)**
- 업무 프로세스 전체에 대해서 데이터 모델링을 수행 
- 복잡하게 표현하지 않고 중요한 부분을 위주로 모델링하는 단계 
- 업무적 관점에서 모델링하며 기술적인 용어는 가급적 사용하지 않음 
- 엔터티(Entity)와 속성(Attribute)을 도출하고 개념적 ERD(Entity Relationship Diagram)를 작성함 

**2) 논리적 모델링(Logical Data Modeling)**
- 개념적 모델링을 논리적 모델링으로 변환하는 작업
- 식별자를 도출하고 필요한 모든 릴레이션을 정의
- 정규화를 수행해서 데이터 모델의 독립성을 확보 

**3) 물리적 모델링(Physical Modeling)**
- 데이터베이스를 실제 구축 
- 성능, 보안, 가용성을 고려해서 구축 

## 데이터 모델링 관점 

**1) 데이터 관점**
- 비즈니스 프로세스에서 사용되는 데이터 
- 업무가 어떤 데이터와 관련있는지 분석 
- 업부가 관여하는 어떤 것(Things) 

**2) 프로세스 관점**
- 비즈니스 프로세스에서 수행되는 작업 
- 업무에서 실제로 하는 일은 무엇인지 또는 무엇을 해야 하는지 분석
- 업무가 관여하는 어떤 것의 성격(Attribute) 

**3) 데이터와 프로세스 관점**
- 프로세스와 데이터 간의 관계 
- 업무에서 처리하는 일의 방법과 데이터가 어떻게 영향을 받는지 분석 
- 업무가 관여하는 어떤 것의 관계(Relationships)

## ERD(Entity Relationship Diagram)

**개체-관계 모델(ERD)**는 데이터 모델링 분야에서 구조화된 데이터에 대한 일련의 표현이다. 구조화된 데이터를 저장하기 위해 데이터베이스를 쓴다. 이 데이터의 구조 및 그에 수반한 제약조건들은 다양한 기법에 의해 설계될 수 있다. 

1. 엔터티를 도출하고 그린다. 
2. 엔터티를 배치한다. 
3. 엔터티 간의 관계를 설정한다.
4. 관계명을 서술한다.
5. 관계 참여도를 표현한다.
6. 관계의 필수 여부를 확인한다.

## ETC

**1) 도메인(Domain)**
- 도메인(Domain)은 속성에 대한 값의 범위 등 제약사항을 기술할 수 있음
- 각 속성이 가질 수 있도록 허용된 값들의 집합
- 속성명과 도메인 명이 반드시 동일할 필요가 있음 
- 릴레이션에서 모든 속성들의 도메인은 원자적이어야 한다.

**2) ANSI/SPARC 3단계 구조**
- 외부 단계 : 개별 사용자의 관점(View)으로서 각 사용자나 응용 프로그래머가 생각하는 개인적 데이터베이스의 구조를 의미함. 외부 스키마라고 하며 여러 개 존재할 수 있음 
- 개념 단계 : DB에 관한 사용자 공동체의 관점. 한 조직 전체를 위한 DB의 논리적 구조를 의미하며 범 기관적 입장에서 전체 DB를 정의한 것을 개념 스키마라고 하고, 단 하나만 존재함. 
- 내부 단계 : 물리적 저장 장치 관점으로서 DB에 어떤 데이터가 어떻게 저장되는지를 표현하는 저장 구조. 실제로 저장된 내부 레코드의 형식, 인덱스의 유무, 저장 데이터 항목의 표현 방법 등을 포함하고 내부 단계에서 DB의 물리적 데이터 구조를 정의한 것을 내부 스키마라고 함. 

# 3층 스키마(3-Level Schema)

## 3층 스키마
- 사용자, 설계자, 개발자가 데이터베이스를 보는 관점에 따라 데이터베이스를 기술하고 이들 간의 관계를 정의한 ANSI 표준
- 데이터베이스의 독립성을 확보하기 위한 방법 

## 3층 스키마 구조 
**1) 외부 스키마(External Schema)**
- 사용자 관점, 업무상 관련이 있는 데이터 접근 
- 응용 프로그램이 접근하는 데이터베이스를 정의함 

**2) 개념 스키마(Conceptual Schema)**
- 개발자 관점, 데이터베이스의 물리적 저장 구조 
- 데이터 저장구조, 레코드 구조, 필드 정의, 인덱스 등을 의미함 

# 엔터티(Entity)

## 엔터티(Entity) 
- 업무에서 관리해야 하는 데이터 집합을 의미하며, 저장되고 관리되어야 하는 데이터
- 개념, 사건, 장소 등의 명사

## 엔터티 특징
- 엔터티는 유일한 식별자가 있어야 한다.
- 2개 이상의 인스턴스가 있어야 한다. 
- 반드시 속성을 가지고 있어야 한다.
- 다른 엔터티와 최소한 한 개 이상 관계가 있어야 한다. 
- 엔터티는 업무에서 관리되어야 하는 집합이다. 

## 엔터티 종류 
**1) 형태에 따른 엔터티**
- 유형 엔터티 : 업무에서 도출되며 지속적으로 사용되는 엔터티
- 개념 엔터티 : 물리적 형태가 없는 엔터티 
- 사건 엔터티 : 비즈니스 프로세스를 실행하면서 생성되는 엔터티 

**2) 시점에 따른 엔터티**
- 기본 엔터티 : 키 엔터티, 독립적으로 생성되는 엔터티 
- 중심 엔터티 : 기본 엔터티로부터 발생되고 행위 엔터티를 생성하는 엔터티 
- 행위 엔터티 : 2개 이상의 엔터티로부터 발생하는 엔터티 

# 속성(Attribute) 

## 속성(Attribute) 
- 업무에서 필요한 정보인 엔터티가 가지는 항목 
- 더 이상 분리되지 않는 단위로, 업무에 필요한 데이터를 저장할 수 있음

## 속성의 종류 
**1) 분해 여부에 따른 종류**
- 단일 속성 : 하나의 의미로 구성된 것 
- 복합 속성 : 여러 개의 의미가 있는 것
- 다중값 속성 : 여러 개의 값을 가질 수 있는 것 

**2) 특성에 따른 종류**
- 기본 속성 : 비즈니스 프로세스에서 도출되는 본래의 속성 
- 설계 속성 : 데이터 모델링 과정에서 발생되는 속성, 유일한 값을 부여함 
- 파생 속성 : 다른 속성에 의해서 만들어지는 속성 

# 관계(Relationship)

- 관계는 엔터티 간의 관련성을 의미하며 존재 관계와 행위 관계로 분류된다
- 존재 관계는 두 개의 엔터티가 존재 여부의 관계가 있는 것이고, 행위 관계는 두 개의 엔터티가 어떤 행위에 의한 관련성이 있는 것이다. 

# 관계 차수(Cardinality) 

## 관계 차수(Cardinality) 
- 관계 차수는 두 개의 엔터티 간에 관계에 참여하는 수를 의미한 

## 관계 차수의 종류

**1) 1:1 관계**
- 완전 1:1 관계 : 하나의 엔터티에 관계되는 엔터티의 관계가 하나인 경우로, 반드시 존재함 
- 선택적 1:1 관계 : 하나의 엔터티에 관계되는 엔터티의 관계가 하나이거나 없을 수 있음 

**2) 1:N 관계**
- 엔터티의 행이 하나 있을 때, 다른 엔터티의 값이 여러 개 있는 관계 

**3) M:N 관계**
- 두 개의 엔터티가 서로 여러 개의 관계를 가지고 있는 것 
- 관계형 데이터베이스에서 M:N 관계의 조인(Join)은 카테시안 곱이 발생한다. 그래서 M:N관계는 1:N, 1:1 관계로 정규화를 진행한다. 

## 필수적 관계 vs 선택적 관계 

**1) 필수적 관계**
- 반드시 하나가 있어햐 하는 관계, 'o' 기호 사용 

**2) 선택적 관계**
- 없을 수도 있는 관계, '|' 기호 사용 

## 식별 관계 vs 비식별 관계 
**1) 식별 관계(Identification Relationship)**
- 부모 테이블의 기본키가 자식 테이블의 왜래키이면서 기본키로 사용되는 관계 
- 실선 표기 

**2) 비식별 관계(Non-identification Relationship)**
- 자식 테이블에서 참조된 왜래키가 기본키가 아닌 일반 컬럼으로 참조되는 관계
- 점선 표기 

# 엔터티 식별자(Entity Identifier) 

## 식별자 
- 엔터티를 대표할 수 있는 유일한 속성 

## 키의 종류 
- 기본키(Primary Key) : 후보키 중에서 엔터티를 대표할 수 있는 키 
- 후보키(Candidate Key) : 유일성과 최소성을 만족할 수 있는 키 
- 슈퍼키(Super Key) : 유일성은 만족하지만 최소성은 만족하지 않는 키 
- 대체키(Alternate Key) : 여러 개의 후보키 중에서 기본키를 선정하고 남은 키 
- 왜래키(Foreign Key) : 참조 무결성을 확인하기 위해 사용되는 키

## 식별자의 종류 
**1) 대표성 여부에 따라**
- 주 식별자 : 유일성과 최소성을 만족하면서 엔터티를 대표하는 식별자
- 보조 식별자 : 유일성과 최소성은 만족하지만 대표성을 만족하지 못하는 식별자 

**2) 생성 여부에 따라**
- 내부 식별자 : 엔터티 내부에서 스스로 생성되는 식별자 
- 외부 식별자 : 다른 엔터티와의 관계로 인하여 만들어지는 식별자 

**3) 속성의 수에 따라**
- 단일 식별자 : 하나의 속성으로 구성됨 
- 복합 식별자 : 두개 이상의 속성으로 구성됨 

**4) 대체 여부에 따라**
- 본질 식별자 : 비즈니스 프로세스에서 만들어지는 식별자 
- 인조 식별자 : 인위적으로 만들어지는 식별자 