---

# データベース (Database)

---

## データベースの基本概念 (Basic Concepts of Database)

- **定義**: 情報（データ）の**集まり** (A collection of information / 信息的集合)
- **語源**: "ベース"には「本拠地」「基盤となる場所」という意味がある ("Base" means "headquarters" or "fundamental place" / "Base"有"总部"、"基础场所"之意)
- **目的**: データを**一元管理** (Unified Management / 统一管理) できるようにする

## データモデル (Data Model / 数据模型)

- **定義**: 現実世界にある複雑なデータの**相互関係** (Interrelationships / 相互关系) を分かりやすく表した**設計図** (Blueprint / 设计图)
- **必要性**: 現実のデータは複雑で、何の計画もなく集めると使い物にならない。まず相互関係を整理する必要がある

### データモデリング (Data Modeling / 数据建模)

- **定義**: 現実世界のデータの相互関係を整理する作業
- **成果物**: データモデル（図）
- **実装**: データモデルをコンピュータ上に実装したものが**データベース**

### データモデルの種類

- **関係データモデル** (Relational Data Model / 关系数据模型)
- **階層データモデル** (Hierarchical Data Model / 层次数据模型)
- **ネットワークデータモデル** (Network Data Model / 网状数据模型)

## 関係データモデル (Relational Data Model / 关系数据模型) 

### 基本構造

- データの集まりを**表** (Table / 表) で表現する
- この「表」によってデータとデータの**関係** (Relationship / 关系) を表す

### 関係データモデルの構成要素

| 用語 | 英語 | 中国語 | 説明 |
|------|------|--------|------|
| **表 (テーブル)** | Table | 表 | データを格納する基本的な構造 |
| **行 (レコード)** | Row, Record, Tuple | 行, 记录 | 一つのデータの実体（例：一人の顧客情報） |
| **列 (カラム/属性)** | Column, Attribute, Field | 列, 属性, 字段 | データの項目（例：顧客ID、氏名、年齢） |
| **主キー (Primary Key)** | Primary Key (PK) | 主键 | 各行を**一意に識別** (Uniquely Identify / 唯一标识) できる列（例：顧客ID）。**重複やNULL禁止** |


### 主キーの特徴

- **一意性**: 同じ値を持つ行が存在してはいけない
- **非NULL**: NULL（空）値を取ってはいけない
- **最小性**: 行を一意に識別するのに必要な最小限の列で構成される

---

## 関係データベース


- **定義**: データを **「表」** (Table / 表) で管理するデータベース
- **実体**: **関係データモデル** (Relational Data Model / 关系数据模型) をコンピュータ上に実装したもの
- **特徴**: 見た目と管理方法が **表計算ソフト** (Spreadsheet Software / 电子表格软件) と非常に似ている

## テーブルの構成要素 (Table Components)

| 用語 | 英語 | 中国語 | 説明 | 例 |
|------|------|--------|------|----|
| **テーブル** | Table | 表 | データを格納する基本単位 | 学生テーブル |
| **レコード (行)** | Row, Record | 行, 记录 | 1つのデータの実体。データ追加で**行が増える** | 1人の学生の全情報 |
| **列 (カラム/属性)** | Column, Attribute | 列, 属性 | データの項目。**列名**を持つ。データ追加でも**数は変わらない** | 学生番号、学生名 |


## 主キー (Primary Key)

- **定義**: テーブル内の**特定のレコードを一意に識別する** (Uniquely Identify a Record / 唯一标识一条记录) ための列
- **目的**: 数万、数十万件のレコードの中から、効率的に1つのレコードを特定するために必要

### 主キーの条件


| No. | 条件 | 英語 | 中国語 | 理由 |
|-----|------|------|--------|------|
| **1** | **値が重複しない** (No Duplicate Values) | Uniqueness | 值不重复 | 重複があると特定的1行を指し示せない |
| **2** | **NULL（空）でない** (Not NULL) | No Null Values | 非空 | NULLがあると識別子として機能しない |

### 複合主キー (Composite Primary Key / 复合主键)

- **定義**: 1つの列では主キーの条件を満たせない場合、**複数の列を組み合わせて**主キーとすること
- **例**: 学校名(School Name) と 学生番号(Student ID) の組み合わせ
  - 単独の学生番号は他校と重複する可能性があるが、学校名と組み合わせることで**一意性を確保**できる

## 外部キー (Foreign Key)

- **定義**: **他のテーブルの主キーを参照する** (References the Primary Key of Another Table / 引用另一张表的主键) 列
- **目的**: テーブル間の**リレーションシップ（関係性）** を定義する

## 参照一貫性 (Referential Integrity)

- **定義**: 外部キーが参照している先のレコードが、**矛盾なく存在している状態**
- **別名**: 参照整合性 (Reference Integrity / 参照完整性)

---

## E-R図 (Entity-Relationship Diagram / 实体-关系图)

- **定義**: データの関係性を **「エンティティ（実体）」** と **「リレーションシップ（関連）」** の2概念で表した**設計図**
- **目的**: 関係データベースを作成するための設計図として使用する

### E-R図の構成

| 要素 | 英語 | 中国語 | 説明 | 例 |
|------|------|--------|------|----|
| **エンティティ** (Entity) | Entity | 实体 | 管理対象。**名詞**で表せるもの | 校長, 学校, 学生 |
| **リレーションシップ** (Relationship) | Relationship | 联系 | 実体間の関係。**動詞**で表せるもの | 所属する, 受講する |

## 多重度 (Multiplicity / 多重度)

- **定義**: エンティティ間の**数の関係**を表す度合い
- **表記**: 最小値..最大値
- **重要表記**:
  - 1: 1つ
  - *: 任意の整数（0以上）
  - 0..1: 0 または 1
  - 1..*: 1以上 (**頻出**)

### リレーションシップの種類 

| 関係の種類 | 多重度の例 | 英語 | 中国语 | 具体例 |
|------------|------------|------|--------|--------|
| **1 対 1** (One-to-One) | 1 : 1 | 1:1 Relationship | 一对一关系 | 1学校 対 1校長 |
| **1 対 多** (One-to-Many) | 1 : 1..* | 1:N Relationship | 一对多关系 | 1学校 対 多学生 |
| **多 対 多** (Many-to-Many) | 1..* : 1..* | M:N Relationship | 多对多关系 | 多学生 対 多科目 |

## 正規化 (Normalization / 规范化)

### 正規化の目的

- **定義**: データの**重複** (Duplication) と、更新時の**矛盾** (Inconsistency) を防ぐためにテーブルを分割すること
- **試験頻出**: **「正規化の目的は、データが重複したり、データ更新の際に矛盾が生じたりしないようにすること」**

### 非正規形 (Unnormalized Form / 非规范化形式)

- **特徴**: 属性に**繰り返し**（繰返し）がある状態
- **問題点**: データ重複により、更新漏れや削除時の情報消失が発生する

## 関数従属 (Functional Dependency / 函数依赖) 

- **定義**: ある属性（列）の値が決まると、**他の属性の値が一意に決まる**関係
- **表記**: →(矢印)
- **例**: 学生番号 → 学生名(学生番号が決まれば学生名が一意に決まる)

### 関数従属の3類型

| 類型 | 英語 | 中国語 | 説明 | 例 |
|------|------|--------|------|----|
| **完全関数従属** | Full Functional Dependency | 完全函数依赖 | 属性が**主キー全体**に関数従属する | 学生番号 → 学生名(主キーが学生番号のみの場合) |
| **部分関数従属** | Partial Functional Dependency | 部分函数依赖 | 属性が**複合主キーの一部**に関数従属する | 学生番号 → 学生名(主キーが(学生番号, 試験ID)の場合) |
| **推移的関数従属** | Transitive Functional Dependency | 传递函数依赖 | 属性が**主キー以外の属性**に関数従属する | 教員番号 → 教員名(主キーは学生番号など) |

## 正規化の過程 (Normalization Process / 规范化过程)

### 第1正規形 (1NF)

- **条件**: **属性の繰り返しをなくす**
- **方法**: 繰り返されている部分を別のレコード（行）として追加する
- **結果**: 主キーが複合主キー (学生番号, 試験ID) になることが多い

### 第2正規形 (2NF)

- **条件**: **部分関数従属をなくす**
- **方法**: 部分関数従属している属性（例: 学生名）を、元の複合主キーの一部（例: 学生番号）を主キーとする新しいテーブルに**分割する**
- **目的**: データ重複を排除する

### 第3正規形 (3NF)

- **条件**: **推移的関数従属をなくす**
- **方法**: 推移的関数従属している属性（例: 教員名）を、その決定項（例: 教員番号）を主キーとする新しいテーブルに**分割する**
- **目的**: 更新矛盾を排除する

---

## データベース管理システム (DBMS)

### DBMS

- **定義**: **DataBase Management System** の略
- **役割**: アプリケーションソフトウェアの要求に応じて、データベースを操作する**仲介ソフトウェア** (Middleware / 中间件)
- **必要性**: アプリケーションが直接データベースを操作するのではなく、DBMSを介して操作することで、データの**一貫性** (Consistency / 一致性) と**セキュリティ** (Security / 安全性) を保つ

### データ操作の流れ (Data Operation Flow)

1. **ユーザ** (User) → (操作) → **アプリケーション** (Application)
2. **アプリケーション** → (操作) → **DBMS**
3. **DBMS** → (操作) → **データベース** (Database)

## 基本のデータ操作 (基本6操作)

DBMSが提供する、データに対する基本的な6つの操作。**関係代数** (Relational Algebra / 关系代数) に基づく。

| 操作 | 英語 | 中国語 | 説明 | SQLでの例 |
|------|------|--------|------|----------|
| **選択** (Selection) | Selection | 选择 | テーブルから**特定の行（レコード）** のみを取り出す | WHERE句 |
| **射影** (Projection) | Projection | 投影 | テーブルから**特定の列（カラム）** のみを取り出す | SELECT句 |
| **結合** (Join) | Join | 连接 | **複数のテーブル**を1つにまとめる | FROM TableA, TableB WHERE ... |
| **挿入** (Insertion) | Insertion | 插入 | テーブルに**新しい行を追加**する | INSERT文 |
| **更新** (Update) | Update | 更新 | 既存の行内のデータを**変更**する | UPDATE文 |
| **削除** (Deletion) | Deletion | 删除 | テーブルから行を**削除**する | DELETE文 |

## SQL (Structured Query Language)

- **定義**: **S**tructured **Q**uery **L**anguage の略
- **役割**: **関係データベースを操作するための標準的な言語** (Standard Language for Operating RDBMS)
- **操作の流れ**: アプリケーション → (SQL文) → RDBMS → (結果) → アプリケーション

### WHERE句と演算子 (条件指定)

- **役割**: **選択**を行う。条件に合致する行のみを取り出す

#### 比較演算子 (Comparison Operators)

| 演算子 | 意味 | 英語 | 中国語 | 例 |
|--------|------|------|--------|----|
| = | 等しい | Equal to | 等于 | 学生名 = '鈴木愛子' |
| >= | 以上 | Greater than or equal | 大于等于 | 学生番号 >= 2 |
| <= | 以下 | Less than or equal | 小于等于 | 年齢 <= 20 |
| > | より大きい | Greater than | 大于 | 点数 > 80 |
| < | より小さい | Less than | 小于 | 点数 < 30 |
| <> | 等しくない | Not equal to | 不等于 | 学科 <> '情報' |

#### 論理演算子 (Logical Operators)

| 演算子 | 意味 | 英語 | 中国語 | 例 |
|--------|------|------|--------|----|
| AND | かつ | AND | 并且 | 学生番号>=2 AND 学生名='鈴木' |
| OR | または | OR | 或者 | 学生番号>=2 OR 学生名='鈴木' |
| NOT | 〜ではない | NOT | 非 | NOT (学生名='鈴木') |

### 集計関数 (Aggregate Functions / 聚合関数)

| 関数 | 機能 | 英語 | 中国語 | 例 |
|------|------|------|--------|----|
| SUM(列名) | 合計を求める | Sum | 求和 | SUM(点数) |
| AVG(列名) | 平均を求める | Average | 求平均 | AVG(点数) |
| MIN(列名) | 最小値を求める | Minimum | 求最小值 | MIN(点数) |
| MAX(列名) | 最大値を求める | Maximum | 求最大值 | MAX(点数) |
| COUNT(*) | 行数を数える | Count | 计数 | COUNT(*) |

## データのグループ化 (GROUP BY句)

- **定義**: SELECT文にGROUP BY句を指定することで、データを**グループ化** (Grouping) する
- **機能**: **列の値が同じレコードを1つにまとめる**ことができる
- **用途**: 各グループごとの**合計** (SUM)、**平均** (AVG) などを求める際に使用する

## WHERE句とGROUP BY句の併用

WHERE句とGROUP BY句を同時に使う場合、**必ず以下の順序で記述する**
1. WHERE句 (まず条件でフィルタリング)
2. GROUP BY句 (その後でグループ化)

### HAVING句の目的とWHERE句との違い

| 句 | 適用タイミング | 英語 | 中国語 | 対象 |
|----|----------------|------|--------|------|
| **WHERE句** | **グループ化する前** | Before Grouping | 分组前 | 元のテーブルの**行（レコード）** |
| **HAVING句** | **グループ化した後** | After Grouping | 分组后 | グループ化でできた**グループ** |

## データの並べ替え (ORDER BY句)

| 指定 | 英語 | 中国語 | 意味 |
|------|------|--------|------|
| **ASC** | Ascending Order | 升序 (从小到大) | **昇順**（小さい値から順） |
| **DESC** | Descending Order | 降序 (从大到小) | **降順**（大きい値から順） |

## ビュー (View)

- **定義**: **仮想的な表** (Virtual Table / 虚拟表)。CREATE VIEW文で作成される
- **別名**: **導出表** (Derived Table / 导出表)
- **対義語**: **実表** (Base Table / 基表) - 実際にデータが保存されている物理的な表

## インデックス (Index / 索引)

- **定義**: データベースの**検索を高速化**するための機能
- **仕組み**: 本の**索引**と同じ。特定の列の値と、その値を持つレコードの**物理的な位置**へのポインタを対にして保持する

### インデックスのトレードオフ (Trade-off)

| メリット (Advantage) | デメリット (Disadvantage) |
|----------------------|--------------------------|
| **検索速度が向上** (SELECTが速い) | **更新処理が遅くなる** (INSERT, UPDATE, DELETEが遅い) |
| 目的のデータを素早く見つけられる | データ更新のたびに、インデックスも更新する必要がある |

## ストアドプロシージャ (Stored Procedure / 存储过程)

- **定義**: データベースに対する**複数の命令を1つにまとめ**、データベース管理システム (DBMS) 内に**保存したプログラム**

- **ネットワーク負荷の軽減**: クライアントが複数回的指令を送信する代わりに、ストアドプロシージャ名を1回呼び出すだけで済む
- **処理の共通化**: 複雑で頻繁に使用する処理をサーバ側に保存し、様々なクライアントから利用できる

---

## トランザクション管理 (Transaction Management)

### トランザクションとは

- **定義**: **関連する複数の処理のまとまり** (A collection of related multiple processes / 相关联的多个处理的集合)
- **ユーザ視点**: ユーザから見た**1つの処理単位**
- **具体例 (銀行振込)**:
  - 太郎の口座から1万円を出金する (Withdraw 10,000 yen from Taro's account)
  - 花子の口座に1万円を入金する (Deposit 10,000 yen into Hanako's account)
  - ユーザ（太郎）にとっては、この**2つの処理が両方成功**して初めて「振り込み」という**1つの処理**が完了したことになる

## ACID特性 (ACID Properties)

| 性質 | 英語 | 中国語 | 説明 |
|------|------|--------|------|
| **原子性**| Atomicity | 原子性 | トランザクション内の処理が **「すべて実行される」** か、**「すべて取り消される」** かのどちらかになる性質。<br>（全部执行 or 全部取消） |
| **一貫性**| Consistency | 一致性 | トランザクションの**前後**でデータベースに矛盾がないこと | 
| **独立性**| Isolation | 隔离性 | 複数のトランザクションを同時実行しても、**互いの処理結果が干渉しない**こと |
| **耐久性**| Durability | 持久性 | トランザクションが完了した後、**ハードウェア障害が発生しても**結果が失われないこと | 

## 障害回復 (Failure Recovery)

- **定義**: 壊れたデータやハードウェアを直すこと
- **別名**: **リカバリ** (Recovery / 恢复)

| ファイル | 英語 | 中国語 | 説明 |
|----------|------|--------|------|
| **バックアップファイル** (Backup File) | Backup File | 备份文件 | データベース全体を**定期的**（例: 毎週末）に保存したファイル |
| **ログファイル** (Log File) | Log File | 日志文件 | トランザクション実行**前後の状態**を記録したファイル<br>• **更新前ログファイル**: トランザクション直前の状態<br>• **更新後ログファイル**: トランザクション完了後の状態<br>（別名: ジャーナルファイル） |

## 障害回復の手法 (Recovery Methods)

### ロールバック (Rollback / 回滚)

- **目的**: トランザクション**実行中**に障害が発生した場合の回復
- **復元先**: トランザクション**開始直前**の状態に戻す
- **使用ファイル**: **更新前ログファイル** (Before-Update Log File)
- **具体例**: 出金処理後の入金処理中に障害発生 → 出金処理を取り消し、全額を太郎の口座に戻す

### ロールフォワード (Rollforward / 前滚)

- **目的**: トランザクション**完了後**に障害（例: ハードディスク破損）が発生した場合の回復
- **復元先**: トランザクション**完了直後**の状態に戻す
- **使用ファイル**: **バックアップファイル** (Backup File) + **更新後ログファイル** (After-Update Log File)
- **手順**:
  1. バックアップファイルでデータベースを復元（この時点では古い状態）
  2. バックアップ取得後から障害発生までに実行されたトランザクションを、更新後ログファイルを使って**再実行**し、最新の状態にまで**追いかける**

## 障害回復手法の比較

| 手法 | 適用タイミング | 使用ファイル | 復元先 |
|------|----------------|-------------|--------|
| **ロールバック** | トランザクション**実行中**の障害 | 更新前ログファイル | トランザクション**開始直前**の状態 |
| **ロールフォワード** | トランザクション**完了後**の障害 | バックアップファイル + 更新後ログファイル | トランザクション**完了直後**の状態 |

---

## 排他制御

- **排他制御**: 複数の人が**同じデータを同時に更新**しようとした場合に、データに**矛盾が生じないようにする**機能
- **重要性**: DBMSにおいて**最も重要な機能**の一つ。基本情報技術者試験でも**非常によく出題**される

## ロック 

### 専有ロック (Exclusive Lock / 独占锁)

- **目的**: **データベースを更新する**際に使用する
- **動作**:
  - ロックをかけたトランザクション: データの**読み書きが可能**
  - 他のトランザクション: データの**読み出しも書き込みも一切できない**
- **別名**: **書き込みロック** (Write Lock / 写锁)

### 共有ロック (Shared Lock / 共享锁)

- **目的**: **データを読み出すことだけが目的**の場合に使用する
- **動作**:
  - ロックをかけたトランザクション: データの**読み出しのみ可能**（書き込み不可）
  - 他のトランザクション: データの**読み出しは可能**（書き込み不可）
- **別名**: **読み取りロック** (Read Lock / 读锁)

## ロックの両立性 (Lock Compatibility)

- **定義**: **複数のトランザクションが、同じデータに対していくつかのロックを同時にかけることができる特性**
- **具体例**: 複数のトランザクションが**共有ロック**を同時にかけることができる

## ロックの両立性マトリックス

| | 共有ロック | 専有ロック |
|------|------------|------------|
| **共有ロック** | ○ (可能) | × (不可能) |
| **専有ロック** | × (不可能) | × (不可能) |

## デッドロック (Deadlock)

- **定義**: 複数のトランザクションが互いに相手のロック解放を待ち続ける状態
- **別名**: **相互待ち** (Mutual Waiting)
- **対策**: 
  - ロックの取得順序を統一する
  - タイムアウト機構を設ける
  - デッドロック検出とロールバック

## ロックの粒度 (Lock Granularity)

- **定義**: ロックの**対象となるデータの単位**
- **選択可能な単位の例**:
  - データベース単位 (Database Level)
  - テーブル単位 (Table Level)
  - レコード単位 (Record Level)

### 粒度の大小とトレードオフ (Trade-off)

| 粒度 | 競合 (Contention) | 管理コスト (Management Cost) | CPU/メモリ負荷 (CPU/Memory Load) |
|------|------------------|-----------------------------|---------------------------------|
| **小さくする** (例: レコード単位) | **起きにくい** (他のTxが利用できるデータが多くなる) | **複雑** | **増える** |
| **大きくする** (例: テーブル単位) | **起きやすい** (他のTxが利用できるデータが少なくなる) | **単純** | **減る** |