# BANCO DE DADOS
## MODELAGEM DE BANCO DE DADOS

A modelagem de banco de dados é o processo de criar uma estrutura lógica para armazenar e organizar dados de maneira eficiente. Esse processo envolve várias etapas e conceitos chave:

1. **Análise de Requisitos**: Compreender as necessidades e os requisitos do negócio ou sistema para determinar quais dados precisam ser armazenados e como serão usados. O Modelo Entidade Relacionamento (MER) começa a ser formulado com base nos requisitos coletados.
2. **Modelo Conceitual**: Este modelo é independente de qualquer sistema de gerenciamento de banco de dados específico. Aqui, o DER é desenvolvido para representar as entidades principais, seus atributos e os relacionamentos entre elas de forma visual. Esta fase é crucial para garantir que todos os _stakeholders_ entendam e concordem com a estrutura básica dos dados antes de prosseguir.
  3. **Modelo Lógico**: O modelo conceitual é refinado em um modelo lógico, detalhando mais os atributos e relacionamentos, e começando a considerar aspectos como tipos de dados e restrições.
  4. **Modelo Físico**: Traduzir o modelo lógico para um modelo físico que pode ser implementado em um sistema de gerenciamento de banco de dados específico (como MySQL, PostgreSQL, Oracle). Isso inclui a definição de tabelas, colunas, índices, chaves primárias e estrangeiras, e outras estruturas de dados.
  5. **Normalização**: Aplicar regras para organizar os dados de modo a minimizar redundâncias e dependências indesejadas. A normalização geralmente envolve decompor tabelas grandes em tabelas menores e eliminar redundâncias de dados, seguindo formas normais (1NF, 2NF, 3NF, etc.).
  6. **Desempenho e Otimização**: Ajustar o modelo físico para melhorar o desempenho do banco de dados, o que pode envolver a denormalização, criação de índices, particionamento de tabelas e outras técnicas de otimização.
  7. **Documentação e Manutenção**: Documentar o modelo de dados para garantir que todos os stakeholders compreendam a estrutura do banco de dados e possam mantê-lo adequadamente no futuro.

### Benefícios:

- **Organização e Clareza**: Facilita a compreensão e o gerenciamento dos dados.
- **Eficiência**: Melhora a eficiência de armazenamento e consulta de dados.
- **Flexibilidade e Escalabilidade**: Permite adaptações futuras sem grandes reestruturações.
- **Redução de Redundância**: Minimiza a duplicação de dados e mantém a integridade dos mesmos.

### Modelo Entidade-Relacionamento (MER) e o Diagrama Entidade-Relacionamento (DER)

O Modelo Entidade-Relacionamento (MER) e o Diagrama Entidade-Relacionamento (DER) são ferramentas fundamentais na modelagem de banco de dados, sendo o MER usado para mostrar uma visão gráfica de forma mais abstrata e compreensível entre as entidades do banco de dados. O DER pode ser utilizado para representar tanto o MER na fase do modelo conceitual do banco de dados qunto na fase de desenvolvimento do modelo lógico de dados.

### Diagrama Entidade-Relacionamento (DER)
O DER é uma representação gráfica do MER, usada para visualizar e documentar o relacionamento entre eentidades em um banco de dados. Ele inclui:

- **Retângulos**: Representam as entidades.
- **Elipses**: Representam os atributos das entidades.
- **Losangos**: Representam os relacionamentos entre entidades.
- **Linhas**: Conectam entidades a seus atributos e relacionamentos.

### Modelo Entidade-Relacionamento (MER) - Projeto Conceitual

O MER é uma abordagem teórica para a modelagem de dados que utiliza conceitos de entidades, atributos e relacionamentos para representar as informações e suas interações em um sistema. Ele foi introduzido por Peter Pin-Shan Chen em 1976.

- **Entidades**: Representam objetos ou conceitos do mundo real que possuem existência independente. Por exemplo, em um sistema de gerenciamento de biblioteca, entidades podem ser Livros, Autores e Membros.
- **Atributos**: São propriedades ou características das entidades. Por exemplo, um Livro pode ter atributos como Título, ISBN e Data de Publicação.
- **Relacionamentos**: Definem como as entidades interagem entre si. Por exemplo, um Autor pode "escrever" um Livro, e um Membro pode "emprestar" um Livro. Os relacionamento são representados por um losângulo.

**NOTAÇÕES UTILIZADAS NO MER**:
- **Entidades**: A notação para entidade é um retângulo.
- **Atributos**: São representados por uma elípse ou um círculo, com destaque para os seguintes atributos:
    -  Chave primária que é sublinhada.
    -  Atributos multivalorados apresentam um `*`
    -  Atributos compostos em negrito
- **Relacionamentos**: São representados por um losângulo.

Os tipos de relacionamento são defindos pela cardinalidade, que define quantas instâncias de uma entidade se relacionam com quantas instâncias de outra entidade. Assim, a cardinalidae determina como as entidades se relacionam entre si, e compreender e definir corretamente a cardinalidade é essencial para criar um banco de dados eficiente, consistente e que atenda às necessidades do negócio.

### Projeto Lógico
No projeto lógico são apresentadas todas as tabelas, seus atributos e tipo de dado de cada atributo, relacionamento entre tabelas e cardinalidade, definição de atributos que são chaves primárias ou chaves estrangeiras, restrições de dados...

#### Tipos de cardinalidade:

1. **Um-para-Um (1:1)**:
    - Cada instância de uma entidade se relaciona com exatamente uma instância de outra entidade.
    - Exemplo: Cada pessoa tem um único passaporte, e cada passaporte pertence a uma única pessoa.

2. **Um-para-Muitos (1:N)**:
    - Uma instância de uma entidade se relaciona com múltiplas instâncias de outra entidade.
    - Exemplo: Um autor pode escrever muitos livros, mas cada livro é escrito por um único autor.

3. **Muitos-para-Um (N:1)**:
    - Muitas instâncias de uma entidade se relacionam com uma única instância de outra entidade.
    Exemplo: Muitos alunos estão matriculados em uma única turma, mas cada turma pode ter muitos alunos.

4. **Muitos-para-Muitos (N:M) ou (N:N)**:
    - Muitas instâncias de uma entidade se relacionam com muitas instâncias de outra entidade.
    - Exemplo: Estudantes podem estar matriculados em muitos cursos, e cada curso pode ter muitos estudantes.

## NORMALIZAÇÃO DE BANCO DE DADOS

Normalização de banco de dados é o processo de organização dos dados em um banco de dados relacional de forma a eliminar anomalias para reduzir a redundância e melhorar a integridade dos dados. O objetivo principal é estruturar o banco de dados de modo que ele minimize a duplicação de informações e possibilite a manutenção eficiente e consistente dos dados.

**Tipos de Anomalias**:

- **Anomalias de Inserção**: Dificuldade ou impossibilidade de inserir novos dados devido a restrições de integridade.
- **Anomalias de Atualização**: Resultam em inconsistências ou valores indesejados após atualizações.
- **Anomalias de Exclusão**: Perda de informações importantes ou referências inválidas após exclusões.
- **Redundância de Dados**: Armazenamento repetido dos mesmos dados.
- **Dependências Funcionais Indesejadas**: Relações mal definidas entre dados.
- **Inconsistências de Dados**: Dados desatualizados ou conflitantes.
- **Dependências Multivaloradas**: Conjuntos de atributos que determinam diferentes valores para outros atributos.
- **Anomalias de Junção**: Informações incorretas após a junção de tabelas.

## Formas Normais Mais Comuns Utilizadas no Processo de Normalização:

**1. Primeira Forma Normal (1FN):**

- Garantir que todos os campos em uma tabela contenham apenas valores atômicos (não divisíveis).
- Eliminar atributos compostos e multivalorados.
- Eliminar grupos repetidos, criando uma nova tabela para cada conjunto de dados relacionados e identificando cada conjunto com uma chave primária.

**2. Segunda Forma Normal (2FN):**

- Atender aos requisitos da 1FN.
- Eliminar dependência parcial e garantir que todos os atributos não-chave sejam totalmente dependentes da chave primária inteira. Isso significa que nenhuma parte da chave primária deve determinar parcialmente um atributo não-chave.

**3. Terceira Forma Normal (3FN):**

- Atender aos requisitos da 2FN.
- Eliminar dependências funcionais transitivas. Ou seja, atributos não-chave não devem depender de outros atributos não-chave.

**4. Forma Normal de Boyce-Codd (BCNF):**

- Uma versão mais rigorosa da 3FN.
- Cada determinação deve ser uma dependência funcional, onde cada determinante é uma superchave.

**5. Quarta Forma Normal (4FN):**

- Atender aos requisitos da BCNF.
- Garantir que não existam dependências multivaloradas. Isso significa que uma tabela não deve conter mais de um conjunto de atributos multivalorados independentes.

**6. Quinta Forma Normal (5FN):**

- Atender aos requisitos da 4FN.
- Eliminar a ocorrência de dependências de junção. Essa forma normal é raramente necessária e se aplica a casos complexos de dependência.

### Benefícios da Normalização
- **Redução da Redundância**: Elimina a duplicação de dados, o que economiza espaço de armazenamento e facilita a manutenção.
- **Melhoria da Integridade**: Reduz o risco de inconsistências, pois as alterações nos dados são refletidas de maneira uniforme em todo o banco de dados.
- **Facilidade de Manutenção**: Simplifica a atualização, inserção e exclusão de dados.
- **Eficiência das Consultas**: Pode melhorar o desempenho das consultas ao eliminar redundâncias e normalizar as relações entre tabelas.

**Desvantagens da Normalização**

- **Complexidade**: A estrutura resultante pode ser mais complexa, exigindo mais tabelas e relacionamentos.
- **Desempenho das Consultas**: Em alguns casos, pode ser necessário realizar muitas junções de tabelas, o que pode afetar negativamente o desempenho das consultas.
 
O processo de normalização deve ser balanceado com as necessidades específicas do sistema de banco de dados e o desempenho desejado. Em alguns casos, pode ser benéfico desnormalizar certas partes do banco de dados para otimizar a performance de consultas específicas.