# **Conceitos Gerais em Modelagem da Informação**


## INTRODUÇÃO 

A modelagem de informações é o conjunto de práticas que determinam os requisitos de estrutura, acessibilidade e ciclo de vida das informações no domínio de um negócio. 

O processo de modelagem durante o desenvolvimento de software, em que arquitetos e engenheiros criam modelos de estrutura de classes, esquemas de bancos de dados e arquitetura de sistemas, desenvolverem modelos de informações que sejam flexíveis o suficiente para absorver mudanças futuras é essenciais.
Com isso, o desenvolvimento exixge equilíbrio quanto à funcionaliade, desepenho, resiliência, segurança e flexibilidade. 

Para tanto, tem sido necessário que, cada vez mais, as empresas tenham total domínio quanto ao fluxo de informações em toda a organização; assim sendo, um
modelo de informações é um auxiliar no desenho e construção de sistemas e processos, bem como também um artefato a ser referenciado em todo o ciclo de vida
das informações relacionadas a tal. Ou seja, modelos são representações, utilizados em determinados contextos, visando à geração de valor comercial.

**“Um modelo é uma descrição abstrata que esconde certos detalhes enquanto ilumina outros.”**


À medida que as empresas passam a criar valor a partir de seus ativos de informação, a modelagem de informações fornece então uma ferramenta importante
para comunicar o desenho, padrões e demais aspectos-chave das entidades no contexto do domínio que está sendo representado para todos os envolvidos.

A modelagem de informações é uma ferramenta para gerenciamento de informações a qual visa suportar a criação de dados confiáveis e​​ de qualidade, mantendo
a integridade dos dados, permitindo que as arquiteturas sejam robustas e escaláveis.

A modelagem é um desafio particular quando os dados residem em fontes não estruturadas, como planilhas, documentos de texto, wikis, sites de colaboração em
documentos, dentre outros.

Tendo em vista que as informações residem e são acessadas em muitos formatos e estruturas diferentes, tais como arquivos, bancos de dados relacionais e não re-
lacionais, serviços, cadeias de blocos, a necessidade de consultar, relacionar, organizar, formatar, relatar, armazenar, atualizar e alterar esquema de entidades requer coordenação e planejamento.

Assim sendo, o processo de modelagem da informação começa com a criação dos modelos, os quais são pensados principalmente durante a coleta de requisitos(dados),
bem como são refinados nas fases de desenho, referenciados durante a implementação e mantidos como um artefato a ser referenciado posteriormente.

Vale ressaltar, que aos poucos,tem havido esforços significativos no desenvolvimento de tais modelos também para outros recursos de gerenciamento de informações, como nos **processos de governança de dados**, **gerenciamento de dados-mestres**, **integração de informações** e até mesmo **análise em segurança da informação**. A modelagem de informações tem se tornado cada vez mais uma etapa importante e essencial em qualquer projeto de desenvolvimento ou manutenção de software.

como se dá a modelagem de informações e a utilização de tais modelos, explanação sobre modelos conceituais e notações mais comuns, além de explanação-exemplo quanto a um processo de modelagem tradicional.<p>
"
A **modelagem de informaçõe** consiste no processo de estruturar e representar os dados de um sistema de maneira que seja compreensível e eficiente para armazenar, manipular e recuperar informações. Essa modelagem é fundamental no desenvolvimento de sistemas de informação, bancos de dados e processos analíticos."

![image.png](attachment:image.png)

## **Conceitos Gerais**
**Como se dá a modelagem de informações e como se utilizam modelos?**

A **modelagem de informações** envolve práticas que definem a estrutura, acessibilidade e ciclo de vida dos dados dentro de um negócio. Assim como outros tipos de modelagem, ela pode ser aplicada para diversos propósitos, desde a criação de modelos conceituais de alto nível até a definição de modelos físicos de dados.  

Para um desenvolvedor que trabalha com **orientação a objetos**, a modelagem de informações se assemelha à modelagem de dados e à modelagem de classes. No entanto, há uma diferença fundamental: enquanto a modelagem de classes abrange tanto os aspectos **comportamentais** quanto os **dados** de um sistema, a modelagem de dados foca exclusivamente na **estrutura dos dados**.  

Na prática, modelar dados significa definir e organizar **entidades** e seus **atributos**, assim como na modelagem de classes identificamos classes e suas propriedades. Além disso, a modelagem de dados inclui **relacionamentos** entre entidades, como **herança** e **agregação**, que também são conceitos presentes na programação orientada a objetos.

A modelagem de informações em arquitetura de sistemas de informação pode assumir várias formas, todas com representações de entidades e seus respectivos relacionamentos, como:

• **Diagramas de classes**: onde são modeladas as informações necessárias para se construir ou manter um sistema ou componente;<p>
• **Diagrama de entidade relacionamento**: modelagem de dados específica para desenho e construção de banco de dados(SGBD);<p>
• **Diagramas de fluxo de informações**: costumam indicar a origem dos dados e seus usos (processo ou sistemas) em toda a empresa, linha de negócios ou
sistema, dependendo do contexto;<p>
• **Modelos de dados**: dependendo do nível de detalhamento, descrevem as entidades e seus relacionamentos detalhando atributos, tipos e multiplicidade de
uma entidade para outras entidades;<p>
• **Ciclos de vida dos dados**: como os dados são criados, usados e retidos (arquivados ou destruídos).<p>

Os modelos de dados variam conforme diversos fatores, como **uso** (analítico ou transacional), **foco** (global, corporativo, linha de negócio ou sistema) e **nível de detalhe** (conceitual, lógico ou físico).  
Por exemplo, os dados de um cliente em um **aplicativo financeiro online** serão organizados de forma diferente dos dados coletados para **análise de localização** em um **aplicativo de mobilidade urbana**. No primeiro caso, a estrutura dos dados tende a ser **normalizada**, garantindo consistência e minimizando redundâncias. Já no segundo caso, o modelo de dados pode seguir um **esquema estrela (star schema)** ou **floco de neve (snowflake schema)**, comuns em **data warehouses**, para otimizar consultas analíticas e melhorar o desempenho na geração de estatísticas.

**“Modelos são usados para organizar o pensamento humano na forma de explicações.”**

A modelagem também pode indicar limites os quais podem ser, por exemplo, limites do fluxo de informações necessários para uma conformidade regulatória ou
restrições de acesso ao negócio, com trilhas de auditoria e segurança rígidas em torno da autenticação e autorização. Os modelos podem ser relevantes para apenas um pequeno grupo de indivíduos para uma necessidade em específico do processo de negócios, ou podem ser reconhecidos como um padrão global da indústria.
Um modelo fornece um formato formalizado que ajuda nas conversas entre arquitetos e usuários, partes interessadas, ou mesmo arquitetos e analistas externos.
As linguagens de modelagem padronizam as notações que transmitem os significados de entidades,atributos, transições, relacionamentos, identificadores, dentre outros. https://youtu.be/ZX7EuRWRdZg

**“Modelos têm uma influência profunda sobre como um problema é resolvido e como uma solução toma forma.”**

Uma **sessão de modelagem** com especialistas ajuda a traduzir conceitos do mundo real (como processos de negócios) em **entidades e informações** que atendam às necessidades da empresa. A **notação** utilizada na modelagem garante que o significado dos dados seja preservado durante as fases de projeto e implementação. Por isso, é essencial que todos os participantes compreendam as notações usadas. Uma análise incorreta pode resultar em problemas de **desempenho, confiabilidade, disponibilidade e escalabilidade**.  

Os **modelos de dados** são classificados em três categorias:  

### **1. Modelos Conceituais de Dados**  
Também chamados de **modelos de domínio**, são usados para entender os **aspectos de negócio**, sem focar na tecnologia.  
- Em **equipes ágeis**, esses modelos são criados no início do projeto para entender os requisitos do sistema.  
- Em **equipes tradicionais**, eles costumam ser feitos antes dos Modelos Lógicos de Dados (MLDs).  
- O principal diagrama usado aqui é o **Diagrama Entidade-Relacionamento (DER)**, que representa as **entidades** e os **relacionamentos** entre elas.  

### **2. Modelos Lógicos de Dados (MLDs)**  
São usados para definir os conceitos de negócio, mas já considerando restrições técnicas e regras de implementação.  
- Incluem elementos como **chaves primárias e estrangeiras**, **normalização** e **integridade referencial**.  
- Podem ser criados para um **projeto específico** ou para toda a empresa.  
- Definem **entidades lógicas**, seus **atributos** e seus **relacionamentos**.  
- São mais comuns em **projetos tradicionais**.  

### **3. Modelos Físicos de Dados (MFDs)**  
Representam o **esquema interno do banco de dados**, ou seja, como os dados serão armazenados fisicamente.  
- Descrevem **tabelas, colunas e relacionamentos** entre elas.  
- Precisam considerar as limitações do **Sistema de Gerenciamento de Banco de Dados (SGBD)**.  
- São úteis tanto em **projetos ágeis** quanto em **tradicionais**.  
- Baseiam-se nos Modelos Lógicos de Dados (MLDs) para sua construção.  

Esses três níveis de modelagem garantem que os dados sejam bem estruturados e alinhados às necessidades do negócio, desde o entendimento inicial até a implementação no banco de dados.

**Embora MLDs e MFDs pareçam similares, e eles de fato o são, o nível de detalhes que cada um deles modela pode ser significativamente diferente. Isso porque o próprio objetivo ao se utilizar de cada diagrama é diferente.**

### **Arquitetura de Três Níveis**  

A arquitetura de três níveis de um banco de dados, definida pelo **ANSI/SPARC**, organiza a estrutura do banco em três camadas para garantir independência dos dados e facilitar a manutenção.  

#### **1. Nível Externo (Visão do Usuário)**  
- Representa a **interface do usuário**, ou seja, como os dados são visualizados pelos diferentes perfis de usuários.  
- Cada usuário pode ter uma **visão personalizada**, acessando apenas os dados relevantes para ele.  
- Exemplo: Um funcionário do RH pode ver apenas informações de empregados, enquanto um gerente financeiro acessa dados de faturamento.  

#### **2. Nível Conceitual (Modelo Lógico)**  
- Define a **estrutura lógica do banco de dados**, independentemente da tecnologia utilizada.  
- Inclui **entidades, relacionamentos, restrições e regras de integridade**.  
- Normalmente representado por **diagramas Entidade-Relacionamento (DER)** ou **Modelos Lógicos de Dados (MLDs)**.  

#### **3. Nível Interno (Modelo Físico)**  
- Representa a **estrutura de armazenamento físico** do banco de dados.  
- Define **tabelas, índices, partições, alocação de espaço e otimização de desempenho**.  
- Depende do **Sistema de Gerenciamento de Banco de Dados (SGBD)** utilizado.  

---

### **Esquema do Banco de Dados**  

O esquema do banco de dados é a **estrutura organizacional** do banco e pode ser dividido em três tipos, alinhados à arquitetura de três níveis:  

1. **Esquema Externo**: Visões individuais dos usuários.  
2. **Esquema Conceitual**: Estrutura lógica geral do banco.  
3. **Esquema Interno**: Definição da implementação física dos dados.  

---

### **Etapas do Desenvolvimento de um Banco de Dados**  

A construção de um banco de dados segue várias etapas para garantir que os dados sejam bem estruturados e otimizados.  

#### **1. Levantamento de Requisitos**  
- Entender as **necessidades do negócio** e os dados que devem ser armazenados.  
- Entrevistar usuários e definir regras de negócio.  

#### **2. Modelagem Conceitual**  
- Criar um **Modelo Conceitual de Dados (MCD)** usando diagramas Entidade-Relacionamento (DER).  

#### **3. Modelagem Lógica**  
- Transformar o modelo conceitual em um **Modelo Lógico de Dados (MLD)**, definindo tabelas, atributos e relacionamentos.  
- Aplicar **normalização** para evitar redundância e garantir integridade.  

#### **4. Modelagem Física**  
- Criar o **Modelo Físico de Dados (MFD)**, que define como os dados serão armazenados no SGBD.  
- Definir **índices, chaves primárias e estrangeiras**.  

#### **5. Implementação**  
- Criar o banco de dados no SGBD escolhido (**MySQL, SQL Server, PostgreSQL, etc.**).  
- Popular as tabelas com os primeiros dados.  

#### **6. Testes e Validação**  
- Verificar **performance, segurança e integridade dos dados**.  
- Ajustar índices e otimizar queries, se necessário.  

#### **7. Manutenção e Monitoramento**  
- Atualizar o banco conforme novas necessidades surgem.  
- Monitorar **desempenho e segurança** para evitar falhas.  

Seguindo essas etapas, o banco de dados será bem estruturado, seguro e eficiente para atender às demandas do negócio. (ABREZENTADO NO VÍDEO)

![image.png](attachment:image.png)

![image.png](attachment:image.png)

**Modelo Conceitual de Dados**, representando um banco de dados relacionado a fotos. Aqui estão algumas observações sobre o esquema:

### **Entidades e Relacionamentos**
1. **Foto (Entidade Principal)**  
   - A tabela **Foto** contém informações como `ID`, `Título`, `Descrição`, `Tipo`, `Usuário`, `Endereço`, `Telefone`, `Email` e `Imagem`.  
   - Se relaciona com várias outras entidades.

2. **Relacionamentos**
   - **Álbum**: Um álbum pode conter várias fotos (relação 1:N).  
   - **Tag**: Uma foto pode ter várias tags associadas (relação N:N).  
   - **Local**: Cada foto pode estar associada a um local específico (relação 1:N).  
   - **Histórico**: Um histórico pode registrar alterações de uma foto (relação 1:N).  
   - **Comentário**: Cada foto pode ter vários comentários associados (relação 1:N).

### **Interpretação**
Este modelo representa um banco de imagens, onde cada foto pode pertencer a um álbum, estar relacionada a um local, ter tags associadas, registros de histórico e comentários.

![Captura de tela de 2025-02-03 15-26-35.png](<attachment:Captura de tela de 2025-02-03 15-26-35.png>)

**Modelo Lógico de Dados**, que é uma evolução do modelo conceitual mostrado anteriormente. Esse modelo lógico detalha os atributos e os tipos de dados das tabelas que compõem o banco de dados.


### **Principais Elementos do Modelo Lógico**
1. **Photo (Foto)**
   - Entidade central, contendo `ID`, `Title`, `Description`, `Privacy`, `UploadDate` e `View`.
   - Relacionada a várias outras entidades, como **Album**, **Tag**, **Location**, **Member** e **Comment**.

2. **Album (Álbum)**
   - Contém as colunas `ID`, `Title`, `Description` e `View`.
   - Relacionamento **1:N** com **Photo** (um álbum pode conter várias fotos).

3. **Tag**
   - Contém `ID` e `Title`.
   - Relacionamento **N:N** com **Photo** (uma foto pode ter várias tags, e uma tag pode estar associada a várias fotos).

4. **Location (Local)**
   - Contém `ID`, `Name` e `Shortname`.
   - Relacionamento **1:N** com **Photo** (uma foto pode estar vinculada a um local específico).

5. **Member (Usuário ou Membro)**
   - Contém `ID`, `Name`, `PhoneNum`, `Email` e `Address`.
   - Relacionamento **1:N** com **Photo** (um usuário pode fazer o upload de várias fotos).

6. **Comment (Comentário)**
   - Contém `ID`, `PostDate` e `Content`.
   - Relacionamento **1:N** com **Photo** (uma foto pode ter vários comentários).

### **Evolução do Modelo**
- O **modelo lógico** refina o **modelo conceitual** ao definir **tipos de dados** para cada atributo.
- A inclusão de **chaves primárias (PK)** e a organização dos relacionamentos tornam o banco de dados **mais estruturado** para implementação.

![image.png](attachment:image.png)

**Modelo Físico de Dados**, que é uma etapa posterior ao modelo lógico. Ele define detalhes específicos para a implementação do banco de dados, incluindo **tipos de dados**, **tamanhos de colunas** e **chaves primárias e estrangeiras**.

### **Principais tabelas e relacionamentos**
1. **Album**
   - Armazena informações sobre álbuns de fotos.
   - Campos: `ID`, `Title`, `Description`, `View`.

2. **Location**
   - Guarda detalhes sobre os locais associados às fotos.
   - Campos: `ID`, `Name`, `Shortname`.

3. **Member**
   - Representa os usuários do sistema.
   - Campos: `ID`, `Name`, `PhoneNum`, `Email`, `Address`.

4. **Photo**
   - Tabela central que armazena fotos e seus metadados.
   - Campos: `ID`, `AlbumID`, `LocationID`, `MemberID`, `Title`, `Description`, `Privacy`, `UploadDate`, `View`, `ImagePath`.

5. **Comment**
   - Contém os comentários feitos nas fotos.
   - Campos: `ID`, `PhotoID`, `PostDate`, `Content`.

6. **Tag**
   - Representa tags que podem ser associadas a fotos.
   - Campos: `ID`, `Title`.

7. **Tag_Photo** (tabela de relacionamento N:N entre Photo e Tag)
   - Campos: `ID`, `TagID`, `PhotoID`.

### **Diferenciais do modelo físico**
✅ Especificação detalhada dos **tipos de dados** (`int`, `varchar`, `date`).  
✅ Definição de **tamanhos de colunas** (`varchar(255)`, `int(5)`).  
✅ Uso de **chaves primárias** (`ID`) e **chaves estrangeiras** (`PhotoID`, `TagID`, `MemberID`).  
✅ Representação de relacionamentos entre tabelas, inclusive **N:N** (Tag_Photo).  

Os Modelos Físicos de Dados (MFDs) devem seguir os padrões de nomenclatura do banco de dados da organização e indicar os tipos de dados das colunas, como **integer** e **varchar(255)**. Esses modelos são úteis tanto no nível corporativo quanto em projetos específicos.  

No contexto empresarial, arquitetos costumam criar **Modelos Lógicos de Dados (MLDs)** de alto nível, que representam a estrutura dos dados essenciais para a empresa. Esses modelos são chamados de **Modelos de Dados da Empresa** ou **Modelos de Informação da Empresa** e podem coexistir com outras representações, como infraestrutura de rede, hardware, estrutura organizacional e processos de negócios. Eles fornecem diretrizes para as equipes de projeto, servindo como referência para definir a estrutura do sistema.  

As equipes de projeto normalmente desenvolvem **MLDs** como parte da fase de análise, especialmente quando o ambiente de implementação é predominantemente **procedural**. Esse tipo de modelo é uma excelente escolha para projetos voltados para dados, como **data warehouses** ou **sistemas de relatórios**. No entanto, quando se trabalha com **tecnologias orientadas a objetos ou baseadas em componentes**, os MLDs podem não ser ideais. Nesses casos, diagramas UML costumam ser mais adequados para representar as estruturas e relações do sistema.  

Quando um banco de dados relacional é utilizado, a criação de um **MFD** é recomendada para modelar o **esquema interno** do banco. Vale destacar que o MFD é apenas um dos diversos artefatos críticos no desenvolvimento de aplicações de negócios, sendo essencial escolher as ferramentas corretas para cada necessidade.  

Além disso, muitos profissionais preferem utilizar **Modelos de Papel de Objeto (ORM, Object-Role Model)** em vez de MLDs para representar modelos conceituais. A principal vantagem dos ORMs é sua notação simplificada, tornando-os mais fáceis de interpretar. No entanto, um ponto de atenção é que esses modelos podem crescer rapidamente e se tornar excessivamente complexos. Um benefício importante dos ORMs é permitir a análise de **exemplos de dados reais** antes de partir para uma abstração, reduzindo o risco de interpretações equivocadas.
ORMs nos permitem, então, primeiramente explorar os exemplos de dados reais ao invés de simplesmente partirmos para uma abstração potencialmente incorreta – por exemplo, a Figura 4 examina o relacionamento entre clientes e um endereço em detalhe.

![image-2.png](attachment:image-2.png)

### **Notações mais comuns**

A Figura 5 a seguir apresenta um comparativo de variadas formas de se representar um modelo conceitual em seis diferentes notações as de Chen, IDEF1X,
Bachman, Engenharia da Informação (na figura em inglês, abreviação IE de information engineering), Min-Max e UML. Além disso, na Figura 6, também a
seguir, temos um resumo da sintaxe das quatro notações mais comuns para modelagem de dados: Engenharia da Informação (EI), Notação de Barker, IDEF1X e
UML (Unified Modeling Language).

![image.png](attachment:image.png)

![image-2.png](attachment:image-2.png)



Resumo de sintaxe em quatro diferentes notações: http://bit.ly/2rMTeW9 <P>
Para mais detalhes é de interesse que se conheça mais a fundo os trabalhos de Chen, Bachman, Martin (EI) e Barker. Disponível em: http://bit.ly/2KIvCZ2

Em resumo, as notações mais utilizadas para modelagem de dados possuem características distintas:  

- **EI (Entidade-Relacionamento Estendida):** Simples e de fácil leitura, essa notação é amplamente usada na modelagem de dados de negócios e na modelagem lógica de alto nível. No entanto, um ponto negativo é a falta de suporte para identificar atributos de entidades, exigindo que esses detalhes sejam representados em outro diagrama ou documentados separadamente.  

- **Notação de Barker:** Uma das mais populares, sendo a padrão em ferramentas como o Oracle Toolset. É considerada abrangente para todos os tipos de modelos de dados, mas pode se tornar complexa devido à presença de hierarquias com múltiplos níveis de profundidade.  

- **IDEF1X:** Originalmente desenvolvida para modelagem física, essa notação é bastante complexa e tem sido cada vez menos utilizada nos últimos anos.  

- **UML:** Embora não seja uma notação específica para modelagem de dados, há iniciativas para criar um perfil UML voltado para esse propósito. No entanto, essas tentativas ainda são incompletas e não foram oficialmente reconhecidas pela UML.  

## **Modelando Dados**

É essencial que um desenvolvedor de software tenha conhecimento dos fundamentos de modelagem de dados. Isso não apenas facilita a leitura dos modelos, mas também permite uma colaboração mais eficiente com os DBAs, responsáveis pela gestão dos dados em um projeto.  

O processo de modelagem de dados pode ser resumido em etapas iterativas, incluindo:  

- **Identificação dos tipos de entidade:** Determinar os principais elementos do sistema que precisam ser representados no banco de dados, como clientes, produtos ou pedidos.  

- **Definição de atributos:** Especificar as características de cada entidade, como nome e e-mail para um cliente ou preço e estoque para um produto.  

- **Aplicação de convenções de nomenclatura:** Definir padrões para nomear entidades, atributos e relacionamentos, garantindo organização e consistência no modelo.  

- **Determinação de relacionamentos:** Estabelecer como as entidades se conectam entre si, como a relação entre clientes e pedidos em um sistema de vendas.  

- **Associação de chaves:** Definir chaves primárias e estrangeiras para garantir a integridade e unicidade dos dados, facilitando a ligação entre tabelas.  

- **Normalização para reduzir redundâncias:** Estruturar os dados de forma eficiente, eliminando repetições desnecessárias e minimizando inconsistências.  

- **Desnormalização para otimizar o desempenho:** Em alguns casos, combinar tabelas ou duplicar dados pode melhorar a performance das consultas, reduzindo a complexidade de certas operações.

### **Identificação de Tipos de Entidade**  

Uma **entidade**, ou **tipo de entidade**, é um conceito semelhante ao de uma classe na programação orientada a objetos. Assim como uma classe representa um conjunto de objetos com características comuns, uma entidade representa uma coleção de elementos semelhantes, como pessoas, lugares, coisas, eventos ou conceitos.  

Em um **modelo de dados**, diferentes tipos de entidades são identificados com base em seus atributos e relacionamentos. Classificá-las corretamente ajuda a definir quais perguntas devem ser feitas ao projetar o banco de dados.  

Por exemplo, em um sistema de vendas, algumas entidades típicas seriam:  

- **Cliente** – Representa as pessoas que compram produtos ou serviços.  
- **Endereço** – Armazena os endereços associados aos clientes ou lojas.  
- **Venda** – Registra cada transação realizada.  
- **Item** – Representa os produtos ou serviços vendidos.  
- **Taxa** – Define impostos ou tarifas aplicáveis às vendas.  

Se estivéssemos modelando um sistema orientado a objetos, provavelmente encontraríamos classes com esses mesmos nomes. No entanto, há uma diferença fundamental entre uma **classe** e um **tipo de entidade**:  

- **Classes** possuem **dados e comportamentos** (métodos ou funções associadas).  
- **Entidades** armazenam apenas **dados**, sem comportamentos associados.  

Por exemplo, "Cliente" e "Venda" são conceitos distintos, portanto, devem ser modelados como entidades separadas para garantir uma estrutura de dados bem organizada e coerente.  


### **Identificação de Atributos**  

Cada entidade é representada por um ou mais **atributos**, que armazenam informações sobre ela.  

Por exemplo, na **Figura 1**, a entidade **Foto** possui atributos como **ID, Título e Descrição**. Da mesma forma, na **Figura 2**, a tabela correspondente no banco de dados, chamada **Photo**, contém colunas com os mesmos nomes (**ID, Title e Description**). Em um banco de dados relacional, uma **coluna** representa a implementação de um **atributo**.  

Ao definir atributos, é essencial garantir que eles sejam **coerentes com o domínio da aplicação e as necessidades do negócio**. Na **Figura 1**, foi decidido modelar **fotos de mídia social**, considerando que essas geralmente possuem identificadores, títulos e descrições variadas.  

A escolha do nível correto de detalhe na modelagem pode ter um impacto significativo no desenvolvimento e na manutenção do sistema. Um modelo bem estruturado evita redundâncias, melhora a eficiência e facilita futuras modificações.

### **Aplicação de Convenções de Nomes**  

Para garantir consistência e clareza na modelagem de dados, as organizações devem estabelecer **normas e diretrizes específicas**. Essas diretrizes incluem convenções de nomenclatura tanto para a **modelagem lógica** quanto para a **modelagem física**.  

- As **convenções de nomenclatura lógica** devem priorizar a **clareza e a legibilidade**, facilitando a compreensão do modelo.  
- As **convenções de nomenclatura física** devem levar em conta aspectos **técnicos e de desempenho**, como restrições de tamanho de nomes em bancos de dados específicos.  

Seguir um conjunto padronizado de regras permite que os desenvolvedores trabalhem de maneira mais organizada e consistente, tornando o projeto de software mais compreensível e sustentável a longo prazo.

### **Identificação de Relacionamentos**  

No mundo real, as entidades possuem **relacionamentos** entre si. Em um sistema de mídia social, por exemplo:  

- **Usuários** fazem **upload** de **fotos**.  
- **Usuários** interagem com **conteúdos**.  
- **Usuários** pertencem a um **grupo de membros**.  

Cada um desses elementos se conecta de forma lógica e representa um **relacionamento** entre entidades. Conceitualmente, esses relacionamentos são equivalentes às **associações entre objetos** na programação orientada a objetos.  

Modelar corretamente esses relacionamentos é essencial para garantir a integridade dos dados e permitir consultas eficientes no banco de dados.  

![image.png](attachment:image.png)

**Isso nos leva a questões como: quantos usuários podem ser envolvidos em um determinado conteúdo e se é possível ter alguma interação com nenhum usuário envolvido?**
Precisamos também identificar a cardinalidade de um relacionamento, uma representação do conceito de “quantos” enquanto opcionalmente representa o conceito de “se é obrigatória a existência da entidade”. Por exemplo, não é suficiente saber que usuários interagem com fotos. Mas também quantas interações um usuário pode realizar, não? Quantas seriam? Nenhuma, uma ou várias? Além disso, os relacionamentos existem nos dois sentidos: não apenas usuários fazem interações,
mas interações são realizadas por usuários.  https://www.macoratti.net/cbmd1.htm

### **Associando Chaves**  

O conceito de **chave** é essencial na modelagem de dados, pois garante a **integridade referencial** no banco de dados, impedindo a duplicação de registros e garantindo que os relacionamentos entre tabelas sejam mantidos corretamente.  

Existem duas estratégias principais para associar chaves às tabelas:  

1. **Chave Natural:** É composta por um ou mais atributos que já existem no negócio e são naturalmente **únicos**.  
   - Exemplo: Em uma tabela **Cliente**, os atributos **Número do Cliente** e **CPF** podem ser considerados **chaves naturais**, pois cada cliente tem um CPF único.  

2. **Chave Substituta:** É uma chave criada artificialmente, sem significado direto para o negócio. Geralmente, é um identificador numérico gerado automaticamente pelo sistema.  
   - Exemplo: Criar um campo **ID_Cliente** como chave primária em vez de usar o CPF. Isso evita problemas caso o CPF precise ser alterado, além de melhorar a eficiência das consultas.  

A escolha entre **chave natural** e **chave substituta** depende do contexto do sistema. Chaves naturais podem ser úteis quando há atributos únicos claros, enquanto chaves substitutas oferecem mais flexibilidade e evitam problemas caso os dados do negócio precisem ser modificados.

### **Normalização para Reduzir Redundância**  

A **normalização** é um processo utilizado para **melhorar a qualidade** do projeto de banco de dados, organizando os atributos de forma a **eliminar redundâncias** e **garantir a integridade dos dados**. Esse método é baseado em regras teóricas que definem as propriedades das relações entre tabelas.  

O principal objetivo da normalização é **minimizar a repetição de informações**, pois manter os mesmos dados em vários lugares pode gerar inconsistências e dificultar a manutenção do banco de dados.  

A seguir, estão as três principais formas normais, que representam níveis progressivos de normalização:  

1. **Primeira Forma Normal (1NF):**  
   - Garante que **não existam grupos de dados repetidos** dentro de uma entidade.  
   - Exemplo: Em uma tabela **Pedidos**, se um cliente comprou três produtos, cada produto deve estar em uma linha separada, e não agrupado em uma única célula.  

2. **Segunda Forma Normal (2NF):**  
   - Além de estar na **1NF**, exige que **todos os atributos não-chave dependam completamente da chave primária**.  
   - Exemplo: Se uma tabela **Pedidos** contém um campo **Nome do Cliente**, isso causa redundância, pois o nome do cliente está relacionado ao **ID do Cliente** e não diretamente ao pedido. A solução seria separar as informações do cliente em uma tabela própria.  

3. **Terceira Forma Normal (3NF):**  
   - Além de estar na **2NF**, requer que **não existam dependências indiretas**, ou seja, todos os atributos devem depender **somente** da chave primária.  
   - Exemplo: Se uma tabela **Pedidos** contém um campo **Cidade do Cliente**, mas a cidade pode ser obtida a partir da tabela **Clientes**, esse dado está redundante e deve ser removido da tabela **Pedidos**.  

O nível de normalização de um banco de dados é definido pelo tipo de entidade **menos normalizado**. Por exemplo, se todas as tabelas estão na **Segunda Forma Normal (2NF)** ou superior, o esquema de dados é considerado estar na **2NF**.  

Embora a normalização seja essencial para evitar redundância e manter a integridade dos dados, em alguns casos pode ser necessário **desnormalizar** certas tabelas para melhorar o desempenho das consultas.  

### **Por que Normalizar os Dados?**  

A principal vantagem da **normalização** é que os dados são **armazenados de forma única e organizada**, reduzindo a **redundância** e evitando inconsistências. Isso significa que, se for necessário atualizar uma informação, a modificação será feita em **apenas um local**, garantindo a integridade dos dados.  

Além disso, bancos de dados altamente normalizados costumam estar mais alinhados com os conceitos da **programação orientada a objetos**. Assim como a ***POO** busca **alta coesão e baixo acoplamento** entre classes, a normalização estrutura os dados de forma modular e independente, tornando o mapeamento entre objetos e tabelas mais intuitivo.  

No entanto, a normalização pode impactar o **desempenho**. Como os dados são distribuídos entre várias tabelas, algumas consultas exigem **junções complexas** para recuperar todas as informações necessárias.  

Por exemplo, em um sistema de **e-commerce**, se os dados de uma venda fossem armazenados **em uma única linha** (incluindo os itens comprados), bastaria uma leitura simples para calcular o valor total da compra. No entanto, com a normalização, os itens da venda estariam em uma **tabela separada**, exigindo uma junção para obter o mesmo resultado, o que pode aumentar o tempo de processamento.  

Por isso, o nível de normalização deve ser **bem planejado**, equilibrando a integridade dos dados com o desempenho das operações no banco de dados.

![image.png](attachment:image.png)

### **Diversificação para Melhoria de Desempenho**  

Embora a **normalização** de dados tenha como principal objetivo a **redução da redundância** e a **garantia da integridade** dos dados, ela pode causar **problemas de desempenho** em sistemas em produção. Isso acontece porque, ao normalizar, os dados são distribuídos entre várias tabelas, o que pode exigir operações mais complexas, como **junções** (joins) entre elas, para recuperar informações relacionadas.

Em outras palavras, as regras de normalização não se preocupam com o **tempo de acesso** aos dados, mas com sua **organização** e **consistência**. Quando os esquemas de dados normalizados são colocados em produção, o desempenho pode ser impactado, especialmente em sistemas com grande volume de dados e consultas complexas.  

A **diversificação** do esquema de dados, ou seja, a alteração de algumas estruturas do banco para otimizar o acesso, pode ser uma solução para melhorar o **tempo de resposta**. Isso pode incluir técnicas como **desnormalização**, onde algumas tabelas são combinadas para reduzir a necessidade de junções, ou o uso de **índices** para acelerar a busca por dados.  

No entanto, é importante observar que **a diversificação deve ser aplicada apenas quando necessário**. Se, após os testes de desempenho, o sistema já estiver funcionando de forma eficiente e atendendo às necessidades da aplicação, não há necessidade de modificar a estrutura. A **diversificação** deve ser uma ação tomada apenas quando **o desempenho se mostrar insatisfatório**.


### **Modelagem de Dados de Forma Evolucionária ou Ágil**  

A **modelagem de dados evolucionária** refere-se ao processo de modelagem realizado de forma **incremental**, ou seja, os dados são modelados em etapas, com melhorias e ajustes sendo feitos ao longo do tempo, à medida que o projeto avança.  

Por outro lado, a **modelagem de dados ágil** é uma abordagem da modelagem evolucionária, mas com um foco **colaborativo**. Equipes de desenvolvimento trabalham juntas, frequentemente com o cliente ou com partes interessadas, para modelar dados de forma rápida e contínua, adaptando-se às mudanças e exigências ao longo do processo.