# Introdução a Base de Dados e SGBDs

## Motivação

Dados estão no centro de praticamente todos os sistemas computacionais. </br>

Como lidar com terabytes de dados de forma eficiente?</br>

Arquivos em disco? Como manter? Como recuperar dados?</br>

Solução mais robusta -> SGBDs :)

<center><img src="./Fig-DB-Usage.png" alt="Exemplo de aplicacoes de banco de dados" width="25%" height="25%"/></center>

## Conceitos

<b>1. Dados</b>: Fatos conhecidos que podem ser armazenados e que possuem um significado implícito.

<i>Exemplo: Nomes, telefones, endereços, etc.</i>

<b>2. Banco de dados (BD)</b>: Coleção de dados relacionados entre si que atendem a um propósito específico.

<i>Exemplo: Agenda de contatos, planilha de Excel, arquivo em formato csv, etc.</i>

<b>3. Sistema Gerenciador de Banco de Dados (SGBD)</b>: Sistema computadorizado de propósito geral que permite a criação e manutenção de um BD.

Oferece basicamente os seguintes recursos:

<ul>
    <li>Suporte à definição dos tipos de dados, estruturas e restrições.</li>
    <li>Permite transações de leitura, escrita, atualização e remoção dos dados (CRUD).</li>
    <li>Oferece uma interface para consultas.</li>
    <li>Permite acesso à múltiplos usuários e programas.</li>
    <li>Garante eficiência, segurança e agilidade.</li>
</ul>

<i>Exemplo: PostgreSQL, Oracle, MySQL, MongoDB, KustoDB, etc.</i>

<b>4. Metadado</b>: Descreve a estrutura interna de um BD em um SGBD.

<i>Exemplo: Esquema do BD, tipo de dados armazenados, etc.</i>

<b>5. Indexação</b>: Estratégias e estruturas para otimizar o acesso aos dados armazenados.

<i>Exemplo: Índice de um livro, Bitmap index, BTree, etc. </i>

<center><img src="./Fig-SGBD.png" alt="Esquema simplificado de um SGBD" width="30%" height="30%"/></center>

## Modelagem de Dados

Um modelo de dados é uma coleção de conceitos para descrever a estrutura do banco de dados (tipos, relações, restrições) em determinada fase do projeto.

Um modelo conceitual (alto-nível) está mais próximo da percepção do usuário, enquanto um modelo físico (baixo-nível) apresenta mais detalhes técnicos.

Entre o modelo conceitual e o físico, está o design lógico (mapeamento).

<center><img src="./Fig-DesignPhases.png" alt="Fases do design de um BD" width="20%" height="20%"/></center>

## Modelo Entidade-Relacionamento (MER)

Nessa abordagem, um banco de dados pode ser descrito por meio de entidades (objeto do mundo real), atributos (propriedades), relacionamentos e especificações extras (e.g. cardinalidade).

Graficamente, esses componentes são representadas por meio de um diagrama entidade-relacionamento (ER).

<center><img src="./Fig-MER-Def.png" alt="Exemplo de um MER" width="30%" height="30%"/></center>

## Classificação dos SGBDs

SGBDs podem ser classificados de acordo com o modelo de dados em que se baseiam, como por exemplo:
    
<b>1. Modelo Relacional (SQL)</b><br/>
2. Modelos baseados em chave-valor, documentos, grafos, XML (Big Data, NoSQL)<br/>
3. Modelo orientado a objetos, etc <br/>

<center>
    <img src="./Fig-REL_Squema.png" alt="Modelo Relacional" width="40%" height="40%"/>
    <img src="./Fig-Doc_Squema.png" alt="Modelo documento" width="30%" height="30%"/>
</center>

SGBDs relacionais são os mais difundidos atualmente, possuem forte fundamentação matemática (álgebra relacional) e um padrão e linguagem bem estabelicidos, como SQL.

<i> Exemplos de SGBDs relacionais comerciais: PostgreSQL, Oracle, MySQL, etc.</i>

## Problema

Escola de Idiomas IsCool decidiu digitalizar o cadastro de seus professores, alunos e cursos.

Requisitos:

1. Um professor pode ministrar varios cursos;
2. Cada turma possui entre 10 a 15 alunos;
3. Um aluno pode se matricular em diferentes cursos.

Quais são as entidades, atributos e os relacionamentos que podemos inferir desse problema?

In [None]:
Entidades: Professores, alunos, cursos
Professores: nome, adfla, 
Professore - ministra - curso
aluno - matricula-se - curso

## SQL DDL/DML

Structured Query Language.

Padrão de linguagem para SGBDs relacionais comerciais.

<b>1. Data definition language (DDL)</b> ou linguagem de definição de dados refere-se aos comandos que atuam sobre o banco de dados (esquema, usuários, índices, etc).

<i>Exemplos de DDL: CREATE, ALTER, DROP, etc. </i>

<code>
CREATE DATABASE NOME;

CREATE TABLE NOME(
&nbsp;&nbsp;&nbsp;&nbsp;ATRIBUTO1 TIPO [CHAVE PRIMARIA] [NOT NULL],
&nbsp;&nbsp;&nbsp;&nbsp;ATRIBUTO2...
);
</code>
<code>
DROP TABLE NOME;
</code>

<b>2. Data manipulation language (DML)</b> ou linguagem de manipulação de dados refere-se aos comandos que atuam sobre os registros (rows).

<i>Exemplos de DML: SELECT, INSERT, UPDATE, DELETE. </i>

<code>
INSERT INTO TABLE(ATRIBUTO1, ATRIBUTO2, ...) VALUES(ATR1_VAL, ATR2_VAL, ...);
</code>

<code>
SELECT ATRIBUTO1, ATRIBUTO2 
FROM TABELA
WHERE CONDICOES
</code>

## Problema

Utilizando o banco de dados relacional Postgres, executar comandos DDL e DML para criar as tabelas e inserir dados para a aplicação do IsCool.

<b> Resposta </b>

In [48]:
%load_ext sql
%sql postgresql://postgres:admin@localhost/letscode

The sql extension is already loaded. To reload it, use:
  %reload_ext sql
 * postgresql://postgres:***@localhost/letscode
Done.


[]

## Sugestão de Modelagem

Entidades: </br>
Professor, Aluno, Curso</br>

Atributos: </br>
Professor: RG, Nome, Endereço, Data de Nascimento, Idade, Gênero, Disponibilidade, Habilidades, Data de admissão. </br>
Aluno: RG, Nome, Endereço, Data de Nascimento, Idade, Gênero, Data da matrícula</br>
Curso: Id, Nome do Curso, Descrição, Livro</br>

Relacionamentos:</br>
Professor ministra curso (1:n) </br>
Aluno matricula-se em uma curso (n:n)</br>

<img src="./Fig-MER-Escola.png" alt="MER Escola" width="30%" height="30%"/>

## Referências

ELMASRI, R.; NAVATHE, S.B. Fundamentals of Database Systems, 7th Edition