# National Health and Nutrition Examination Survey (NHANES)
[https://wwwn.cdc.gov/nchs/nhanes/](https://wwwn.cdc.gov/nchs/nhanes/)

Este laboratório usará dados extraídos do NHANES.

## NHANES datasets from 2013-2014

Foram extraídos dados do [NHANES 2013-2014](https://wwwn.cdc.gov/nchs/nhanes/continuousnhanes/default.aspx?BeginYear=2013).

Os dados estão disponíveis em arquivos CSV no diretório `/data/nhanes`. Lá está disponível a documentação do esquema dos arquivos.

# Tarefa 1 - Esquema Relacional

Analise os arquivos CSV que estão no diretório `/data/nhanes` e escreva um esquema relacional referente às tabelas, suas chaves primárias e estrangeiras (não é SQL ainda). Coloque a chave primária com dois underlines antes e dois depois:



Pessoa (__Id__, Gênero, Idade)
Medicamento(__Codigo__, NomeMedicamento)
UsoMedicamento (IdPessoa,CodMedicamento,DiasUso)
-CHE:IdPessoa from Pessoa
-CHE:CodMedicamento from Medicamento


## Criação das Tabelas em SQL e Importação de Dados

Considere o seguinte exemplo em que é criada uma tabela em SQL e importado dados do arquivo CSV `demographic-person.csv`.

In [3]:
%defaultDatasource jdbc:h2:mem:db

In [4]:
DROP TABLE IF EXISTS Pessoa

In [5]:
CREATE TABLE Pessoa (
  Id VARCHAR(5) NOT NULL,
  Gender INTEGER,
  Age INTEGER,
  PRIMARY KEY(Id)
) AS SELECT
    id,
    gender,
    age
FROM CSVREAD('data/demographic-person.csv');

In [6]:
SELECT * FROM Pessoa;

# Tarefa 2 - Criação das Tabelas em SQL e Importação de Dados

Escreva instruções SQL para montar as duas tabelas restante, conforme definido no esquema relacional da **Tarefa 1**.

**Importante:** não defina chave primária para a tabela de uso de medicamento.

Durante a criação das tabelas, realize a importação dos dados do arquivo CSV nas tabelas criadas, conforme exemplo anterior.

In [7]:
DROP TABLE IF EXISTS Droga

In [8]:
CREATE TABLE Droga (
  Droga_Id VARCHAR(6) NOT NULL,
  nomeDroga VARCHAR(100) NOT NULL,
  PRIMARY KEY(Droga_Id)
) AS SELECT
    code,
    name
FROM CSVREAD('data/medications-drug.csv');

In [9]:
SELECT * FROM Droga

In [55]:
DROP TABLE IF EXISTS Uso


In [58]:
CREATE TABLE Uso (
    Person_Id VARCHAR (5) NOT NUll,
    Droga_Id VARCHAR (6) NOT NUll,
    Days_of_use INTEGER ,
    FOREIGN KEY(Person_Id)
        REFERENCES Pessoa(Id)
          ON DELETE NO ACTION
          ON UPDATE NO ACTION,
    FOREIGN KEY (Droga_Id)
        REFERENCES Droga(Droga_Id)
            ON DELETE NO ACTION
            ON DELETE NO ACTION
    ) AS SELECT 
        person_id,
        drug_code,
        days_use
    FROM CSVREAD('data/medications-use.csv');

In [59]:
SELECT * FROM Uso

# Tarefa 3 - Consultas Simples

Execute as consultas a seguir.

a) Liste pessoas com idade acima de 60

In [21]:
SELECT * FROM  Pessoa WHERE age > 60;

b) Liste as idades das pessoas cadastradas (sem repetições)

In [22]:
SELECT DISTINCT Pessoa.Age FROM Pessoa

c) Liste código das pessoas, idade, código dos medicamentos que usaram e dias de uso

In [27]:
SELECT  Pessoa.Id, Pessoa.Age, Droga.Droga_Id, Uso.Days_of_use
FROM Pessoa, Droga, Uso
WHERE Pessoa.Id = Uso.Person_Id and Droga.Droga_Id = Uso.Droga_Id;

d) Liste código das Pessoas, idade, nome dos medicamentos que usaram e quantos dias de uso

In [66]:
SELECT DISTINCT  Pessoa.Id, Pessoa.Age, Droga.nomeDroga, Uso.Days_of_use
FROM Pessoa, Droga, Uso
WHERE Pessoa.Id = Uso.Person_Id and Droga.Droga_Id = Uso.Droga_Id;



e) Liste nome dos medicamentos que foram usados por pessoas (sem repetições)

In [67]:
SELECT DISTINCT Droga.nomeDroga
FROM Pessoa, Droga, Uso
WHERE Pessoa.Id = Uso.Person_Id and Droga.Droga_Id = Uso.Droga_Id;

f) Liste nome dos medicamentos usados por mais de 2.000 dias (sem repetições)

In [68]:
SELECT  DISTINCT Droga.nomeDroga
FROM Pessoa, Droga, Uso
WHERE Pessoa.Id = Uso.Person_Id and Droga.Droga_Id = Uso.Droga_Id and Uso.Days_of_use > 2000;