# National Health and Nutrition Examination Survey (NHANES)
[https://wwwn.cdc.gov/nchs/nhanes/](https://wwwn.cdc.gov/nchs/nhanes/)

Este laboratório usará dados extraídos do NHANES.

## NHANES datasets from 2013-2014

Foram extraídos dados do [NHANES 2013-2014](https://wwwn.cdc.gov/nchs/nhanes/continuousnhanes/default.aspx?BeginYear=2013).

Os dados estão disponíveis em arquivos CSV no diretório `/data/nhanes`. Lá está disponível a documentação do esquema dos arquivos.

# Tarefa 1 - Esquema Relacional

Analise os arquivos CSV que estão no diretório `/data/nhanes` e escreva um esquema relacional referente às tabelas, suas chaves primárias e estrangeiras (não é SQL ainda). Coloque a chave primária com dois underlines antes e dois depois:

\__teste\__


Pessoa(__Id__, Gênero, Idade)

Medicamento(__Codigo__, NomeMedicamento)

UsoMedicamento(__IdPessoa__, __CodMedicamento__, DiasUso)
- CHE: IdPessoa from Pessoa
- CHE: CodMedicamento from Medicamento



## Criação das Tabelas em SQL e Importação de Dados

Considere o seguinte exemplo em que é criada uma tabela em SQL e importado dados do arquivo CSV `demographic-person.csv`.

In [1]:
%defaultDatasource jdbc:h2:mem:db

UsageError: Line magic function `%defaultDatasource` not found.


In [None]:
CREATE TABLE Pessoa (
  Id VARCHAR(5) NOT NULL,
  Gender INTEGER,
  Age INTEGER,
  PRIMARY KEY(Id)
) AS SELECT
    id,
    gender,
    
    age
FROM CSVREAD('../../../data/nhanes/demographic-person.csv');

SyntaxError: invalid syntax (Temp/ipykernel_8848/2206601307.py, line 1)

In [None]:
SELECT * FROM Pessoa;

# Tarefa 2 - Criação das Tabelas em SQL e Importação de Dados

Escreva instruções SQL para montar as duas tabelas restante, conforme definido no esquema relacional da **Tarefa 1**.

**Importante:** não defina chave primária para a tabela de uso de medicamento.

Durante a criação das tabelas, realize a importação dos dados do arquivo CSV nas tabelas criadas, conforme exemplo anterior.

In [None]:

CREATE TABLE Droga (
  Code VARCHAR(6) NOT NULL,
  Name VARCHAR(100),
  PRIMARY KEY(Code)
) AS SELECT
    Code,
    Name
FROM CSVREAD('../../../data/nhanes/medications-drug.csv');


CREATE TABLE Uso (
  Person_id VARCHAR(5) NOT NULL,
  Drug_code VARCHAR(6) NOT NULL,
  Days_use INTEGER , 
  FOREIGN KEY (Person_id)
   REFERENCES Pessoa(Id)
    ON DELETE NO ACTION
    ON UPDATE CASCADE,
  FOREIGN KEY (Drug_code)
   REFERENCES Droga(Code)
    ON DELETE NO ACTION
    ON DELETE CASCADE
) AS SELECT
    Person_id,
    Drug_code,
    Days_use
FROM CSVREAD('../../../data/nhanes/medications-use.csv');

SELECT * from droga;
select * from uso;

# Tarefa 3 - Consultas Simples

Execute as consultas a seguir.

a) Liste pessoas com idade acima de 60

In [None]:
SELECT * FROM Pessoa WHERE age > 60;

b) Liste as idades das pessoas cadastradas (sem repetições)

In [None]:
SELECT DISTINCT age FROM Pessoa ;

c) Liste código das pessoas, idade, código dos medicamentos que usaram e dias de uso

In [None]:
SELECT P.Id, P.Age, U.Drug_code, U.Days_use  
    FROM Pessoa P JOIN  Uso U  
      ON P.Id = U.Person_id ;

d) Liste código das Pessoas, idade, nome dos medicamentos que usaram e quantos dias de uso

In [None]:
SELECT P.Id, P.Age, U.Drug_code, U.Days_use  
    FROM Pessoa P, Droga D JOIN  Uso U  
      ON P.Id = U.Person_id and D.code = U.Drug_code ;

e) Liste nome dos medicamentos que foram usados por pessoas (sem repetições)

In [None]:
SELECT DISTINCT D.name 
    FROM  Droga D  JOIN  Uso U  
      ON  D.code = U.Drug_code ;

f) Liste nome dos medicamentos usados por mais de 2.000 dias (sem repetições)

In [None]:
SELECT DISTINCT D.name 
    FROM  Droga D  JOIN  Uso U  
      ON  D.code = U.Drug_code and U.days_use > 2000;