In [3]:
%defaultDatasource jdbc:h2:mem:db

In [5]:
DROP TABLE IF EXISTS Drug;
DROP TABLE IF EXISTS Pathology;
DROP TABLE IF EXISTS DrugUse;

CREATE TABLE Drug (
  code INT NOT NULL,
  name VARCHAR(200) NOT NULL,
  PRIMARY KEY(code)
) AS SELECT
    code,
    name
FROM CSVREAD('drug.csv');

CREATE TABLE Pathology (
  code INT NOT NULL,
  name VARCHAR(200) NOT NULL,
  PRIMARY KEY(code)
) AS SELECT
    code,
    name
FROM CSVREAD('pathology.csv');

CREATE TABLE DrugUse (
  idPerson INT NOT NULL,
  codePathology INT NOT NULL,
  codeDrug INT NOT NULL,
  FOREIGN KEY(codePathology)
    REFERENCES Pathology(code)
      ON DELETE NO ACTION
      ON UPDATE NO ACTION,
  FOREIGN KEY(codeDrug)
    REFERENCES Drug(code)
      ON DELETE NO ACTION
      ON UPDATE NO ACTION,
) AS SELECT
    idPerson,
    codePathology,
    codeDrug
FROM CSVREAD('drug-use.csv');

CREATE TABLE SideEffect(
  idPerson INT NOT NULL,
  codePathology INT NOT NULL,
  FOREIGN KEY(codePathology)
    REFERENCES Pathology(code)
      ON DELETE NO ACTION
      ON UPDATE NO ACTION
) AS SELECT idPerson, codePathology
FROM CSVREAD('sideeffect.csv');

In [131]:
SELECT * FROM Drug;
SELECT * FROM Pathology;
SELECT * FROM DrugUse;
SELECT * FROM SideEffect
ORDER BY CODEPATHOLOGY;

# FDA Adverse Event Reporting System (FAERS)

Considere a base de dados que reúne relatos de efeitos adversos de drogas: [FDA Adverse Event Reporting System (FAERS)](https://open.fda.gov/data/faers/).

As fontes de dados são publicadas e documentadas em: [Latest Quarterly Data Files](https://www.fda.gov/drugs/fda-adverse-event-reporting-system-faers/fda-adverse-event-reporting-system-faers-latest-quarterly-data-files)

# Interação entre medicamentos
Considere como uma interação toda vez que um medicamento A é tomado em conjunto com um medicamento B por uma pessoa. Crie uma consulta que retorne para cada par de medicamento A,B o número de interações, somente para aqueles medicamentos que são tomados em conjunto mais de 30 vezes (passaremos a chamar de **grupo mais 30**).

In [28]:
DROP VIEW IF EXISTS DrugInteraction30;
DROP VIEW IF EXISTS DrugInteraction;

CREATE VIEW DrugInteraction AS
SELECT DUA.codeDrug druga, DUB.codeDrug drugb
FROM DrugUse DUA, DrugUse DUB
WHERE DUA.IdPerson = DUB.IdPerson AND DUA.codeDrug < DUB.codeDrug;

CREATE VIEW DrugInteraction30 AS
SELECT druga, drugb, count(*) weight
FROM DrugInteraction
GROUP BY druga, drugb
HAVING weight > 30;

SELECT * FROM DrugInteraction30;

## Tabela Resultante

Se estiver demorando muito para gerar a tabela, você poderá usar a seguinte tabela resultante pronta. Essa tabela tem todas as interações, você ainda precisará filtrar o **grupo mais 30**.

In [52]:
DROP VIEW IF EXISTS DrugInteraction30;
DROP TABLE IF EXISTS DrugInteraction30;
DROP TABLE IF EXISTS DrugInteraction;

CREATE TABLE DrugInteraction (
  druga INT NOT NULL,
  drugb INT NOT NULL,
  weight INT NOT NULL,
  PRIMARY KEY(druga, drugb)
) AS SELECT
    druga,
    drugb,
    weight
FROM CSVREAD('drug-interaction.csv');

CREATE VIEW DrugInteraction30 AS
SELECT druga, drugb, weight
FROM DrugInteraction
GROUP BY druga, drugb
HAVING weight > 30;

SELECT * FROM DrugInteraction30;
--SELECT * FROM DrugInteraction;

# Suporte

### Qual o suporte que cada uma das associações tem?

Gere uma consulta que apresente o suporte do **grupo mais 30**. Ordene o resultado por ordem de suporte. 

Observação: Para que o resultado da divisão seja fracionária, converta o numerador em `DOUBLE` usando:
~~~sql
CAST(campo AS DOUBLE)
~~~

In [128]:
DROP VIEW IF EXISTS TOTALQUANTITY;

CREATE VIEW TOTALQUANTITY AS 
SELECT SUM(WEIGHT) QUANTITY
FROM DRUGINTERACTION30;

SELECT * FROM TOTALQUANTITY;

SELECT DRUGINTERACTION30.DRUGA, DRUGINTERACTION30.DRUGB, CAST(DRUGINTERACTION30.WEIGHT AS DOUBLE) / TOTALQUANTITY.QUANTITY AS SUPORTE
FROM DRUGINTERACTION30, TOTALQUANTITY
GROUP BY DRUGINTERACTION30.DRUGA, DRUGINTERACTION30.DRUGB, TOTALQUANTITY.QUANTITY
ORDER BY DRUGINTERACTION30.DRUGA;

# Confiança

### Qual a confiança que cada uma das associações tem?

Gere uma consulta que apresente a confiança do **grupo mais 30**. Ordene o resultado por ordem de confiança.

In [130]:
DROP VIEW IF EXISTS TOTALQUANTITY;

-- TABELA MATRIZ
-- SELECT * FROM DRUGINTERACTION30;

-- TABELA USADA PARA ESTUDO
-- SELECT DRUGA, DRUGB, CAST(COUNT(DISTINCT DRUGA AND DRUGB)AS DOUBLE) CAST
-- FROM DRUGINTERACTION30
-- GROUP BY DRUGA, DRUGB
-- ORDER BY DRUGA, DRUGB;

CREATE VIEW TOTALQUANTITY AS 
SELECT DISTINCT DRUGA, CAST(SUM(WEIGHT) AS DOUBLE) QUANTITY
FROM DRUGINTERACTION30
GROUP BY DRUGA
ORDER BY DRUGA;

-- SELECT * FROM TOTALQUANTITY;

SELECT DRUGINTERACTION30.DRUGA, DRUGINTERACTION30.DRUGB, CAST(DRUGINTERACTION30.WEIGHT AS DOUBLE) / TOTALQUANTITY.QUANTITY AS SUPORTE
FROM DRUGINTERACTION30, TOTALQUANTITY
WHERE DRUGINTERACTION30.DRUGA = TOTALQUANTITY.DRUGA
GROUP BY DRUGINTERACTION30.DRUGA, DRUGINTERACTION30.DRUGB, TOTALQUANTITY.QUANTITY
ORDER BY DRUGINTERACTION30.DRUGA, DRUGINTERACTION30.DRUGB;

# Efeito Colateral

Para cada medicamento, qual o percentual do medicamento A que tem efeito colateral junto com o medicamento B, quando comparado com seu uso sem o medicamento B.