In [1]:
%defaultDatasource jdbc:h2:mem:db

In [2]:
DROP TABLE IF EXISTS Drug;
DROP TABLE IF EXISTS Pathology;
DROP TABLE IF EXISTS DrugUse;

CREATE TABLE Drug (
  code INT NOT NULL,
  name VARCHAR(200) NOT NULL,
  PRIMARY KEY(code)
) AS SELECT
    code,
    name
FROM CSVREAD('../../../data/faers-2017/drug.csv');

CREATE TABLE Pathology (
  code INT NOT NULL,
  name VARCHAR(200) NOT NULL,
  PRIMARY KEY(code)
) AS SELECT
    code,
    name
FROM CSVREAD('../../../data/faers-2017/pathology.csv');

CREATE TABLE DrugUse (
  idPerson INT NOT NULL,
  codePathology INT NOT NULL,
  codeDrug INT NOT NULL,
  FOREIGN KEY(codePathology)
    REFERENCES Pathology(code)
      ON DELETE NO ACTION
      ON UPDATE NO ACTION,
  FOREIGN KEY(codeDrug)
    REFERENCES Drug(code)
      ON DELETE NO ACTION
      ON UPDATE NO ACTION,
) AS SELECT
    idPerson,
    codePathology,
    codeDrug
FROM CSVREAD('../../../data/faers-2017/drug-use.csv');

CREATE TABLE SideEffect(
  idPerson INT NOT NULL,
  codePathology INT NOT NULL,
  FOREIGN KEY(codePathology)
    REFERENCES Pathology(code)
      ON DELETE NO ACTION
      ON UPDATE NO ACTION
) AS SELECT idPerson, codePathology
FROM CSVREAD('../../../data/faers-2017/sideeffect.csv');

In [3]:
SELECT * FROM Drug;
SELECT * FROM Pathology;
SELECT * FROM DrugUse;
SELECT * FROM SideEffect;

# FDA Adverse Event Reporting System (FAERS)

Considere a base de dados que reúne relatos de efeitos adversos de drogas: [FDA Adverse Event Reporting System (FAERS)](https://open.fda.gov/data/faers/).

As fontes de dados são publicadas e documentadas em: [Latest Quarterly Data Files](https://www.fda.gov/drugs/fda-adverse-event-reporting-system-faers/fda-adverse-event-reporting-system-faers-latest-quarterly-data-files)

# Interação entre medicamentos
Considere como uma interação toda vez que um medicamento A é tomado em conjunto com um medicamento B por uma pessoa. Crie uma consulta que retorne para cada par de medicamento A,B o número de interações, somente para aqueles medicamentos que são tomados em conjunto mais de 30 vezes (passaremos a chamar de **grupo mais 30**).

In [None]:
DROP VIEW Interacao IF EXISTS;
DROP VIEW GrupoMais30 IF EXISTS;

CREATE VIEW Interacao AS
SELECT A.codeDrug medicamentoA, B.codeDrug medicamentoB
FROM DrugUse A, DrugUse B
WHERE A.IdPerson = B.IdPerson AND A.codeDrug <> B.codeDrug;

CREATE VIEW GrupoMais30 AS
SELECT medicamentoA, medicamentoB, COUNT(*) usos
FROM Interacao
GROUP BY medicamentoA, medicamentoB
HAVING usos > 30;

SELECT * FROM GrupoMais30;

## Tabela Resultante

Se estiver demorando muito para gerar a tabela, você poderá usar a seguinte tabela resultante pronta. Essa tabela tem todas as interações, você ainda precisará filtrar o **grupo mais 30**.

In [5]:
CREATE TABLE DrugInteraction (
  druga INT NOT NULL,
  drugb INT NOT NULL,
  weight INT NOT NULL,
  PRIMARY KEY(druga, drugb)
) AS SELECT
    druga,
    drugb,
    weight
FROM CSVREAD('../../../data/faers-2017/results/drug-interaction.csv');

SELECT * FROM DrugInteraction;

# Suporte

### Qual o suporte que cada uma das associações tem?

Gere uma consulta que apresente o suporte do **grupo mais 30**. Ordene o resultado por ordem de suporte. 

Observação: Para que o resultado da divisão seja fracionária, converta o numerador em `DOUBLE` usando:
~~~sql
CAST(campo AS DOUBLE)
~~~

In [None]:
DROP VIEW GrupoMais30 IF EXISTS;
CREATE VIEW GrupoMais30 AS SELECT * FROM DrugInteraction WHERE weight > 30;

SELECT drugA, drugB, weight, CAST(weight AS DOUBLE) / (SELECT COUNT(*) FROM DrugInteraction) Suporte FROM GrupoMais30 ORDER BY Suporte;

# Confiança

### Qual a confiança que cada uma das associações tem?

Gere uma consulta que apresente a confiança do **grupo mais 30**. Ordene o resultado por ordem de confiança.

In [None]:
SELECT GM.drugA, GM.drugB, GM.weight, CAST(GM.weight AS DOUBLE) / (SELECT COUNT(*) FROM DrugInteraction DI WHERE DI.drugA = GM.drugA OR DI.drugA = GM.drugB ) Confianca FROM GrupoMais30 GM ORDER BY Confianca;

# Efeito Colateral

Para cada medicamento, qual o percentual do medicamento A que tem efeito colateral junto com o medicamento B, quando comparado com seu uso sem o medicamento B.

In [3]:
DROP VIEW InteracaoPessoa IF EXISTS;
DROP VIEW CONTAGEMEFEITOSCOLATERAISDOISMED IF EXISTS;
DROP VIEW contagemEfeitosColateraisUmMed IF EXISTS;
DROP VIEW Interacao IF EXISTS;
DROP VIEW AfetadosPorEfeitoColateral IF EXISTS;
DROP VIEW usosMedicamentos IF EXISTS;

CREATE VIEW usosMedicamentos AS
SELECT codeDrug, COUNT(*) usos
FROM DrugUse
GROUP BY codeDrug
ORDER BY codeDrug;


CREATE VIEW AfetadosPorEfeitoColateral AS
SELECT idPerson, codePathology, codeDrug
FROM DrugUse 
WHERE idPerson = ANY (SELECT DISTINCT idPerson FROM SideEffect);

CREATE VIEW Interacao AS
SELECT A.codeDrug medicamentoA, B.codeDrug medicamentoB, A.codePathology
FROM DrugUse A, DrugUse B
WHERE A.IdPerson = B.IdPerson AND A.codeDrug < B.codeDrug;

CREATE VIEW contagemEfeitosColateraisUmMed AS
SELECT codeDrug medicamentoA, COUNT(*) numeroafetados
FROM AfetadosPorEfeitoColateral 
GROUP BY codeDrug
ORDER BY codeDrug;

CREATE VIEW contagemEfeitosColateraisDoisMed AS
SELECT medicamentoA, medicamentoB, COUNT(*) numeroafetados
FROM Interacao 
GROUP BY medicamentoA, medicamentoB
ORDER BY medicamentoA, medicamentoB;

SELECT CECUM.medicamentoA, CECDM.medicamentoB, CAST(CECUM.numeroafetados AS DOUBLE) / (SELECT COUNT(*) FROM DrugInteraction DI WHERE DI.drugA = GM.drugA OR DI.drugA = CECDM.medicamentoB ) porcentagemAfetadosA, CAST(CECDM.numeroafetados AS DOUBLE) / (SELECT COUNT(*) FROM DrugInteraction DI WHERE DI.drugA = GM.drugA OR DI.drugA = CECDM.medicamentoB ) porcentagemAfetadosB 
FROM contagemEfeitosColateraisUmMed CECUM, contagemEfeitosColateraisDoisMed CECDM
WHERE CECUM.medicamentoA = CECDM.medicamentoA AND CECUM.medicamentoA <> CECDM.medicamentoB
GROUP BY CECUM.medicamentoA, CECDM.medicamentoB