In [2]:
%defaultDatasource jdbc:h2:mem:db

# Analise de associação dos modelos lógicos
* Nesta tarefa realizaremos a associação entre diferentes fontes de dados de forma a obter informações sobre a correlação de fatores relacionados aos pacientes infectados com hiv

# Extração dos dados:
* Extraímos os dados de 5 anos consecutivos das fontes de dados de gastos de saúde per capita, pacientes vivos com hiv e óbitos advindos do hiv de diversos países.

In [3]:
CREATE TABLE gasto_per_capita (
  Country VARCHAR(12) NOT NULL,
    countryname VARCHAR(60) not null,
    y2007 float(30) not null,
    y2008 float(30) not null,
    y2009 float(30) not null,
    y2010 float(30) not null,
    y2011 float(30) not null,
    PRIMARY KEY(Country)
) AS SELECT
    "Country Code",
    "Country Name",
    "2007 [YR2007]",
    "2008 [YR2008]",
    "2009 [YR2009]",
    "2010 [YR2010]",
    "2011 [YR2011]"
FROM CSVREAD('../data/gasto_per_capita.csv')
where "2007 [YR2007]" <> '..' and
    "2008 [YR2008]" <> '..' and
    "2009 [YR2009]" <> '..' and
    "2010 [YR2010]" <> '..' and
    "2011 [YR2011]" <> '..';
    
CREATE TABLE vivos_com_hiv (
  Country VARCHAR(12) NOT NULL,
    countryname VARCHAR(60) not null,
    y2007 int not null,
    y2008 int not null,
    y2009 int not null,
    y2010 int not null,
    y2011 int not null,
    primary key(Country)
) AS SELECT
    "Country Code",
    "Country Name",
    "2007 [YR2007]",
    "2008 [YR2008]",
    "2009 [YR2009]",
    "2010 [YR2010]",
    "2011 [YR2011]"
FROM CSVREAD('../data/living_with_hiv.csv')
where "2007 [YR2007]" <> '..' and
    "2008 [YR2008]" <> '..' and
    "2009 [YR2009]" <> '..' and
    "2010 [YR2010]" <> '..' and
    "2011 [YR2011]" <> '..';
    
CREATE TABLE obitos (
  Country VARCHAR(12) NOT NULL,
    countryname VARCHAR(60) not null,
    y2007 int not null,
    y2008 int not null,
    y2009 int not null,
    y2010 int not null,
    y2011 int not null,
    primary key(Country)
) AS SELECT
    "Country Code",
    "Country Name",
    "2007 [YR2007]",
    "2008 [YR2008]",
    "2009 [YR2009]",
    "2010 [YR2010]",
    "2011 [YR2011]"
FROM CSVREAD('../data/obitos.csv')
where "2007 [YR2007]" <> '..' and
    "2008 [YR2008]" <> '..' and
    "2009 [YR2009]" <> '..' and
    "2010 [YR2010]" <> '..' and
    "2011 [YR2011]" <> '..';

# Análise associativa:
* Relacionamos as diferentes tabelas de forma a encontrar uma relação entre os diferentes dados.

In [4]:
select country, gpc, ((0.0+mortes)/(0.0+vivos)) as ratio from(
select vivos_com_hiv.country, vivos_com_hiv.y2007 as vivos, obitos.y2007 as mortes, gasto_per_capita.y2007 as gpc
from vivos_com_hiv, gasto_per_capita, obitos
where vivos_com_hiv.country = gasto_per_capita.country and vivos_com_hiv.country = obitos.country)
where vivos > 0
order by ratio asc;
select country, gpc, ((0.0+mortes)/(0.0+vivos)) as ratio from(
select vivos_com_hiv.country, vivos_com_hiv.countryname, vivos_com_hiv.y2008 as vivos, obitos.y2008 as mortes, gasto_per_capita.y2008 as gpc
from vivos_com_hiv, gasto_per_capita, obitos
where vivos_com_hiv.country = gasto_per_capita.country and vivos_com_hiv.country = obitos.country)
where vivos > 0
order by ratio asc;
select country, gpc, ((0.0+mortes)/(0.0+vivos)) as ratio from(
select vivos_com_hiv.country, vivos_com_hiv.y2009 as vivos, obitos.y2009 as mortes, gasto_per_capita.y2009 as gpc
from vivos_com_hiv, gasto_per_capita, obitos
where vivos_com_hiv.country = gasto_per_capita.country and vivos_com_hiv.country = obitos.country)
where vivos > 0
order by ratio asc;
select country, gpc, ((0.0+mortes)/(0.0+vivos)) as ratio from(
select vivos_com_hiv.country, vivos_com_hiv.y2010 as vivos, obitos.y2010 as mortes, gasto_per_capita.y2010 as gpc
from vivos_com_hiv, gasto_per_capita, obitos
where vivos_com_hiv.country = gasto_per_capita.country and vivos_com_hiv.country = obitos.country)
where vivos > 0
order by ratio asc;
select country, gpc, ((0.0+mortes)/(0.0+vivos)) as ratio from(
select vivos_com_hiv.country, vivos_com_hiv.y2011 as vivos, obitos.y2011 as mortes, gasto_per_capita.y2011 as gpc
from vivos_com_hiv, gasto_per_capita, obitos
where vivos_com_hiv.country = gasto_per_capita.country and vivos_com_hiv.country = obitos.country)
where vivos > 0
order by ratio asc;

# Conclusões sobre a análise:
* É possível observar que, em países que possuem um investimento per capita em saúde maior tendem a ter menos mortes por hiv nos infectados.