# Projeto 1 - Ciência dos Dados

Nome: Erick Finger

## Pergunta (s) a ser respondida

Os indicadores usados no cálculo do IDH experienciam melhora no período de 1993-2000 para Laos, Cambodia, Vietnã e Mianmar?

## Explicação da hipótese e mecanismo

## Hipótese:

Ao longo da década de 1990, foram observadas algumas ocorrências na Ásia:
- a ASEAN (Association of Southeast Asian Nations), um bloco que visava o crescimento econômico e o desenvolvimento cultural e social dos países-membros, se tornou um bloco de livre-comércio em 1992;
- em 1995, o Vietnã se junta à ASEAN
- em 1997, Laos e Mianmar se juntam à ASEAN
- em 1999, o Cambodia se junta à ASEAN, sendo o país-membro mais recente

Dado isso, acredita-se que a entrada no bloco por parte dos 4 países mencionados tenha contribuído em aspectos como crescimento econômico, educação e expectativa de vida, ou seja, entrar no bloco contribuiu para o desenvolvimento desses países

## Mecanismo:

Os objetivos fundamentais da ASEAN são a paz regional e o desenvolvimento econômico, social, cultural, tecnológico, científico e administrativo dos países-membros, então juntar-se ao bloco, ainda mais no período em que está se tornando um bloco de livre comércio, deve contribuir em alguma escala para o desenvolvimento de um país.

## Referência:

https://asean.org/asean/about-asean/

## Bases de dados usadas

# GDPpercapita:

https://data.worldbank.org/indicator/NY.GDP.PCAP.KD

# GDP:

https://www.gapminder.org/data/documentation/gd001/

# Expectativa de vida:

https://www.gapminder.org/data/documentation/gd004/

# Tempo na escola de homens entre 15 e 24 anos:

http://ghdx.healthdata.org/record/ihme-data/global-educational-attainment-1970-2015

# Tempo na escola de mulheres entre 15 e 24 anos:

http://ghdx.healthdata.org/record/ihme-data/global-educational-attainment-1970-2015

# Exportações:

https://data.worldbank.org/indicator/NE.EXP.GNFS.ZS

# Importações:

https://data.worldbank.org/indicator/NE.IMP.GNFS.ZS

# Trocas comerciais:

https://data.worldbank.org/indicator/TG.VAL.TOTL.GD.ZS

## Análise de dados

Insira abaixo uma análise de dados tratada para ter maior clareza. 

Lembre-se de que, além deste arquivo principal, você precisa entregar um ou mais *notebooks* mais brutos com todas as tentativas que fez e que não deram certo .

**Não inclua dados ou gráficos sem motivação nem interpretação** - sempre que fizer uma análise, plot ou tablea, diga qual sua intenção. Logo após a apresentação diga qual conclusão específica ou interpretação você tira daquela análise

In [3]:
%matplotlib inline
import pandas as pd
import numpy as np
import math as math
from scipy import stats
import matplotlib.pyplot as plt

In [4]:
gdpcapita = pd.read_excel("gdppercapita_us_inflation_adjusted.xlsx")
gdp = pd.read_excel("total_gdp_ppp_inflation_adjusted.xlsx")
expvida = pd.read_excel("life_expectancy_years.xlsx")
men_school = pd.read_excel("mean_years_in_school_men_15_to_24_years.xlsx")
women_school = pd.read_excel("mean_years_in_school_women_15_to_24_years.xlsx")
exports = pd.read_excel("exports_percent_of_gdp.xlsx")
imports = pd.read_excel("imports_percent_of_gdp.xlsx")
trade = pd.read_excel("merchandise_trade_percent_of_gdp.xlsx")

In [5]:
gdpcapita_idx = gdpcapita.set_index("country")
gdp_idx = gdp.set_index("country")
expvida_idx = expvida.set_index("country")
men_school_idx = men_school.set_index("country")
women_school_idx = women_school.set_index("country")
exports_idx = exports.set_index("country")
imports_idx = imports.set_index("country")
trade_idx = trade.set_index("country")

In [6]:
linhas = ["Cambodia", "Lao", "Myanmar", "Vietnam", "Indonesia", "Malaysia", "Philippines", "Singapore", "Thailand", "Brunei"]
colunas = [ano for ano in range(1993,2014)]
aseancapita = gdpcapita_idx.loc[linhas, colunas]
aseangdp = gdp_idx.loc[linhas, colunas]
aseanexpvida = expvida_idx.loc[linhas, colunas]
aseanmenschool = men_school_idx.loc[linhas,colunas]
aseanwomenschool = women_school_idx.loc[linhas,colunas]
aseanexports = exports_idx.loc[linhas,colunas]
aseanimports = imports_idx.loc[linhas,colunas]
aseantrade = trade_idx.loc[linhas,colunas]

In [7]:
antes_1990 = ["Indonesia", "Malaysia", "Philippines", "Singapore", "Thailand", "Brunei"]
indicadores = [aseancapita, aseangdp, aseanexpvida, aseanmenschool, aseanwomenschool, aseanexports, aseanimports, aseantrade]
for indicador in indicadores:
    indicador.loc[:,"Membro_antes_de_1990"] = "Não"
    indicador.loc[antes_1990,"Membro_antes_de_1990"] = "Sim"

In [8]:
def reta(dados_x, dados_y, c):    
    a = dados_y.cov(dados_x) / dados_x.var()
    b = dados_y.mean() - a*dados_x.mean()

    print('Ajuste linear entre X3 e X4:')
    print('Coeficiente linear:', b)
    print('Coeficiente angular:', a)
    plt.scatter(dados_x, dados_y, c=c, alpha=0.8)
    plt.title('x versus y')
    plt.xlabel('eixo x')
    plt.ylabel('eixo y')

    plt.plot((dados_x.min(), dados_x.max()), (a*dados_x.min()+b, a*dados_x.max()+b), color=c)

    plt.tight_layout()

In [None]:
tempo = np.arange(1993,2013,1)
for ano in tempo:
    print(ano)
    for indicador1 in indicadores:
        for indicador2 in indicadores:
            plt.scatter(indicador1.loc[indicador1.Membro_antes_de_1990=="Sim",ano], indicador2.loc[indicador2.Membro_antes_de_1990=="Sim", ano], color="r")
            reta(indicador1.loc[indicador1.Membro_antes_de_1990=="Sim",ano], indicador2.loc[indicador2.Membro_antes_de_1990=="Sim", ano], "r")
            plt.scatter(indicador1.loc[indicador1.Membro_antes_de_1990=="Não",ano], indicador2.loc[indicador2.Membro_antes_de_1990=="Não", ano], color="b")
            reta(indicador1.loc[indicador1.Membro_antes_de_1990=="Não",ano], indicador2.loc[indicador2.Membro_antes_de_1990=="Não", ano], "g")
            plt.grid(True)
            plt.show()

## Conclusão

Responda à pergunta, argumentando da melhor forma possível com base nos dados

Como podemos observar nos gráficos, os valores dos indicadores observados em Laos, Cambodia, Vietnã e Mianmar eram bem pequenos em 1993 quando comparados com os valores do resto dos países da ASEAN no mesmo ano. No entanto, à medida que o tempo passa e os 4 países se juntam ao bloco, podemos observar, como nos gráficos de 2000, que os valores dos 4 países se aproximaram muito dos valores do resto do bloco, provando que entrar no bloco contibuiu para o desenvolvimento desses países. Ou seja, minha hipótese estava correta, q.e.d.

Obs: Esses anos foram escolhidos especificamente pois em 1993 nenhum dos 4 países fazia parte da ASEAN e em 2000 os 4 já eram membros