# Análise de indicadores da Amazônia Legal Brasileira: uma perspectiva data-driven  `Projeto disciplinar INTI6 (2023) - Inteligência Artificial` - `Aplicar técnicas de Ciência de Dados em um conjunto de dados (dataset).`

> Pamela Dantas - CP3019012

> Matheus Tosi - CP3019098



Uma perspectiva data-driven é uma abordagem que se baseia em dados para tomar decisões

Essa abordagem enfatiza a importância da coleta, análise e interpretação de dados para entender um problema e identificar soluções. 

## Contextualização

O desmatamento na Amazônia Legal Brasileira -- uma região de grande importância ecológica, econômica e social para o país -- é um problema grave que ameaça a integridade do local, causando a perda de biodiversidade, a redução da qualidade do solo e da água, e a intensificação do aquecimento e ebulição global. 

Acreditamos que este data-driven possa contribuir para a compreensão e o combate ao desmatamento da Amazônia Legal, pois uso de dados é uma abordagem promissora para entender o problema. Por exemplo, podemos utilizar dos dados extraídos para:

* identificar tendências de desmatamento ao longo do tempo, entender as causas do desmatamento e identificar áreas que precisam de atenção especial;
* identificar áreas com maior risco de desmatamento;
* identificar correlações entre o desmatamento e outros fatores, como o desenvolvimento econômico, a pobreza e a mudança climática.. 

## Base de dados

##### Dataset: 
 
https://www.ufsm.br/2023/02/03/amazonia-ganha-base-de-dados-inedita  

https://zenodo.org/records/7098  

A base de dados contém 36 indicadores ambientais, socioeconômicos e epidemiológicos dos 772 municípios dos nove estados da Amazônia Legal Brasileira, referentes ao período de 20007aes-ambientais-e-mais  

##### Os indicadores estão organizados em seis temas: 

> Perda de habitat: taxa de desmatamento, taxa de fragmentação florestal, índice de cobertura florestal 

> Uso e cobertura da terra: área de pastagem, área de agricultura, área de floresta 

> Mobilidade humana: taxa de migração rural-urbana, taxa de migração internacional 

> Anomalias climáticas: precipitação, temperatura, evapotranspiração 

> Carga de doenças transmitidas por vetores: incidência de malária, incidência de dengue, incidência de chikungunya 

> Índices de pobreza multidimensional: índice de pobreza multidimensional rural, índice de pobreza multidimensional urbana 


### Importando o dataset localmente

In [1]:
# Importar as bibliotecas necessárias
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# IDA - Indicadores de Dimensão Ambiental
data_ida = pd.read_csv("base/TRAJETORIAS_DATASET_Environmental_dimension_indicators.csv")

# IDE - Indicadores de Dimensão Epidemiológica
data_ida = pd.read_csv("base/TRAJETORIAS_DATASET_Epidemiological_dimension_indicators.csv")

# IP - Indicadores da População
data_ida = pd.read_csv("base/TRAJETORIAS_DATASET_Population_indicators.csv")

# IDS - Indicadores da Dimensão Socioeconomica
data_ida = pd.read_csv("base/TRAJETORIAS_DATASET_Socio-Economic_dimension-indicators.csv")


### Importando o dataset do GitHub

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# mesma nomenclatura usada na célula acima
data_ida = pd.read_csv("https://raw.githubusercontent.com/pameladantasp/AmazoniaLegalBrasileira-DataDriven--Projeto_INTI6/BaseDeDados/TRAJETORIAS_DATASET_Environmental_dimension_indicators.csv")
data_ide = pd.read_csv("https://raw.githubusercontent.com/pameladantasp/AmazoniaLegalBrasileira-DataDriven--Projeto_INTI6/BaseDeDados/TRAJETORIAS_DATASET_Epidemiological_dimension_indicators.csv")
data_ip = pd.read_csv("https://raw.githubusercontent.com/pameladantasp/AmazoniaLegalBrasileira-DataDriven--Projeto_INTI6/BaseDeDados/TRAJETORIAS_DATASET_Population_indicators.csv")
data_ids = pd.read_csv("https://raw.githubusercontent.com/pameladantasp/AmazoniaLegalBrasileira-DataDriven--Projeto_INTI6/BaseDeDados/TRAJETORIAS_DATASET_Socio-Economic_dimension-indicators.csv")


## 1. Explorar os dados

Entender o que a base de dados pode nos “contar”, sobre o que cada coluna se trata; 

In [2]:
# data_ida.head()
# data_ida.describe()


Unnamed: 0,"state_abbrev,""state"",""municipality"",""geocode"",""period"",""refor"",""secveg"",""pasture"",""crop"",""urban"",""core"",""edge"",""port"",""river"",""road"",""mining"",""fire"",""dgorg"",""dgfor"",""defor"",""deorg"",""precp"",""precn"",""tempp"""
0,"AC,""Acre"",""Santa Rosa do Purus"",""1200435"",2006..."
1,"AC,""Acre"",""Marechal Thaumaturgo"",""1200351"",200..."
2,"AC,""Acre"",""Porto Walter"",""1200393"",2006,""0.977..."
3,"AC,""Acre"",""Jordão"",""1200328"",2006,""0.978644303..."
4,"AC,""Acre"",""Feijó"",""1200302"",2006,""0.9558723163..."


## 2. Pré-processamento

Eliminar ou concatenar dados; eliminar valores nulos, juntar dados duplicados; converter dados, como horas e datas por exemplo, converter valores int/float/boolean; 

## 3. Analisar tendências


In [None]:
# ...



## 4. Analisar correlações


In [None]:
# ...



## 5. Analisar dados espaciais


In [None]:
# ...


## 6. Analisar dados demográficos


In [None]:
# ...


## 7. Analisar dados econômicos


In [None]:
# ...

