Skip to content

carolinafreitasm/ips-amazonia

Repository files navigation

IPS Amazônia — Análise de Indicadores Sociais, Ambientais e Territoriais

Quantitative analysis of social, environmental and territorial indicators for municipalities in the Brazilian Legal Amazon, using the Amazon Social Progress Index (IPS Amazônia)

Table of Contents / Sumário

🇬🇧 English

🇧🇷 Português


Project structure

ips-amazonia/
├── 00_config.R          # Global settings: paths, colour palette, ggplot2 theme
├── 01_download.R        # Automated download via datazoom.amazonia
├── 02_process.R         # Data cleaning, variable construction, panel base
├── 03_descriptive.R     # Descriptive tables via gt
├── 04_visualizations.R  # Thematic charts with editorial theme
├── 05_maps.R            # Choropleth maps by municipality
├── 06_panel.R           # Panel data models (Pooled OLS, FE, RE, Hausman)
├── run_all.R            # Runs the full pipeline in sequence
├── renv.lock            # Package versions for reproducibility
└── data/
    ├── raw/             # Raw data — not versioned
    └── processed/       # Processed bases — not versioned

Data

Source: IPS Amazônia — Amazon Social Progress Index
Provider: DataZoom Amazônia / PUC-Rio
Period: 2014, 2018, 2021 and 2023
Access: Public data via datazoom.amazonia R package
Coverage: 772 municipalities in the Brazilian Legal Amazon
Unit of analysis: Municipality × year (panel format)

IPS Amazônia structure

The index is organised into 3 dimensions and 12 components:

Dimension Components
Basic Human Needs Nutrition & basic medical care, Water & sanitation, Housing, Personal safety
Wellbeing Foundations Access to basic knowledge, Access to information & communication, Health & wellbeing, Environmental quality
Opportunities Individual rights, Individual freedom of choice, Tolerance & inclusion, Access to higher education

Variables used

Code Description
ips_amazon IPS Amazônia overall score (0–100)
basic_human_needs Basic Human Needs dimension score
well_being_fundamentals Wellbeing Foundations dimension score
oportunities Opportunities dimension score
elementary_education_quality_ideb_0_to_10_scale IDEB — primary education quality (0–10)
adaquate_sewage_percent_population Population with adequate sewage (%)
homicides_deaths_100_000_people Homicides per 100,000 inhabitants
broadband_internet_acesses_per_100_houses Broadband internet per 100 households
recent_deforestation_percent_municipality_area Recent deforestation (% of municipal area)
child_labor_number_families_with_at_least_one_kid_working_per_1_000_families Child labour per 1,000 families
violence_against_women_per_100_000_women Violence against women per 100,000
partisan_diversity_percent_of_councilman_from_different_parties Partisan diversity (%)
habitation_with_adequate_floor_percent Housing with adequate floor (%)

Methodology

Descriptive analysis

Mean scores and distributions calculated for all municipalities across all four time periods. Rankings, top/bottom performers, and cross-state comparisons produced for the overall IPS and all 12 components.

Choropleth maps

Map classification uses Jenks natural breaks (classInt::classIntervals(..., style = "jenks")), which minimises within-class variance and maximises between-class variance — the standard approach in statistical thematic cartography.

Panel data models

Dependent variable: IPS Amazônia (0–100)
Sample: 772 municipalities × 4 years = 3,088 observations
Specification:

$$\text{IPS}_{it} = \beta_0 + \beta_1 \text{Sewage}_{it} + \beta_2 \text{InfantMort}_{it} + \beta_3 \text{Homicides}_{it} + \beta_4 \text{IDEB}_{it} + \beta_5 \text{Internet}_{it} + \beta_6 \text{Deforest}_{it} + \beta_7 \text{ChildLabour}_{it} + \beta_8 \text{ViolWomen}_{it} + \beta_9 \text{PartDiversity}_{it} + \beta_{10} \text{AdFloor}_{it} + \alpha_i + \varepsilon_{it}$$

Three specifications estimated: Pooled OLS, Fixed Effects (within estimator, individual effects) and Random Effects.
Model selection via Hausman test (FE vs RE) and F-test (Pooled vs FE).

Methodological note: The panel has non-consecutive periods (2014, 2018, 2021, 2023), meaning within-municipality variation captures changes over intervals of different lengths. This should be considered when interpreting the fixed effects estimates.


Main results

National overview

Evolution of IPS Amazônia

The overall IPS Amazônia remained relatively stable between 2014 (~54.4) and 2023 (~54.3), masking divergent trends across dimensions: Wellbeing Foundations improved from 55.1 to 57.8, while Opportunities declined from 44.6 to 40.3 — indicating a widening gap in access to rights, education and inclusion.

Regional inequality

State ranking

Regional maps

Change 2014–2023

Components by state

Component heatmap

Sanitation

Sanitation evolution

Sewage map

Education

Education evolution

IDEB map

Deforestation

Deforestation evolution

Deforestation map

Violence against women

Violence against women

Panel data models

Panel models


Generated outputs

Folder Content
outputs/figures/ 28 thematic charts (14 PT + 14 EN), PNG 300 dpi
outputs/maps/ 20 choropleth maps + 2 dimension panels (PT + EN)
outputs/tables/ 24 analytical tables in HTML and PNG (12 PT + 12 EN)

Reproducibility

# 1. Clone the repository
git clone https://github.com/carolinafreitasm/ips-amazonia.git

# 2. Open the project in RStudio

# 3. Restore packages
renv::restore()

# 4. Run the full pipeline
source("run_all.R")

Estimated runtime: 30–60 minutes (map rendering and data download are the main bottlenecks).
Raw and processed data are not versioned — generated automatically by the pipeline.


Packages and citations

citation("datazoom.amazonia")
citation("ggplot2")
citation("geobr")
citation("sf")
citation("plm")
citation("gt")
citation("classInt")
citation("showtext")
Package Use Reference
datazoom.amazonia IPS data download DataZoom PUC-Rio (2023)
ggplot2 Visualisations Wickham (2016)
geobr Brazilian municipality geometries Pereira & Gonçalves (2021)
sf Spatial data Pebesma (2018)
plm Panel data models Croissant & Millo (2008)
gt / gtExtras Editorial tables Iannone et al. (2024)
classInt Jenks breaks Bivand (2023)
showtext IBM Plex typography Qiu (2023)
patchwork Panel composition Pedersen (2024)
dplyr / tidyr Data manipulation Wickham et al. (2023)
renv Reproducibility Ushey & Wickham (2023)

References

Primary data source

DATAZOOMPUC. datazoom.amazonia: Downloading and reading data from the Brazilian Amazon. PUC-Rio, 2023. Available at: https://github.com/datazoompuc/datazoom.amazonia

IPS BRASIL. IPS Amazônia — Índice de Progresso Social da Amazônia. Available at: https://ipsbrasil.org.br/amazonia

R packages

CROISSANT, Y.; MILLO, G. Panel Data Econometrics in R: The plm Package. Journal of Statistical Software, v. 27, n. 2, 2008.

PEREIRA, R. H. M.; GONÇALVES, C. N. geobr: Loads Shapefiles of Official Spatial Data Sets of Brazil. Rio de Janeiro: IPEA, 2021.

WICKHAM, H. ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York, 2016.

WICKHAM, H. et al. dplyr: A Grammar of Data Manipulation. R package version 1.1.4, 2023.

PEBESMA, E. Simple Features for R: Standardized Support for Spatial Vector Data. The R Journal, v. 10, n. 1, p. 439–446, 2018.

IANNONE, R. et al. gt: Easily Create Presentation-Ready Display Tables. R package version 0.10.1, 2024.


Tools

Tool Use
R 4.5.2 Main analysis language
RStudio Development environment
Git 2.50 Version control
GitHub Repository hosting and portfolio
renv Package management and reproducibility

Author

Carolina Freitas
PhD in Economic Development — UFPR
PUCRS Online

GitHub


Estrutura do projeto

ips-amazonia/
├── 00_config.R          # Configuração global: caminhos, paleta, tema ggplot2
├── 01_download.R        # Download automático via datazoom.amazonia
├── 02_process.R         # Tratamento, construção de variáveis, base painel
├── 03_descriptive.R     # Tabelas descritivas via gt
├── 04_visualizations.R  # Gráficos temáticos com tema editorial
├── 05_maps.R            # Mapas coropléticos por município
├── 06_panel.R           # Modelos de painel (Pooled OLS, EF, EA, Hausman)
├── run_all.R            # Executa o pipeline completo em sequência
├── renv.lock            # Versões dos pacotes para reprodutibilidade
└── data/
    ├── raw/             # Dados brutos — não versionados
    └── processed/       # Bases processadas — não versionadas

Dados

Fonte: IPS Amazônia — Índice de Progresso Social da Amazônia
Provedor: DataZoom Amazônia / PUC-Rio
Período: 2014, 2018, 2021 e 2023
Acesso: Dados públicos via pacote datazoom.amazonia
Cobertura: 772 municípios da Amazônia Legal brasileira
Unidade de análise: Município × ano (formato painel)

Estrutura do IPS Amazônia

O índice é organizado em 3 dimensões e 12 componentes:

Dimensão Componentes
Necessidades Humanas Básicas Nutrição e cuidados básicos, Água e saneamento, Habitação, Segurança pessoal
Fundamentos do Bem-Estar Acesso ao conhecimento básico, Acesso à informação e comunicação, Saúde e bem-estar, Qualidade ambiental
Oportunidades Direitos individuais, Liberdade individual de escolha, Tolerância e inclusão, Acesso à educação superior

Metodologia

Análise descritiva

Médias e distribuições calculadas para todos os municípios nos quatro períodos. Rankings, melhores e piores desempenhos e comparações inter-estaduais produzidos para o IPS geral e todos os 12 componentes.

Mapas coropléticos

A classificação utiliza quebras naturais de Jenks (classInt::classIntervals(..., style = "jenks")), que minimiza a variância intraclasse e maximiza a variância interclasse — padrão em cartografia temática estatística.

Modelos de dados em painel

Variável dependente: IPS Amazônia (0–100)
Amostra: 772 municípios × 4 anos = 3.088 observações
Especificação:

$$\text{IPS}_{it} = \beta_0 + \beta_1 \text{Esgoto}_{it} + \beta_2 \text{MortInfantil}_{it} + \beta_3 \text{Homicídios}_{it} + \beta_4 \text{IDEB}_{it} + \beta_5 \text{Internet}_{it} + \beta_6 \text{Desmat}_{it} + \beta_7 \text{TrabInfantil}_{it} + \beta_8 \text{ViolMulher}_{it} + \beta_9 \text{DivPartidária}_{it} + \beta_{10} \text{PisoAdequado}_{it} + \alpha_i + \varepsilon_{it}$$

Três especificações estimadas: Pooled OLS, Efeitos Fixos (estimador within, efeitos individuais) e Efeitos Aleatórios.
Seleção via teste de Hausman (EF vs EA) e teste F (Pooled vs EF).

Nota metodológica: O painel possui períodos não consecutivos (2014, 2018, 2021, 2023). A variação intramunicípio captura mudanças ao longo de intervalos de comprimento diferente, o que deve ser considerado na interpretação dos coeficientes de efeitos fixos.


Principais resultados

Panorama nacional

Evolução do IPS Amazônia

O IPS Amazônia médio permaneceu relativamente estável entre 2014 (~54,4) e 2023 (~54,3), mascarando trajetórias divergentes entre dimensões: Fundamentos do Bem-Estar melhorou de 55,1 para 57,8, enquanto Oportunidades caiu de 44,6 para 40,3 — indicando ampliação do déficit em direitos, educação superior e inclusão.

Desigualdade regional

Ranking de estados

Mapas regionais

Variação 2014–2023

Componentes por estado

Heatmap de componentes

Saneamento

Evolução do saneamento

Mapa de esgoto

Educação

Evolução da educação

Mapa do IDEB

Desmatamento

Evolução do desmatamento

Mapa de desmatamento

Violência contra mulheres

Violência contra mulheres

Modelos de painel

Modelos de painel


Outputs gerados

Pasta Conteúdo
outputs/figures/ 28 gráficos temáticos (14 PT + 14 EN), PNG 300 dpi
outputs/maps/ 20 mapas coropléticos + 2 painéis de dimensões (PT + EN)
outputs/tables/ 24 tabelas analíticas em HTML e PNG (12 PT + 12 EN)

Reprodutibilidade

# 1. Clone o repositório
git clone https://github.com/carolinafreitasm/ips-amazonia.git

# 2. Abra o projeto no RStudio

# 3. Restaure os pacotes
renv::restore()

# 4. Execute o pipeline completo
source("run_all.R")

Tempo estimado: 30–60 minutos (renderização dos mapas e download dos dados são os principais gargalos).
Dados brutos e processados não são versionados — gerados automaticamente pelo pipeline.


Pacotes e citações

Pacote Uso Referência
datazoom.amazonia Download dos dados do IPS DataZoom PUC-Rio (2023)
ggplot2 Visualizações Wickham (2016)
geobr Geometrias municipais brasileiras Pereira & Gonçalves (2021)
sf Dados espaciais Pebesma (2018)
plm Modelos de dados em painel Croissant & Millo (2008)
gt / gtExtras Tabelas editoriais Iannone et al. (2024)
classInt Quebras de Jenks Bivand (2023)
showtext Tipografia IBM Plex Qiu (2023)
patchwork Composição de painéis Pedersen (2024)
dplyr / tidyr Manipulação de dados Wickham et al. (2023)
renv Reprodutibilidade Ushey & Wickham (2023)

Referências

Fonte primária dos dados

DATAZOOMPUC. datazoom.amazonia: Downloading and reading data from the Brazilian Amazon. PUC-Rio, 2023. Disponível em: https://github.com/datazoompuc/datazoom.amazonia

IPS BRASIL. IPS Amazônia — Índice de Progresso Social da Amazônia. Disponível em: https://ipsbrasil.org.br/amazonia

Pacotes R

CROISSANT, Y.; MILLO, G. Panel Data Econometrics in R: The plm Package. Journal of Statistical Software, v. 27, n. 2, 2008.

PEREIRA, R. H. M.; GONÇALVES, C. N. geobr: Loads Shapefiles of Official Spatial Data Sets of Brazil. Rio de Janeiro: IPEA, 2021.

WICKHAM, H. ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York, 2016.

WICKHAM, H. et al. dplyr: A Grammar of Data Manipulation. R package version 1.1.4, 2023.

PEBESMA, E. Simple Features for R: Standardized Support for Spatial Vector Data. The R Journal, v. 10, n. 1, p. 439–446, 2018.

IANNONE, R. et al. gt: Easily Create Presentation-Ready Display Tables. R package version 0.10.1, 2024.


Ferramentas

Ferramenta Uso
R 4.5.2 Linguagem principal de análise
RStudio Ambiente de desenvolvimento
Git 2.50 Controle de versão
GitHub Hospedagem do repositório e portfólio
renv Gerenciamento de pacotes e reprodutibilidade

Autora

Carolina Freitas
Doutora em Desenvolvimento Econômico — UFPR
PUCRS Online

GitHub


Releases

No releases published

Packages

 
 
 

Contributors

Languages