## An√°lise Explorat√≥ria da Produ√ß√£o de Caf√© (IBGE - Tabela 1613)
Explora√ß√£o inicial dos dados processados sobre a produ√ß√£o de caf√© Ar√°bica e Canephora no Brasil, a partir da base do IBGE.

### 1 - Setup
Importa√ß√£o das bibliotecas e carregamento dos dados processados:

In [5]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.read_csv('/home/brunatereza/cafe-ibge-2024/data/processed/ibge_cafe_2024_processed.csv')

### 2 - Estrutura dos Dados
Vis√£o geral do dataset e valida√ß√£o inicial.

In [6]:
df.describe()
df.isna().sum()
df['UF'].value_counts()

UF
MG    494
SP    276
PR    175
BA    136
ES     75
RO     52
MT     36
AM     18
CE     18
RJ     18
AC     17
GO     15
PE      9
PA      8
MS      6
PB      2
AL      1
RN      1
TO      1
DF      1
Name: count, dtype: int64

### 3 - Completude de Valores Ausentes
Identifica√ß√£o de colunas com nulos e percentual de preenchimento.

In [7]:
df.isna().sum()
(df.isna().mean() * 100).round(2)


Munic√≠pio                                                           0.0
UF                                                                  0.0
√Årea destinada √† colheita de Ar√°bica                                0.0
√Årea destinada √† colheita de Canephora                              0.0
√Årea colhida de Ar√°bica                                             0.0
√Årea colhida de Canephora                                           0.0
Toneladas produzidas de Ar√°bica                                     0.0
Toneladas produzidas de Canephora                                   0.0
Rendimento m√©dio da produ√ß√£o (Quilogramas por Hectare) Ar√°bica      0.0
Rendimento m√©dio da produ√ß√£o (Quilogramas por Hectare) Canephora    0.0
Valor da produ√ß√£o (Mil Reais) Ar√°bica                               0.0
Valor da produ√ß√£o (Mil Reais) Canephora                             0.0
dtype: float64

### 4- Produ√ß√£o Total por Estado
Quantifica√ß√£o da produ√ß√£o de Ar√°bica e Canephora agregada por UF.

In [8]:
prod_por_uf = df.groupby('UF')[['Toneladas produzidas de Ar√°bica', 'Toneladas produzidas de Canephora']].sum().sort_values(by='Toneladas produzidas de Ar√°bica', ascending=False)
prod_por_uf.head(10)

Unnamed: 0_level_0,Toneladas produzidas de Ar√°bica,Toneladas produzidas de Canephora
UF,Unnamed: 1_level_1,Unnamed: 2_level_1
MG,1663992,23337
SP,335206,104
ES,224649,657004
BA,91890,127260
PR,40206,0
RJ,18950,67
GO,16538,0
DF,1098,0
PE,573,0
CE,495,15


### 7. Conclus√µes da An√°lise Explorat√≥ria:

A an√°lise explorat√≥ria da **Tabela 1613 (Produ√ß√£o Agr√≠cola Municipal - Culturas Permanentes, IBGE 2024)** revelou padr√µes importantes sobre a distribui√ß√£o e a produ√ß√£o nas diferentes regi√µes do pa√≠s.

### Distribui√ß√£o Geogr√°fica
A base cont√©m **1.359 munic√≠pios**, distribu√≠dos em **20 Unidades Federativas**.  
Os estados com maior presen√ßa de munic√≠pios produtores s√£o:

- **Minas Gerais (494 munic√≠pios)**
- **S√£o Paulo (276 munic√≠pios)**
- **Paran√° (175 munic√≠pios)**
- **Bahia (136 munic√≠pios)**
- **Esp√≠rito Santo (75 munic√≠pios)**

Esses cinco estados concentram a maior parte da produ√ß√£o nacional.

---

### Produ√ß√£o por Tipo de Caf√©
- O **Caf√© Ar√°bica** domina a produ√ß√£o nacional, com forte presen√ßa em **MG, SP e PR**.  
- O **Caf√© Canephora (Conilon)** aparece principalmente em **ES e BA**, refletindo a adapta√ß√£o clim√°tica dessas regi√µes.

---

### Qualidade dos Dados
| Indicador | Valor |
|------------|--------|
| Total de linhas | 1.359 |
| Linhas com valores nulos | 0 |
| Linhas com valores zerados | 0 |
| **Completude** | **100%** |

A base de dados bruta, conta com todos os munic√≠pios do Brasil, por√©m muitos deles sem produ√ß√£o de caf√© ou com dados omitidos, o processamento removeu todos esses registros, para a an√°lise de registros v√°lidos para produ√ß√£o de caf√© no Brasil.
Os registros com dados v√°lidos representam as √°reas efetivamente produtoras.

---

### Conclus√£o
Os dados est√£o limpos, padronizados e prontos para an√°lise aprofundada.  
O pr√≥ximo passo ser√° a **cria√ß√£o de visualiza√ß√µes e dashboards** para destacar:
- A concentra√ß√£o da produ√ß√£o por estado e tipo de caf√©;  
- O valor econ√¥mico da produ√ß√£o;  
- As diferen√ßas regionais de produtividade.

---

üìÅ *Fonte dos dados:* [IBGE ‚Äì SIDRA, Tabela 1613](https://www.ibge.gov.br/estatisticas/economicas/agricultura-e-pecuaria/9117-producao-agricola-municipal-culturas-temporarias-e-permanentes)
