## Importação das bibliotecas

- `boto3`: biblioteca oficial da AWS para acessar recursos como o S3.
- `pandas`: usado para manipulação e análise de dados tabulares.
- `botocore.exceptions`: tratamento de erros relacionados à autenticação e conexão com serviços AWS.

In [1]:
import pandas as pd
import boto3
from botocore.exceptions import BotoCoreError, ProfileNotFound, NoCredentialsError

### Carregamento do dataset

In [2]:
df = pd.read_csv("C:/Users/Vinic/Downloads/bolsa_familia_2024.csv")

### Informações do DataFrame

In [3]:
df.head()

Unnamed: 0,codigo_ibge,anomes_s,qtd_familias_beneficiarias_bolsa_familia_s,valor_repassado_bolsa_familia_s,pbf_vlr_medio_benef_f
0,110001,202412,1677,1132797.0,679.54
1,110002,202412,7710,5247594.0,683.9
2,110003,202412,307,207117.0,674.65
3,110004,202412,6066,4041564.0,666.7
4,110005,202412,1213,849202.0,702.4


In [4]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 66840 entries, 0 to 66839
Data columns (total 5 columns):
 #   Column                                      Non-Null Count  Dtype  
---  ------                                      --------------  -----  
 0   codigo_ibge                                 66840 non-null  int64  
 1   anomes_s                                    66840 non-null  int64  
 2   qtd_familias_beneficiarias_bolsa_familia_s  66840 non-null  int64  
 3   valor_repassado_bolsa_familia_s             66840 non-null  float64
 4   pbf_vlr_medio_benef_f                       66840 non-null  float64
dtypes: float64(2), int64(3)
memory usage: 2.5 MB


In [5]:
df.describe()

Unnamed: 0,codigo_ibge,anomes_s,qtd_familias_beneficiarias_bolsa_familia_s,valor_repassado_bolsa_familia_s,pbf_vlr_medio_benef_f
count,66840.0,66840.0,66840.0,66840.0,66840.0
mean,325358.627828,202406.5,3744.75211,2549393.0,677.713829
std,98482.928985,3.452078,16088.50042,10771850.0,30.753817
min,110001.0,202401.0,5.0,2950.0,486.48
25%,251210.0,202403.75,510.0,341104.0,661.27
50%,314627.5,202406.5,1327.5,898949.0,675.0
75%,411920.0,202409.25,3326.0,2279641.0,690.4
max,530010.0,202412.0,720175.0,490340800.0,1151.8


In [6]:
df.isnull().sum()

codigo_ibge                                   0
anomes_s                                      0
qtd_familias_beneficiarias_bolsa_familia_s    0
valor_repassado_bolsa_familia_s               0
pbf_vlr_medio_benef_f                         0
dtype: int64

In [7]:
df.duplicated(subset=["codigo_ibge", "anomes_s"]).sum()

np.int64(0)

### Questionamentos e analises

Q1 - Quais faixas de municípios concentram mais repasses acima da média nacional?

Q2 - Como o valor médio do benefício evolui ao longo do tempo em diferentes faixas de demanda?

Q3 - Qual a desigualdade interna em cada faixa de demanda em relação ao valor médio anual por família?

### Envio do csv para o bucket do s3

In [8]:
try:
    session = boto3.Session(profile_name='compass-sso')
    s3 = session.client('s3')
    print("Conexão com o S3 estabelecida com sucesso!")
except ProfileNotFound:
    print(" Erro: Perfil 'compass-sso' não encontrado. Verifique se o perfil está configurado com aws configure.")
except NoCredentialsError:
    print(" Erro: Credenciais não encontradas. Configure suas credenciais AWS.")
except BotoCoreError as e:
    print(f" Erro ao conectar com a AWS: {e}")

s3.upload_file('bolsa_familia_2024.csv', 'desafio-sprint4-8972', 'bolsa_familia_2024.csv')

Conexão com o S3 estabelecida com sucesso!
