# Tratamento do CSV de Demandas 2022

## Objetivo
Neste notebook, vamos **tratar o arquivo `demandas-2022.csv`**, filtrando apenas os dados dos meses de **março e abril** de 2022.  
Os dados serão preparados para análises posteriores de produção de lixo e alagamentos em Fortaleza.

---

## Importação das Bibliotecas
```python

In [8]:
import pandas as pd

### Carregamento do Arquivo CSV

In [10]:
# Caminho do arquivo
path = "../ data/raw/demandas-2022.csv"

# Tentativa de leitura do CSV
try:
    df = pd.read_csv(path, sep=';', encoding='utf-8')
    print("Arquivo lido com sucesso em UTF-8!")
except UnicodeDecodeError:
    df = pd.read_csv(path, sep=';', encoding='latin-1')
    print("Erro ao ler em UTF-8, mas funcionou com Latin-1!")
except FileNotFoundError:
    print("Erro: arquivo não encontrado. Verifique o caminho.")


Erro ao ler em UTF-8, mas funcionou com Latin-1!


### Visualização Inicial dos Dados

In [11]:
df.head()
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10246 entries, 0 to 10245
Data columns (total 16 columns):
 #   Column           Non-Null Count  Dtype  
---  ------           --------------  -----  
 0   Data/Hora        10246 non-null  object 
 1   Obs Fiscal       10246 non-null  object 
 2   Status           10246 non-null  object 
 3   Logradouro       10246 non-null  object 
 4   Número           10245 non-null  object 
 5   Bairro           10245 non-null  object 
 6   Cidade           10246 non-null  object 
 7   UF               338 non-null    object 
 8   CEP              10245 non-null  float64
 9   Data Agenda      2 non-null      object 
 10  Data Execução    10114 non-null  object 
 11  Nome             10246 non-null  object 
 12  Concessionária   10246 non-null  object 
 13  Tipo da Demanda  10246 non-null  object 
 14  Prazo            10246 non-null  object 
 15  Zona             10232 non-null  object 
dtypes: float64(1), object(15)
memory usage: 1.3+ MB


### Conversão da Coluna de Data/Hora

In [12]:
df['Data/Hora'] = pd.to_datetime(df['Data/Hora'], errors='coerce')

### Filtragem Apenas de Março e Abril

In [13]:
# Remover valores nulos e duplicados antes do filtro
df_clean = df.dropna(subset=['Data/Hora']).drop_duplicates()

# Filtrar apenas março (3) e abril (4)
df_filtrado = df_clean[df_clean['Data/Hora'].dt.month.isin([3, 4])]

# Conferir resultado
df_filtrado.info()
df_filtrado.head()

<class 'pandas.core.frame.DataFrame'>
Index: 704 entries, 0 to 9653
Data columns (total 16 columns):
 #   Column           Non-Null Count  Dtype         
---  ------           --------------  -----         
 0   Data/Hora        704 non-null    datetime64[ns]
 1   Obs Fiscal       704 non-null    object        
 2   Status           704 non-null    object        
 3   Logradouro       704 non-null    object        
 4   Número           704 non-null    object        
 5   Bairro           704 non-null    object        
 6   Cidade           704 non-null    object        
 7   UF               15 non-null     object        
 8   CEP              704 non-null    float64       
 9   Data Agenda      0 non-null      object        
 10  Data Execução    697 non-null    object        
 11  Nome             704 non-null    object        
 12  Concessionária   704 non-null    object        
 13  Tipo da Demanda  704 non-null    object        
 14  Prazo            704 non-null    object       

Unnamed: 0,Data/Hora,Obs Fiscal,Status,Logradouro,Número,Bairro,Cidade,UF,CEP,Data Agenda,Data Execução,Nome,Concessionária,Tipo da Demanda,Prazo,Zona
0,2022-03-01 09:14:00,(43535) Árvore caída e ja cortada na Rua Copér...,Finalizada,Copérnico,192,Paupina,Fortaleza,,60872596.0,,31/01/2022 00:00,José Raphael Martins Cardoso (URBFOR),Ecofor,Coleta de Poda,Excedido o Prazo,SER 6
1,2022-03-01 09:18:00,(43536) Árvore caída e ja cortada na Av L x Av...,Finalizada,L,1310,Prefeito José Walter,Fortaleza,,60750110.0,,12/01/2022 00:00,José Raphael Martins Cardoso (URBFOR),Ecofor,Coleta de Poda,Excedido o Prazo,SER 8
2,2022-03-01 09:22:00,(43537) Árvore caída e ja cortada na Av Dr cor...,Finalizada,Doutor Correia Lima,818,Edson Queiroz,Fortaleza,,60834195.0,,15/01/2022 00:00,José Raphael Martins Cardoso (URBFOR),Ecofor,Coleta de Poda,Excedido o Prazo,SER 7
3,2022-03-01 09:24:00,(43534) BAIRRO: CONJUNTO CEARÁ I PRÓXIMO A FAR...,Finalizada,D,1636,Conjunto Ceará I,Fortaleza,,60533624.0,,12/01/2022 00:00,Francisco Eugênio Sales Januário (SER XI),Ecofor,Coleta de Entulho (de forma manual),Excedido o Prazo,SER 11
4,2022-03-01 09:39:00,(43538) A equipe de Infraestrutura e Conservaç...,Finalizada,César Cals,802,Vicente Pinzon,Fortaleza,,60182035.0,,13/01/2022 00:00,Anna Karolyne Xavier Siqueira de Oliveira (SER...,Ecofor,Coleta Mecanizada (Grandes volumes),Excedido o Prazo,SER 2


### Exportação do Arquivo Filtrado

In [None]:
# Salvar CSV tratado para análises posteriores
df_filtrado.to_csv("../ data/processed/demandas-marco-abril-2022.csv", index=False, encoding='utf-8')
print("Arquivo filtrado salvo com sucesso em 'data/processed/demandas-marco-abril-2022.csv'")


Arquivo filtrado salvo com sucesso em '../data/raw/demandas-marco-abril-2022.csv'
