# Efetue a análise exploratória dos dados levantando os principais pontos relevantes para a solução do problema.

    Este projeto tem como intuito analisar o visível aumento de moradores em situação de rua no município de Santos/SP. Para a análise estão sendo coletados dados do site do município, onde serão analisados os seguintes agrupamentos de dados:
    Análise quantitativa de dados demográficos e sociais:
        * População total do município
        * Número de pessoas em situação de rua
        * Número total de catadores
    Análise de encaminhamentos e equipamentos para atendimento à população em situação de rua:
        * Número de encaminhamentos após abordagem social a moradores de rua
        * Número de equipamentos para atendimento à população em situação de rua
    Análise de gastos e despesas na área de Assistência Social:
        * Gastos públicos em cada área administrativa do município – Assistência Social
        * Total das despesas previstas com Assistência Social
        * Total de gastos em todas as áreas administrativas do município
    Análise de atendimentos nos restaurantes populares e Centro de Referência Especializado
        * Atendimentos nos restaurantes populares
        * Quantidade de restaurantes populares
        * Quantidade de pessoas em situação de rua atendidas no Centro Pop

# Justifique os principais pontos escolhidos para a solução do problema e descreva sua relevância. 

    Os agrupamentos escolhidos tem a função de fundamentar as análises primeiramente num panorama geral e aos poucos aprofundarem nas evoluções tomadas pelo município e nos cuidados com as pessoas em situação de rua.
    
    Análise quantitativa de dados demográficos e sociais: este grupo de dados visa primeiramente analisar a progressão da população total do município, das em situação de rua e de catadores. A ideia é acompanhar o crescimento ou diminuição e qual sua porcentagem relativa entre estes dados.
    
    Análise de encaminhamentos e equipamentos para atendimento à população em situação de rua: um passo a frente, a ideia é verificar como e se estão sendo abordados, com quantos equipamentos e se os mesmos são proporcionais ao número total de pessoas em situação de rua. Através da análise destes dados será possível verificar se está sendo dada a devida importância à este problema social.

    Análise de gastos e despesas na área de Assistência Social: correlacionado ao agrupamento acima, este visa verificar de maneira mais ampla quais os cuidados das áreas responsáveis e qual a proporção destes esforços em relação ao tomado em outras áreas. 

    Análise de atendimentos nos restaurantes populares e Centro de Referência Especializado: este conjunto tem como intuito analisar se o governo dá uma base para as pessoas em situação financeira delicada, evitando assim que cheguem a se encontrar em situação de rua ou que retornem à mesma. Nesta análise poderemos verificar se existe a necessidade de uma instrução maior aos mesmos quanto à existência destes centro e restaurantes populares e, mais aprofundadamente, se se recusam a ir por algum motivo.




# 1. Importando as bibliotecas

In [1]:
import pandas as pd
import matplotlib.pyplot as plt

# 2. Criando os DataFrames

In [2]:
# Leitura de arquivos relacionados a atendimentos nos restaurantes populares e Centro de Referência Especializado
atend_rest_pop = pd.read_csv('Atendimentos nos restaurantes populares.csv')
qt_rest_pop = pd.read_csv('Quantidade de restaurantes populares.csv')
atend_centropop = pd.read_csv('Quantidade de pessoas em situação de rua atendidas no Centro Pop.csv')

# Leitura de arquivos relacionados a gastos e despesas na área de Assistência Social
gastos_assist_soc = pd.read_csv('Gastos públicos em cada área administrativa do município – Assistência Social.csv')
desp_assist_soc = pd.read_csv('Total das despesas previstas com Assistência Social.csv')
gastos_gerais_mun = pd.read_csv('Total de gastos em todas as áreas administrativas do município.csv')

# Leitura de arquivos relacionados a dados demográficos e sociais
pop_santos = pd.read_csv('População total do município.csv')
qt_situacao_rua = pd.read_csv('Número de pessoas em situação de rua.csv')
qt_catadores = pd.read_csv('Número total de catadores - Seds.csv')

# Leitura de arquivos relacionados a encaminhamentos e equipamentos para atendimento à população em situação de rua
encam_abord = pd.read_csv('Número de encaminhamentos após abordagem social a moradores de rua.csv')
equip_atend = pd.read_csv('Número de equipamentos para atendimento à população em situação de rua.csv')

# 3. Limpeza e preparação dos dados

#### Criando uma função chamada 'organizar' para converter os dados e eliminar a coluna 'descricao'

In [35]:
def organizar(df):
    # Convertendo a coluna 'data' para o tipo datetime
    df['data'] = pd.to_datetime(df['data'])
    
    # Extraindo apenas a parte da data (sem horário)
    df['data'] = df['data'].dt.date

    # Ordenando o DataFrame por ano
    df = df.sort_values(by='data')
    
    # Removendo a coluna 'descricao'
    df = df.drop('descricao', axis=1)

    return df

#### Chamando a função 'organizar' para cada DataFrame

In [36]:

atend_rest_pop = organizar(atend_rest_pop)
qt_rest_pop = organizar(qt_rest_pop)
atend_centropop = organizar(atend_centropop)
gastos_assist_soc = organizar(gastos_assist_soc)
desp_assist_soc = organizar(desp_assist_soc)
gastos_gerais_mun = organizar(gastos_gerais_mun)
pop_santos = organizar(pop_santos)
qt_situacao_rua = organizar(qt_situacao_rua)
qt_catadores = organizar(qt_catadores)
encam_abord = organizar(encam_abord)
equip_atend = organizar(equip_atend)

In [5]:
""""# Criando o gráfico
plt.figure(figsize=(10, 6))
plt.plot(atend_rest_pop['data'], atend_rest_pop['valor'], marker='o', linestyle='-')

# Adicionando rótulos e título
plt.xlabel('Data')
plt.ylabel('Valor')
plt.title('Atendimentos nos Restaurantes Populares ao longo do tempo')

# Exibindo o gráfico
plt.grid(True)
plt.show()"""

'"# Criando o gráfico\nplt.figure(figsize=(10, 6))\nplt.plot(atend_rest_pop[\'data\'], atend_rest_pop[\'valor\'], marker=\'o\', linestyle=\'-\')\n\n# Adicionando rótulos e título\nplt.xlabel(\'Data\')\nplt.ylabel(\'Valor\')\nplt.title(\'Atendimentos nos Restaurantes Populares ao longo do tempo\')\n\n# Exibindo o gráfico\nplt.grid(True)\nplt.show()'

#### Criando um dicionário 'dataframes' para facilitar a verificação de dados

In [41]:
dataframes = {
    'atend_rest_pop': atend_rest_pop,
    'qt_rest_pop': qt_rest_pop,
    'atend_centropop': atend_centropop,
    'gastos_assist_soc': gastos_assist_soc,
    'desp_assist_soc': desp_assist_soc,
    'gastos_gerais_mun': gastos_gerais_mun,
    'pop_santos': pop_santos,
    'qt_situacao_rua': qt_situacao_rua,
    'qt_catadores': qt_catadores,
    'encam_abord': encam_abord,
    'equip_atend': equip_atend
}

#### Aplicando um .isna para verificar se existem itens NaN

In [None]:
for name, df in dataframes.items():
    print(f"Verificando DataFrame: {name}")
    print(df.isna().sum())

#### Removendo linhas duplicadas

In [46]:
for name, df in dataframes.items():
    df.drop_duplicates(inplace=True)