<h2><center>Análise Exploratória de Dados 📊</center></h2>

<h5>Grupo: TechMovee</h5>
<h5>Objetivo: Limpeza de dados - Normalização - Gráficos - Análises</h5>
<h5>Autor: Melissa Martins de Araujo - 2°G - n°14</h5>

<br>
<h2><center>Começo do código</center></h2>

<h4>Importações</h4>

In [1]:
import pandas as pd  # Importa a biblioteca pandas para manipulação de dados
from collections import Counter  # Importa Counter para contagem de ocorrências
import plotly.express as px  # Importa a biblioteca Plotly Express para visualização de dados
from plotly.subplots import make_subplots  # Importa a função para criar subgráficos
import plotly.graph_objects as go  # Importa objetos gráficos para criar figuras mais complexas

<h4>Lendo a base</h4>

In [2]:
# Lendo o arquivo Excel com dados de uma pesquisa
data = pd.read_excel('C:\\Users\\melissamartins-ieg\\OneDrive - Instituto Germinare\\Interdisciplinar\\AED - Interdisciplinar\\Bases\\pesquisa_responsaveis.xlsx')

<h4>Tratando a base - Limpeza de Dados</h4>

In [4]:
# Excluindo as colunas ID. hora de início, Hora de conclusão, Email, Nome e Hora da última modificação, já que são colunas desnecessárias para nossa análise
data = data.drop(['ID','Hora de início','Hora de conclusão','Email','Nome','Hora da última modificação'], axis=1)

<h3><center>Análise de Distribuição de valores</center></h3>

In [3]:
# Criando uma figura com múltiplos subgráficos (3 linhas e 2 colunas)
fig = make_subplots(rows=3, cols=2, 
                    specs=[[{'type': 'bar'}, {'type': 'bar'}],  # Gráficos de barras na primeira linha
                           [{'type': 'bar'}, {'type': 'domain'}],  # Gráfico de barras e gráfico de pizza na segunda linha
                           [{'type': 'bar'}, {'type': 'bar'}]],  # Gráficos de barras na terceira linha
                    subplot_titles=(  # Títulos dos subgráficos
                        'Distribuição de Idades dos Filhos',
                        'Distribuição uso de serviço de transporte escolar',
                        'Distribuição de Distância de Casa à Escola',
                        'Distribuição do Tempo que Leva para Ir à Escola',
                        'Você já teve problemas com transporte escolar?',
                        'Uso de um Transporte Mais Seguro e Eficiente'
                    ))

# Definindo paletas de cores personalizadas para os gráficos
cores_barras = ['#7CE4DD']  # Cor das barras
cores_pizza = ['#24B4F4', '#96EFF5', '#53D9F4', '#7CE4DD']  # Cores para o gráfico de pizza
colors = ['#7CE4DD', '#96EFF5', '#53D9F4']  # Outra paleta de cores para os gráficos

# Gráfico 1 - Barras: Distribuição da Idade dos Filhos
bar_idades = px.bar(data, 
                    x='Qual é a idade do(s) seu(s) filho(s)?',
                    color_discrete_sequence=cores_barras)  # Criando gráfico de barras para a idade dos filhos
for trace in bar_idades.data:
    fig.add_trace(trace, row=1, col=1)  # Adicionando o gráfico na primeira linha e primeira coluna

# Gráfico 2 - Barras: Uso do serviço de transporte escolar
bar_uso = px.bar(data, 
                 x='Já fez uso do serviço de um transporte escolar para o(s) seu(s) filho(s)?',
                 color_discrete_sequence=cores_barras)  # Criando gráfico de barras para uso do transporte escolar
for trace in bar_uso.data:
    fig.add_trace(trace, row=1, col=2)  # Adicionando o gráfico na primeira linha e segunda coluna

# Gráfico 3 - Barras: Tempo que leva para ir à escola
ordem_tempo = ['Mais de 30 minutos', '21 - 30 minutos', '10 - 20 minutos', 'Menos de 10 minutos']  # Definindo a ordem das categorias
bar_tempo = px.bar(data, 
                   x='Quanto tempo você leva, em média, para levar seu(s) filho(s) à escola?',
                   category_orders={'Quanto tempo você leva, em média, para levar seu(s) filho(s) à escola?': ordem_tempo},  # Definindo a ordem das categorias
                   color_discrete_sequence=cores_barras)  # Criando gráfico de barras para o tempo de deslocamento
for trace in bar_tempo.data:
    fig.add_trace(trace, row=2, col=1)  # Adicionando o gráfico na segunda linha e primeira coluna

# Gráfico 4 - Pizza: Distância de casa à escola
pie_distancia = px.pie(data, 
                       names='Qual é a distância entre sua casa e a escola?', 
                       color='Qual é a distância entre sua casa e a escola?',  # Cor por categoria
                       color_discrete_sequence=cores_pizza)  # Criando gráfico de pizza para a distância
for trace in pie_distancia.data:
    fig.add_trace(trace, row=2, col=2)  # Adicionando o gráfico na segunda linha e segunda coluna

# Gráfico 5 - Problemas com Transporte Escolar
problem_counts = data['Você já teve problemas com transporte escolar?'].value_counts()  # Contando as ocorrências de problemas
fig.add_trace(
    go.Bar(x=problem_counts.index, y=problem_counts.values, 
           marker_color=colors[0]),  # Adicionando gráfico de barras para problemas com transporte
    row=3, col=1  # Adicionando o gráfico na terceira linha e primeira coluna
)

# Gráfico 6 - Disposição para Uso de Transporte mais Seguro
willingness_counts = data['Você estaria disposto a mudar o transporte do seu(s) filho(s) para uma van escolar que oferecesse mais segurança e eficiência?'].value_counts()  # Contando as ocorrências de disposição
fig.add_trace(
    go.Bar(x=willingness_counts.index, y=willingness_counts.values, 
           marker_color=colors[0]),  # Adicionando gráfico de barras para disposição a mudar para transporte mais seguro
    row=3, col=2  # Adicionando o gráfico na terceira linha e segunda coluna
)

# Atualiza o layout da figura com título e configurações de exibição
fig.update_layout(
    title_text='Análise de Distribuições de Valores',  # Definindo o título principal do gráfico
    height=1000,  # Definindo a altura da figura
    title_x=0.5,  # Centralizando o título
    showlegend=True,  # Exibindo a legenda
    legend=dict(
        x=1,  # Posição da legenda na horizontal
        y=0.5,  # Posição da legenda na vertical
        traceorder='normal',  # Ordem dos itens na legenda
        font=dict(size=12),  # Tamanho da fonte da legenda
    )
)

# Exibindo a figura combinada
fig.show()


<h3><center>Análise de Relação das Variáveis</center></h3>

In [4]:
# Definindo a ordem das categorias para o gráfico de dificuldade em encontrar transporte escolar
ordem_distancia = ['Mais de 10 km', '5 - 9 km', '1 - 4 km', 'Menos de 1 km']
cores_barras = ['#7CE4DD', '#FF7171']  # Define nova paleta de cores

# Gráfico de barras: Dificuldade em Encontrar Transporte Escolar vs Distância da Escola
fig = px.bar(data, x='Qual é a distância entre sua casa e a escola?',
             category_orders={'Qual é a distância entre sua casa e a escola?': ordem_distancia},  # Definindo a ordem das categorias
             color='Você tem ou já teve dificuldade para encontrar transporte escolar para o seu(s) filho(s)?',  # Cor por categoria
             title='Dificuldade em Encontrar Transporte Escolar vs Distância da Escola',  # Título do gráfico
             color_discrete_sequence=cores_barras,  # Definindo as cores das barras
             barmode='stack')  # Modo de empilhamento para as barras
fig.update_layout(height=700, width=1500, showlegend=True)  # Atualizando layout do gráfico
fig.show()  # Exibindo o gráfico

In [5]:
# Gráfico de barras: Problemas de Comunicação vs Tempo de Deslocamento
ordem_tempo = ['Mais de 30 minutos', '21 - 30 minutos', '10 - 20 minutos', 'Menos de 10 minutos']  # Definindo a ordem das categorias
cores_barras = ['#53D9F4', '#7CE4DD', '#FF7171']  # Definindo nova paleta de cores
fig = px.bar(data, x='Quanto tempo você leva, em média, para levar seu(s) filho(s) à escola?', 
             color='Você já teve problemas com horário e comunicação com o transportador?',  # Cor por categoria
             category_orders={'Quanto tempo você leva, em média, para levar seu(s) filho(s) à escola?': ordem_tempo},  # Definindo a ordem das categorias
             color_discrete_sequence=cores_barras,  # Definindo as cores das barras
             title='Problemas de Comunicação vs Tempo de Deslocamento', barmode='group')  # Título do gráfico e modo de agrupamento
fig.update_layout(height=700, width=1500, showlegend=True)  # Atualizando layout do gráfico
fig.show()  # Exibindo o gráfico

<h3><center>Conclusão</center></h3>

<h4>A análise dos gráficos apresentados revela uma série de insights importantes sobre o uso do transporte escolar, destacando tanto a experiência atual das famílias quanto as áreas que necessitam de melhorias.
Distribuição de Idade dos Filhos mostra uma predominância de filhos adolescentes, o que enfatiza a necessidade de um sistema de transporte que atenda eficientemente essa faixa etária. A distribuição do uso do transporte escolar indica uma familiaridade com o serviço, sugerindo que os pais estariam abertos a melhorias e novas opções. A distância entre casa e escola mostra que a maioria dos alunos leva de 10 a 20 minutos para chegar à escola, um fator que pode influenciar a decisão de usar o transporte escolar.
A análise de problemas com o transporte escolar e a preferência por um serviço mais seguro e eficiente revela uma percepção majoritariamente positiva do serviço atual, ao mesmo tempo que indica uma demanda por melhorias. O gráfico sobre dificuldade em encontrar transporte escolar relaciona a distância com a dificuldade, evidenciando que famílias que vivem mais longe da escola enfrentam maiores desafios, o que reforça a necessidade de soluções mais acessíveis para esses casos.
Por fim, a relação entre problemas de comunicação e tempo de deslocamento sugere que quanto maior o tempo de viagem, maior a probabilidade de problemas de comunicação, o que indica uma área clara para intervenção e aprimoramento.
Em conclusão, os dados coletados refletem uma base sólida de satisfação com o transporte escolar atual, mas também destacam oportunidades significativas para melhorias em termos de segurança, eficiência e comunicação, especialmente para famílias que enfrentam desafios devido à distância. A implementação de um sistema de transporte que priorize essas necessidades pode não apenas melhorar a experiência das famílias, mas também contribuir para um ambiente escolar mais seguro e acessível.
</h4>

<h2><center>Fim. 🤗</center></h2>