In [3]:
import plotly.express as px
import plotly.graph_objects as go
import pandas as pd
import numpy as np
import json
from   sqlalchemy import create_engine

In [4]:
engine = create_engine('postgresql+psycopg2://postgres:datascience007@localhost:5432/machineLearning')

`Série Historica de desistencias`

In [5]:
def SerieHistoricaDesistencias():
    with open('json/queries.json', 'r', encoding='utf-8') as f:
        queries = json.load(f)

    sql = queries['SerieHistoricaDesistencia']
    return pd.read_sql(sql, engine)

In [6]:
data1 = SerieHistoricaDesistencias()

In [7]:
def SerieHistoricaDesistenciasPlot(data):
    fig = go.Figure(
        go.Scatter(
            x = data['ano_saida'],
            y = data['count'],
            fill='tozeroy',
            fillcolor='rgba(255, 99, 71, 0.422)'
        )
    )
    fig.update_traces(
        hovertemplate = '<extra></extra><b>Ano:%{x}<b><br>Desistencias:%{y}<br><extra></extra>',
        marker = dict(
            color = 'tomato'
        )
    )

    fig.update_layout(
        hovermode = 'x unified',
        template = 'simple_white',
        title    = dict(
            text = 'Série historica Desistência de Alunos'
        ),
        xaxis = dict(
            nticks = 7,
            title = dict(
                text=None
            )
        ),
        yaxis = dict(
            showgrid  = True, 
            gridwidth = 1,
            griddash  = 'dot',
            gridcolor = 'black',
            linecolor = 'white',
            title = dict(
                text = 'Quantidade' 
            )
        ),
        margin = dict(
            r = 20,
            b = 20
        )
    )
    return fig

In [8]:
SerieHistoricaDesistenciasPlot(data1).show()

`Forma de ingresso`

In [9]:
def FormaDeEntrada(anos = [2010, 2010], status = ['Cancelado', 'Ativo','Concluído', 'Trancado'], modo_entrada = ['VESTIBULAR', 'SISU']):
    with open('json/queries.json', 'r', encoding='utf-8') as f:
        queries = json.load(f)

    sql = queries['Forma de entrada']
    sql = sql.replace('ano1_', str(anos[0])).replace('ano2_', str(anos[1]))
    d_ = ['d1', 'd2', 'd3', 'd4']
    for e, i in enumerate(status):
        sql = sql.replace(f'{d_[e]}', f'{i}')

    c_ = ['c1', 'c2']
    for e, i in enumerate(modo_entrada):
        sql = sql.replace(f'{c_[e]}', f'{i}')
    return pd.read_sql(sql, engine)

In [10]:
data = FormaDeEntrada(anos=[2010, 2023], status=['Concluído', 'Ativo'])

In [11]:
data

Unnamed: 0,status,forma_ingresso,count
0,Ativo,SELEÇÃO SISU,25308
1,Ativo,VESTIBULAR,723
2,Concluído,SELEÇÃO SISU,17819
3,Concluído,VESTIBULAR,5994


In [12]:
def FormaDeEntradaPlot(data):
    fig = go.Figure()
    color = ['#bad9b5', '#732c2c']

    for subset, c in zip(data['forma_ingresso'].unique(), color):
        fig.add_trace(
            go.Bar(
                x = data[data['forma_ingresso'] == subset]['status'],
                y = data[data['forma_ingresso'] == subset]['count'],
                name = subset,
                text = data[data['forma_ingresso'] == subset]['count'],
                textposition = 'auto',
                customdata  = [data[data['forma_ingresso'] == subset]['forma_ingresso']],
                marker_color = c,
                meta=[subset]

            )
        )
    fig.update_traces(
        hovertemplate = '<b>Status:%{x} - %{meta[0]}<b><br>Quantidade:%{y}<br><extra></extra>',
    )
    fig.update_layout(
        dragmode = False,
        height = 300,
        hovermode = 'x unified',
        template = 'simple_white',
        title    = dict(
            text = 'Forma de entrada',
           automargin=True,

        ),
        legend = dict(
            title = dict(
                text = None, 
            ),
            font = dict(
                size = 8
            ),
            orientation = 'h',
            yanchor = 'bottom',
            y = 1.02,
            xanchor = 'right',
            x = 1
        ),
        xaxis = dict(
            title = dict(
                text = None
            )
        ),
        yaxis = dict(
            title = dict(
                text = 'Quantidade',
                font = dict(
                    size = 8
                )
            )
        ),
        margin = dict(
            r = 20,
            b = 10,
            l = 0 ,
            t = 0
        )
    )
    return fig

In [13]:
FormaDeEntradaPlot(data).show()

`Por sexo`

In [14]:
def PorSexo(anos = [2010, 2010], status = ['Cancelado', 'Ativo','Concluído', 'Trancado'], modo_entrada = ['VESTIBULAR', 'SISU']):
    with open('json/queries.json', 'r', encoding='utf-8') as f:
        queries = json.load(f)

    sql = queries['PorSexo']
    sql = sql.replace('ano1_', str(anos[0])).replace('ano2_', str(anos[1]))

    d_ = ['d1', 'd2', 'd3', 'd4']
    for e, i in enumerate(status):
        sql = sql.replace(f'{d_[e]}', f'{i}')

    c_ = ['c1', 'c2']
    for e, i in enumerate(modo_entrada):
        sql = sql.replace(f'{c_[e]}', f'{i}')

    return pd.read_sql_query(sql, engine)

In [15]:
data = PorSexo(anos=[2010, 2023], status=['Cancelado', 'Concluído'], modo_entrada=['SISU'])
data

Unnamed: 0,sexo,forma_ingresso,status,count
0,Feminino,SELEÇÃO SISU,Cancelado,17110
1,Feminino,SELEÇÃO SISU,Concluído,8881
2,Masculino,SELEÇÃO SISU,Cancelado,27478
3,Masculino,SELEÇÃO SISU,Concluído,8938


In [16]:
def PorSexoPlot(data):
    data['forma_ingresso'] = data['forma_ingresso'].str.title()
    fig = px.sunburst(
        data, 
        path=['sexo', 'forma_ingresso', 'status'], 
        values='count',
        color_discrete_sequence=['lightskyblue', 'lightpink'],

    )
    fig.update_traces(
        textinfo = 'label+percent parent',
        texttemplate  ='%{label}<br>%{percentEntry}',
        hovertemplate = '<b>%{label}</b><br>Quantidade: %{value} (%{percentRoot:.2f})<extra></extra>',
        marker = dict(
            line = dict(
                width = 1,
                color = 'white'
            )
        )
    )
    fig.update_layout(
        height = 300,
        template = 'simple_white',
        uniformtext=dict(
            minsize=10, 
        ),
        margin = dict(
            r = 50,
            b = 10,
            l = 50,
            t = 50
        ),
        title = dict(
            text = 'Por sexo e forma de ingresso',
            automargin=True
        ),
        hovermode = 'x',
        hoverlabel = dict(
            bgcolor = 'white',
            font  = dict(
                size = 12
            ),
            align = 'right',
        )
    )
    return fig

In [17]:
PorSexoPlot(data).show()

`media aprovados`

In [18]:
def MediaAprovados(anos = [2010, 2010], status = ['Cancelado', 'Ativo','Concluído', 'Trancado'], modo_entrada = ['VESTIBULAR', 'SISU']):
    with open('json/queries.json', 'r',encoding='utf-8') as f:
        queries = json.load(f)
    sql = queries['MediaAprovados']
    sql = sql.replace('ano1_', f'{anos[0]}').replace('ano2_',f'{anos[1]}')

    d_ = ['d1', 'd2', 'd3', 'd4']
    for e, i in enumerate(status):
        sql = sql.replace(f'{d_[e]}', f'{i}')

    c_ = ['c1', 'c2']
    for e, i in enumerate(modo_entrada):
        sql = sql.replace(f'{c_[e]}', f'{i}')

    return pd.read_sql_query(sql, engine)

In [19]:
data = MediaAprovados(anos=[1988, 2023], status=['Cancelado', 'Concluído'], modo_entrada=['SISU', 'VESTIBULAR'])

In [20]:
def MediaAprovadosPlot(data):
    data['forma_ingresso'] = data['forma_ingresso'].str.title()
    
    fig = go.Figure()
    color = ['#bad9b5', '#732c2c']

    for subset, c in zip(data['forma_ingresso'].unique(), color):
        fig.add_trace(
            go.Bar(
                x = data[data['forma_ingresso'] == subset]['status'],
                y = data[data['forma_ingresso'] == subset]['media'],
                name = subset,
                text = data[data['forma_ingresso'] == subset]['media'],
                textposition = 'auto',
                marker_color = c,
                customdata  = [data[data['forma_ingresso'] == subset]['forma_ingresso']],
                meta=[subset]
                

            )
        )
    fig.update_traces(
        hovertemplate = '<b>%{meta[0]}<b><br>Quantidade:%{y}<br><extra></extra>',
    )
    fig.update_layout(

        height = 300,
        template = 'simple_white',
        uniformtext=dict(
            minsize=10, 
        ),
        margin = dict(
            r = 50,
            b = 10,
            l = 50,
            t = 50
        ),
        title = dict(
            text = 'Media de aprovados',
            automargin=True
        ),
        yaxis = dict(
            visible = False
        ),
        hovermode = 'x unified',
        hoverlabel = dict(
            bgcolor = 'white',
            font  = dict(
                size = 12
            ),
            align = 'right',
        ),

    )
    return fig

In [21]:
MediaAprovadosPlot(data).show()

`Cancelamento de matricular por modalidade`

In [142]:
def CancelamentoMatricular():
    with open('json/queries.json', 'r', encoding='utf-8') as f:
        queries = json.load(f)
    sql = queries['CancelamentoMatricularModalidade']
    return pd.read_sql_query(sql, engine)

In [143]:
data = CancelamentoMatricular()

In [164]:
def CancelamentoMatricularPlot(data):
    fig = go.Figure()

    for name_ in data['modalidade_considerada'].unique():
        subset = data[data['modalidade_considerada'] == name_].sort_values(by='ano_saida')
        meta_  = subset['nome_mobilidadade_considerada'].unique()[0] 
        fig.add_trace(
            go.Scatter(
                x = subset['ano_saida'],
                y = subset['count'],
                mode = 'lines',
                name = name_,
                meta = [meta_, name_],
            )
        )
    fig.update_traces(
        hovertemplate = '<b>%{meta[0]} (%{meta[1]})<b> - %{y}<extra></extra>',
        hoverlabel = dict(
            font = dict(
                size = 16
            )
        )
    )
    
    fig.update_layout(
        height = 350,
        hovermode = 'x unified',
        template = 'simple_white',
        margin = dict(
            r = 20,
            b = 10,
            l = 20,
            t = 50
        ),
        title = dict(
            text = 'Cancelamento Matriculas por Modalidade dos anos 2017 à 2023',
            font = dict(
                size=14,
                family="Inter, sans-serif",
                weight="bold"  
            ),
            automargin=True
        ),
        yaxis = dict(
            showgrid = True
        ),
        legend = dict(
            font = dict(
                size = 12
            ),
            borderwidth = 0,
            orientation = 'h',
            yanchor = 'top',
            xanchor = 'left',
            y = 1
        ),
        font = dict(
            family="Inter, sans-serif",
        )
    )
    return fig

In [165]:
CancelamentoMatricularPlot(data).show()

`Relação ano de entrada e saida`

In [26]:
def RelacaoAnoEntradaSaida():
    with open('json/queries.json', 'r', encoding='utf-8') as f:
        queries = json.load(f)
    sql = queries['TempoCancelamento']
    return pd.read_sql_query(sql, engine)

In [27]:
data = RelacaoAnoEntradaSaida()

In [134]:
def RelacaoAnoEntradaSaidaPlot(data):
    fig = go.Figure()
    order=['No mesmo ano', 'Primeiro ano', 'Segundo ano', 'Terceiro ano', 'Quarto ano', 'Quinto ano', 'Sexto ano']   
    colors = px.colors.qualitative.Dark24[0:10]

    for name_, c in zip(data['modalidade_considerada'].unique(), colors):
        subset = data[data['modalidade_considerada'] == name_]
        meta_  = subset['nome_mobilidadade_considerada'].unique()[0]
        fig.add_trace(
            go.Bar(
                x = subset['ano_de_cancelamento'],
                y = subset['count'],
                name = name_,
                meta = [meta_],
                marker = dict(
                    color = c
                )
            )
        )
    fig.update_traces(
        hovertemplate = '<extra></extra>%{meta[0]}<br> <b>%{y}</b>',
        hoverlabel = dict(
            font = dict(
                size =14
            )

        )
    )
 
    fig.update_layout(
        height = 400,
        dragmode = False,
        hovermode = 'x unified',
        template = 'simple_white',
        xaxis = dict(
            categoryorder='array', 
            categoryarray=list(order)
        ),
        yaxis = dict(
            showgrid = True
        ),
        margin = dict(
            r = 10,
            b = 10,
            l = 10,
            t = 50
        ),
        title = dict(
            text = 'Relação entre Ano de Entrada e Ano de Saida',
            font = dict(
                size=14,
                family="Inter, sans-serif",
                weight="bold"
            ),
            automargin=True
        ),
        legend = dict(
            y = 1,
            x = 0.85,
            title = dict(
                text = 'Modalidade',
            )
        ),
        font = dict(
            family="Inter, sans-serif",
        )
    )
    return fig
       

In [29]:
RelacaoAnoEntradaSaidaPlot(data).show()

`taxa de cancelamento por curso`

In [115]:
def TaxaCancelamento(anos=[2010, 2023], modo_entrada = ['VESTIBULAR', 'SISU']):
    with open('json/queries.json', 'r', encoding='utf-8') as f:
        queries = json.load(f)

    sql = queries['TaxaCancelados']
    sql = sql.replace('ano1_', str(anos[0])).replace('ano2_', str(anos[1]))
    
    c_ = ['c1', 'c2']
    for e, i in enumerate(modo_entrada):
        sql = sql.replace(f'{c_[e]}', f'{i}')
    return pd.read_sql_query(sql, engine)

In [119]:
data = TaxaCancelamento(anos=[1999, 2023], modo_entrada = ['VESTIBULAR', 'SISU'])
data

Unnamed: 0,nome_curso,taxa_cancelamento
0,Bacharelado Em Design,100.0
1,Direito - Sobral,100.0
2,Interdisciplinar Em Ciências Naturais,100.0
3,Historia,98.63
4,Engenharia Ambiental,98.48
5,Engenharia De Materiais,95.21
6,Interdisciplinar Em Ciências Naturais E Matemá...,94.04
7,Musica - Licenciatura,81.66
8,Engenharia De Teleinformática,81.56
9,Design De Produto,79.25


In [126]:
def TaxaCancelamentoPlot(data):
    fig = go.Figure(
        go.Table(
            header = dict(
                values = ['Curso', 'Taxa de Cancelamento'],
                line_color = '#732c2c',
                fill_color = '#732c2c',
                align = ['left', 'left'],
                font = dict(color = 'white', size = 14),
                height = 30
            ),
            cells = dict(
                values = [data['nome_curso'], data['taxa_cancelamento']],
                line_color = '#732c2c',
                fill_color = 'white',
                font = dict(color = 'black', size = 14),
                align = ['left', 'left'],
            ),
        )
    )
    fig.update_layout(
        height = 200,
        margin = dict(
            l = 5,
            r = 5,
            t = 50,
            b = 0
        ),
        title = dict(
            text = 'Top 10 Cursos Mais Cancelados',
            font = dict(
                size=16,
                color='black',
                family="Inter, sans-serif",
                weight="bold"
            ),
            automargin=True
        ),
        font = dict(
            family="Inter, sans-serif",
        )
    )
    return fig

In [127]:
TaxaCancelamentoPlot(data).show()