In [7]:
# Passo 1: Importar a biblioteca pandas e verificar as planilhas no arquivo

import pandas as pd

# Caminho para o seu arquivo de dados
caminho_arquivo = './dados/capacitia-dados.xlsx'

try:
    # Ler o arquivo Excel
    xls = pd.ExcelFile(caminho_arquivo)
    
    # Obter e imprimir os nomes de todas as planilhas
    nomes_das_planilhas = xls.sheet_names
    print("Ótimo! O arquivo foi encontrado. Estas são as planilhas disponíveis:")
    print(nomes_das_planilhas)

except FileNotFoundError:
    print(f"Erro: O arquivo não foi encontrado no caminho '{caminho_arquivo}'.")
    print("Por favor, verifique se o nome da pasta e do arquivo estão corretos.")

Ótimo! O arquivo foi encontrado. Estas são as planilhas disponíveis:
['DADOS', 'VISÃO ABERTA', 'CARGOS-INCRITOS', 'CARGOS-CERTIFICADOS', 'SECRETARIAS-MASTERCLASS', 'SECRETARIAS-CURSO 1', 'SECRETARIAS-CURSO 2']


In [8]:
# Passo 2: Carregar a planilha 'CARGOS-INCRITOS' e ver as primeiras linhas

# Vamos carregar os dados da planilha específica em um DataFrame
# (Lembre-se que a variável 'caminho_arquivo' já foi definida no passo anterior)
df_cargos_inscritos = pd.read_excel(caminho_arquivo, sheet_name='CARGOS-INCRITOS')

# Agora, vamos exibir as 5 primeiras linhas desse DataFrame
print("Conteúdo das 5 primeiras linhas da planilha 'CARGOS-INCRITOS':")
print(df_cargos_inscritos.head())

Conteúdo das 5 primeiras linhas da planilha 'CARGOS-INCRITOS':
       Unnamed: 0  SECRETÁRIO  PRESIDENTE  VICE PRESIDENTE  SUPERINTENDENTE  \
0  1ª Masterclass           0           0                0                8   
1  2ª Masterclass           1           0                0                5   
2  3ª Masterclass           0           0                0                0   
3  4ª Masterclass           1           2                0                1   
4  5ª Masterclass           1           0                1                0   

   DIRETOR  CHEFE DE GABINETE  ASSESSOR  GERENTE  COORDENADOR  PRÓ-REITOR  \
0       12                  2         0        5            0           0   
1       19                  3         3        7            2           0   
2       16                  1         2        0            0           0   
3       19                  0         0        2            0           1   
4        9                  0         2        4            2           0   


In [9]:
# Passo 3: Somar os inscritos para cada cargo

# Primeiro, vamos remover a coluna 'Unnamed: 0' para que a gente possa somar apenas os números
cargos_numericos = df_cargos_inscritos.drop(columns=['Unnamed: 0'])

# Agora, vamos somar os valores de cada coluna (cada cargo)
total_por_cargo = cargos_numericos.sum()

# Exibir o resultado final
print("Total de inscritos por cargo (somando todas as Masterclasses):")
print(total_por_cargo)

Total de inscritos por cargo (somando todas as Masterclasses):
SECRETÁRIO             5
PRESIDENTE             4
VICE PRESIDENTE        1
SUPERINTENDENTE       24
DIRETOR              186
CHEFE DE GABINETE     18
ASSESSOR             123
GERENTE              109
COORDENADOR          127
PRÓ-REITOR             1
OUTROS               108
dtype: int64


In [10]:
# Passo 4: Visualizar os totais com um gráfico de barras

# Importando a biblioteca de gráficos, caso ainda não tenha sido feito nesta sessão
import plotly.express as px

# Para uma melhor visualização, vamos ordenar os dados do maior para o menor
dados_ordenados = total_por_cargo.sort_values(ascending=False)

# Criando o gráfico de barras
fig = px.bar(
    x=dados_ordenados.index,
    y=dados_ordenados.values,
    title="Total de Inscritos por Cargo em Todas as Masterclasses",
    labels={'x': 'Cargo', 'y': 'Número Total de Inscritos'},
    text=dados_ordenados.values  # Adiciona os números no topo das barras
)

# Ajusta a posição do texto para ficar fora das barras
fig.update_traces(textposition='outside')

# Exibe o gráfico interativo
fig.show()

In [11]:
# Passo 5: Carregar a planilha 'CARGOS-CERTIFICADOS' e ver as primeiras linhas

df_cargos_certificados = pd.read_excel(caminho_arquivo, sheet_name='CARGOS-CERTIFICADOS')

print("Conteúdo das 5 primeiras linhas da planilha 'CARGOS-CERTIFICADOS':")
print(df_cargos_certificados.head())

Conteúdo das 5 primeiras linhas da planilha 'CARGOS-CERTIFICADOS':
       Unnamed: 0  SECRETÁRIO  PRESIDENTE  VICE PRESIDENTE  SUPERINTENDENTE  \
0  1ª Masterclass           0           0                0                5   
1  2ª Masterclass           1           0                0                3   
2  3ª Masterclass           0           0                0                0   
3  4ª Masterclass           0           1                0                1   
4  5ª Masterclass           0           0                1                0   

   DIRETOR  CHEFE DE GABINETE  ASSESSOR  GERENTE  COORDENADOR  PRÓ-REITOR  \
0        7                  1         0        1            0           0   
1       13                  3         3        3            1           0   
2       16                  1         2        0            0           0   
3       17                  0         0        2            0           1   
4        9                  0         0        4            2           0

In [13]:
# Passo 6: Somar os certificados para cada cargo

# Remove a coluna de texto para podermos somar os números
certificados_numericos = df_cargos_certificados.drop(columns=['Unnamed: 0'])

# Soma os valores de cada coluna para obter o total por cargo
total_por_cargo_certificados = certificados_numericos.sum()

# Exibe o resultado da soma
print("Total de certificados por cargo (somando todas as Masterclasses):")
print(total_por_cargo_certificados)

Total de certificados por cargo (somando todas as Masterclasses):
SECRETÁRIO             1
PRESIDENTE             2
VICE PRESIDENTE        1
SUPERINTENDENTE       12
DIRETOR              130
CHEFE DE GABINETE     13
ASSESSOR              75
GERENTE               66
COORDENADOR           91
PRÓ-REITOR             1
OUTROS                48
dtype: int64


In [14]:
# Passo 7: Criar uma tabela comparativa

# Criando um novo DataFrame usando nossos dados agregados
# O pandas alinha os dados automaticamente pelo nome do cargo (o índice)
df_comparativo = pd.DataFrame({
    'Inscritos': total_por_cargo,
    'Certificados': total_por_cargo_certificados
})

# Substitui possíveis valores 'NaN' (Not a Number) por 0, caso um cargo
# exista em uma lista mas não na outra.
df_comparativo = df_comparativo.fillna(0)

# Calcula a taxa de certificação em porcentagem
# Multiplicamos por 100 e arredondamos para 2 casas decimais para ficar mais legível
df_comparativo['Taxa de Certificação (%)'] = \
    (df_comparativo['Certificados'] / df_comparativo['Inscritos'] * 100).round(2)

# Exibe a tabela comparativa final, ordenada do maior para o menor n° de inscritos
print("Tabela Comparativa: Inscritos vs. Certificados")
print(df_comparativo.sort_values(by='Inscritos', ascending=False))

Tabela Comparativa: Inscritos vs. Certificados
                   Inscritos  Certificados  Taxa de Certificação (%)
DIRETOR                  186           130                     69.89
COORDENADOR              127            91                     71.65
ASSESSOR                 123            75                     60.98
GERENTE                  109            66                     60.55
OUTROS                   108            48                     44.44
SUPERINTENDENTE           24            12                     50.00
CHEFE DE GABINETE         18            13                     72.22
SECRETÁRIO                 5             1                     20.00
PRESIDENTE                 4             2                     50.00
VICE PRESIDENTE            1             1                    100.00
PRÓ-REITOR                 1             1                    100.00


In [15]:
# Passo 8: Criar os gráficos comparativos

# (Relembrando que o df_comparativo já foi criado e calculado no passo anterior)

# --- Gráfico 1: Comparativo de Inscritos vs. Certificados ---

# Ordenando pela quantidade de inscritos para uma visualização limpa
df_ordenado_inscritos = df_comparativo.sort_values(by='Inscritos', ascending=False)

fig1 = px.bar(
    df_ordenado_inscritos,
    x=df_ordenado_inscritos.index,
    y=['Inscritos', 'Certificados'],
    title='Comparativo de Inscritos vs. Certificados por Cargo',
    labels={'x': 'Cargo', 'value': 'Número de Pessoas'},
    barmode='group'  # Essencial para agrupar as barras lado a lado
)

print("Exibindo Gráfico 1: Comparativo lado a lado...")
fig1.show()


# --- Gráfico 2: Taxa de Certificação por Cargo ---

# Ordenando pela taxa de certificação para destacar os melhores e piores
df_ordenado_taxa = df_comparativo.sort_values(by='Taxa de Certificação (%)', ascending=False)

fig2 = px.bar(
    df_ordenado_taxa,
    x=df_ordenado_taxa.index,
    y='Taxa de Certificação (%)',
    title='Taxa de Certificação por Cargo',
    labels={'x': 'Cargo', 'Taxa de Certificação (%)': 'Taxa de Certificação (%)'},
    text=df_ordenado_taxa['Taxa de Certificação (%)'].apply(lambda x: f'{x}%') # Formata o texto da barra
)

fig2.update_traces(textposition='outside')
print("\nExibindo Gráfico 2: Ranking da Taxa de Certificação...")
fig2.show()

Exibindo Gráfico 1: Comparativo lado a lado...



Exibindo Gráfico 2: Ranking da Taxa de Certificação...


In [16]:
# Passo 9: Carregar a planilha 'SECRETARIAS-MASTERCLASS' e ver as primeiras linhas

df_secretarias_masterclass = pd.read_excel(caminho_arquivo, sheet_name='SECRETARIAS-MASTERCLASS')

print("Conteúdo das 5 primeiras linhas da planilha 'SECRETARIAS-MASTERCLASS':")
print(df_secretarias_masterclass.head())

Conteúdo das 5 primeiras linhas da planilha 'SECRETARIAS-MASTERCLASS':
   Nº SECRETARIA/ÓRGÃO  Nº INSCRITOS  Nº CERTIFICADOS  Nº EVASÃO
0   1          BADESPI             3                2          1
1   2             CCOM             5                3          2
2   3              CGE             2                2          0
3   4              DER             9                5          4
4   5           FAPEPI             4                3          1


In [17]:
# Passo 10: Criar gráficos para a participação por Secretaria

# (Lembre-se que o df_secretarias_masterclass já está carregado)

# --- Gráfico 1: Ranking de Secretarias por Nº de Inscritos ---

# Para uma melhor visualização, vamos ordenar as secretarias pela quantidade de inscritos
df_masterclass_ordenado = df_secretarias_masterclass.sort_values(by='Nº INSCRITOS', ascending=False)

fig3 = px.bar(
    df_masterclass_ordenado,
    x='SECRETARIA/ÓRGÃO',
    y='Nº INSCRITOS',
    title='Nº de Inscritos na Masterclass por Secretaria/Órgão',
    labels={'SECRETARIA/ÓRGÃO': 'Secretaria / Órgão', 'Nº INSCRITOS': 'Número de Inscritos'},
    text='Nº INSCRITOS'
)
fig3.update_traces(textposition='outside')
print("Exibindo Gráfico 1: Ranking de Secretarias por Inscrição...")
fig3.show()


# --- Gráfico 2: Comparativo de Inscritos, Certificados e Evasão ---

fig4 = px.bar(
    df_masterclass_ordenado,
    x='SECRETARIA/ÓRGÃO',
    y=['Nº INSCRITOS', 'Nº CERTIFICADOS', 'Nº EVASÃO'],
    title='Balanço da Masterclass por Secretaria/Órgão',
    labels={'SECRETARIA/ÓRGÃO': 'Secretaria / Órgão', 'value': 'Quantidade'},
    barmode='group'
)
print("\nExibindo Gráfico 2: Comparativo Agrupado...")
fig4.show()

Exibindo Gráfico 1: Ranking de Secretarias por Inscrição...



Exibindo Gráfico 2: Comparativo Agrupado...


In [18]:
# Passo 11: Análise completa da planilha 'SECRETARIAS-CURSO 1'

print("--- Análise: SECRETARIAS-CURSO 1 ---")

# 1. Carregar os dados da planilha
try:
    df_curso1 = pd.read_excel(caminho_arquivo, sheet_name='SECRETARIAS-CURSO 1')

    # 2. Ordenar pelo número de inscritos
    df_curso1_ordenado = df_curso1.sort_values(by='Nº INSCRITOS', ascending=False)

    # 3. Gerar Gráfico de Ranking de Inscritos
    print("\nExibindo Gráfico 3: Ranking de Secretarias por Inscrição (Curso 1)...")
    fig5 = px.bar(
        df_curso1_ordenado,
        x='SECRETARIA/ÓRGÃO',
        y='Nº INSCRITOS',
        title='Nº de Inscritos no Curso 1 por Secretaria/Órgão',
        labels={'SECRETARIA/ÓRGÃO': 'Secretaria / Órgão', 'Nº INSCRITOS': 'Número de Inscritos'},
        text='Nº INSCRITOS'
    )
    fig5.update_traces(textposition='outside')
    fig5.show()

    # 4. Gerar Gráfico Comparativo Agrupado
    print("\nExibindo Gráfico 4: Comparativo Agrupado (Curso 1)...")
    fig6 = px.bar(
        df_curso1_ordenado,
        x='SECRETARIA/ÓRGÃO',
        y=['Nº INSCRITOS', 'Nº CERTIFICADOS', 'Nº EVASÃO'],
        title='Balanço do Curso 1 por Secretaria/Órgão',
        labels={'SECRETARIA/ÓRGÃO': 'Secretaria / Órgão', 'value': 'Quantidade'},
        barmode='group'
    )
    fig6.show()

except Exception as e:
    print(f"\nOcorreu um erro ao analisar a planilha 'SECRETARIAS-CURSO 1': {e}")
    print("Verifique se a planilha e os nomes das colunas ('SECRETARIA/ÓRGÃO', 'Nº INSCRITOS', etc.) existem e estão corretos.")

--- Análise: SECRETARIAS-CURSO 1 ---

Exibindo Gráfico 3: Ranking de Secretarias por Inscrição (Curso 1)...



Exibindo Gráfico 4: Comparativo Agrupado (Curso 1)...


In [35]:
# Passo 12: Análise completa da planilha 'SECRETARIAS-CURSO 2' (Versão Corrigida)

print("--- Análise Final: SECRETARIAS-CURSO 2 ---")

try:
    # Carregando os dados com a correção: pulando a primeira linha do arquivo
    df_curso2 = pd.read_excel(
        caminho_arquivo,
        sheet_name='SECRETARIAS-CURSO 2',
        skiprows=1
    )

    # Ordenar pelo número de inscritos
    df_curso2_ordenado = df_curso2.sort_values(by='Nº INSCRITOS', ascending=False)

    # Gerar Gráfico de Ranking de Inscritos
    print("\nExibindo Gráfico 5: Ranking de Secretarias por Inscrição (Curso 2)...")
    fig7 = px.bar(
        df_curso2_ordenado,
        x='SECRETARIA/ÓRGÃO',
        y='Nº INSCRITOS',
        title='Nº de Inscritos no Curso 2 por Secretaria/Órgão',
        labels={'SECRETARIA/ÓRGÃO': 'Secretaria / Órgão', 'Nº INSCRITOS': 'Número de Inscritos'},
        text='Nº INSCRITOS'
    )
    fig7.update_traces(textposition='outside')
    fig7.show()

    # Gerar Gráfico Comparativo Agrupado
    print("\nExibindo Gráfico 6: Comparativo Agrupado (Curso 2)...")
    fig8 = px.bar(
        df_curso2_ordenado,
        x='SECRETARIA/ÓRGÃO',
        y=['Nº INSCRITOS', 'Nº CERTIFICADOS', 'Nº EVASÃO'],
        title='Balanço do Curso 2 por Secretaria/Órgão',
        labels={'SECRETARIA/ÓRGÃO': 'Secretaria / Órgão', 'value': 'Quantidade'},
        barmode='group'
    )
    fig8.show()

except Exception as e:
    print(f"\nOcorreu um erro ao analisar a planilha 'SECRETARIAS-CURSO 2': {e}")

--- Análise Final: SECRETARIAS-CURSO 2 ---

Exibindo Gráfico 5: Ranking de Secretarias por Inscrição (Curso 2)...



Exibindo Gráfico 6: Comparativo Agrupado (Curso 2)...


In [36]:
# Passo 13: Análise do Funil Geral de Engajamento

# Somando os totais de cada DataFrame
# Usamos .sum() em cada coluna de interesse
total_inscritos = df_secretarias_masterclass['Nº INSCRITOS'].sum() + \
                  df_curso1['Nº INSCRITOS'].sum() + \
                  df_curso2['Nº INSCRITOS'].sum()

total_certificados = df_secretarias_masterclass['Nº CERTIFICADOS'].sum() + \
                     df_curso1['Nº CERTIFICADOS'].sum() + \
                     df_curso2['Nº CERTIFICADOS'].sum()

total_evasao = df_secretarias_masterclass['Nº EVASÃO'].sum() + \
               df_curso1['Nº EVASÃO'].sum() + \
               df_curso2['Nº EVASÃO'].sum()


print("--- Visão Geral do Programa (Todos os Eventos) ---")
print(f"Total de Vagas Ocupadas (Inscrições): {total_inscritos}")
print(f"Total de Certificados Emitidos: {total_certificados}")
print(f"Total de Evasões Registradas: {total_evasao}")

# Calculando a taxa de certificação geral
taxa_geral_certificacao = (total_certificados / total_inscritos * 100).round(2)
print(f"Taxa de Certificação Geral do Programa: {taxa_geral_certificacao}%")


# Criando o gráfico de funil
dados_funil = dict(
    quantidade=[total_inscritos, total_certificados],
    etapa=['Inscritos', 'Certificados']
)

fig9 = px.funnel(
    dados_funil,
    x='quantidade',
    y='etapa',
    title='Funil de Engajamento Consolidado do Programa'
)
fig9.show()

--- Visão Geral do Programa (Todos os Eventos) ---
Total de Vagas Ocupadas (Inscrições): 797
Total de Certificados Emitidos: 504
Total de Evasões Registradas: 293
Taxa de Certificação Geral do Programa: 63.24%


In [3]:
import pandas as pd

tab1 = "https://docs.google.com/spreadsheets/d/e/2PACX-1vQLcc_iCM1W3vJiiT1Dpu5zFSakEaL4yQYcmzGld--b83giWuHDPKQA_1jwpicbNY8eP5X3ZT2qlCFW/pubhtml"
tab2 = "https://docs.google.com/spreadsheets/d/e/2PACX-1vT04wuoclB0hqIpg72X6uCut_SSDsF5Hw70wa5R1EIwIgLhOgi4ffflFb39R68H6jAIhNVf-OmJ9Dmv/pubhtml"

df = pd.read_html(tab1, header=1, encoding="utf-8")[0]
df2 = pd.read_html(tab2, header=1, encoding="utf-8")[0]


In [4]:
display(df.head())
display(df2.head())

Unnamed: 0,1,Nome,Unnamed: 2,Órgão / Secretaria de Governo,Participou da Segunda Etapa do CapacitIA? (Curso de 20 horas),Participou da Terceira Etapa do CapacitIA? (Curso de construção de assistentes),Desenvolveu algum assistente ou solução de IA dentro da sua Secretaria ou Órgão?,"Se desenvolveu algum assistente, qual o objetivo deste?","Se desenvolveu algum assistente, qual link de acesso?","Atualmente, esse assistente está sendo utilizado por você ou sua equipe?",Que desafios ou limitações você identificou ao usar o assistente?,Em qual estágio do fluxo de trabalho o assistente mais auxilia?,"Você tem interesse em aprimorar, ampliar ou corrigir o Assistente?","Caso tenha interesse, como o assistente pode se tornar mais funcional para atender as necessidades da sua Secretaria?"
0,,,,,,,,,,,,,,
1,2.0,Alan Santos,,SEPLAN,Sim,Sim,Não,,,Não,,Atendimento a usuários,Sim,
2,3.0,Alene Moraes dos Passos,,SEPLAN,Não,Sim,Não,não,não,Não,,Outro (campo aberto),,Sim
3,4.0,Alexandro Dantas Borges de Oliveira,,JUCEPI,Sim,Sim,Sim,Consultor de Compras Publicas,https://chatgpt.com/g/g-67f3be52b02c8191ac14f9...,Sim,Até o momento nem uma,Geração de relatórios,Não,
4,5.0,Alexsander Bruno Sampaio Borges,,Setur,Não,Não,Não,Não,Não,Não,,,,


Unnamed: 0,1,#,NOME,DESCRIÇÃO,LINK,ORIGEM,SECRETARIA / RESPONSÁVEL,SIA+?,DOMÍNIO TEMÁTICO,PÚBLICO-ALVO,PRIVACIDADE,MODELO BASE UTILIZADO,VERSÃO DO MODELO,Temperatura (nível de criatividade),FORMATO DA ENTRADA,FORMATO DA RESPOSTA,DATA DISPONIBILIZAÇÃO,Estratégia de resposta (ex: só com base na base de conhecimento? Pode usar internet?),BASE DE CONHECIMENTO UTILIZADA,DOCUMENTAÇÃO
0,2,5,BADESPI TECH - IA Sob Medida,IA personalizada para a análise de cada client...,,CAPACITIA (ALUNOS),BADESPI,,,,,,,,,,,,,Baixar
1,3,6,BadespIA,É um assistente virtual desenvolvido para atua...,,CAPACITIA (ALUNOS),BADESPI,,GESTÃO PÚBLICA,Gestão Pública,,,,,,,,,,Baixar
2,4,9,BADESPI Mais Inteligente: Atendimento Virtual ...,Uma solução inovadora para modernizar o atendi...,,CAPACITIA (ALUNOS),BADESPI,,,,,,,,,,,,,Baixar
3,5,56,Projeto de Implantação de Agentes de IA e Chat...,Agendamento ágil de consultas e suporte inicia...,,CAPACITIA (ALUNOS),CENDFOL,,SAÚDE / ASSISTENCIA SOCIAL,Gestão Pública,,,,,,,,,,Baixar
4,6,40,Solução de IA para Gestão e Controle de Saldo ...,OBJETIVO: Criar um assistente de IA que automa...,,CAPACITIA (ALUNOS),DSEG/GAMIL-PI,,GESTÃO PÚBLICA,Gestão Pública,,,,,,,,,,Baixar
