# Análise de Gráficos de Sentimentos

Análise de sentimentos dos feedbacks dos alunos com plotagem de gráficos.

In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

%matplotlib inline
%config InlineBackend.figure_format='retina'

sns.set(style='whitegrid', palette='muted', font_scale=1.2)

: 

In [None]:
# Carregando o arquivo CSV com os feedbacks classificados
csv_path = "feedbacks_alunos_com_sentimento - classificado.csv"
df_respostas_com_sentimento = pd.read_csv(csv_path)

print(f"Total de feedbacks: {len(df_respostas_com_sentimento)}")
df_respostas_com_sentimento.head()

In [None]:
# Unificando cursos similares em 'Licenciatura em Computação'
cursos_licenciatura = [
    'Computação (Noturno)',
    'Licenciatura em Computação',
    'Licenciatura em Computação (noturno)'
]

# Substitui todos os cursos de licenciatura pelo nome unificado
df_respostas_com_sentimento['curso'] = df_respostas_com_sentimento['curso'].replace(cursos_licenciatura, 'Licenciatura em Computação')

print(f"Cursos após unificação:")
print(df_respostas_com_sentimento['curso'].value_counts())
print(f"\nTotal de registros: {len(df_respostas_com_sentimento)}")

In [None]:
# Análise 1: Sentimentos por curso
dados_analise1 = df_respostas_com_sentimento.groupby(["curso", "sentimento"]).size().reset_index(name="quantidade")

# Análise 2: Sentimentos por semestre
df_semestre = df_respostas_com_sentimento.dropna(subset=["semestre"])
dados_analise2 = df_semestre.groupby(["semestre", "sentimento"]).size().reset_index(name="quantidade")

# Análise 3: Sentimento vs percepção de utilidade
df_util = df_respostas_com_sentimento[df_respostas_com_sentimento["acho_util"].isin(["SIM", "UM POUCO"])]
dados_analise3 = df_util.groupby(["acho_util", "sentimento"]).size().reset_index(name="quantidade")

# Análise 4: Sentimento por curso e semestre
dados_analise4 = df_respostas_com_sentimento.groupby(["curso", "semestre", "sentimento"]).size().reset_index(name="quantidade")

In [None]:
# Calcular total por curso para obter porcentagem
dados_analise1["total"] = dados_analise1.groupby("curso")["quantidade"].transform("sum")
dados_analise1["porcentagem"] = (dados_analise1["quantidade"] / dados_analise1["total"]) * 100

dados_analise2["total"] = dados_analise2.groupby("semestre")["quantidade"].transform("sum")
dados_analise2["porcentagem"] = (dados_analise2["quantidade"] / dados_analise2["total"]) * 100

dados_analise3["total"] = dados_analise3.groupby("acho_util")["quantidade"].transform("sum")
dados_analise3["porcentagem"] = (dados_analise3["quantidade"] / dados_analise3["total"]) * 100

dados_analise4["total"] = dados_analise4.groupby(["curso","semestre"])["quantidade"].transform("sum")
dados_analise4["porcentagem"] = (dados_analise4["quantidade"] / dados_analise4["total"]) * 100

## Gráfico 1: Distribuição de sentimentos por curso

In [None]:
# Criando gráfico de sentimento por curso
plt.figure(figsize=(10, 6))
ax = sns.barplot(data=dados_analise1, x="curso", y="quantidade", hue="sentimento")
dados_analise1.sort_values(by="sentimento", inplace=True)
count = 0
for patch in ax.patches:
    if(count == len(dados_analise1)):
      break
    else:
      altura = patch.get_height()
      porcentagem = dados_analise1["porcentagem"].iloc[count]

      ax.text(patch.get_x() + patch.get_width() / 2, altura + 1,  # Posição do texto
          f'{porcentagem:.2f}%',  # Formatação do percentual
          ha='center', va='bottom', fontsize=10)
      count += 1

# Título e rótulos
plt.title("Distribuição de sentimentos por curso")
plt.xlabel("Curso")
plt.ylabel("Quantidade de feedbacks")
plt.xticks(rotation=15, ha='right')
plt.tight_layout()
plt.legend(title="Sentimento")
plt.show()

## Gráfico 2: Distribuição de sentimentos por semestre

In [None]:
# Criando gráfico de sentimento por semestre
plt.figure(figsize=(10, 6))
ax = sns.barplot(data=dados_analise2, x="semestre", y="quantidade", hue="sentimento")
dados_analise2.sort_values(by="sentimento", inplace=True)
count = 0
for patch in ax.patches:
    if(count == len(dados_analise2)):
      break
    else:
      altura = patch.get_height()
      porcentagem = dados_analise2["porcentagem"].iloc[count]

      ax.text(patch.get_x() + patch.get_width() / 2, altura + 1,  # Posição do texto
          f'{porcentagem:.2f}%',  # Formatação do percentual
          ha='center', va='bottom', fontsize=10)
      count += 1

# Título e rótulos
plt.title("Distribuição de sentimentos por semestre")
plt.xlabel("Semestre")
plt.ylabel("Quantidade de feedbacks")
plt.xticks(rotation=15, ha='right')
plt.tight_layout()
plt.legend(title="Sentimento")
plt.show()

## Gráfico 3: Distribuição de sentimentos por achou útil

In [None]:
# Criando gráfico de sentimento por achou útil
plt.figure(figsize=(10, 6))
ax = sns.barplot(data=dados_analise3, x="acho_util", y="quantidade", hue="sentimento")
dados_analise3.sort_values(by="sentimento", inplace=True)
count = 0
for patch in ax.patches:
    if(count == len(dados_analise3)):
      break
    else:
      altura = patch.get_height()
      porcentagem = dados_analise3["porcentagem"].iloc[count]

      ax.text(patch.get_x() + patch.get_width() / 2, altura + 1,  # Posição do texto
          f'{porcentagem:.2f}%',  # Formatação do percentual
          ha='center', va='bottom', fontsize=10)
      count += 1

# Título e rótulos
plt.title("Distribuição de sentimentos por achou útil")
plt.xlabel("Achou útil")
plt.ylabel("Quantidade de feedbacks")
plt.xticks(rotation=15, ha='right')
plt.tight_layout()
plt.legend(title="Sentimento")
plt.show()

## Gráfico 4a: Distribuição de sentimentos por semestre - Ciência da Computação

In [None]:
# Filtra dados apenas para Ciência da Computação
dados_ciencia = dados_analise4[dados_analise4['curso'] == 'Ciência da Computação'].copy()
dados_ciencia = dados_ciencia.sort_values("sentimento").reset_index(drop=True)

# Cria gráfico
plt.figure(figsize=(12, 6))
ax = sns.barplot(data=dados_ciencia, x="semestre", y="quantidade", hue="sentimento")

# Adiciona porcentagens nas barras
count = 0
for patch in ax.patches:
    if count < len(dados_ciencia):
        altura = patch.get_height()
        porcentagem = dados_ciencia["porcentagem"].iloc[count]
        
        ax.text(patch.get_x() + patch.get_width() / 2, altura + 1,
               f'{porcentagem:.2f}%',
               ha='center', va='bottom', fontsize=10)
        count += 1

# Ajustes visuais
plt.title("Distribuição de sentimentos por semestre - Ciência da Computação")
plt.xlabel("Semestre")
plt.ylabel("Quantidade de feedbacks")
plt.xticks(rotation=15, ha='right')
plt.legend(title="Sentimento")
plt.tight_layout()
plt.show()

## Gráfico 4b: Distribuição de sentimentos por semestre - Licenciatura em Computação

In [None]:
# Filtra dados apenas para Licenciatura em Computação
dados_licenciatura = dados_analise4[dados_analise4['curso'] == 'Licenciatura em Computação'].copy()
dados_licenciatura = dados_licenciatura.sort_values("sentimento").reset_index(drop=True)

# Cria gráfico
plt.figure(figsize=(12, 6))
ax = sns.barplot(data=dados_licenciatura, x="semestre", y="quantidade", hue="sentimento")

# Adiciona porcentagens nas barras
count = 0
for patch in ax.patches:
    if count < len(dados_licenciatura):
        altura = patch.get_height()
        porcentagem = dados_licenciatura["porcentagem"].iloc[count]
        
        ax.text(patch.get_x() + patch.get_width() / 2, altura + 1,
               f'{porcentagem:.2f}%',
               ha='center', va='bottom', fontsize=10)
        count += 1

# Ajustes visuais
plt.title("Distribuição de sentimentos por semestre - Licenciatura em Computação")
plt.xlabel("Semestre")
plt.ylabel("Quantidade de feedbacks")
plt.xticks(rotation=15, ha='right')
plt.legend(title="Sentimento")
plt.tight_layout()
plt.show()

## Gráfico 5: Comparação Pandemia vs Semestres Presenciais

Comparação dos sentimentos entre o semestre de pandemia (2021.2) e todos os semestres presenciais agrupados.

In [None]:
# Criando coluna de período (Pandemia vs Presencial)
df_respostas_com_sentimento['periodo'] = df_respostas_com_sentimento['semestre'].apply(
    lambda x: 'Pandemia (2021.2)' if x == '2021.2 - pandemia' else 'Presencial (outros semestres)'
)

# Preparando dados para o gráfico
dados_comparacao = df_respostas_com_sentimento.groupby(['periodo', 'sentimento']).size().reset_index(name='quantidade')

# Calculando porcentagens
dados_comparacao['total'] = dados_comparacao.groupby('periodo')['quantidade'].transform('sum')
dados_comparacao['porcentagem'] = (dados_comparacao['quantidade'] / dados_comparacao['total']) * 100

# Criando o gráfico
plt.figure(figsize=(10, 6))
ax = sns.barplot(data=dados_comparacao, x='periodo', y='quantidade', hue='sentimento')

# Adiciona porcentagens nas barras
dados_comparacao_sorted = dados_comparacao.sort_values('sentimento').reset_index(drop=True)
count = 0
for patch in ax.patches:
    if count < len(dados_comparacao_sorted):
        altura = patch.get_height()
        porcentagem = dados_comparacao_sorted['porcentagem'].iloc[count]
        
        ax.text(patch.get_x() + patch.get_width() / 2, altura + 1,
               f'{porcentagem:.2f}%',
               ha='center', va='bottom', fontsize=11, fontweight='bold')
        count += 1

# Ajustes visuais
plt.title('Comparação de Sentimentos: Pandemia vs Semestres Presenciais', fontsize=14, fontweight='bold')
plt.xlabel('Período', fontsize=12)
plt.ylabel('Quantidade de feedbacks', fontsize=12)
plt.legend(title='Sentimento', title_fontsize=12)
plt.xticks(rotation=0)
plt.tight_layout()
plt.show()