In [1]:
import matplotlib.pyplot as plt
import pandas as pd

In [2]:
# Leitura do arquivo CSV
file_path = 'PDA_Cursos_Especializacao_Brasil.csv'
df = pd.read_csv(file_path)

In [None]:
df.head()


In [4]:
plt.style.use('ggplot')

In [5]:
# Agrupar por UF e SITUACAO
df_grouped = df.groupby(['UF', 'SITUACAO']).size().unstack(fill_value=0)

In [6]:
# Gráfico 1: Top 10 Cursos de Especialização mais Frequentes
plt.figure(figsize=(10, 6))
df['NOME_ESPECIALIZACAO'].value_counts().head(10).plot(kind='bar', color='skyblue')
plt.title('Top 10 Cursos de Especialização mais Frequentes', fontsize=14)
plt.xlabel('Nome do Curso', fontsize=12)
plt.ylabel('Frequência', fontsize=12)
plt.xticks(rotation=90)
plt.tight_layout()
plt.savefig('grafico_1.png')
plt.close()

In [7]:
# Gráfico 2: Situação das Vagas por Estado (UF)
df_grouped = df.groupby(['UF', 'SITUACAO']).size().unstack(fill_value=0)
df_grouped.plot(kind='bar', stacked=True, figsize=(12, 8))
plt.title('Situação das Vagas por Estado (UF)')
plt.xlabel('Estado (UF)')
plt.ylabel('Quantidade de Vagas')
plt.xticks(rotation=90)
plt.tight_layout()
plt.savefig('grafico_2.png')
plt.close()

In [8]:
# Gráfico 3: Situação Nacional
situacao_nacional = df['SITUACAO'].value_counts()
plt.figure(figsize=(7, 7))
plt.pie(situacao_nacional, labels=situacao_nacional.index, autopct='%1.1f%%', startangle=90)
plt.title('Proporção de Vagas por Situação no Brasil')
plt.savefig('grafico_3.png')
plt.close()

In [9]:
# Gráfico 4: Distribuição das Modalidades de Ensino
plt.figure(figsize=(8, 8))
df['MODALIDADE'].value_counts().plot(kind='pie', autopct='%1.1f%%', startangle=90, colors=['#66b3ff','#99ff99','#ffcc99'])
plt.title('Distribuição das Modalidades de Ensino', fontsize=14)
plt.ylabel('')
plt.tight_layout()
plt.savefig('grafico_5.png')
plt.close()

In [10]:

# Gráfico 5: Top 10 Municípios com Mais Cursos
plt.figure(figsize=(10, 6))
df['MUNICIPIO'].value_counts().head(10).plot(kind='bar', color='lightblue')
plt.title('Top 10 Municípios com Mais Cursos', fontsize=14)
plt.xlabel('Município', fontsize=12)
plt.ylabel('Frequência', fontsize=12)
plt.xticks(rotation=90)
plt.tight_layout()
plt.savefig('grafico_6.png')
plt.close()

In [11]:
# Gráfico 6: Distribuição de Cursos por Região
plt.figure(figsize=(8, 8))
df['REGIAO'].value_counts().plot(kind='pie', autopct='%1.1f%%', startangle=90, colors=['#ff9999','#66b3ff','#99ff99','#ffcc99','#c2c2f0'])
plt.title('Distribuição de Cursos por Região', fontsize=14)
plt.ylabel('')
plt.tight_layout()
plt.savefig('grafico_7.png')
plt.close()