# Educação e sucesso profissional.


A pipeline de dados construída para esse projeto foi inspirada no arquivo [Education & Career Success](https://www.kaggle.com/datasets/adilshamim8/education-and-career-success) extraído do Kaggle. O arquivo que inicialmente continha apenas uma tabela foi fragmentado em três tabelas distintas para uma melhor análise e compreensão dos dados. A qualidade dos dados foi verificada e, apesar das transformações e formatações realizadas, os dados permaneceram fiéis à versão original.



<img src="MVP_imagem_dataset.jpg" width="800">








####**Objetivo**: Explorar a relação entre o desempenho acadêmico e o sucesso profissional de estudantes que moram nos Estados Unidos (EUA). Ao final dessa análise é esperado que seja possível responder todas as perguntas localiazadas logo abaixo.

- Estudantes de universidades mais bem classificadas (university_ranking) ganham salários iniciais mais altos?
- Quais fatores mais contribuem para um crescimento rápido na carreira (years_to_promotion)?
- Estudantes de certas áreas (field_of_study) tem mais oportunidades de emprego do que outras?
- O número de estágios concluídos (interships_completed) tem impacto no salário inicial?
- Estudantes com pontuação alta em networking (networking_score) recebem mais ofertas de emprego?


#Descrição das colunas e dos dados numéricos e categóricos.

## Informações do estudante

- **Student_ID:** Identificador único para cada estudante;
- **Age:** Idade do estudante (18-30 anos);
- **Gender:** Gênero ( Masculino, Feminino ou Outro);

## Desempenho acadêmico

- **High_School_GPA:** Média escolar do ensino médio (escala de 2.0 - 4.0);
- **SAT_Score:** Pontuação no teste padronizado (900 - 1600);
- **University_Ranking:** Ranking da universidade frequentada (1-1000);
- **University_GPA:** Média acadêmica na universidade (escala de 2.0 - 4.0);
- **Field_of_Study:** Área de estudo (Ciência da Computação, Medicina, Administração/Negócios, Artes, Direito, Engenharia, Matemática);

## Habilidades e atividades extracurriculares

- **Internships_Completed:** – Número de estágios concluídos (0-4);
- **Projects_Completed:** – Número de projetos acadêmicos ou pessoais concluídos (0-9);
- **Certifications:** – Número de certificações adicionais obtidas (0-5);
- **Soft_Skills_Score:** – Avaliação das habilidades interpessoais (1-10);
- **Networking_Score:** Pontuação baseada em conexões e networking profissional (1-10);

## Resultados profissionais

- **Job_Offers:** Número de ofertas de emprego recebidas após a graduação (0-5);
- **Starting_Salary:** Salário inicial (anual) no primeiro emprego em dólares americanos (25.000 - 101.000)
- **Career_Satisfaction:** Nível de satisfação com a carreira (1-10);
- **Years_to_Promotion:** Tempo necessário para receber a primeira promoção (1-5 anos);
- **Current_Job_Level:** Nível de carreira atual (Júnior, Pleno, Sênior, Executivo);
- **Work_Life_Balance:** Avaliação do equilíbrio entre trabalho e vida pessoal (1-10);
- **Entrepreneurship:** Indica se a pessoa iniciou um negócio próprio (Sim/Não).






# Modelagem dos dados em Esquema Estrela

<img src="Esquema_Estrela_MVP._.jpg" width="800">

#CAMADA BRONZE (DADOS BRUTOS)

#Carregamento dos dados originais

###Utilizando o Spark e o Pandas para carregar todos os dados da tabela original diretamente do GitHub.

In [0]:
%python
import pandas as pd
from pyspark.sql import SparkSession


spark = SparkSession.builder.appName("LoadGitHubCSV").getOrCreate()


github_url = "https://raw.githubusercontent.com/Davisdenner/mvp_engenharia_de_dados/refs/heads/main/Arquivos%20utilizados/education_career_success.csv"


df_pandas = pd.read_csv(github_url)

df_spark = spark.createDataFrame(df_pandas)

spark.sql("DROP TABLE IF EXISTS education_career_success")

df_spark.write.format("delta").mode("overwrite").saveAsTable("education_career_success")

print(" Dados carregados com sucesso no Databricks!")



 Dados carregados com sucesso no Databricks!


###Visualizando a tabela original "education_carrer_success".

In [0]:
SELECT * FROM education_career_success;

Student_ID,Age,Gender,High_School_GPA,SAT_Score,University_Ranking,University_GPA,Field_of_Study,Internships_Completed,Projects_Completed,Certifications,Soft_Skills_Score,Networking_Score,Job_Offers,Starting_Salary,Career_Satisfaction,Years_to_Promotion,Current_Job_Level,Work_Life_Balance,Entrepreneurship
S02001,19,Female,3.82,1553,400,3.56,Business,4,6,2,8,8,4,34800.0,9,2,Mid,1,No
S02002,23,Male,3.64,1218,772,3.45,Engineering,4,8,3,5,5,3,63100.0,6,2,Entry,3,Yes
S02003,19,Female,2.26,1098,57,3.9,Arts,0,0,0,8,5,5,68200.0,3,3,Mid,1,No
S02004,20,Female,4.0,945,969,3.48,Mathematics,2,1,1,6,3,3,45900.0,4,2,Entry,4,No
S02005,23,Male,2.52,1404,625,3.39,Engineering,0,5,2,1,2,3,32700.0,9,5,Mid,7,No
S02006,22,Female,3.45,1439,213,2.52,Law,2,1,4,5,6,4,41500.0,6,3,Entry,9,No
S02007,25,Male,3.82,1413,279,3.85,Engineering,1,1,4,10,4,0,54400.0,8,2,Entry,4,No
S02008,26,Male,2.47,916,756,2.36,Medicine,1,4,5,2,10,1,56700.0,7,2,Mid,6,No
S02009,28,Female,3.82,1214,380,3.81,Engineering,2,6,5,7,4,4,79300.0,1,1,Entry,2,No
S02010,20,Female,2.62,1335,117,2.63,Medicine,3,3,2,10,6,0,62300.0,1,5,Entry,7,No


<img src="Tabela _ education_carreer_success.png" width="1000">

#CAMADA PRATA (DADOS LIMPOS E ADAPTADOS)


##Fragmentando a tabela original em três tabelas distintas:
- education_info;
- experience_info;
- carrer_info.

##Catálogo das colunas utlizadas na tabela "education_info".

- **Student_ID**: Identificação única do estudante;
- **Age**: Idade do estudante (18-30);
- **Gender**: Gênero do estudante (Masculino, Feminino ou Outro);
- **High_School_GPA**: Média no ensino médio (escala de 2.0 - 4.0);
- **SAT_Score**: Pontuação no SAT (900 - 1600);
- **University_Ranking**: Ranking da universidade frequentada (1 - 1000);
- **University_GPA**: Média na universidade (escala de 2.0 - 4.0);
- **Field_of_Study**: Área de estudo (Ciência da Computação, Medicina, Administração/Negócios, Artes, Direito, Engenharia, Matemática).



In [0]:
CREATE TABLE IF NOT EXISTS education_info (
    Student_ID VARCHAR(50) PRIMARY KEY,
    Age INT,
    Gender VARCHAR(10),
    High_School_GPA FLOAT,
    SAT_Score INT,
    University_Ranking INT,
    University_GPA FLOAT,
    Field_of_Study VARCHAR(100)
);

   

In [0]:
INSERT INTO education_info (Student_ID, Age, Gender, High_School_GPA, SAT_Score, University_Ranking, University_GPA, Field_of_Study)
SELECT 
    Student_ID,
    Age,
    Gender,
    High_School_GPA,
    SAT_Score,
    University_Ranking,
    University_GPA,
    Field_of_Study
FROM education_career_success;


num_affected_rows,num_inserted_rows
5000,5000


%md
###Visualizando a tabela "education_info"

In [0]:
SELECT*FROM education_info;

Student_ID,Age,Gender,High_School_GPA,SAT_Score,University_Ranking,University_GPA,Field_of_Study
S00001,24,Male,3.58,1052,291,3.96,Arts
S00002,21,Other,2.52,1211,112,3.63,Law
S00003,28,Female,3.42,1193,715,2.63,Medicine
S00004,25,Male,2.43,1497,170,2.81,Computer Science
S00005,22,Male,2.08,1012,599,2.48,Engineering
S00006,24,Male,2.4,1600,631,3.78,Law
S00007,27,Male,2.36,1011,610,3.83,Computer Science
S00008,20,Male,2.68,1074,240,2.84,Computer Science
S00009,24,Male,2.84,1201,337,3.31,Business
S00010,28,Male,3.02,1415,138,2.33,Computer Science


<img src="Tabela _ education_info.png" width="1000">

##Catálogo das colunas utlizadas na tabela "experience_info".

- **Student_ID**: Identificação única do estudante;
- **Internships_Completed**: Número de estágios concluídos (0-4);
- **Projects_Completed**: Número de projetos concluídos (0-9);
- **Certifications**: Número de certificações obtidas (0-5);
- **Soft_Skills_Score**: Avaliação de habilidades interpessoais (1-10);
- **Networking_Score**: Avaliação de networking (1-10).


In [0]:
CREATE TABLE IF NOT EXISTS experience_info (
    Student_ID VARCHAR(50),
    Internships_Completed INT,
    Projects_Completed INT,
    Certifications INT,
    Soft_Skills_Score INT,
    Networking_Score INT,
    CONSTRAINT fk_experience_student FOREIGN KEY (Student_ID) REFERENCES education_info(Student_ID)
);


In [0]:
INSERT INTO experience_info (Student_ID, Internships_Completed, Projects_Completed, Certifications, Soft_Skills_Score, Networking_Score)
SELECT 
    Student_ID,
    Internships_Completed,
    Projects_Completed,
    Certifications,
    Soft_Skills_Score,
    Networking_Score
FROM education_career_success;


num_affected_rows,num_inserted_rows
5000,5000


###Visualizando a tabela "experience_info".

In [0]:
SELECT*FROM experience_info;

Student_ID,Internships_Completed,Projects_Completed,Certifications,Soft_Skills_Score,Networking_Score
S00001,3,7,2,9,8
S00002,4,7,3,8,1
S00003,4,8,1,1,9
S00004,3,9,1,10,6
S00005,4,6,4,10,9
S00006,2,3,2,2,2
S00007,0,1,3,3,3
S00008,1,5,5,5,1
S00009,2,3,0,5,5
S00010,1,5,3,10,2


<img src="Tabela _ experience_info.png" width="1000">

###Catálogo das colunas utlizadas na tabela "career_info".

- **Student_ID**: Identificação única do estudante;
- **Job_Offers**: Número de ofertas de emprego recebidas após a graduação (0-5);
- **Starting_Salary**: Salário inicial (anual) no primeiro emprego em dólares americanos (25000 -  101000);
- **Career_Satisfaction**: Nível de satisfação com a carreira (escala de 1 a 10);
- **Years_to_Promotion**: Tempo necessário para receber a primeira promoção (1-5 anos);
- **Current_Job_Level**: Nível de carreira atual (Entry, Mid, Senior, Executive);
- **Work_Life_Balance**: Equilíbrio entre trabalho e vida pessoal (escala de 1 a 10);
- **Entrepreneurship**: Indica se a pessoa iniciou um negócio (Yes ou No).

In [0]:
CREATE TABLE IF NOT EXISTS career_info (
    Student_ID VARCHAR(50),
    Job_Offers INT,
    Starting_Salary FLOAT,
    Career_Satisfaction INT,
    Years_to_Promotion INT,
    Current_Job_Level VARCHAR(50),
    Work_Life_Balance INT,
    Entrepreneurship VARCHAR(50),
    CONSTRAINT fk_career_student FOREIGN KEY (Student_ID) REFERENCES education_info(Student_ID)
);


   

In [0]:
INSERT INTO career_info (Student_ID, Job_Offers, Starting_Salary, Career_Satisfaction, Years_to_Promotion, Current_Job_Level, Work_Life_Balance, Entrepreneurship)
SELECT 
    Student_ID,
    Job_Offers,
    Starting_Salary,
    Career_Satisfaction,
    Years_to_Promotion,
    Current_Job_Level,
    Work_Life_Balance,
    Entrepreneurship
FROM education_career_success;


num_affected_rows,num_inserted_rows
5000,5000


###Visualizando a tabela "carrer_info".

In [0]:
SELECT*FROM career_info;

Student_ID,Job_Offers,Starting_Salary,Career_Satisfaction,Years_to_Promotion,Current_Job_Level,Work_Life_Balance,Entrepreneurship
S00001,5,27200.0,4,5,Entry,7,No
S00002,4,25000.0,1,1,Mid,7,No
S00003,0,42400.0,9,3,Entry,7,No
S00004,1,57400.0,7,5,Mid,5,No
S00005,4,47600.0,9,5,Entry,2,No
S00006,1,68400.0,9,2,Entry,8,Yes
S00007,2,55500.0,7,4,Mid,3,No
S00008,2,38000.0,2,3,Entry,3,No
S00009,2,68900.0,2,2,Entry,2,No
S00010,0,58900.0,4,2,Senior,2,No


<img src="Tabela _ career_info.png" width="1000">

#Qualidade dos dados

- Logo abaixo foi feita uma análise de valores por atributo, para constatar que não se encontrou problemas no conjunto de dados.

##Análise de qualidade para a tabela  "**education_info**".

- Verificação de valores ausentes;
- Verificação dos valores mínimo e máximo da coluna "University_GPA", para garantir que os dados estejam completos e dentro dos limites esperados.

In [0]:
SELECT
    COUNT(*) AS total_rows,
    COUNT(DISTINCT Student_ID) AS unique_ids,
    COUNT(*) - COUNT(University_GPA) AS missing_university_gpa,
    MIN(University_GPA) AS min_gpa,
    MAX(University_GPA) AS max_gpa
FROM education_info;

total_rows,unique_ids,missing_university_gpa,min_gpa,max_gpa
20000,5000,0,2.0,4.0


<img src="Tabela_quali_education_info1.png" width="1000">

- Verificação de distribuição por área de estudo.

In [0]:
SELECT
    Field_of_Study,
    COUNT(*) AS qtd_estudantes
FROM education_info
GROUP BY Field_of_Study
ORDER BY qtd_estudantes DESC;


Field_of_Study,qtd_estudantes
Arts,2996
Mathematics,2980
Law,2908
Business,2876
Engineering,2804
Medicine,2756
Computer Science,2680


<img src="Tabela_quali_education_info2.png" width="1000">

##Análise de qualidade para a tabela  "**experience_info**".

- Verificação de valores fora dos limites esperados.

In [0]:
SELECT
    MIN(Internships_Completed) AS min_internships,
    MAX(Internships_Completed) AS max_internships,
    MIN(Soft_Skills_Score) AS min_soft_skills,
    MAX(Soft_Skills_Score) AS max_soft_skills,
    MIN(Networking_Score) AS min_networking,
    MAX(Networking_Score) AS max_networking
FROM experience_info;


min_internships,max_internships,min_soft_skills,max_soft_skills,min_networking,max_networking
0,4,1,10,1,10


<img src="Tabela_quali_experience_info1.png" width="1000">

- Verificação de valores ausentes.

In [0]:
SELECT
    COUNT(*) - COUNT(Internships_Completed) AS missing_internships,
    COUNT(*) - COUNT(Projects_Completed) AS missing_projects,
    COUNT(*) - COUNT(Certifications) AS missing_certifications
FROM experience_info;


missing_internships,missing_projects,missing_certifications
0,0,0


<img src="Tabela_quali_experience_info2.png" width="1000">

##Análise de qualidade para a tabela  "**career_info**".

- Verificação dos intervalos de salário e promoções.

In [0]:
SELECT
    MIN(Starting_Salary) AS min_salary,
    MAX(Starting_Salary) AS max_salary,
    MIN(Years_to_Promotion) AS min_years_promotion,
    MAX(Years_to_Promotion) AS max_years_promotion
FROM career_info;

min_salary,max_salary,min_years_promotion,max_years_promotion
25000.0,101000.0,1,5


<img src="Tabela_quali_career_info1.png" width="1000">

- Verificação de valores inconsistentes na coluna "Job_Offers".

In [0]:
SELECT
    Job_Offers,
    COUNT(*) AS qtd_estudantes
FROM career_info
GROUP BY Job_Offers
ORDER BY Job_Offers;


Job_Offers,qtd_estudantes
0,3392
1,3292
2,3424
3,3304
4,3216
5,3372


<img src="Tabela_quali_career_info2.png" width="1000">

#CAMADA OURO (DADOS PRONTOS PARA ANÁLISE)

#Solução dos problemas definidos nos objetivos.

### 1. Estudantes de universidades mais bem classificadas ganham salários iniciais mais altos? 

In [0]:
SELECT 
    e.University_Ranking,
    AVG(c.Starting_Salary) AS Avg_Starting_Salary
FROM 
    education_info e
JOIN 
    career_info c ON e.Student_ID = c.Student_ID
WHERE 
    c.Starting_Salary IS NOT NULL
GROUP BY 
    e.University_Ranking
ORDER BY 
    e.University_Ranking ASC;

University_Ranking,Avg_Starting_Salary
1,52533.333333333336
2,50975.0
3,52580.0
4,49250.0
5,45640.0
6,39800.0
7,54533.333333333336
8,57650.0
9,47175.0
10,44950.0


<img src="Solucao_1.png" width="1000">

### Resolução do problema 1:

Conforme as médias de salários iniciais e o ranking das universidades encontrados nas tabelas, é possível perceber que nem sempre os estudantes de universidades mais bem classificadas ganham salários iniciais mais altos, já que os estudantes com a maior média de salário inicial frequentaram as universidades que se encontram na décima primeira e décima quarta posição no ranking de universidades.

###2. Quais fatores mais contribuem para um crescimento rápido na carreira (Years_to_Promotion)?

In [0]:
SELECT 
    c.Years_to_Promotion,
    AVG(e.University_GPA) AS Avg_Uni_GPA,
    AVG(x.Internships_Completed) AS Avg_Internships,
    AVG(x.Certifications) AS Avg_Certifications,
    AVG(x.Soft_Skills_Score) AS Avg_SoftSkills,
    AVG(x.Networking_Score) AS Avg_Networking
FROM 
    career_info c
JOIN 
    education_info e ON c.Student_ID = e.Student_ID
JOIN 
    experience_info x ON c.Student_ID = x.Student_ID
GROUP BY 
    c.Years_to_Promotion
ORDER BY 
    c.Years_to_Promotion;


Years_to_Promotion,Avg_Uni_GPA,Avg_Internships,Avg_Certifications,Avg_SoftSkills,Avg_Networking
1,3.0226109367406035,1.9638802889576883,2.519091847265222,5.602683178534572,5.556243550051599
2,2.999541552952618,2.0191021967526264,2.498567335243553,5.471824259789876,5.587392550143266
3,3.003382507692021,1.9852476290832453,2.519494204425712,5.60695468914647,5.578503688092729
4,3.060715707111548,1.9542743538767395,2.4642147117296225,5.485089463220676,5.462226640159046
5,3.01401360574802,1.9863945578231288,2.5597667638483963,5.571428571428571,5.50728862973761


<img src="Solucao_2.png" width="1000">


### Resolução do problema 2:

Conforme o agrupamento realizado e as médias calculadas para entender quantos anos cada estudante levou até receber a primeira promoção, e quais fatores foram determinantes para um crescimento rápido, chegamos aos resultados mostrados na tabela acima. Após a análise dos resultados, é possível perceber que os dois fatores determinantes para uma promoção rápida são as soft skills e o networking.

###3. Estudantes de certas áreas têm mais oportunidades de emprego do que outras?

In [0]:
SELECT 
    e.Field_of_Study,
    AVG(c.Job_Offers) AS Avg_Job_Offers
FROM 
    education_info e
JOIN 
    career_info c ON e.Student_ID = c.Student_ID
GROUP BY 
    e.Field_of_Study
ORDER BY 
    Avg_Job_Offers DESC;


Field_of_Study,Avg_Job_Offers
Mathematics,2.5140939597315435
Medicine,2.507982583454281
Arts,2.5033377837116157
Engineering,2.5021398002853066
Computer Science,2.4776119402985075
Law,2.462173314993122
Business,2.4534075104311546


<img src="Solucao_3.png" width="1000">

### Resolução do problema 3:

Em consonância com os agrupamentos e as médias feitas na consulta, foi possível obter os resultados mostrados na tabela acima, com as áreas de estudo e a média de ofertas de emprego recebidas pelos estudantes de suas respectivas formações. É interessante observar que as quatro primeiras áreas apresentam uma média de ofertas de emprego bastante próxima. O destaque negativo vai para a área de Business (Administração/Negócios), que apresenta a menor média.

### 4. O número de estágios concluídos tem impacto no salário inicial?




In [0]:
SELECT 
    x.Internships_Completed,
    COUNT(*) AS Num_Students,
    AVG(c.Starting_Salary) AS Avg_Starting_Salary
FROM 
    experience_info x
JOIN 
    career_info c ON x.Student_ID = c.Student_ID
GROUP BY 
    x.Internships_Completed
ORDER BY 
    x.Internships_Completed;


Internships_Completed,Num_Students,Avg_Starting_Salary
0,16000,50417.9
1,16608,50442.87090558767
2,15632,50229.47799385875
3,16336,50334.57394711068
4,15424,51425.622406639006


<img src="Solucao_4.png" width="1000">

### Resolução do problema 4:
Em consonância com a contagem, o agrupamento e a média calculados, foi possível obter o resultado mostrado na tabela acima para a análise do impacto do número de estágios concluídos no salário inicial dos estudantes. Observa-se que o número de estágios tem um impacto muito pequeno. Levando em consideração os resultados obtidos para estudantes que não realizaram nenhum estágio e para aqueles que fizeram até quatro estágios, a diferença é de apenas mil dólares anuais.


### 5. Estudantes com pontuação alta em networking recebem mais ofertas de emprego?

In [0]:
SELECT 
    x.Networking_Score,
    AVG(c.Job_Offers) AS Avg_Job_Offers
FROM 
    experience_info x
JOIN 
    career_info c ON x.Student_ID = c.Student_ID
GROUP BY 
    x.Networking_Score
ORDER BY 
    x.Networking_Score DESC;


Networking_Score,Avg_Job_Offers
10,2.441955193482688
9,2.4694280078895465
8,2.5282651072124755
7,2.410204081632653
6,2.481617647058824
5,2.416829745596869
4,2.572895277207392
3,2.527083333333333
2,2.4428857715430863
1,2.6046025104602517


<img src="Solucao_5.png" width="1000">

### Resolução do problema 5:

Conforme o resultado obtido na consulta com base no Networking Score e na média de ofertas de emprego, é possível observar que ter uma alta pontuação em networking profissional não necessariamente resulta em um maior número de ofertas. Isso porque os estudantes com a maior média de ofertas de emprego possuem uma pontuação de networking igual a 1 (a mais baixa possível).



## Discussão geral sobre a resolução de cada problema: 

De modo geral, mesmo considerando a escassez de dados, os resultados obtidos indicam que o sucesso profissional não depende de um único fator isolado, mas sim de um conjunto complexo de variáveis que interagem de forma não linear. Por outro lado, habilidades interpessoais e fatores comportamentais (soft skills, networking) se destacaram como diferenciais importantes, reforçando a necessidade de uma formação mais ampla e integrada, tanto no aspecto técnico quanto humano. Isso reforça a importância de uma formação mais ampla e integrada, que combine excelência técnica com o desenvolvimento de competências humanas, um equilíbrio cada vez mais essencial no mercado atual.

# Autoavaliação

O principal objetivo desta análise foi alcançado e tinha como base explorar a relação entre o desempenho acadêmico e o sucesso profissional de estudantes residentes nos Estados Unidos (EUA). Os principais desafios encontrados foram a escassez de dados e a interpretação de variáveis subjetivas. Métricas como soft skills e networking score envolvem certo grau de subjetividade, o que exige atenção redobrada na análise e interpretação. Ainda assim, a partir da construção de um banco de dados estruturado em três tabelas relacionais (education_info, experience_info, career_info) e da realização de consultas SQL analíticas, foi possível atingir com sucesso o objetivo definido inicialmente. As consultas permitiram identificar padrões relevantes, como a relação entre o GPA universitário e o tempo até a primeira promoção, o impacto limitado dos estágios sobre o salário inicial e a inesperada ausência de correlação direta entre a pontuação de networking e o número de ofertas de emprego.

Nesta etapa da análise, foi utilizada exclusivamente a linguagem SQL. Para enriquecer e tornar o trabalho mais robusto futuramente, propõem-se as seguintes extensões:

- Trabalhar com dados do Brasil (ou incluir uma seção comparativa) mostrando senso de realidade e aplicabilidade.

- Replicar a análise com dados brasileiros, como os disponibilizados pelo INEP, IBGE, CAGED ou plataformas de mercado de trabalho, contextualizando os resultados à realidade nacional;

- Utilizar linguagens como Python para aplicar técnicas de machine learning, desenvolvendo modelos preditivos para estimar o salário inicial ou o tempo até a promoção com base em múltiplos atributos;

- Criar dashboards interativos com ferramentas como Power BI, Tableau ou Streamlit, permitindo explorar os dados de forma visual e dinâmica;

- Propor um sistema de recomendação educacional, baseado em modelos que sugiram ações práticas para estudantes maximizarem seu sucesso profissional, com base nos padrões identificados nos dados.









