# üìä An√°lise Salarial 2023 ‚Äì Profissionais Tech
**Autor:** Gabriel dos Santos Ferreira  
**LinkedIn:** [Gabriel Ferreira](https://www.linkedin.com/in/gabriel-ferreira-384648181)

Este notebook realiza uma an√°lise explorat√≥ria (EDA) com base em dados reais sobre cargos e sal√°rios no setor de tecnologia.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

plt.style.use('ggplot')
sns.set_theme()

# Carregar o dataset (ajustar caminho se necess√°rio)
df = pd.read_csv('salaries.csv')

## üîç Diagn√≥stico Inicial dos Dados

In [None]:
df.info()
df.describe()
df.isnull().sum()

## üåê Cria√ß√£o de Vers√£o Bil√≠ngue dos Dados

In [None]:
colunas_traducao = {
    'work_year': 'ano_base',
    'experience_level': 'nivel_experiencia',
    'employment_type': 'tipo_contratacao',
    'job_title': 'cargo',
    'salary': 'salario_bruto',
    'salary_currency': 'moeda_salario',
    'salary_in_usd': 'salario_usd',
    'employee_residence': 'residencia_funcionario',
    'remote_ratio': 'percentual_remoto',
    'company_location': 'local_empresa',
    'company_size': 'porte_empresa'
}

df_pt = df.copy()
df_pt.rename(columns=colunas_traducao, inplace=True)
df_pt['nivel_experiencia'] = df_pt['nivel_experiencia'].map({'EN': 'J√∫nior', 'SE': 'S√™nior', 'MI': 'Pleno', 'EX': 'Executivo'})
df_pt['tipo_contratacao'] = df_pt['tipo_contratacao'].map({'FT': 'Integral', 'PT': 'Meio per√≠odo', 'CT': 'Contrato', 'FL': 'Freelancer'})
df_pt['porte_empresa'] = df_pt['porte_empresa'].map({'S': 'Pequena', 'M': 'M√©dia', 'L': 'Grande'})

## üìä Visualiza√ß√µes Iniciais (EDA)

In [None]:
plt.figure(figsize=(10,5))
sns.histplot(df['salary_in_usd'], bins=40, kde=True)
plt.title("Distribui√ß√£o Salarial (USD)")
plt.xlabel("Sal√°rio em USD")
plt.ylabel("Frequ√™ncia")
plt.tight_layout()
plt.show()

In [None]:
plt.figure(figsize=(8,5))
sns.boxplot(data=df, x='experience_level', y='salary_in_usd', order=['EN','MI','SE','EX'])
plt.title("Sal√°rio por N√≠vel de Experi√™ncia")
plt.xlabel("N√≠vel de Experi√™ncia")
plt.ylabel("Sal√°rio em USD")
plt.tight_layout()
plt.show()

## üìå Conclus√µes e Relev√¢ncia Profissional
**1.** A distribui√ß√£o de sal√°rios apresenta forte assimetria, com mediana mais confi√°vel que a m√©dia.  
**2.** A progress√£o por experi√™ncia √© clara: J√∫nior ‚Üí Pleno ‚Üí S√™nior ‚Üí Executivo.  

---
### ‚úÖ Habilidades demonstradas neste projeto:
- Limpeza e transforma√ß√£o de dados
- Visualiza√ß√£o com matplotlib e seaborn
- Cria√ß√£o de vers√£o bil√≠ngue (PT/EN)
- Storytelling com dados e insights t√©cnicos

---
### üöÄ Pr√≥ximos passos sugeridos:
- Desenvolver um dashboard no Power BI usando esse mesmo dataset
- Fazer an√°lise por pa√≠s, por porte da empresa e por tipo de contrata√ß√£o
- Publicar no GitHub com README estruturado e imagens
- Compartilhar no LinkedIn com post de destaque