# Técnicas de Análise de Dados Quantitativos
Este notebook apresenta exemplos práticos para Estatística Descritiva, Estatística Inferencial, Modelagem e Regressão, e Análise Exploratória de Dados.

## Estatística Descritiva
Analisamos estatísticas básicas de um conjunto de dados.

In [None]:
import pandas as pd
import numpy as np

# Criando um conjunto de dados fictício
data = {'Idade': [23, 45, 31, 35, 40, 29, 33, 50, 41, 37],
        'Salário': [3000, 7000, 5000, 5500, 6000, 4200, 4900, 8000, 6200, 5800]}
df = pd.DataFrame(data)

# Estatísticas básicas
print("Média:
", df.mean())
print("Mediana:
", df.median())
print("Desvio Padrão:
", df.std())
print("Resumo Estatístico:
", df.describe())

## Estatística Inferencial
Aplicamos um Teste t para comparar dois grupos de dados.

In [None]:
from scipy import stats

# Criando dois grupos de dados fictícios
grupo1 = np.random.normal(5000, 800, 30)
grupo2 = np.random.normal(5500, 850, 30)

# Teste t para comparação das médias
t_stat, p_value = stats.ttest_ind(grupo1, grupo2)
print("Estatística do Teste t:", t_stat)
print("Valor p:", p_value)

# Interpretação do resultado
if p_value < 0.05:
    print("Rejeitamos H0: Existe diferença significativa entre os grupos.")
else:
    print("Não rejeitamos H0: Não há evidências de diferença significativa.")

## Modelagem e Regressão
Criamos um modelo de regressão linear entre idade e salário.

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.linear_model import LinearRegression

# Criando variáveis independentes (X) e dependentes (y)
X = df[['Idade']]
y = df['Salário']

# Criando o modelo de regressão linear
model = LinearRegression()
model.fit(X, y)

# Predições
df['Salário_Predito'] = model.predict(X)

# Visualização
sns.scatterplot(x=df['Idade'], y=df['Salário'], label="Salário Real")
sns.lineplot(x=df['Idade'], y=df['Salário_Predito'], color='red', label="Regressão Linear")
plt.xlabel("Idade")
plt.ylabel("Salário")
plt.title("Regressão Linear entre Idade e Salário")
plt.legend()
plt.show()

## Análise Exploratória de Dados (EDA)
Exploramos os dados com histogramas, matriz de correlação e gráficos de dispersão.

In [None]:
# Histogramas
df.hist(figsize=(8, 5), bins=5)
plt.show()

# Matriz de correlação
print("Matriz de Correlação:
", df.corr())

# Gráfico de dispersão
sns.pairplot(df)
plt.show()