<a href="https://colab.research.google.com/github/marcusnmiranda/EAD/blob/main/Vi%C3%A9s_em_um_Modelo_de_Contrata%C3%A7%C3%A3o.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Viés em um Modelo de Contratação

## Passo 1: Preparação dos Dados
Criamos um conjunto de dados fictício onde há um viés de contratação contra candidatos de uma determinada etnia.

In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction import DictVectorizer
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report

# Criação do conjunto de dados fictício com viés
data = {
    'nome': ['João', 'Emily', 'Xiao', 'Priya', 'Ahmed', 'Maria', 'Carlos', 'Liu', 'Sofia', 'Miguel'],
    'etnia': ['branco', 'branco', 'asiático', 'indiano', 'árabe', 'hispânico', 'branco', 'asiático', 'hispânico', 'hispânico'],
    'genero': ['masculino', 'feminino', 'masculino', 'feminino', 'masculino', 'feminino', 'masculino', 'feminino', 'feminino', 'masculino'],
    'experiencia': [5, 7, 3, 8, 4, 6, 2, 7, 5, 4],
    'educacao': ['bacharelado', 'mestrado', 'doutorado', 'mestrado', 'bacharelado', 'bacharelado', 'bacharelado', 'doutorado', 'mestrado', 'bacharelado'],
    'contratado': ['sim', 'sim', 'não', 'sim', 'não', 'sim', 'não', 'não', 'sim', 'não']
}

df = pd.DataFrame(data)


# Passo 2: Preparação e Vetorização dos Dados
Transformamos os dados categóricos em vetores numéricos.

In [2]:
# Separação dos dados em treinamento e teste
X = df.drop('contratado', axis=1)
y = df['contratado']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Vetorização dos dados
vectorizer = DictVectorizer(sparse=False)
X_train_vec = vectorizer.fit_transform(X_train.to_dict(orient='records'))
X_test_vec = vectorizer.transform(X_test.to_dict(orient='records'))


# Passo 3: Treinamento do Modelo
Treinamos um modelo de floresta aleatória (RandomForestClassifier) com os dados de treinamento.

In [3]:
# Treinamento do modelo
model = RandomForestClassifier(random_state=42)
model.fit(X_train_vec, y_train)


# Passo 4: Avaliação do Modelo
Avaliação do modelo utilizando os dados de teste.

In [4]:
# Predição e avaliação do modelo
y_pred = model.predict(X_test_vec)
print(classification_report(y_test, y_pred))


              precision    recall  f1-score   support

         não       0.00      0.00      0.00         0
         sim       1.00      0.67      0.80         3

    accuracy                           0.67         3
   macro avg       0.50      0.33      0.40         3
weighted avg       1.00      0.67      0.80         3



  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))


# Passo 5: Demonstração do Viés
Vamos verificar como o modelo classifica novos candidatos com base nos padrões aprendidos.

In [5]:
# Novos candidatos para testar o viés
test_candidates = [
    {'nome': 'Ana', 'etnia': 'asiático', 'genero': 'feminino', 'experiencia': 5, 'educacao': 'mestrado'},
    {'nome': 'Pedro', 'etnia': 'árabe', 'genero': 'masculino', 'experiencia': 4, 'educacao': 'bacharelado'},
    {'nome': 'Clara', 'etnia': 'branco', 'genero': 'feminino', 'experiencia': 7, 'educacao': 'mestrado'},
    {'nome': 'Hugo', 'etnia': 'hispânico', 'genero': 'masculino', 'experiencia': 6, 'educacao': 'bacharelado'}
]

# Vetorização dos candidatos de teste
test_candidates_vec = vectorizer.transform(test_candidates)

# Predição das candidaturas
test_predictions = model.predict(test_candidates_vec)

# Resultados
for candidate, prediction in zip(test_candidates, test_predictions):
    print(f'Candidato: {candidate} - Predição de contratação: {prediction}')


Candidato: {'nome': 'Ana', 'etnia': 'asiático', 'genero': 'feminino', 'experiencia': 5, 'educacao': 'mestrado'} - Predição de contratação: não
Candidato: {'nome': 'Pedro', 'etnia': 'árabe', 'genero': 'masculino', 'experiencia': 4, 'educacao': 'bacharelado'} - Predição de contratação: não
Candidato: {'nome': 'Clara', 'etnia': 'branco', 'genero': 'feminino', 'experiencia': 7, 'educacao': 'mestrado'} - Predição de contratação: sim
Candidato: {'nome': 'Hugo', 'etnia': 'hispânico', 'genero': 'masculino', 'experiencia': 6, 'educacao': 'bacharelado'} - Predição de contratação: não


# Análise dos Resultados
Este exemplo ilustra como um modelo pode aprender vieses presentes nos dados de treinamento. Por exemplo, se os dados de treinamento têm menos candidatos de determinadas etnias sendo contratados, o modelo pode aprender a associar essas etnias com uma menor probabilidade de contratação, mesmo que isso não reflita a competência real dos candidatos.

# Conclusão
Este exemplo demonstra como um modelo pode ser enviesado se os dados de treinamento contêm preconceitos implícitos. É crucial garantir que os dados sejam representativos e livres de preconceitos para que os modelos de IA possam fazer previsões justas e precisas. Em contextos de gerenciamento de projetos e outras áreas, é importante aplicar técnicas de mitigação de viés e avaliar continuamente os modelos para detectar e corrigir possíveis vieses.