In [None]:
import numpy as np
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score, recall_score, precision_score, f1_score, confusion_matrix

# Carregar conjunto de dados de dígitos (exemplo)
digits = load_digits()

# Dividir dados em recursos (X) e rótulos (y)
X = digits.data
y = digits.target

# Dividir os dados em conjuntos de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Pré-processamento dos dados (normalização)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Treinar modelo (SVM como exemplo)
model = SVC(kernel='linear', random_state=42)
model.fit(X_train_scaled, y_train)

# Prever os rótulos para os dados de teste
y_pred = model.predict(X_test_scaled)

# Calcular métricas de avaliação
accuracy = accuracy_score(y_test, y_pred)
recall = recall_score(y_test, y_pred, average='weighted')
precision = precision_score(y_test, y_pred, average='weighted')
f1 = f1_score(y_test, y_pred, average='weighted')
conf_matrix = confusion_matrix(y_test, y_pred)

# Calcular sensibilidade e especificidade a partir da matriz de confusão
VP = np.diag(conf_matrix)
FP = np.sum(conf_matrix, axis=0) - VP
FN = np.sum(conf_matrix, axis=1) - VP
VN = np.sum(conf_matrix) - (VP + FP + FN)
sensitivity = VP / (VP + FN)
specificity = VN / (VN + FP)

# Imprimir métricas de avaliação
print("Acurácia:", accuracy)
print("Sensibilidade:", np.mean(sensitivity))
print("Especificidade:", np.mean(specificity))
print("Precisão:", precision)
print("F-score:", f1)


In [None]:
Neste exemplo:

Usamos o conjunto de dados de dígitos do scikit-learn como exemplo.
Dividimos os dados em conjuntos de treinamento e teste.
Normalizamos os dados para garantir que todas as características tenham a mesma escala.
Treinamos um modelo de SVM (Support Vector Machine) usando os dados de treinamento normalizados.
Avaliamos o modelo usando os dados de teste e calculamos as métricas de avaliação (acurácia, sensibilidade, especificidade, precisão e F-score).
Também calculamos a sensibilidade e especificidade usando a matriz de confusão.
Este exemplo demonstra um fluxo típico de trabalho para construir e avaliar um modelo de classificação em Python, incluindo o cálculo das principais métricas de avaliação. Certifique-se de adaptar o código para o seu conjunto de dados específico e para o tipo de modelo que está construindo.