<a href="https://colab.research.google.com/github/galenzo17/AI-personal-test/blob/main/one_agent.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Instalación de las dependencias necesarias
!pip install kaggle
!pip install pandas
!pip install numpy
!pip install scikit-learn
!pip install matplotlib
!pip install seaborn


In [None]:
# Importación de las librerías
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import os

from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder, StandardScaler
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score
from sklearn.ensemble import RandomForestClassifier


In [None]:
# Configuración de la API de Kaggle
# Sube tu archivo kaggle.json para acceder a la API de Kaggle
from google.colab import files
files.upload()


In [None]:
# Crear la carpeta .kaggle y mover el archivo kaggle.json
!mkdir -p ~/.kaggle
!cp kaggle.json ~/.kaggle/
!chmod 600 ~/.kaggle/kaggle.json


In [None]:
# Descargar el conjunto de datos de riesgo crediticio desde Kaggle
!kaggle datasets download -d laotse/credit-risk-dataset


In [None]:
# Descomprimir el conjunto de datos
!unzip credit-risk-dataset.zip


In [None]:
# Cargar el conjunto de datos
data = pd.read_csv('credit_risk_dataset.csv')


In [None]:
# Exploración inicial de los datos
print("Dimensiones del conjunto de datos:", data.shape)
print("\nPrimeras 5 filas:")
print(data.head())
print("\nDescripción estadística:")
print(data.describe())
print("\nInformación del conjunto de datos:")
print(data.info())


In [None]:
# Comprobar valores nulos
print("Cantidad de valores nulos por columna:")
print(data.isnull().sum())


In [None]:
# Eliminación o imputación de valores nulos si es necesario
# En este caso, eliminaremos filas con valores nulos
data = data.dropna()


In [None]:
# Codificación de variables categóricas
le = LabelEncoder()
data['person_home_ownership'] = le.fit_transform(data['person_home_ownership'])
data['loan_intent'] = le.fit_transform(data['loan_intent'])
data['loan_grade'] = le.fit_transform(data['loan_grade'])
data['cb_person_default_on_file'] = le.fit_transform(data['cb_person_default_on_file'])


In [None]:
# Separación de variables independientes y dependientes
X = data.drop('loan_status', axis=1)
y = data['loan_status']


In [None]:
# División del conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


In [None]:
# Escalado de características
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)


In [None]:
# Definición del agente (modelo de inteligencia artificial)
class CreditRiskAgent:
    def __init__(self):
        self.model = RandomForestClassifier(n_estimators=100, random_state=42)

    def train(self, X, y):
        self.model.fit(X, y)

    def predict(self, X):
        return self.model.predict(X)

    def evaluate(self, X, y):
        predictions = self.predict(X)
        print("Matriz de confusión:")
        print(confusion_matrix(y, predictions))
        print("\nInforme de clasificación:")
        print(classification_report(y, predictions))
        print("Exactitud:", accuracy_score(y, predictions))


In [None]:
# Crear una instancia del agente y entrenar el modelo
agent = CreditRiskAgent()
agent.train(X_train, y_train)


In [None]:
# Evaluar el modelo en el conjunto de prueba
agent.evaluate(X_test, y_test)


In [None]:
# Visualización de la importancia de las características
importances = agent.model.feature_importances_
features = data.drop('loan_status', axis=1).columns
indices = np.argsort(importances)

plt.figure(figsize=(10, 8))
plt.title('Importancia de las características')
plt.barh(range(len(indices)), importances[indices], color='b', align='center')
plt.yticks(range(len(indices)), [features[i] for i in indices])
plt.xlabel('Importancia relativa')
plt.show()
