# Importar las bibliotecas requeridas
Importar las bibliotecas necesarias, incluyendo seaborn, pandas, numpy, sklearn y matplotlib.

In [None]:
# Importar las bibliotecas requeridas
import seaborn as sns
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import classification_report, confusion_matrix
import matplotlib.pyplot as plt

# Carga y limpieza de datos
Cargar los datos de los componentes de red y realizar la limpieza inicial de los datos.

In [None]:
# Cargar los datos
data = pd.read_csv('network_components.csv')

# Verificar los primeros datos
print(data.head())

# Verificar si hay valores nulos
print(data.isnull().sum())

# Limpieza de datos: eliminar las filas con valores nulos
data = data.dropna()

# Verificar los datos después de la limpieza
print(data.head())

# Análisis exploratorio de datos
Realizar un análisis exploratorio de los datos para entender las características y relaciones de los componentes de red.

In [None]:
# Análisis exploratorio de datos
# Descripción general de los datos
print(data.describe())

# Visualización de la distribución de los datos
sns.pairplot(data)

# Correlación entre las características
corr = data.corr()
sns.heatmap(corr, annot=True)

# Visualización de la relación entre el costo y la velocidad de la red
sns.scatterplot(x='cost', y='network_speed', data=data)

# Visualización de la relación entre el año y la velocidad de la red
sns.scatterplot(x='year', y='network_speed', data=data)

# Visualización de la relación entre la estructura de la red y la velocidad de la red
sns.scatterplot(x='network_structure', y='network_speed', data=data)

# Visualización de la relación entre el número de puertos y la velocidad de la red
sns.scatterplot(x='number_of_ports', y='network_speed', data=data)

# Preprocesamiento de datos
Preparar los datos para el entrenamiento del modelo, incluyendo la codificación de variables categóricas y la normalización de variables numéricas.

In [None]:
# Preprocesamiento de datos

# Codificación de variables categóricas
data = pd.get_dummies(data, columns=['network_structure'], drop_first=True)

# Normalización de variables numéricas
scaler = StandardScaler()
data[['cost', 'network_speed', 'year', 'number_of_ports']] = scaler.fit_transform(data[['cost', 'network_speed', 'year', 'number_of_ports']])

# Verificar los datos después del preprocesamiento
print(data.head())

# Entrenamiento del modelo de recomendación
Entrenar un modelo de recomendación utilizando un algoritmo de aprendizaje automático.

In [None]:
# Dividir los datos en conjuntos de entrenamiento y prueba
X = data.drop('network_speed', axis=1)
y = data['network_speed']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Entrenar el modelo de recomendación
model = KNeighborsClassifier(n_neighbors=5)
model.fit(X_train, y_train)

# Evaluar el modelo
y_pred = model.predict(X_test)
print(confusion_matrix(y_test, y_pred))
print(classification_report(y_test, y_pred))

# Visualizar la matriz de confusión
cm = confusion_matrix(y_test, y_pred)
sns.heatmap(cm, annot=True, fmt='d')

# Visualizar la importancia de las características
importance = model.feature_importances_
plt.bar([x for x in range(len(importance))], importance)
plt.show()

# Evaluación del modelo
Evaluar el rendimiento del modelo de recomendación utilizando métricas apropiadas.

In [None]:
# Evaluación del modelo
# Calcular la precisión del modelo
accuracy = model.score(X_test, y_test)
print(f'Accuracy: {accuracy * 100}%')

# Generar la matriz de confusión
cm = confusion_matrix(y_test, y_pred)
sns.heatmap(cm, annot=True, fmt='d')
plt.title('Matriz de confusión')
plt.xlabel('Clase predicha')
plt.ylabel('Clase verdadera')
plt.show()

# Generar el informe de clasificación
report = classification_report(y_test, y_pred)
print('Informe de clasificación:')
print(report)

# Visualizar la importancia de las características
importance = model.feature_importances_
plt.bar(X.columns, importance)
plt.title('Importancia de las características')
plt.xlabel('Características')
plt.ylabel('Importancia')
plt.xticks(rotation=90)
plt.show()

# Recomendación de componentes de red
Utilizar el modelo entrenado para recomendar componentes de red basados en ciertos patrones, como el costo, la velocidad de red, el año, la estructura de la red y el número de puertos.

In [None]:
# Recomendación de componentes de red
# Definir los patrones para la recomendación
patterns = {
    'cost': 0.5,  # Costo
    'year': 2020,  # Año
    'network_structure': 'Ethernet',  # Estructura de la red
    'number_of_ports': 24  # Número de puertos
}

# Codificar y normalizar los patrones
patterns_encoded = pd.get_dummies(pd.DataFrame([patterns]), columns=['network_structure'], drop_first=True)
patterns_encoded[['cost', 'year', 'number_of_ports']] = scaler.transform(patterns_encoded[['cost', 'year', 'number_of_ports']])

# Realizar la recomendación
recommendation = model.predict(patterns_encoded)
print(f'Recommended network speed: {recommendation[0]}')