<a href="https://colab.research.google.com/github/MattJCR/Algoritmo-KNN/blob/master/Algoritmo_KNN.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Algoritmo KNN**

El algoritmo KNN es un algoritmo de aprendizaje de máquinas utilizado en minería de datos y análisis de datos. La idea principal detrás de este algoritmo es encontrar el grupo de puntos de datos más cercanos (conocidos como "vecinos") a un nuevo punto de datos, y utilizar ese grupo para predecir la clase del nuevo punto de datos. Esto se logra calculando la distancia entre el nuevo punto de datos y cada uno de los puntos de datos en el conjunto de datos utilizando una medida de distancia como la distancia euclidiana o la distancia de Manhattan. Luego, se seleccionan los k puntos con la menor distancia al nuevo punto de datos, y esos puntos se utilizan para predecir la clase del nuevo punto de datos.

Aquí hay un ejemplo de implementación del algoritmo KNN en Python utilizando el conjunto de datos Iris y un clasificador KNN:

In [4]:
# Import necessary libraries
from sklearn import datasets
from sklearn.neighbors import KNeighborsClassifier

# Load the Iris dataset
iris = datasets.load_iris()

# Create the KNN classifier
# Specify that 3 neighbors should be used and the Euclidean distance should be used
knn = KNeighborsClassifier(n_neighbors=3, metric="euclidean")

# Train the classifier with the data
knn.fit(iris.data, iris.target)

# Make a prediction for a new data point
# In this case, the measurements of an Iris flower with petal and sepal lengths and widths equal to 5 are used
prediction = knn.predict([[5, 5, 5, 5]])

# Print the prediction result
print("Prediction:", prediction)


Prediction: [2]


# **Clasificador de vecinos de radio**

El clasificador de vecinos de radio es una variante del algoritmo KNN que utiliza un radio fijo para determinar los vecinos de un nuevo punto de datos. En lugar de seleccionar los k puntos con la menor distancia al nuevo punto de datos, el clasificador de vecinos de radio selecciona todos los puntos dentro del radio especificado del nuevo punto de datos.

Aquí hay un ejemplo de implementación del clasificador de vecinos de radio en Python utilizando el conjunto de datos Iris:

```
# Tiene formato de código
```



In [16]:
# Import necessary libraries
from sklearn import datasets
from sklearn.neighbors import RadiusNeighborsClassifier

# Load the Iris dataset
iris = datasets.load_iris()

# Create the radius neighbors classifier
# Specify that a radius of 6.0 should be used and the Manhattan distance should be used
rnc = RadiusNeighborsClassifier(radius=6.0, metric="manhattan")

# Train the classifier with the data
rnc.fit(iris.data, iris.target)

# Make a prediction for a new data point
# In this case, the measurements of an Iris flower with petal and sepal lengths and widths equal to 5 are used
prediction = rnc.predict([[5, 5, 5, 5]])

# Print the prediction result
print("Prediction:", prediction)


Prediction: [2]


# **Error cuadrático medio**

El error cuadrático medio (MSE) es una métrica que se utiliza para evaluar el desempeño de un modelo de aprendizaje de máquinas. El MSE se calcula como el promedio de las diferencias cuadradas entre los valores predecidos y los verdaderos valores. En otras palabras, mide la cantidad promedio en la que los valores predecidos se desvían de los valores verdaderos. Un MSE más bajo indica un ajuste mejor del modelo a los datos.

Aquí hay un ejemplo de implementación del MSE en Python utilizando el conjunto de datos Iris y un clasificador de vecinos de radio:

In [9]:
# Import necessary libraries
from sklearn import datasets
from sklearn.neighbors import RadiusNeighborsClassifier
from sklearn.metrics import mean_squared_error

# Load the Iris dataset
iris = datasets.load_iris()

# Create the radius neighbors classifier
# Specify that a radius of 0.5 should be used and the Euclidean distance should be used
rnc = RadiusNeighborsClassifier(radius=5.0, metric="manhattan")

# Split the dataset into a training set and a test set
X_train = iris.data[:100]
y_train = iris.target[:100]
X_test = iris.data[100:]
y_test = iris.target[100:]

# Train the classifier with the training data
rnc.fit(X_train, y_train)

# Make predictions with the test data
predictions = rnc.predict(X_test)

# Calculate the mean squared error
mse = mean_squared_error(y_test, predictions)

# Print the mean squared error
print("Mean Squared Error:", mse)


Mean Squared Error: 1.0


En resumen:
* El algoritmo KNN es un algoritmo de aprendizaje de máquinas que se utiliza para clasificar datos.
* El algoritmo funciona seleccionando los k puntos de datos más cercanos a un nuevo punto de datos y asignando al nuevo punto la etiqueta de la mayoría de los puntos seleccionados.
* La distancia entre puntos de datos se puede calcular utilizando diferentes métricas, como la distancia Euclidiana o la distancia de Manhattan.
* El clasificador de vecinos de radio es una variante del algoritmo KNN que utiliza un radio fijo para determinar los vecinos de un nuevo punto de datos.
* El error cuadrático medio (MSE) es una métrica que se utiliza para evaluar el desempeño de un modelo de aprendizaje de máquinas. Un MSE más bajo indica un ajuste mejor del modelo a los datos.

