## Ejercicio 5

El archivo **semillas.csv** contiene información de granos que pertenecen a tres variedades diferentes de trigo: Kama, Rosa y Canadiense. El total es de 210 ejemplos a razón de 70 ejemplos para cada tipo de grano, seleccionados al azar para el experimento. La información registrada corresponde al resultado de la visualización de alta calidad de la estructura interna del núcleo efectuada utilizando una técnica de rayos X blandos. Este tipo de estudio no es destructivo y es considerablemente más económico que otras técnicas de imagen más sofisticadas como la microscopía de barrido o la tecnología láser. Las imágenes se grabaron en placas KODAK de rayos x de 13x18 cm. Los estudios se realizaron utilizando granos de trigo cosechados combinados procedentes de campos experimentales, explorados en el Instituto de Agrofísica de la Academia Polaca de Ciencias en Lublin. Para construir los datos, se midieron siete parámetros geométricos de cada grano de trigo:

- área A
- perímetro P
- compacidad C = 4 * pi * A / P ^ 2
- longitud del núcleo
- ancho del núcleo
- coeficiente de asimetría
- longitud del surco del núcleo

A partir de los 210 ejemplos, luego de normalizarlos utilizando los valores de media y desvío, se logró entrenar un perceptrón capaz de identificar, con una precisión del 100%, uno de los tres tipos de semillas. Para realizar el entrenamiento se utilizó una velocidad de aprendizaje de 0.05 y un máximo de 200 iteraciones. Indique cuál es el tipo de semilla que puede ser reconocido correctamente por un perceptrón.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from Fuentes.ClassPerceptron import Perceptron

DATOS_DIR   = '../../Datos/p2/'
data = pd.read_csv(DATOS_DIR + 'semillas.csv')

ALPHA = 0.05
MAX_ITERATIONS = 200

X = data.drop(columns=["Clase"])
y = data["Clase"]   
X_norm = (X - X.mean()) / X.std()
data = pd.concat([X_norm, y], axis=1)

data["Clase_Tipo1"] = (data["Clase"] == "Tipo1").astype(int)
data["Clase_Tipo2"] = (data["Clase"] == "Tipo2").astype(int)
data["Clase_Tipo3"] = (data["Clase"] == "Tipo3").astype(int)

ppn = Perceptron(alpha=ALPHA, n_iter=MAX_ITERATIONS, random_state=1)
ppn.fit(data[["Area", "Perimetro", "Compacidad", "LongNucleo", "AnchoNucleo", "Asimetria", "LongSurco"]].values, data["Clase_Tipo1"].values)
Y = ppn.predict(data[["Area", "Perimetro", "Compacidad", "LongNucleo", "AnchoNucleo", "Asimetria", "LongSurco"]].values)
print(sum(Y == data["Clase_Tipo1"].values))

ppn = Perceptron(alpha=ALPHA, n_iter=MAX_ITERATIONS, random_state=1)
ppn.fit(data[["Area", "Perimetro", "Compacidad", "LongNucleo", "AnchoNucleo", "Asimetria", "LongSurco"]].values, data["Clase_Tipo2"].values)
Y = ppn.predict(data[["Area", "Perimetro", "Compacidad", "LongNucleo", "AnchoNucleo", "Asimetria", "LongSurco"]].values)
print(sum(Y == data["Clase_Tipo2"].values))

ppn = Perceptron(alpha=ALPHA, n_iter=MAX_ITERATIONS, random_state=1)
ppn.fit(data[["Area", "Perimetro", "Compacidad", "LongNucleo", "AnchoNucleo", "Asimetria", "LongSurco"]].values, data["Clase_Tipo3"].values)
Y = ppn.predict(data[["Area", "Perimetro", "Compacidad", "LongNucleo", "AnchoNucleo", "Asimetria", "LongSurco"]].values)
print(sum(Y == data["Clase_Tipo3"].values))


195
210
201


> **Conclusión:** La clase 2 puede ser perfectamente reconocida por un perceptrón luego de una normalización z-score.