# Neurona Lineal - Autos - Predicción
---
**Montar la carpeta de Google Drive y definir constantes para trabajar**

In [1]:
ColabNotebook = 'google.colab' in str(get_ipython())

if ColabNotebook:
    # monta G-drive en entorno COLAB
    from google.colab import drive
    drive.mount('/content/drive/')

    # carpeta donde se encuentran archivos .py auxiliares
    FUENTES_DIR = '/content/drive/MyDrive/Colab Notebooks/FUENTES/'
    DATOS_DIR = '/content/drive/MyDrive/Colab Notebooks/DATOS/'      # carpeta donde se encuentran los datasets
else:
    # configuración para notebook con instalación LOCAL
    FUENTES_DIR = '../Fuentes'         # carpeta donde se encuentran archivos .py auxiliares
    DATOS_DIR   = '../../Datos/' # carpeta donde se encuentran los datasets

# agrega ruta de busqueda donde tenemos archivos .py
import sys
sys.path.append(FUENTES_DIR)

**Carga del Dataset y selección de atributos numéricos**

In [2]:
import os
import pandas as pd
import numpy as np
import chardet
from matplotlib import pyplot as plt
from sklearn.preprocessing import MinMaxScaler, StandardScaler
from ClassNeuronaLineal import NeuronaLineal

nombre_archivo = DATOS_DIR + 'automobile-simple.csv'

#-- detectando la codificación de caracteres usada ----
with open(nombre_archivo, 'rb') as f:
    result = chardet.detect(f.read())

df= pd.read_csv(nombre_archivo, encoding=result['encoding'])

print(result['encoding'])
df

FileNotFoundError: [Errno 2] No such file or directory: '../Datos/automobile-simple.csv'

**Asignar atributos sin valor o con valor nulo**

In [None]:
# muestra cantidad de valores faltantes o nulos por atributo/característica
print('Antes:\n',df.isnull().sum(), '\n')

values = {'price': df['price'].mean()}

# reemplaza valores nulos por los indicados en el diccionario values
df = df.fillna(value=values)

# comprobacion
print('Despues:\n', df.isnull().sum())

**Normalización de valores de atributo y valor a predecir**

In [None]:
# Imprime matriz de correclacion
corr = df[['engine-size', 'price']].corr()
print(corr)

# seleccion de atributos
X = np.array(df['engine-size']).reshape((-1,1))
T = np.array(df['price']).reshape((-1,1))

# normalizacion de datos de entrada
normalizarEntrada = 2

if normalizarEntrada==0:
    data_scaler = None
elif normalizarEntrada==1:
    data_scaler , targer_scaler= MinMaxScaler(), MinMaxScaler()
    X = data_scaler.fit_transform(X)
    T = targer_scaler.fit_transform(T)
elif normalizarEntrada==2:
    data_scaler, targer_scaler = StandardScaler(), StandardScaler()
    X = data_scaler.fit_transform(X)
    T = targer_scaler.fit_transform(T)

**Construccion del modelo y entrenamiento**

In [None]:
# entrena neurona lineal y grafica
modelo = NeuronaLineal(alpha=0.02, n_iter=500, cotaE=0.0001, draw=1, title=['Tamaño motor', 'Precio'])
modelo.fit(X, T)

# imprime errores de cada iteracion:
print('Errores:')
for i, err in enumerate(modelo.errors_):
    print('%3d => %f' % (i, err[0]))


**Prediccion de valores**

In [None]:
# invierte normalización para predecir
tamaño_motor = 130

entrada = np.array([tamaño_motor]).reshape((-1,1))

if data_scaler:
  entrada = data_scaler.transform(entrada)

prediccion = modelo.predict( entrada )

if targer_scaler:
  prediccion = targer_scaler.inverse_transform([prediccion])

# para la siguiente prueba tamaño_motor debe coincidir con valores de engin-size en el data_frame

autos_sel = df['engine-size']==tamaño_motor
valor_prom = df[autos_sel]['price'].mean()
valor_min = df[autos_sel]['price'].min()
valor_max = df[autos_sel]['price'].max()

print('Tamaño Motor:%.0f' % tamaño_motor)

print('Prediccion Precio: %.2f'% prediccion)

print('  Precio Promedio: %.2f'% valor_prom)
print('    Precio Mínimo: %.2f'% valor_min)
print('    Precio Máximo: %.2f'% valor_max)

df[autos_sel]