# Ciencia de Datos en Python
## Hoja de Trabajo No.3: Diccionarios, Sets y Programacion Orientada a Objetos
## Presentada por: Margerys Salgado

## Programacion Orientada a Objetos

### Determinacion del Modelo de Regresion Lineal Simple

#### Carga de los Datos

In [874]:
import csv

with open("data_ht3.csv", "r", newline='') as ht3: 
    next(ht3)
    Y, X = zip(*((float(n) for n in line.rstrip().rsplit(",", maxsplit=2)[-2:])
                    for line in ht3))

#print(X)
#print(Y)

In [875]:
len(X)
len(Y)

200

In [876]:
type(X)
type(Y)

tuple

#### Método Mínimo Cuadrados Ordinarios (MCO)

* MCO asegura que se minimicen la suma de errores al cuadrado, entendiéndose que el término del error no es más que la diferencia entre los valores reales y el estimado; es por esto que se denomina mínimos cuadrados ordinarios. 

* El MCO producirá una recta que se extiende por el centro del diagrama de dispersión aproximándose a todos los puntos de datos más que cualquier otra recta, tal que la suma de los errores al cuadrado es menor de lo que sería con cualquier otra recta.

* Es importante mencionar que la recta MCO se basa en las desviaciones de las observaciones a partir de su media.

##### Variables (Lista de Valores)

In [579]:
print(X)

In [580]:
print(Y)

In [877]:
X = np.array(X)
Y = np.array(Y)

##### Para determinar la recta que mejor se ajuste, MCO requiere de ciertos productos

###### Calculo de las Medias

In [504]:
med_x = mean(X)
med_x

147.0425

In [507]:
med_y = mean(Y)
med_y

14.022500000000003

##### Calculo de la Varianza

In [583]:
var_x = sum((X - mean(X))**2)
var_x

1466819.0287500012

In [584]:
var_y = sum((Y - mean(Y))**2)
var_y

5417.148749999998

##### Suma de los Cuadrados

In [509]:
SCx = (sum(X*X))-(((sum(X))**2)/len(X))
SCx

1466819.0287500015

In [490]:
SCy = (sum(Y*Y))-(((sum(Y))**2)/len(Y))
SCy

5417.148749999993

##### Suma de los Productos Cruzados de X,Y

In [491]:
SCxy = (sum(X*Y)) - (((sum(X))*(sum(Y)))/len(X)) 
SCxy

69727.64874999993

##### Parámetros de Regresión

Pendiente de la Recta de Regresion

In [722]:
b1 = SCxy/SCx
b1

0.04753664043301965

Intercepto de la recta de regresion

In [723]:
b0 = med_y - (b1*med_x)
b0

7.032593549127711

##### Modelo de Regresión Estimado

In [881]:
Y_hat = b0 + b1*X

##### Suma de Cuadrados Totales

In [547]:
SCT = sum((Y-(med_y))**2)
SCT

5417.148749999998

##### Suma de Cuadrados de la Regresión

In [548]:
SCR = sum(((Y_hat)-(med_y))**2)
SCR

3314.6181668686354

##### Suma de Cuadrados del Error

In [552]:
SCE = sum((Y-(Y_hat))**2)
SCE

2102.5305831313512

##### Coeficiente de Correlación

In [1078]:
rt = SCxy/((SCx*SCy)**(1/2))
rt

0.7822244248616058

##### Coeficiente de Determinación

In [799]:
r2 = ((SCxy)**2)/(SCx*SCy)
r2

0.61187505085007

### Constructor

In [1077]:
#Clase
class My_regresion:
    
    #Metodo Constructor Principal()
    def __init__(self, x, y):
        #Atributos (variables)
        self.med_x = (sum(X)/len(X))
        self.med_y = (sum(Y)/len(Y))
        self.var_x = sum((X - (sum(X)/len(X)))**2)
        self.var_y = sum((Y - (sum(Y)/len(Y)))**2)
        self.SCx = (sum(X*X))-(((sum(X))**2)/len(X))
        self.SCxy = (sum(X*Y)) - (((sum(X))*(sum(Y)))/len(X))
        self.r2 = ((SCxy)**2)/(SCx*SCy)
        self.r = SCxy/((SCx*SCy)**(1/2))
        self.SCE = sum((Y-(Y_hat))**2)
        self.beta0 = (((len(X))*(sum(X*Y)))-((sum(X))*(sum(Y))))/(((len(X))*(sum(X**2)))-((sum(X))**2))
        self.beta1 = (((sum(X**2))*(sum(Y)))-((sum(X))*(sum(X*Y))))/(((len(X))*(sum(X**2)))-((sum(X))**2))
        self.x = np.array(X)
        self.y = np.array(Y)
        self.Y_hat = (med_y - (b1*med_x))+(SCxy/SCx)*X

    #Metodo Predict()
    def predict(self):
        return 'Modelo Estimado Y_hat: b0:{0} + b1:{1}*Xi,'.format(self.beta0, self.beta0)
    
    #Metodo PredictN()
    def predictN(self):
        return (f'Serie Modelo Estimado({self.Y_hat})')
    
    #Metodo r2()
    def r2(self):
        #Atributos
        self.SCxy = (sum(X*Y)) - (((sum(X))*(sum(Y)))/len(X))
        self.SCy = (sum(Y*Y))-(((sum(Y))**2)/len(Y))
        self.r2 = ((SCxy)**2)/(SCx*SCy)
    
    #Metodo r()
    def r(self):
        #Atributo
        self.r = SCxy/((SCx*SCy)**(1/2))
        
    #Metodo getAllRegParams()
    def getAllRegParams(self):
        return 'Estadisticos Estimados: b0:{0}, b1:{1}, r2:{2}, r:{1},'.format(self.beta0, self.beta1, self.r2, self.r)
    
    #Metodo Decorador
    @classmethod
    def from_file(cls):
        return cls(['Dep.Var'], ['Ind.Var']. format(self.x, self.y))


#Crear un Objeto relacionado con la Clase
#objeto. nombre de la clase. nombre del atributo

modelo = My_regresion(X, Y)
#print los return
print(modelo.predict())
print(modelo.getAllRegParams())
print(modelo.predictN())


Modelo Estimado Y_hat: b0:0.04753664043301965 + b1:0.04753664043301965*Xi,
Estadisticos Estimados: b0:0.04753664043301965, b1:7.0325935491277205, r2:0.61187505085007, r:7.0325935491277205,
Serie Modelo Estimado([17.97077451  9.14797405  7.85022376 14.23439457 15.62721814  7.44616232
  9.76595037 12.74649773  7.44140866 16.53041431 10.17476548 17.23871025
  8.16396559 11.66741599 16.73482186 16.32125309 10.25557777 20.40940417
 10.32212907 14.03474068 17.41459582 18.31779199  7.6600772  17.88520856
  9.99412625 19.52997632 13.82557947 18.44614092 18.85970969 10.38868036
 20.95607553 12.39948025 11.653155   19.65832525 11.58185004 20.85149492
 19.72012288 10.58358059  9.08142275 17.87094757 16.65876324 15.44657891
 20.98935118 16.86792445  8.22576322 15.35625929 11.2966302  18.43663359
 17.83291826 10.21279479 16.53041431 11.80527225 17.31952254 15.71278409
 19.52046899 16.48763133  7.37961102 13.50708398 17.05331735 17.04856369
  9.57580381 19.45391769 18.4081116  11.91460652 13.2646471