# Magic Methods

Below you'll find the same code from the previous exercise except two more methods have been added: an __add__ method and a __repr__ method. Your task is to fill out the code and get all of the unit tests to pass. You'll find the code cell with the unit tests at the bottom of this Jupyter notebook.

As in previous exercises, there is an answer key that you can look at if you get stuck. Click on the "Jupyter" icon at the top of this notebook, and open the folder 4.OOP_code_magic_methods. You'll find the answer.py file inside the folder.

In [2]:
import math
import matplotlib.pyplot as plt

class Gaussian():
    """ Clase de distribución gaussiana para calcular y
     visualización de una distribución gaussiana.
    
     Atributos:
         media (flotante) que representa el valor medio de la distribución
         stdev (flotante) que representa la desviación estándar de la distribución
         data_list (lista de flotantes) una lista de flotantes extraídos del archivo de datos
            
     """
    def __init__(self, mu = 0, sigma = 1):
        
        self.mean = mu
        self.stdev = sigma
        self.data = []


    
    def calculate_mean(self):
    
        """Método para calcular la media del conjunto de datos.
        
         Argumentos:
             Ninguna
        
         Devoluciones:
             float: media del conjunto de datos
    
         """
        
        #TODO: Calcular la media del conjunto de datos. Recuerde que el conjunto de datos se almacena en self.data
        # Cambiar el valor del atributo medio para que sea la media del conjunto de datos
        # Devuelve la media del conjunto de datos          
        avg = 1.0 * sum(self.data) / len(self.data)
        self.mean = avg
        
        return self.mean
                


    def calculate_stdev(self, sample=True):

        """Método para calcular la desviación estándar del conjunto de datos.
        
         Argumentos:
             muestra (bool): si los datos representan una muestra o población
        
         Devoluciones:
             float: desviación estándar del conjunto de datos
    
         """
         # HACER:
         # Calcular la desviación estándar del conjunto de datos
         #
         # La variable muestra determina si el conjunto de datos contiene una muestra o una población
         # Si muestra = Verdadero, esto significa que los datos son una muestra.
         # Tenga en cuenta el valor de la muestra para calcular la desviación estándar
        if sample:
            n = len(self.data) - 1
        else:
            n = len(self.data)
        mean = self.mean
        sigma = 0
        for d in self.data:
            sigma += (d - mean) ** 2
        sigma = math.sqrt(sigma / n)
        
        # Asegúrese de actualizar self.stdev y devolver la desviación estándar también   
        self.stdev = sigma
        
        return self.stdev
        

    def read_data_file(self, file_name, sample=True):
    
        """Método para leer datos de un archivo txt. El archivo txt debería tener
         un número (flotante) por línea. Los números se almacenan en el atributo de datos.
         Después de leer el archivo, se calculan la media y la desviación estándar
                
         Argumentos:
             file_name (cadena): nombre de un archivo para leer
        
         Devoluciones:
             Ninguna
        
         """
        
        # Este código abre un archivo de datos y agrega los datos a una lista llamada data_list
        with open(file_name) as file:
            data_list = []
            line = file.readline()
            while line:
                data_list.append(int(line))
                line = file.readline()
        file.close()
    
        # HACER:
        # Actualice el atributo self.data con data_list
        # Actualice self.mean con la media de data_list.
        # Puede usar el método de cálculo de la media () con self.calculate_mean ()
        # Actualice self.stdev con la desviación estándar de data_list. Utilizar el
        # método calcaulte_stdev().
        self.data = data_list
        self.mean = self.calculate_mean()
        self.stdev = self.calculate_stdev(sample)
        
    def plot_histogram(self):
        """Método para generar un histograma de los datos de la variable de instancia utilizando
         librería de pyplot matplotlib.
        
         Argumentos:
             Ninguna
            
         Devoluciones:
             Ninguna
         """
        
        # TODO: Trace un histograma de data_list usando el paquete matplotlib.
        # Asegúrese de etiquetar los ejes x e y y también asigne un título al gráfico
        plt.hist(self.data)
        plt.title('Histogram of Data')
        plt.xlabel('data')
        plt.ylabel('count')
        
                
        
    def pdf(self, x):
        """Calculadora de función de densidad de probabilidad para la distribución gaussiana.
        
         Argumentos:
             x (flotante): punto para calcular la función de densidad de probabilidad
            
        
         Devoluciones:
             float: salida de la función de densidad de probabilidad
         """
        
         # TODO: Calcular la función de densidad de probabilidad de la distribución Gaussiana
         # en el valor x. Deberá usar self.stdev y self.mean para hacer el cálculo
        return (1.0 / (self.stdev * math.sqrt(2*math.pi))) * math.exp(-0.5*((x - self.mean) / self.stdev) ** 2)
    
    def plot_histogram_pdf(self, n_spaces = 50):

        """Método para trazar el histograma normalizado de los datos y un gráfico de los
         función de densidad de probabilidad a lo largo del mismo rango
        
         Argumentos:
             n_spaces (int): número de puntos de datos
        
         Devoluciones:
             lista: valores x para la gráfica pdf
             lista: valores de y para la gráfica de pdf
            
         """
        
         #TODO: Nada que hacer para este método. Pruébelo y vea cómo funciona.
        
        mu = self.mean
        sigma = self.stdev

        min_range = min(self.data)
        max_range = max(self.data)
        
        # calcula el intervalo entre los valores de x
        interval = 1.0 * (max_range - min_range) / n_spaces

        x = []
        y = []
        
        # calcular los valores de x para visualizar
        for i in range(n_spaces):
            tmp = min_range + interval*i
            x.append(tmp)
            y.append(self.pdf(tmp))

        # haz los gráficos
        fig, axes = plt.subplots(2,sharex=True)
        fig.subplots_adjust(hspace=.5)
        axes[0].hist(self.data, density=True)
        axes[0].set_title('Normed Histogram of Data')
        axes[0].set_ylabel('Density')

        axes[1].plot(x, y)
        axes[1].set_title('Normal Distribution for \n Sample Mean and Sample Standard Deviation')
        axes[0].set_ylabel('Density')
        plt.show()

        return x, y

    def __add__(self, other):
        
        """Método mágico para sumar dos distribuciones gaussianas
        
         Argumentos:
             otro (gaussiano): instancia gaussiana
            
         Devoluciones:
             Gaussiana: distribución gaussiana
            
        """
        
        # TODO: Calcular los resultados de sumar dos distribuciones gaussianas
        # Al sumar dos distribuciones gaussianas, el valor medio es la suma
        # de las medias de cada gaussiana.
        #
        # Al sumar dos distribuciones gaussianas, la desviación estándar es la
        # raíz cuadrada de la suma de los cuadrados, es decir, sqrt(stdev_one ^ 2 + stdev_two ^ 2)
        
        # crear un nuevo objeto Gaussiano
        result = Gaussian()
        
        # TODO: calcular la media y la desviación estándar de la suma de dos gaussianas
         # cambie esta línea para calcular la media de la suma de dos distribuciones gaussianas
        result.mean = self.mean + other.mean
        # cambie esta línea para calcular la desviación estándar de la suma de dos distribuciones gaussianas
        result.stdev = math.sqrt(self.stdev ** 2 + other.stdev ** 2)
        
        return result

    def __repr__(self):
    
        """Método mágico para generar las características de la instancia gaussiana
        
         Argumentos:
             Ninguna
        
         Devoluciones:
             cadena: características de la Gaussiana
        
         """
        
         # TODO: Devuelve una cadena en el siguiente formato -
         # "valor_medio medio, desviación estándar valor_desviación_estándar"
         # donde mean_value es la media de la distribución Gaussiana
         # y standard_deviation_value es la desviación estándar de
         # el gaussiano.
         # Por ejemplo, "media 3,5, desviación estándar 1,3"
        
        return "mean {}, standard deviation {}".format(self.mean, self.stdev)

In [3]:
# Unit tests to check your solution

import unittest

class TestGaussianClass(unittest.TestCase):
    def setUp(self):
        self.gaussian = Gaussian(25, 2)

    def test_initialization(self): 
        self.assertEqual(self.gaussian.mean, 25, 'incorrect mean')
        self.assertEqual(self.gaussian.stdev, 2, 'incorrect standard deviation')

    def test_pdf(self):
        self.assertEqual(round(self.gaussian.pdf(25), 5), 0.19947,\
         'pdf function does not give expected result') 

    def test_meancalculation(self):
        self.gaussian.read_data_file('numbers.txt', True)
        self.assertEqual(self.gaussian.calculate_mean(),\
         sum(self.gaussian.data) / float(len(self.gaussian.data)), 'calculated mean not as expected')

    def test_stdevcalculation(self):
        self.gaussian.read_data_file('numbers.txt', True)
        self.assertEqual(round(self.gaussian.stdev, 2), 92.87, 'sample standard deviation incorrect')
        self.gaussian.read_data_file('numbers.txt', False)
        self.assertEqual(round(self.gaussian.stdev, 2), 88.55, 'population standard deviation incorrect')

    def test_add(self):
        gaussian_one = Gaussian(25, 3)
        gaussian_two = Gaussian(30, 4)
        gaussian_sum = gaussian_one + gaussian_two
        
        self.assertEqual(gaussian_sum.mean, 55)
        self.assertEqual(gaussian_sum.stdev, 5)

    def test_repr(self):
        gaussian_one = Gaussian(25, 3)
        
        self.assertEqual(str(gaussian_one), "mean 25, standard deviation 3")
        
tests = TestGaussianClass()

tests_loaded = unittest.TestLoader().loadTestsFromModule(tests)

unittest.TextTestRunner().run(tests_loaded)

......
----------------------------------------------------------------------
Ran 6 tests in 0.014s

OK


<unittest.runner.TextTestResult run=6 errors=0 failures=0>