In [None]:
%matplotlib inline
import matplotlib
import seaborn as sns
matplotlib.rcParams['savefig.dpi'] = 144

In [None]:
import expectexception

# Programación orientada a objetos

En las últimas lecciones, a veces me he referido a **objetos** o **objetos de Python**. También mencioné **métodos** de objetos (por ejemplo, el método `get` de` dict`). que significan estas expresiones?

Por ahora podemos pensar en un objeto como algo que podemos almacenar en una variable. Podemos tener objetos de diferente `type`. También podríamos llamar al `type` de un objeto su **class**. Volveremos a clase más tarde.

In [None]:
x = 42
print('%d is an object of %s' % (x, type(x)))

x = 'Hello world!'
print('%s is an object of %s' % (x, type(x)))

x = {'name': 'Dylan', 'age': 26}
print('%s is an object of %s' % (x, type(x)))

Ya sabemos que los enteros, cadenas y diccionarios se comportan de manera diferente. Tienen diferentes propiedades y capacidades diferentes. En el lenguaje de programación, decimos que tienen diferentes **atributos** y **métodos**.

Los atributos de un objeto son sus variables internas que se utilizan para almacenar información sobre el objeto.

In [None]:
# a complex number has real and imaginary parts
x = complex(5, 3)
print(x.real)
print(x.imag)

Los métodos de un objeto son sus funciones internas que implementan diferentes capacidades.

In [None]:
x = 'Dylan'
print(x.lower())
print(x.upper())

Interactuaremos con los métodos de un objeto más a menudo que con sus atributos. Los atributos representan el _estado_ de un objeto. Por lo general, preferimos mutar el estado de un objeto a través de sus métodos, ya que los métodos representan las acciones que uno puede tomar de manera segura sin romper el objeto. A menudo los atributos de un objeto serán inmutables.

In [None]:
%%expect_exception TypeError

x = complex(5, 3)
x.real = 6

Un ejemplo de un método que muta un objeto es el método `append` de una ` list`.

In [None]:
x = [35, 'example', 348.1]
x.append(True)
print(x)

¿Cómo sabemos cuáles son los atributos y métodos de un objeto? Podemos usar la función `dir` de Python. Podemos usar `dir` en un objeto o en una clase.

In [None]:
# dir on an object
x = 42
print(dir(x)[-6:]) # I've truncated the results for clarity

# dir on a class
print(dir(int)[-6:])

También podemos consultar la documentación de la clase. Por ejemplo, [aquí está la documentación de Python sobre los tipos de Python incorporados](https://docs.python.org/2/library/stdtypes.html). Usaremos la documentación cada vez más a medida que incorporemos bibliotecas y herramientas de terceros en Python.

## Clases

Pero esto no es toda la historia. Los métodos y atributos de un `dict` no nos dicen nada acerca de los pares clave-valor o hash. La definición completa de un objeto es la clase de un objeto. Podemos definir nuestras propias clases para crear objetos que realizan una variedad de tareas relacionadas o representan información de una manera conveniente. Algunos de los ejemplos que trataremos más adelante en el curso son clases para hacer gráficos y gráficas, clases para crear y analizar tablas de datos y clases para hacer estadísticas y regresión.

Por ahora, implementemos una clase llamada `Rational` para trabajar con números fraccionarios (por ejemplo, 5/15). Lo primero que necesitaremos para hacer `Rational` es poder crear un objeto` Rational`. Definimos cómo debería funcionar esto con un método especial (oculto) llamado `__init__`. También definiremos otro método especial llamado `__repr__` que le dice a Python cómo imprimir el objeto.

In [None]:
class Rational(object):

    def __init__(self, numerator, denominator):
        self.numerator = numerator
        self.denominator = denominator

    def __repr__(self):
        return '%d/%d' % (self.numerator, self.denominator)

In [None]:
fraction = Rational(4, 3)
print(fraction)

Es posible que haya notado que ambos métodos tomaron como primer argumento la palabra clave `self`. El primer argumento de cualquier método en una clase es la instancia de la clase sobre la cual se llama al método. Piense en una clase como un plano a partir del cual posiblemente se construyen muchos objetos. El argumento `self` es el mecanismo que utiliza Python para que el método pueda saber a qué instancia de la clase se está recurriendo. Cuando el método es realmente llamado, podemos llamarlo de dos maneras. Digamos que creamos una clase `MyClass` con el método` .do_it (self)`, si instanciamos un objeto de esta clase, podemos llamar al método de dos maneras:

In [None]:
class MyClass(object):
    def __init__(self, num):
        self.num = num
        
    def do_it(self):
        print((self.num))
        
myclass = MyClass(2)
myclass.do_it()
MyClass.do_it(myclass)

En forma `myclass.do_it ()` el argumento `self` se entiende porque` myclass` es una instancia de `MyClass`. Esta es la forma casi universal de llamar a un método. La otra posibilidad es `MyClass.do_it (myclass)` donde pasamos el objeto `myclass` como el argumento` self`, esta sintaxis es mucho menos común.

Al igual que todos los argumentos de Python, no hay necesidad de que `self` sea nombrado` self`, también podríamos llamarlo `this` o` apple` o `wizard`. Sin embargo, el uso de `self 'es una convención de Python muy fuerte que rara vez se rompe. Debe utilizar esta convención para que otras personas entiendan su código.

Volvamos a nuestra clase `Rational`. Hasta ahora, podemos hacer un objeto `Rational` y` imprimirlo, pero no puede hacer mucho más. También podríamos querer un método de "reducción" que dividirá el numerador y el denominador por su mayor divisor común. Por lo tanto, necesitaremos escribir una función que calcule el mayor divisor común. Agregaremos esto a nuestra definición de clase.

In [None]:
class Rational(object):

    def __init__(self, numerator, denominator):
        self.numerator = numerator
        self.denominator = denominator

    def __repr__(self):
        return '%d/%d' % (self.numerator, self.denominator)

    def _gcd(self):
        smaller = min(self.numerator, self.denominator)
        small_divisors = {i for i in range(1, smaller + 1) if smaller % i == 0}
        larger = max(self.numerator, self.denominator)
        common_divisors = {i for i in small_divisors if larger % i == 0}
        return max(common_divisors)

    def reduce(self):
        gcd = self._gcd()
        self.numerator = self.numerator / gcd
        self.denominator = self.denominator / gcd
        return self

In [None]:
fraction = Rational(16, 32)
fraction.reduce()
print(fraction)

Estamos construyendo gradualmente la funcionalidad de nuestra clase `Rational`, pero tiene un gran problema: ¡no podemos hacer matemáticas con eso!

In [None]:
%%expect_exception TypeError

print(4 * fraction)

Tenemos que decirle a Python cómo implementar operadores matemáticos (`+`, `-`,` * `,` / `) para nuestra clase.

In [None]:
print(dir(int))

Si miramos a `dir (int)` vemos que tiene métodos ocultos como `__add__`,` __div__`, `__mul__`,` __sub__`, etc. Al igual que `__repr__` le dice a Python cómo `print` nuestro objeto, estos métodos ocultos le dicen a Python cómo manejar operadores matemáticos.

Agreguemos los métodos que implementan operaciones matemáticas a nuestra definición de clase. Para realizar sumas o restas, tendremos que encontrar un denominador común con el número que estamos sumando. Para simplificar, solo implementaremos la multiplicación. No podremos sumar, restar o dividir. Incluso implementar solo la multiplicación requerirá un poco de lógica.

In [None]:
class Rational(object):

    def __init__(self, numerator, denominator):
        self.numerator = numerator
        self.denominator = denominator

    def __repr__(self):
        return '%d/%d' % (self.numerator, self.denominator)

    def __mul__(self, number):
        if isinstance(number, int):
            return Rational(self.numerator * number, self.denominator)
        elif isinstance(number, Rational):
            return Rational(self.numerator * number.numerator, self.denominator * number.denominator)
        else:
            raise TypeError('Expected number to be int or Rational. Got %s' % type(number))
        
    def _gcd(self):
        smaller = min(self.numerator, self.denominator)
        small_divisors = {i for i in range(1, smaller + 1) if smaller % i == 0}
        larger = max(self.numerator, self.denominator)
        common_divisors = {i for i in small_divisors if larger % i == 0}
        return max(common_divisors)

    def reduce(self):
        gcd = self._gcd()
        self.numerator = self.numerator / gcd
        self.denominator = self.denominator / gcd
        return self

In [None]:
print(Rational(4, 6) * 3)
print(Rational(5, 9) * Rational(2, 3))

In [None]:
%%expect_exception TypeError

# remember, no support for float
print(Rational(4, 6) * 2.3)

In [None]:
%%expect_exception TypeError

# also, no addition, subtraction, etc.
print(Rational(4, 6) + Rational(2, 3))

Definir clases puede ser mucho trabajo. Tenemos que imaginar todas las formas en que podríamos querer usar un objeto y dónde podemos encontrarnos con problemas. Esto también se aplica a la definición de funciones, pero las clases generalmente manejarán muchas tareas, mientras que una función solo puede hacer una.

## Métodos privados en Python

Puede que hayas notado que hemos usado algunos métodos que comienzan con `_` como` _gcd`. Esto tiene un significado convencional en Python que se implementa formalmente en otros idiomas, la noción de una función privada. Las clases se utilizan para encapsular la funcionalidad y los datos al tiempo que proporcionan una interfaz al mundo exterior de otros objetos. Piense en un programa como una empresa, cada trabajador tiene sus propias responsabilidades y sabe que otras personas de la compañía realizan ciertas tareas, pero no necesariamente saben cómo esas personas realizan esas tareas.

Para hacer esto posible, las clases tienen métodos tanto públicos como privados. Los métodos públicos son métodos que están expuestos a otros objetos o la interacción del usuario. Los métodos privados se utilizan internamente para el objeto, a menudo en un sentido "auxiliar". En algunos idiomas, esta noción de métodos públicos y privados se aplica y el programador deberá especificar cada método como público o privado. En Python, todos los métodos son públicos, pero para distinguir qué métodos queremos que sean privados, agregamos un guión bajo al principio del método, de ahí `_gcd`. Esta es una nota para alguien que usa la clase de que este método solo debe llamarse dentro del objeto y puede estar sujeto a cambios con las nuevas versiones, mientras que los métodos públicos con suerte no cambiarán su interfaz.

Otra convención de Python que trata los guiones bajos son los llamados métodos `dunder` que tienen guiones bajos antes y después de los nombres de los métodos. Hay un montón de estos en Python `__init__, __name__, __add__`, etc. y tienen un significado especial. Tenga en cuenta que, en general, también se consideran métodos privados, excepto en circunstancias especiales. En el caso de métodos como `__add__`, son los que permiten al programador especificar la operación` + `. Dado que estos métodos tienen un significado especial para Python, solo deben usarse con cuidado. Además, aunque la sobrecarga de cosas como el operador `+` podría tener sentido para usted al programarlo, puede ser muy confuso para alguien que lee su código, ya que el sistema de tipos dinámico de Python generalmente no permite la determinación de tipos hasta el tiempo de ejecución, generalmente definiendo un `El método .add` es mucho más claro.

## ¿Cuándo queremos clases?

Cuando queremos realizar un conjunto de tareas relacionadas, especialmente en la repetición, generalmente queremos definir una nueva clase. Veremos que en la mayoría de las bibliotecas de terceros que usaremos, las herramientas principales que presentan a Python son nuevas clases. Por ejemplo, más adelante en el curso aprenderemos acerca de la biblioteca de Pandas, cuya característica principal es la clase `DataFrame`.

In [None]:
import pandas as pd

df = pd.DataFrame({'a': [1, 2, 5], 'b': [True, False, True]})

print(type(df))
df.head()

Aquí está el comienzo (resumido) de la definición de la clase DataFrame:

```python
class DataFrame(NDFrame):

    def __init__(self, data=None, index=None, columns=None, dtype=None,
                 copy=False):
        if data is None:
            data = {}
        if dtype is not None:
            dtype = self._validate_dtype(dtype)

        if isinstance(data, DataFrame):
            data = data._data

        if isinstance(data, BlockManager):
            mgr = self._init_mgr(data, axes=dict(index=index, columns=columns),
                                 dtype=dtype, copy=copy)
        elif isinstance(data, dict):
            mgr = self._init_dict(data, index, columns, dtype=dtype)
        elif isinstance(data, ma.MaskedArray):
            import numpy.ma.mrecords as mrecords
            # masked recarray
            if isinstance(data, mrecords.MaskedRecords):
                mgr = _masked_rec_array_to_mgr(data, index, columns, dtype,
                                               copy)

            # a masked array
            else:
                mask = ma.getmaskarray(data)
                if mask.any():
                    data, fill_value = maybe_upcast(data, copy=True)
                    data[mask] = fill_value
                else:
                    data = data.copy()
                mgr = self._init_ndarray(data, index, columns, dtype=dtype,
                                         copy=copy)

        elif isinstance(data, (np.ndarray, Series, Index)):
            if data.dtype.names:
                data_columns = list(data.dtype.names)
                data = dict((k, data[k]) for k in data_columns)
                if columns is None:
                    columns = data_columns
                mgr = self._init_dict(data, index, columns, dtype=dtype)
            elif getattr(data, 'name', None) is not None:
                mgr = self._init_dict({data.name: data}, index, columns,
                                      dtype=dtype)
            else:
                mgr = self._init_ndarray(data, index, columns, dtype=dtype,
                                         copy=copy)
        elif isinstance(data, (list, types.GeneratorType)):
            if isinstance(data, types.GeneratorType):
                data = list(data)
            if len(data) > 0:
                if is_list_like(data[0]) and getattr(data[0], 'ndim', 1) == 1:
                    if is_named_tuple(data[0]) and columns is None:
                        columns = data[0]._fields
                    arrays, columns = _to_arrays(data, columns, dtype=dtype)
                    columns = _ensure_index(columns)

                    # set the index
                    if index is None:
                        if isinstance(data[0], Series):
                            index = _get_names_from_index(data)
                        elif isinstance(data[0], Categorical):
                            index = _default_index(len(data[0]))
                        else:
                            index = _default_index(len(data))

                    mgr = _arrays_to_mgr(arrays, columns, index, columns,
                                         dtype=dtype)
                else:
                    mgr = self._init_ndarray(data, index, columns, dtype=dtype,
                                             copy=copy)
            else:
                mgr = self._init_dict({}, index, columns, dtype=dtype)
        elif isinstance(data, collections.Iterator):
            raise TypeError("data argument can't be an iterator")
        else:
            try:
                arr = np.array(data, dtype=dtype, copy=copy)
            except (ValueError, TypeError) as e:
                exc = TypeError('DataFrame constructor called with '
                                'incompatible data and dtype: %s' % e)
                raise_with_traceback(exc)

            if arr.ndim == 0 and index is not None and columns is not None:
                values = cast_scalar_to_array((len(index), len(columns)),
                                              data, dtype=dtype)
                mgr = self._init_ndarray(values, index, columns,
                                         dtype=values.dtype, copy=False)
            else:
                raise ValueError('DataFrame constructor not properly called!')

        NDFrame.__init__(self, mgr, fastpath=True)
```

¡Eso es mucho código solo para `__init__`!

A menudo, usaremos la relación entre una nueva clase y las clases existentes para la funcionalidad _inherit_, evitando que escribamos algo de código.

## Herencia

A menudo, las clases que definimos en Python se construirán a partir de ideas existentes en otras clases. Por ejemplo, nuestra clase `Rational` es un número, por lo que debería comportarse como otros números. Podríamos escribir una implementación de `Rational` que use aritmética` float` y simplemente convierta entre el punto flotante y las representaciones racionales durante la entrada y salida. Esto nos ahorraría complejidad en la implementación de la aritmética, pero podría complicar la creación y representación de objetos. Incluso si nunca escribe una clase, es útil comprender la idea de herencia y la relación entre las clases.

Vamos a escribir una clase general llamada `Rectangle`, tendrá dos atributos, una longitud y un ancho, así como algunos métodos.

In [None]:
class Rectangle(object):
    def __init__(self, height, length):
        self.height = height
        self.length = length
    
    def area(self):
        return self.height * self.length
    
    def perimeter(self):
        return 2 * (self.height + self.length)

Ahora, un cuadrado también es un rectángulo, pero es algo más restringido, ya que tiene la misma altura que la longitud, por lo que podemos subclase `Rectangle` y aplicar esto en el código.

In [None]:
class Square(Rectangle):
    def __init__(self, length):
        super(Square, self).__init__(length, length)

In [None]:
s = Square(5)
s.area(), s.perimeter()

A veces (aunque no a menudo) queremos verificar realmente el tipo de un objeto python (de qué clase es). Hay dos formas de hacer esto, veamos primero algunos ejemplos para tener una idea de la diferencia.

In [None]:
type(s) == Square

In [None]:
type(s) == Rectangle

In [None]:
isinstance(s, Rectangle)

Como habrá notado, la calidad de tipo de verificación solo verifica la clase exacta a la que pertenece un objeto, mientras que `isinstance (c, Class)` comprueba si `c` es un miembro de la clase` Class` o un miembro de una subclase de `Class`. Casi siempre `isinstance` es la forma correcta de verificar esto, porque si una clase implementa algún tipo de funcionalidad, sus subclases implementan la misma funcionalidad (¡es posible que tengan alguna funcionalidad extra adicional!).

## Programación orientada a objetos

Ahora que entendemos los objetos y las clases, volvamos a la idea de _programación orientada a objetos_. La programación orientada a objetos (`OOP`) es una perspectiva que los programas tratan esencialmente sobre la creación de objetos y la interacción entre ellos. En `OOP`, casi cada fragmento de código describe un objeto, los atributos de un objeto o los métodos de un objeto. Mantener esta perspectiva en mente puede ayudarnos a entender lo que está sucediendo en un programa.

## Preguntas:
- ¿Cuáles son algunos objetos Python incorporados que pueden heredar de la misma clase principal?