<a href="https://colab.research.google.com/github/alexandergribenchenko/Data_Science_Self_Study/blob/main/OOP_for_Data_Science.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Python Object-Oriented Programming (OOP) for Data Science**

**Nota introductoria**: Este notebook toma como fuente base el artículo:  [Python Object-Oriented Programming (OOP) for Data Science](https://acortar.link/0463Nz)

## **01. ¿Que es la Programación Orientada a Objetos?**

La Programación Orientada a objetos (o OOP) se refiere a un paradigma de programación que basa su desarrollo en un elemento fundamantal denomiado `objeto`. Los objetos presentan 2 elementos constitutivos: 

- **Atributos:** son las propiedades especificas de un objeto.
- **Métodos:** son  las acciones o comportamientos que sobre el propio objeto se pueden tener.

## **02. Conceptos fundamentales de la Programación Orientada a Objetos**

La programación orientada a objetos presenta los siguientes conceptos fundamantales:

- **Encapsulación:** La idea detrás de la encapsulación es que todos los atributos y métodos de un objeto se mantengan privados y a salvo de que otro objeto los herede. Esto le permite definir métodos y atributos públicos y privados. Las personas que usan su programa pueden usar los métodos públicos, mientras que los métodos privados no.

- **Abstracción:** Detrás del concepto de abstracción está el concepto de encapsulación. La abstracción le permite exponer solo mecanismos de alto nivel para hacer ciertas cosas mientras oculta (o "abstrae") los mecanismos complejos detrás de esto. Por ejemplo, su automóvil abstrae toda la mecánica detrás de encender su automóvil presionando un botón o girando una llave.

- **Herencia**: La herencia le permite crear objetos similares que mantienen un número base de propiedades (atributos) y habilidades (métodos). Esto le permite crear un tipo de objeto que puede usarse como base para muchos otros objetos sin necesidad de repetir su código. Por ejemplo, la base de un automóvil se puede usar para crear objetos como camiones, SUV y autocaravanas. **Nota:** Existen diferentes tipos de herencia: herencia simple, herencia multiple, herencia multinivel, herencia jerárquica y herencia híbrida.

- **Polimorfismo**: El concepto de polimorfismo se basa en el concepto de herencia. Si bien puede ser útil definir objetos secundarios, estos objetos secundarios pueden funcionar de forma ligeramente diferente. El polimorfismo le permite definir un objeto secundario pero crear y usar sus propios métodos. Siguiendo el ejemplo de los automóviles y camiones, el método para encender un camión puede ser ligeramente diferente al de encender un automóvil.




## **03. ¿Por qué la programación orientada a objetos es importante para la ciencia de datos?**

En muchos casos en ciencia de datos, el paradigma de la `programación procedimental` será suficiente. Esto estructura un programa casi como una receta o un manual de instrucciones. En este caso, cada línea de código se ejecuta en orden. Entonces, ¿qué tiene para ti aprender programación orientada a objetos cuando todo lo que quieres hacer es analizar datos?

Hay dos razones principales para hacer esto:

1. **Los objetos están en todas partes:** en Python (de hecho, todo es un objeto).
2. **Organización del código:** a medida que crecen sus programas, también crece la complejidad. La programación orientada a objetos le permite organizar su código, lo que facilita la prueba, la depuración y la expansión. Permite mejorar modularizando lo que inicialmente tenemos como *código spaguetti*.

En las primeras etapas de trabajo con Python para la ciencia de datos, puede parecer que los conceptos detrás de la programación orientada a objetos no tienen sentido o no se aplican. ¡Pero no te desesperes!

Aprender a pensar en el paradigma de la programación orientada a objetos le permite comprender mejor cómo funcionan muchas aplicaciones de Python. Por ejemplo, un Pandas DataFrame es un objeto complejo que tiene muchos atributos y métodos. El simple hecho de saber que un DataFrame es un objeto le permite comprender por qué el DataFrame tiene ciertos métodos, mientras que, por ejemplo, una lista de Python no los tiene.

Como científico de datos, no siempre necesitará usar programación orientada a objetos. No caiga en la trampa de que todo debe seguir un paradigma OOP. Más adelante en el tutorial, aprenderá algunos casos de uso excelentes para cuando debería intentar usar la programación orientada a objetos.


## **04. ¿Por qué crear objetos en Python?**

En muchos casos, Python le brinda la capacidad de definir conceptos simples utilizando tipos de datos primitivos, como listas y diccionarios. Por ejemplo, podría crear una lista para contener información sobre los estudiantes de su clase. Vamos a crear algunas listas para contener esta información:

In [1]:
# Creating lists to store data
nik = ['Nik', 33, 'datagy.io', 'Toronto']
kate = ['Kate', 33, 'government', 'Toronto']
evan = ['Evan', 40, 'teaching', 'London']

Si bien este enfoque funciona, hay una serie de problemas diferentes con este enfoque:
1. Es necesario recordar la posición de cada elemento. 
2. Cuando un elemento no existe, el índice puede apuntar a un elemento diferente. 
3. No está claro qué representa cada elemento.

Si bien podríamos convertir estas listas en diccionarios, o en un dictado predeterminado, todavía hay una serie de problemas con este enfoque. Debe definir funciones para permitir que estos diccionarios hagan algo. Estas funciones son entonces accesibles para cualquier otra cosa en su programa. Esto puede hacer que sea bastante confuso para los lectores de su código y tener consecuencias no deseadas.

Todos estos problemas se pueden resolver creando una clase, que puede contener diferentes piezas de información, pero también puede contener funciones. ¡En la siguiente sección, aprenderá cómo crear su primera clase en Python!

## **05. Objetos y Clases en Python**

En Python, puede definir una clase usando la palabra clave `class`. La palabra clave va seguida del nombre de la clase y dos puntos. ¡Eso, en sí mismo, es suficiente para definir una clase! Vamos a crear una nueva clase siguiendo nuestra convención anterior:

In [2]:
# Creating your first class
class Person:
   pass

Por convención, una clase de Python se escribe con letras mayúsculas separando cada palabra. Si tuviéramos una clase de varias palabras, entonces cada palabra sería una letra mayúscula. 

Analicemos algunas piezas de terminología antes de pasar a algo más detallado:

Aprendamos cómo podemos expandir nuestro método dándole algunas propiedades. Esto se hace usando lo que se llama el método `__init__`, también conocido como el método constructor.

## **06. Python init: el método del constructor**

En este momento, nuestra clase `Person` no contiene ninguna información ni hace nada. Crear esta clase, tal como está ahora, en realidad no logra nada. Veamos cómo podemos ampliar esto estableciendo los atributos iniciales de una persona.

In [3]:
# Adding details to the Person class
class Person:
    def __init__(self, name, age, company):
        self.name = name
        self.age = age
        self.company = company

Nuestra clase Persona ahora tiene tres atributos, `name`, `age` y `company`. Cuando creamos una nueva persona, podemos pasar estos parámetros para hacer que nuestra persona sea un poco más interesante.

In [4]:
# Creating our first Person instance
Nik = Person('Nik', 33, 'datagy.io')
print (Nik.name, Nik.age, Nik.company)

Nik 33 datagy.io


A primera vista, esta función parece un poco extraña. La función `__init__()` se conoce como método constructor. Este método establece el estado inicial del objeto, inicializando esa instancia de la clase.

La función `__init__()` puede contener cualquier cantidad de parámetros, pero el primer argumento siempre debe ser la variable self.

## **07. Comprender `self` en la programación orientada a objetos de Python**

El parámetro `self` se usa para representar esa instancia de una clase. `self` le permite a Python saber que el atributo o los métodos deben aplicarse a ese objeto (y solo a ese objeto). En esencia, el parámetro `self` asigna los atributos con los argumentos dados.

Cuando creó el primer objeto anterior, a las variables que se pasaron se les asignaron los enlaces `self`. Así por ejemplo:

- `self.name` se le asignó el argumento del parámetro de `name` 
- `self.company` se le asignó el argumento del parámetro `company`.

Entonces, `self` apunta a la instancia de esa clase. En Python, `self` permite que los objetos accedan a sus atributos y métodos y hace que estas instancias sean únicas.

## **08. Atributos de clase e instancia de Python**

En esta sección, aprenderá más sobre los atributos en las clases de Python. De hecho, hay dos tipos principales de atributos contenidos en las clases de Python. Hay atributos de clase y atributos de instancia. Carguemos algo de código nuevamente y echemos un vistazo a la diferencia:

In [11]:
# Looking at the difference between class and instance attributes
class Person:
    # Class attribute
    type = 'Human'
    perro = 'gato'
    def __init__(self, name, age, company):
        # Instance attributes
        self.name = name
        self.age = age
        self.company = company

In [12]:
Nik = Person('Nik', 33, 'datagy.io')
print (Nik.type, Nik.name, Nik.age, Nik.company, Nik.perro)

Human Nik 33 datagy.io gato


En el ejemplo anterior hemos declarado cuatro atributos. Tres de estos atributos son atributos de instancia, mientras que solo uno es un atributo de clase. Entonces, ¿cuál es la diferencia? La siguiente tabla desglosa algunas de las diferencias clave entre los atributos de clase e instancia:

Descripción	| Atributo de instancia |	Atributo de clase
--- | --- | ---
Creado	| Dentro de la función `__init__()` |	Creado antes de la función `__init__()`
Referencias `self` | No referencia a `self` | Se especifica usando `self.attribute_name`
Genérico / Específico | Genérico para todas las instancias, a menos que se modifique | Específico para una instancia de clase








Entonces, ¿cuándo deberías usar uno sobre el otro?

- Si desea que un atributo sea el mismo para cada instancia de su clase, como el atributo de tipo en la clase Persona, utilice un atributo de clase. Esto evita que necesite pasarlo como un valor cada vez que crea una clase.
- Si desea que un atributo sea específico para un objeto, utilice un atributo de instancia. Esto le permite personalizar el objeto para satisfacer sus necesidades.

## **09. Acceder a atributos de objetos en Python**

Ahora que comprende los atributos de los objetos de Python, veamos cómo puede acceder a estos atributos. Se puede acceder a los atributos de los objetos de Python mediante la notación de puntos. Esta es una forma familiar de acceder a datos en listas o diccionarios y funciona como es de esperar.

In [13]:
class Person:
    # Class attribute
    type = 'Human'

    def __init__(self, name, age, company):
        # Instance attributes
        self.name = name
        self.age = age
        self.company = company

Nik = Person('Nik', 33, 'datagy.io')

Este objeto ahora tiene cuatro atributos. Si está trabajando en un IDE como VS Code, estos atributos son incluso accesibles a través de Intellisense. Esto le permite ahorrar algo de tiempo escribiendo y hacer que los nombres de sus atributos se llamen correctamente.

Veamos cómo podemos imprimir el atributo de empresa en nuestro objeto Nik.



In [14]:
# Printing an object's attribute
print(Nik.company)


datagy.io


Incluso podemos modificar estos atributos simplemente asignándoles directamente un nuevo valor. Digamos que tenía un cumpleaños y quería actualizar mi edad, simplemente podría escribir:

In [15]:
# Modifying an object's attribute
Nik.age = 34
print(Nik.age)

34


El estado de ese objeto se mantiene y se puede modificar. Esta es una de las ventajas de usar la programación orientada a objetos: puede ejecutar su programa mientras se mantienen los datos de su programa de una manera útil y fácil de entender.

## **10. Funciones y métodos de Python**

Hasta ahora, los objetos que ha creado contienen información, pero en realidad no hacen nada. En Python, usamos funciones para crear acciones repetitivas. En la programación orientada a objetos, también existen funciones. Sin embargo, los métodos se refieren a funciones contenidas en un objeto.

La conclusión aquí es: si bien se puede llamar a una función desde cualquier lugar, un método de clase solo se puede llamar desde una instancia de esa clase. Debido a esto, todo método es una función pero no toda función es un método.

¡Vamos a definir nuestro primer método de objeto! Crearemos un método que permita que nuestro objeto salude a alguien usando su nombre:

In [20]:
# Writing your first object method
class Person:
    type = 'Human'

    def __init__(self, name, age, company):
        self.name = name
        self.age = age
        self.company = company
    
    def greet(self):
        print('Hi there! My name is ', self.name)

Nik = Person('Nik', 33, 'datagy.io')
Nik.greet()

Hi there! My name is  Nik


Definir un método de objeto es casi lo mismo que crear una función regular. Hay una serie de diferencias clave:

- La función se define dentro del objeto.
- Se requiere el argumento `self`.
Se requiere que el primer argumento debe ser `self`.

Recuerde, `self` apunta a esa instancia del objeto. Debido a esto, el método puede acceder a sus atributos. Sin embargo, incluso si la función no requiere ningún atributo de sí mismo, se requiere el argumento.

Ahora vamos a crear un método que modifique el objeto en sí. Creemos un método que permita que nuestro objeto tenga un cumpleaños. Esto aumentará la edad en uno, utilizando el operador de asignación de aumento.

In [22]:
# Adding a birthday method to our class
class Person:
    type = 'Human'

    def __init__(self, name, age, company):
        self.name = name
        self.age = age
        self.company = company
    
    def greet(self):
        print('Hi there! My name is ', self.name)

    def have_birthday(self):
        self.age += 1

Nik = Person('Nik', 33, 'datagy.io')
print(Nik.age)         
Nik.have_birthday()
print(Nik.age)
Nik.have_birthday()
print(Nik.age)     

33
34
35


Si bien la complejidad de nuestro método `have_birthday()` es bastante sencilla, esto lleva al punto de la programación orientada a objetos. Somos capaces de abstraer la mecánica detrás de lo que hace el programa detrás de un método fácil de entender.

## **11. Herencia de clases en Python**

En esta sección, aprenderá sobre un concepto importante relacionado con la programación orientada a objetos de Python: `la herencia`. La herencia es un proceso por el cual una clase adquiere los atributos y métodos de otra clase. Sin embargo, la clase también puede tener sus propios atributos y métodos.

En el caso de la herencia, la clase original se denomina *parent class*, mientras que la clase que hereda se denomina *child class*.

Lo especial de las *child classes* en Python es que:

- Heredan todos los atributos y métodos de la clase principal. 
- Pueden definir sus propios atributos y métodos.
- Pueden sobrescribir los atributos y métodos de la clase principal.

Veamos cómo podemos aprovechar el concepto de herencia para crear una nueva clase: `Employee`. Cada `Employee` tendrá los mismos atributos y métodos de `Person`, pero también tendrá acceso a algunos propios:

In [35]:
# Creating your first sub-class
class Employee(Person):
    def __init__(self, name, age, company, employee_number, income):
        super().__init__(name, age, company)
        self.employee_number = employee_number
        self.income = income

    def do_work(self):
        print("Working hard!")

kate = Employee('Kate', 33, 'government', 12345, 90000)

kate.do_work()
kate.greet()
print(kate.age)
kate.have_birthday()
print(kate.age)

Working hard!
Hi there! My name is  Kate
33
34


In [36]:
print (kate.type, kate.name, kate.age, kate.company, kate.employee_number, kate.income )

Human Kate 34 government 12345 90000


Ahora que hemos creado una subclase de Empleado, podemos crear estos objetos. Los objetos tendrán acceso a los mismos métodos y atributos, pero también a atributos o métodos adicionales. Hay algunas cosas a tener en cuenta aquí:

- `super().__init__()` se incluye en la primera línea de la función `__init__()` de la subclase. Esto permite que la clase herede todos los atributos de la clase principal, sin necesidad de repetirlos.
- La función `super()` toma todos los argumentos originales de la clase principal
- No necesitábamos repetir ningún método de la clase original, pero aún podemos acceder a ellos.

Veamos cómo podemos acceder a un método de clase padre:

In [37]:
# Accessing a parent class method
kate = Employee('Kate', 33, 'government', 12345, 90000)
kate.greet()

Hi there! My name is  Kate


En el ejemplo anterior, aunque la clase `Employee` no define explícitamente el método `greeting()`, ¡tiene acceso a él por el poder de la herencia!

## **12. Polimorfismo en clases de Python**

Ahora, supongamos que desea asegurarse de que sus empleados usen un saludo más formal. La clase principal, `Person`, que definiste anteriormente ya tiene un método `greeting()`. Veamos cómo puede modificar el comportamiento de la clase secundaria, Empleado, para tener su propio saludo único.

En Python, el polimorfismo es tan simple como definir ese método en la clase secundaria. Esto le permite sobrescribir cualquier método principal sin tener que preocuparse por los gastos generales. Veamos cómo podemos implementar esto:

In [38]:
# Polymorphism in Python classes
class Employee(Person):
    def __init__(self, name, age, company, employee_number, income):
        super().__init__(name, age, company)
        self.employee_number = employee_number
        self.income = income

    def greet(self):
        print('Welcome! How may I help you?')

    def do_work(self):
        print("Working hard!")

kate = Employee('Kate', 33, 'government', 12345, 90000)
kate.greet()

Welcome! How may I help you?


Aquí, definió un nuevo método `greeting()` que se comporta de manera diferente al método del mismo nombre en la clase principal. Este proceso se conoce como anulación de métodos. El polimorfismo le permite acceder a los métodos y atributos anulados en una clase secundaria.

## **13. ¿Cuándo debería usar la programación orientada a objetos?**

Entonces, has aprendido mucho sobre la programación orientada a objetos en Python. Es posible que aún se pregunte: "¿Cómo se aplica esto al aprendizaje de la ciencia de datos en Python?" En muchos casos, la programación procedimental puede ser suficiente para usted al principio. Hay dos razones clave por las que querrá aprender programación orientada a objetos, incluso si confía principalmente en la programación procedimental.

**Los objetos de Python están en todas partes, literalmente.** Todo en Python es un objeto (ya sea un número entero o incluso una función). Comprender cómo funcionan los métodos y atributos de los objetos le permite comprender mejor cómo funciona Python. Los objetos son una parte fundamental de las bibliotecas de ciencia de datos. Comprender, por ejemplo, que un DataFrame es un objeto abre la comprensión de cómo los métodos de DataFrame pueden funcionar para manipular sus datos.

**La programación orientada a objetos en Python le permite organizar su código.** No todos los proyectos requieren que use programación orientada a objetos. Pero una vez que su programa gane complejidad y/o usuarios, puede ser útil comenzar a pensar en la programación orientada a objetos. Al igual que las funciones te permiten organizar y abstraer el código, los objetos también lo hacen.

## **14. Conclusión y resumen**

En este tutorial, aprendió a usar la programación orientada a objetos en Python y cómo se relaciona con el ámbito de la ciencia de datos. La siguiente sección proporciona un resumen rápido de la programación orientada a objetos de Python:

- La programación orientada a objetos está relacionada con cuatro conceptos principales: encapsulación, abstracción, herencia y polimorfismo.
- Todo en Python es un objeto: comprender OOP le permite comprender mejor los conceptos detrás de las bibliotecas de ciencia de datos.
- OOP te permite seguir trabajando con programación procedural, pero de una forma más estructurada.
- El método `__init__()` le permite pasar atributos de instancia. Los atributos de clase se definen fuera del método constructor.
- Se puede acceder a los atributos de los objetos usando la notación de puntos, similar a acceder a los elementos del diccionario.
- Los métodos son funciones definidas en una clase, a las que solo puede acceder esa clase (o cualquier clase secundaria).
- La herencia de clases le permite reutilizar el código de las clases principales mientras agrega atributos y métodos únicos a una clase secundaria.
- El polimorfismo le permite sobrescribir cualquier método o atributo definido en una clase principal.