# Introduccion a los tipos de datos y estructuras nativas en Python

En el transcurso de este curso nos dedicaremos a descubrir, de manera introductoria, el lenguaje de programación Python. Esto lo haremos desde un enfoque aplicado. Es decir, a partir de casos concretos de análisis donde el participante deberá interpretar distintas cuestiones asociadas al mundo del transporte urbano.

Para ello, introduciremos uno de los lenguajes más populares y actuales en el campo de la Ciencia de Datos.

Python es un lenguaje de programación orientado a objetos. A grandes rasgos, esto significa que el contenido que se guarda en ellos puede ser de distintas clases.

Un objeto es simplemente una colección de datos (variables) y métodos (funciones) que actúan sobre esos datos. Del mismo modo, una clase es un plano para ese objeto. Es la definición de su estructura, es decir, de todos los elementos que lo componen.

Podemos pensar a la clase como un boceto del objeto. Como el plano de una vivienda por decirlo de alguna manera. Las clases tienen propiedades y métodos. Por ejemplo, un objeto de clase "Perro" puede tener propiedades como un nombre o una edad como así métodos como "ladrar", "saltar", etc. 

Por ende, se considera objeto al "resultado" o instancia de una clase. Tal es así que podemos hablar de objeto o, incluso, directamente de instancia o evento.

Python es un lenguaje bastante útil para modularizar. En otras palabras, para "encapsular comportamientos". Esto permite dividir un proceso complejo en pequeños módulos que realizan funciones específicas. Algo que resulta bastante efectivo para garantizar el funcionamiento de un todo más complejo.




# Tipos de datos

> **1. `Integer`**

Una variable de tipo integer o entero sólo puede guardar números enteros. Es decir sin coma. Los enteros no tienen demasiadas propiedades ni métodos interesantes.

In [None]:
# Almacenamos un entero en una variable
a = 1
print(a)

1


In [None]:
# Podemos sumarlo con otra variable
b = 1
print(a+b)

2


In [None]:
# También sumar números sin asignar o asignar a una variable directamente una suma
c = 1 + 4
print(c)
print(4 + 3)

5
7


In [None]:
# Podemos ver el tipo de datos de un entero asignado a una variable o sin asignar
print(type(c))
print(type(8))

<class 'int'>
<class 'int'>


> **2. `Float`**

Una variable de tipo float sólo puede almacenar números decimales. Tomar en cuenta que en python, los números decimales se escriben con punto en lugar de coma.

<b> ¿Qué propiedades o métodos puede tener un objeto de tipo float? <b/>

In [None]:
mi_float = 3.4
print(mi_float)
print(type(mi_float))

3.4
<class 'float'>


Un típico problema, es tener que saber si el valor flotante se puede convertir en entero sin perder información, es decir, si tiene decimales distintos de 0. Para esto podemos utilizar el método *is_integer()* de la clase Float.

In [None]:
# Noten que si mi resultado está en el último renglón de la celda, no necesito utilizar la función print()
mi_float.is_integer()

False

In [None]:
3.0.is_integer()

True

Para pasar de un float a un integer podemos usar la función int(). Esto se llama CASTEAR la variable como entero, es decir, estamos destruyendo un objeto de una clase y creando otro de otra clase que represente lo mejor posible al primero. Veamos qué pasa...

In [None]:
# Si no teníamos decimales no perdemos información
int(2.0)

2

In [None]:
# Si tenemos decimales nos quedamos con la parte entera
int(3.9)

3

> **3. `string`**

Una variable de tipo string o cadena sólo puede almacenar una cadena de caracteres, pueden ser letras y números, puntos, comas, espacios, etc . . .

Para definir strings tenemos que utilizar las comillas dobles o las comillas simples.

<b> ¿Qué propiedades o métodos puede tener un objeto de tipo float? <b/>

In [None]:
a = "Esto es un string"
b = 'Esto también es un string'
print(a)
print(b)

Esto es un string
Esto también es un string


Los strings tienen MUCHOS métodos interesantes, podemos querer buscar si aparece un patrón dentro del string, podemos querer saber cuántas letras tiene, podemos querer transformar todo el contenido a letra minúscula, podemos querer concatenar dos strings y muchos etcéteras.

In [None]:
# Transformamos todo el contenido a minúscula con el método .lower()
a.lower()

'esto es un string'

In [None]:
# Vemos cuántas veces ocurre un patrón con el método count.
b.count('es')

1

Veamos cómo se comporta el operador *+* con estos distintos tipos de datos.

In [None]:
print(1 + 3.0)
print(type(1 + 3.0))

print('1' + '1')
print(type('1' + '1'))

4.0
<class 'float'>
11
<class 'str'>


In [None]:
# Veamos que pasa si tratamos de sumar un entero con un string
print(1 + '1')

TypeError: ignored

In [None]:
# Pero si CASTEAMOS (cambiamos de clase) el entero como string o viceversa el problema se resuelve
print(str(1) + '1')

11


> **3. `Boolean`**

Una variable booleana sólo puede guardar uno de los siguientes valores: True o False (verdadero o falso).

In [None]:
a = True
b = False

In [None]:
# Veamos el operador and
a and b

False

In [None]:
# Y el operador or
a or b

True

In [None]:
print(type(a))

<class 'bool'>


In [None]:
# Los booleanos también pueden usarse libremente como los enteros 0 para False y 1 para True
# Veamos esta comparación.
a == 1

True

In [None]:
# O esta suma
a + 3

4

## Colecciones

Recordemos que Python también ofrece clases que permiten almacenar y manipular colecciones de elementos. 

> **1. `lista`**

Las listas son colecciones de elementos ordenados. Cada elemento de la lista puede ser un objeto de cualquier tipo, inclusive una lista. Las listas se definen usando []. 

In [None]:
mi_lista = [1,25,'4',[1,2]]

Las listas tienen muchos métodos interesantes, por ejemplo podemos querer agregar un elemento o contar la cantidad total.

In [None]:
# Contar los elementos
len(mi_lista)

4

In [None]:
# Agregar un elemento
mi_lista.append(9)
print(mi_lista)

[1, 25, '4', [1, 2], 9]


Para acceder a uno o más de elementos de la lista, lo hacemos utilizando [].
Podemos hacer dos cosas:

In [None]:
# Indexing: acceder a un elemento específico
mi_lista[4]

9

In [None]:
# Slicing: acceder a varios de los elementos con el patrón [Start:Stop:Step]
mi_lista[2:5]

['4', [1, 2], 9]

> **2. `tupla`**

Las tuplas son colecciones ordenadas e inmutables. No tienen el método append porque no se les pueden agregar nuevos elementos. 
También pueden combinar distintas clases de elementos y soportan slicing e indexing. <br>
Se definen con ().

In [None]:
mi_tupla = (2,3,5.6,7)

In [None]:
# Indexing
mi_tupla[2]

5.6

In [None]:
mi_tupla[2:4]

(5.6, 7)

> **3. `diccionario`**

Los diccionarios son colecciones desordenadas de elementos y por eso no soportan slicing ni indexing.
Los diccionarios son conjuntos de claves y valores, se definen usando {}.

Para poder acceder a un valor, tenemos que conocer la clave. Muchas veces se usan como sustituto de una clase. En lugar de definir la clase alumno, con todas sus propiedades puede definir un diccionario alumno. Está técnica de codificación es más rápida y liviana en memoria. 

In [None]:
mi_alumno = {'curso':1, 'nombre':'Emanuel'}

In [None]:
type(mi_alumno)

dict

In [None]:
# Para acceder a los elementos, necesito saber las claves
mi_alumno['curso']

1

<b> ¿Qué métodos y propiedades podrían tener los diccionarios? <b>

In [None]:
# Típicamente queremos saber las claves que contiene
mi_alumno.keys()

dict_keys(['curso', 'nombre'])

In [None]:
# O si una clave en particular está definida en el diccionario
print('curso' in mi_alumno)
print('apellido' in mi_alumno)

True
False


# Algunas cuestiones básicas: funciones y métodos. 

Una función es un bloque de código que comienza con la sentencia `def` y lleva un nombre asociado. Puede recibir argumentos, los que comúnmente son utilizados en una expresión o secuencia de sentencias para realizar alguna tarea o devolver un objeto. De esta manera...

In [None]:
# Armemos una función que devuelva la suma de los elementos de un iterable...
def sumar(arg):
    '''
    Suma de los items de un objeto iterable.
    ...
    Argumentos:
        arg(iterable): iterable de elementos numéricos 
                       (e.g. 'list' o 'pandas serie')
    Devuelve:
        integer: resultado de la sumatoria
    '''
    total = 0
    for i in range(len(arg)):
        total = total + arg[i] 
    return total

In [None]:
iterable = [2,4,6,8]

In [None]:
sumar(iterable)

20

Vemos que esta función nos sirve para obtener el resultado. Llamándola y pasándole el parámetro que deseemos nos devuelve la sumatoria de todos sus elementos. Ahora, ¿la forma de ejecutar una función solamente es llamándola de este modo? No, hay otra manera de llamar a las funciones y esta es a través de los métodos. Un `método` es en sí mismo una función pero cuya cualidad principal es la de aplicarse sobre un objeto mismo, utilizando parámetros opcionales. Un método sólo existe dentro del objeto y por eso se lo puede llamar desde sí mismo.

En la POO, las clases tienen `atributos` y `métodos`. Por decirlo de alguna manera, la clase calculadora, tiene números y los puede sumar. En python, los métodos se definen dentro de las clases y se llaman desde el objeto aplicando un paréntesis. Esta es la otra manera de llamar funciones que nos estaba faltando. Veámosla...

In [None]:
# llamemos la función que creamos enteriormente...
sumar(iterable)

20

In [None]:
# hagamos lo mismo, sumar todos los elementos de un iterable pero ahora usando numpy...
import numpy as np

In [None]:
# hasta ahora tenemos el mismo resultado
np.sum(iterable)

20

Tratemos ahora de sumar los elementos de nuestra lista pero pensando a la suma como una propiedad que esta tiene y puede aplicar sobre sí misma. Es decir como si puedese hacerlo por el hecho de ser una lista:

In [None]:
# veamos qué sucede
iterable.sum()

AttributeError: ignored

Queda claro por el error. La lista no cuenta con un método integrado que permita automáticamente sumar los elementos que la componen. Pero no ocurre lo mismo con los objetos de numpy. Continuemos con el ejemplo y veamos por qué...

In [None]:
# convertimos nuesta lista en un array de numpy
np.array(iterable).sum()

20

Ahora que ya revisamos esto, tenemos en claro que los métodos se llaman o ejecutan desde el objeto mismo mientras que las funciones lo hacen por fuera y aplicando parámetros a una expresión. 

Revisemos ahora algunas formas alternativas de aplicar funciones y de llamar métodos que nos serán realmente útiles.