![](https://api.brandy.run/core/core-logo-wide)

# Python Basics: Data Types and Operations

## ¿Qué es Python?
[Python](https://en.wikipedia.org/wiki/Python_(programming_language)) es un lenguaje de programación `imperativo` y de `alto nivel`, creado por Guido van Rossum y mantenido por la Python Software Foundation.

Ese lenguaje tuvo su lanzamiento en el año 1991. Con más de 30 años, Python sigue siendo un lenguaje de programación moderno, con cada vez más uso en la industria y con una comunidad cada vez mayor de desarolladores dedicados a ese lenguaje.

Por su flexibilidad, sintaxis clara y amplo suporte (por su comunidad y gran cantidad de librerias open source) es un favorito entre Data Analysts, Data Scientists, com amplo uso para el Machine Learning y el Big Data.

### El alto nivel
No es presunción llamar a Python un lenguaje de alto nivel. 😎

En programación alto y bajo nivel tiene un significado específico.

![High Level](img/high_level.png)

Todos los ordenadores dependen de algun tipo de CPU, ese es el componente electrónico responsable por el procesado. Muchas veces oímos que la CPU es el cerebro del ordenador y por lo tanto imaginamos que funcione como nuestro cerebro, pero eso está muy lejos de la verdad. La CPU simplemente procesa impulsos y señales eléctricas que nosotros representamos como unos y ceros.

Decir que un lenguaje de programación es de bajo nivel significa que programar en ese lenguaje es programar más cercano a esos señales y impulsos electricos. Sin ninguna abstracción, estariamos basicamente dibujando cosas complejas con componentes muy primitivos.

De ahí el nacimieto y evolución de los lenguajes de alto nivel, cuyo proposito es permitir que podamos programar con un lenguaje lo más parecido con un lenguaje natural como el inglés. Eso permite que escribamos programas más complejos y de manera más eficiente, mientras el proprio ordenador maneja los detalles fisicos del procesador. 👾

<div style="width: 100%;">
        <div style="width: 50%; float: left"> 
            <img/ src="img/cpu.jpeg">
        </div>
        <div style="margin-left: 50%;;"> 
            <img/ src="img/cpu_inside.png" width=400>
        </div>
    </div>
    
A la derecha vemos el interior de un procesador 1802, de 8 bit del año 1974. ¡Los ordenadores que tenemos hoy son mucho más complejos!

### ¡Imperativo!

El hecho de llamar a python (y otros lenguajes) de imperativos tiene que ver con su propósito, dar ordenes. Un script, el codigo de un programa, son una serie de instrucciones para que el ordenador siga. A una serie de instrucciones también se llama `algoritmo`. 

En un lenguaje de programación de lo más alto nivel posible (inimaginable), programar seria decir al ordenador `haz eso`. Pero todavía no hemos conseguido un ordenador capaz de entender eso. Con lo que tienen de rápidos para la matematica, les falta en logica (y sentido comun). 🤣

Por lo tanto tenemos que partir lo que queremos en instrucciones más pequenitas, que los ordenadores puedan comprender. Y para eso usamos de un lenguaje, como Python, que define una serie de reglas estruturadas para eso.

## La sintaxis

Como todo lenguaje, Python tiene sus reglas, a las cuales nos referimos como `sintaxis`. Esas reglas son los elementos básicos del lenguaje y la manera como combinamos y interactuamos con ellos.

### Las variables

La variable es un contenedor de algun objeto, y esos objetos son los elementos más básicos, los átomos de un programa. En Python, todos los elementos son objetos y esos objetos pueden ser de diferentes tipos:

![Data Types](img/data_types.png)

Los tipos (o classes) arriba son aquellos que consideramos como los tipos básicos de datos. Además de esos, python contiene por defecto los tipos `None`, `function` y `type`.

Pero no nos limitamos a los tipos por defecto, sino que también se pueden crear nuevos tipos. Al largo de nuestra trayectoria en Python utilizaremos objetos de muchos tipos y podremos crear también nuestros próprios.

Las variables pueden contener objetos de cualquier tipo, pero es importante conocer los tipos de nuestras variables pues no todas las operaciones son compatibles con cualquier tipo.

In [4]:
for tipo in [1, 2.2, 5+7j, {1:2}, True, {1}, "1", (1,2), [1], None, print, int]:
    print(f"{tipo} -> {type(tipo)}")

1 -> <class 'int'>
2.2 -> <class 'float'>
(5+7j) -> <class 'complex'>
{1: 2} -> <class 'dict'>
True -> <class 'bool'>
{1} -> <class 'set'>
1 -> <class 'str'>
(1, 2) -> <class 'tuple'>
[1] -> <class 'list'>
None -> <class 'NoneType'>
<built-in function print> -> <class 'builtin_function_or_method'>
<class 'int'> -> <class 'type'>


## Methods and Operations
En esa lección vamos repasar algunos de los tipos patrón de Python, sus operaciones y metodos. Un metodo es una función, pero que pertenence a un tipo de dato específico. Se pueden identificar por la manera como se llaman a esas funciones.

Al llamar un metodo, lo hacemos despues del objeto, separando por un `.`, tal como en:

```python
string = "The quick brown fox jumps over the lazy dog"
string.split(" ")
```

### String
Un string es una cadena de texto, i.e.: un contenedor de caracteres. Son ordenados y poséen index. Veamos algunos de sus metodos.

#### Operators
Los operadores matematicos muchas veces tienen diferentes significados en diferentes tipos de datos. Para los strings, los siguientes operadores:

- +
El operador `+` significa concatenar strings, poner uno seguido del otro, por lo tanto se usa entre 2 strings.

- *
La "multiplicación" no se usa entre dos strings, sino que entre un string y un entero y significa concatenar el string n veces.

In [5]:
a = '-'
b = '*'

In [6]:
a+b

'-*'

In [7]:
a-b

TypeError: unsupported operand type(s) for -: 'str' and 'str'

In [8]:
a*b

TypeError: can't multiply sequence by non-int of type 'str'

In [9]:
a*50

'--------------------------------------------------'

In [10]:
a/50

TypeError: unsupported operand type(s) for /: 'str' and 'int'

In [11]:
"ab"*5

'ababababab'

In [12]:
a*1.5

TypeError: can't multiply sequence by non-int of type 'float'

In [13]:
a*(5+3j)

TypeError: can't multiply sequence by non-int of type 'complex'

#### Case methods
Hay algunos metodos particulares de los strings que se usan para verificar y convertir los caracteres en el string.

In [27]:
a = "Hola"
b = "12235"

In [18]:
a.isalpha()

True

In [19]:
b.isalpha()

False

In [24]:
a = "1"

In [25]:
a.isalpha()

False

In [26]:
a.isalnum()

True

In [28]:
a.islower()

False

In [29]:
a.isupper()

False

#### Positioning strings
Metodos usados para cambiar la posición de los caracteres en los strings.

In [32]:
x = "Hola me llamo Antonio, pero mis amigos me llaman 'Anthony'"

In [34]:
len(x)

58

In [35]:
x.center(60)

" Hola me llamo Antonio, pero mis amigos me llaman 'Anthony' "

In [41]:
x = "       Hola        "

In [40]:
x.lstrip()

'Hola'

In [42]:
x.lstrip().rstrip()

'Hola'

In [43]:
x.strip()

'Hola'

In [45]:
x = x.strip()

In [46]:
x

'Hola'

In [49]:
x[1] = "6"

TypeError: 'str' object does not support item assignment

#### Other methods

In [56]:
x = "Holllllla"

In [61]:
x.replace("l", "5")

'Ho555555a'

In [62]:
h = x.replace("l", "5")

In [63]:
x

'Holllllla'

In [64]:
h

'Ho555555a'

In [67]:
dir("hola")

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getnewargs__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mod__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmod__',
 '__rmul__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'capitalize',
 'casefold',
 'center',
 'count',
 'encode',
 'endswith',
 'expandtabs',
 'find',
 'format',
 'format_map',
 'index',
 'isalnum',
 'isalpha',
 'isascii',
 'isdecimal',
 'isdigit',
 'isidentifier',
 'islower',
 'isnumeric',
 'isprintable',
 'isspace',
 'istitle',
 'isupper',
 'join',
 'ljust',
 'lower',
 'lstrip',
 'maketrans',
 'partition',
 'removeprefix',
 'removesuffix',
 'replace',
 'rfind',
 'rindex',
 'rjust',
 'rpartition',
 'rsplit',
 'rstrip',
 'split',
 'splitlines',
 'startswith',
 'strip',
 'swapcase',


In [70]:
x

'Holllllla'

Con la `?` podemos obtener información sobre los metodos, los parametros que recibe y el resultado que devuelve. Es posible que no todas las funciones proporcionen esta información.

In [71]:
x.find?

[0;31mDocstring:[0m
S.find(sub[, start[, end]]) -> int

Return the lowest index in S where substring sub is found,
such that sub is contained within S[start:end].  Optional
arguments start and end are interpreted as in slice notation.

Return -1 on failure.
[0;31mType:[0m      builtin_function_or_method


In [72]:
"hola".find("la")

2

In [77]:
for char in "Hola":
    print(char)

H
o
l
a


In [78]:
x = "Hola me llamo Antonio, pero mis amigos me llaman 'Anthony'"

In [90]:
x[::-1]

"'ynohtnA' namall em sogima sim orep ,oinotnA omall em aloH"

In [98]:
x = "12345"

In [99]:
num = int(x)
type(num)

int

Hay muchos otros métodos de los strings que podéis investigar y utilizar. Citamos algunos más, pero no son todos. Una lista completa puede ser encontrada en las referencias al final.

- count
- startswith
- endswith
- index
- join
- split
- zfill

### List
En las listas, los operadores `+` y `*` funcionan de manera muy parecida con los strings.

#### Operators

In [101]:
a = [1,2,3,4,5]
b = ["H","o", "l", "a"]
c = [print, type]
d = [{2:1}]
e = [print, 1, "h", {1:2}]

In [103]:
a+b

[1, 2, 3, 4, 5, 'H', 'o', 'l', 'a']

In [104]:
a*5

[1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 1, 2, 3, 4, 5]

#### Including methods

In [106]:
a[0] = 5

In [107]:
a

[5, 2, 3, 4, 5]

In [109]:
x = "hola"
x[0]="j"

TypeError: 'str' object does not support item assignment

In [125]:
a.append("g")

In [111]:
a

[5, 2, 3, 4, 5, 'g']

In [113]:
a.insert(3, "Hola")

In [114]:
a

[5, 2, 3, 'Hola', 4, 5, 'g']

In [115]:
dir(a)

['__add__',
 '__class__',
 '__class_getitem__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__iadd__',
 '__imul__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__rmul__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'append',
 'clear',
 'copy',
 'count',
 'extend',
 'index',
 'insert',
 'pop',
 'remove',
 'reverse',
 'sort']

#### Removing methods

In [118]:
a

[5, 2, 3, 'Hola', 4, 5, 'g']

In [121]:
a[-1]

'g'

In [126]:
expulsado = a.pop()

In [127]:
a

[5, 2, 3, 'Hola', 4, 5]

In [128]:
expulsado

'g'

No es posible eliminar un valor de una lista cuando este no se encuentra dentro de ella.

In [133]:
a.remove(5)

ValueError: list.remove(x): x not in list

In [132]:
a

[2, 3, 'Hola', 4]

In [134]:
a.count(2)

1

In [142]:
a = [1,6,12,4,5]

In [143]:
sorted(a)

[1, 4, 5, 6, 12]

In [144]:
a

[1, 6, 12, 4, 5]

In [140]:
a.sort()

In [141]:
a

[1, 4, 5, 6, 12]

In [146]:
a.sort(reverse=True)

In [147]:
a

[12, 6, 5, 4, 1]

In [148]:
a.sort?

[0;31mSignature:[0m [0ma[0m[0;34m.[0m[0msort[0m[0;34m([0m[0;34m*[0m[0;34m,[0m [0mkey[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m [0mreverse[0m[0;34m=[0m[0;32mFalse[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m
Sort the list in ascending order and return None.

The sort is in-place (i.e. the list itself is modified) and stable (i.e. the
order of two equal elements is maintained).

If a key function is given, apply it once to each list item and sort them,
ascending or descending, according to their function values.

The reverse flag can be set to sort in descending order.
[0;31mType:[0m      builtin_function_or_method


In [149]:
x = [[1,5,2],[5,1,45],[6,2,7],["hola",10,"jose"]]

In [150]:
x

[[1, 5, 2], [5, 1, 45], [6, 2, 7], ['hola', 10, 'jose']]

In [151]:
x.sort(key= lambda x: x[1])

In [152]:
x

[[5, 1, 45], [6, 2, 7], [1, 5, 2], ['hola', 10, 'jose']]

In [153]:
x = ["a","c","d","h", "A", "lam"]

In [154]:
x.sort()

In [155]:
x

['A', 'a', 'c', 'd', 'h', 'lam']

#### Other

Otros métodos de las listas incluyen:

- count
- extend
- index
- reverse
- sort

### Tuple
Como elementos inmutables, las tuplas poséen apenas 2 métodos:

In [160]:
tupla = (1,)

In [161]:
type(tupla)

tuple

In [162]:
tupla[0]

1

In [163]:
tupla[0]=5

TypeError: 'tuple' object does not support item assignment

Aunque las tuplas sean inmutables, es posible cambiar el contenido de un diccionario/lista que se encuentre dentro de está. No es posible cambiar ese diccionario/lista por otro tipo de datos.

In [171]:
t = ({1:1},[1,2,3], 5)

In [167]:
t

({1: 1}, [1, 2, 3])

In [172]:
t[0][2]=10

In [173]:
t

({1: 1, 2: 10}, [1, 2, 3], 5)

In [178]:
t[0] = 6

TypeError: 'tuple' object does not support item assignment

In [179]:
dir(t)

['__add__',
 '__class__',
 '__class_getitem__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getnewargs__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmul__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'count',
 'index']

In [183]:
j = t +(12,57)

In [185]:
j + ("Hola",)

({1: 1, 2: 10}, [1, 2, 3], 5, 12, 57, 'Hola')

### Dictionary

Los 3 principales metodos que vamos utilizar de los diccionarios son aquellos que devuelven sus elementos. Veamos.

In [186]:
dir(dict)

['__class__',
 '__class_getitem__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__ior__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__ne__',
 '__new__',
 '__or__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__ror__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'clear',
 'copy',
 'fromkeys',
 'get',
 'items',
 'keys',
 'pop',
 'popitem',
 'setdefault',
 'update',
 'values']

In [263]:
d = {1:2, 2:"Hola"}

In [264]:
d.keys()

dict_keys([1, 2])

In [265]:
list(d.keys())

[1, 2]

In [266]:
d.values()

dict_values([2, 'Hola'])

In [267]:
d.items()

dict_items([(1, 2), (2, 'Hola')])

Para añadir datos al diccionario, debemos indicar la `key` y el `value`

In [268]:
d["Saludo"] = "Good morning"

In [269]:
d

{1: 2, 2: 'Hola', 'Saludo': 'Good morning'}

In [260]:
d = {"tipo":type, "tamaño":len}

In [261]:
d

{'tipo': type, 'tamaño': <function len(obj, /)>}

In [262]:
for funcion in d.values():
    if funcion([123,3,4,6]) != "None":
        print(funcion([123,3,4,6]))

<class 'list'>
4


La funcion `get` devuelve el `value` de la `key` indicada. Si esta no existe, devuelve el valor del segundo parametro

In [228]:
d.get(5, "No existe")

'No existe'

Como esos metodos devuelven listas, se pueden iterar por ellos.

In [230]:
for k,v in d.items():
    print(f"Key:{k} \tValue:{v}")

Key:imprime 	Value:<built-in function print>
Key:tamaño 	Value:<built-in function len>


### Set

Los sets también son un tipo de dato en python que contienen muchos métodos. Algunos de los de los más interesantes son aquellos que se relacionados con la noción matemática de los [conjuntos](https://en.wikipedia.org/wiki/Set_(mathematics))

In [231]:
dir(set)

['__and__',
 '__class__',
 '__class_getitem__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__iand__',
 '__init__',
 '__init_subclass__',
 '__ior__',
 '__isub__',
 '__iter__',
 '__ixor__',
 '__le__',
 '__len__',
 '__lt__',
 '__ne__',
 '__new__',
 '__or__',
 '__rand__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__ror__',
 '__rsub__',
 '__rxor__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__sub__',
 '__subclasshook__',
 '__xor__',
 'add',
 'clear',
 'copy',
 'difference',
 'difference_update',
 'discard',
 'intersection',
 'intersection_update',
 'isdisjoint',
 'issubset',
 'issuperset',
 'pop',
 'remove',
 'symmetric_difference',
 'symmetric_difference_update',
 'union',
 'update']

A la hora de definir el tipo de dato, si queremos definir un set, tenemos que hacerlo explicitamente, ya que comparte sintaxis con el diccionario

In [232]:
s = {}

In [233]:
type(s)

dict

In [234]:
s = set()

In [235]:
type(s)

set

In [244]:
numeros = {1,2,3,4,5,6,7,8,9,10,11}
pares = set(range(0,11,2))

In [245]:
pares

{0, 2, 4, 6, 8, 10}

In [246]:
impares = set(range(1,11,2))

In [247]:
impares

{1, 3, 5, 7, 9}

In [248]:
primos = {1,2,3,5,7,11}

In [249]:
primos.issubset(numeros)

True

In [250]:
numeros.issubset(primos)

False

Una propiedad de los `set` es que no puede haber valores repetidos.

In [251]:
s = {1,1,1,1,1,1,1,1,1,1,1}

In [252]:
s

{1}

In [253]:
pares.union(impares)

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

## Resources
- [String methods](https://www.w3schools.com/python/python_ref_string.asp)
- [List methods](https://www.w3schools.com/python/python_ref_list.asp)
- [Tuple methods](https://www.w3schools.com/python/python_ref_tuple.asp)
- [Dictionary methods](https://www.w3schools.com/python/python_ref_dictionary.asp)
- [Set methods](https://www.w3schools.com/python/python_ref_set.asp)
- [Python built-in methods](https://www.w3schools.com/python/python_ref_functions.asp)