# Introducción a la programación con Python

### Clase I

- [Presentación](#Presentación-Humai)
- [¿Por qué Python?](#Python)
- [Defininendo DS, IA, ML, DL...](#DS,IA,ML,DL...)
- [Tipos de Variables](#Variables)
- [Numéricos](#Numéricos)
- [Booleanos](#Booleanos)
- [String](#String)
- [Listas](#Listas)
- [Diccionarios](#Diccionarios)
- [Sets](#Sets)
- [Condicionales](#Condicionales)
- [Búcles](#Búcles)

## Python

- Elegante, sencillo
- Comunidad y accesibilidad
- Desarrollos de estado del arte
- Flexibilidad "full stack"
- Multi-paradigma

https://insights.stackoverflow.com/trends?tags=python%2Cr%2Cmatlab

# IDEs

### Spyder

<img src = 'https://docs.spyder-ide.org/_images/mainwindow_default_1610.png' style = 'width: 1500px;'/>

### Pycharm

<img src = 'https://www.marsja.se/wp-content/uploads/2017/07/PyCharm-IDE-vs-Spyder-IDE-Best-Python.png' style = 'width: 1500px;'/>

### VS Code 

<img src = 'https://user-images.githubusercontent.com/1487073/58344409-70473b80-7e0a-11e9-8570-b2efc6f8fa44.png' style = 'width: 1500px;'/>


# Hola Jupyter!

En esta _notebook_ conoceremos el entorno Jupyter (o Google Colaboratory, una versión online gratuita), interfaz incluida en la instalación de [Python](https://en.wikipedia.org/wiki/Python_(programming_language)) ampliamente usada para Data Science llamada [Anaconda](https://www.anaconda.com/distribution/). Para seguir el curso offline, luego de descargar e instalar Anaconda, ejecutar en la terminal

> jupyter lab

Cada una de estas _celdas_ funciona como un bloque donde podemos escribir texto plano, Latex, HTML, además de ejecutar código Python, R, bash y otros. 

$$\bar{x} = \frac{1}{n} \sum_{i=1}^n x_i$$

In [6]:
import plotly.express as px
import numpy as np

df = px.data.gapminder().query("year == 2007")
df["world"] = "world"

fig = px.treemap(df, path=['world', 'continent', 'country'], values='pop',
                  color='lifeExp', hover_data=['iso_alpha'],
                  color_continuous_scale='RdBu',
                  color_continuous_midpoint=np.average(df['lifeExp'], weights=df['pop']))
fig.show()

# Declarando variables 

Existen distintos tipos de variables:
- int: entero
- float: punto flotante
- string: cadena de caracteres
- bool: booleano, 0, 1, True o False

Y estructuras de datos, como:
  - list: lista de elementos (de cualquier tipo, incluida otra lista)
  - dict: "diccionario", conjunto de pares llave:valor
  
Veamos un primer ejemplo

In [4]:
primera_variable = 'Hola mundo!'

primera_variable

'Hola mundo!'

Declaramos una variable llamada *primera_variable* asignándole el valor de "Hola mundo!". La **función print** toma entre paréntesis esa variable y muestra el valor en pantalla. 

## Numéricos

In [8]:
# Declaramos dos variables de tipo numérico
x = 5
y = 12.1

In [10]:
# Podemos hacer las operaciones numéricas usuales
print(x+y) # suma
print(x*2) # multiplicacion
print(x**(1/2)) # elevado a 

17.1
10
2.23606797749979


In [4]:
# Operaciones numéricas - Divisiones
print(y / x) 
#Devuelve el dividendo 
print(y // x) 
#Devuelve el resto
print(y % x)

3.025
3.0
0.09999999999999964


Otros ejemplos:

In [12]:
# Otros ejemplos

un_string = 'variable de ejemplo'
un_bool = True

La **función** _type_ recibe de **argumento** una **variable** y **devuelve** su tipo

In [33]:
type(x), type(y)

(int, float)

Intentemos la siguiente suma...

¿Qué paso?

Si **convertimos** el string "10" a tipo int

In [158]:
5 + int('10')

15

Cada tipo de variable responde a ciertos **métodos**. Veamos las operaciones lógicas, que utilizan **booleanos**

## Booleanos

In [37]:
# Operaciones lógicas
print(10 >= 9)

True


In [43]:
print("palabra" == "palabra")
print("otras palabras" != "otras palabras") 

True
False


In [17]:
print("test" in "testing")

a = 'testing'

print('test' in a)

True
True


Los operadores disponibles son: 

    Relacionales:
    - >= , <=, <, > : Mayor o igual, menor o igual, mayor o menor
    - != , == : Distinto, Igual
    - in : Contenido por 
    Lógicos:
    - not o ~ : Negación
    - and o & : Ambas verdaderas
    - or o | : Una u otra es verdadera
    
Como booleanos, se pueden utilizar tanto 0 y 1 como True y False.

## Strings

In [47]:
"dos strings se pueden " + "sumar"

'dos strings se pueden sumar'

Podemos acceder a ellos mediante **índices**. Los mismos funcionan para cualquier **iterable**, que es un objeto con muchos elementos que son accesibles secuencialmente. 

El índice se escribe entre corchetes [ ] y tiene **hasta** 3 valores:
    
    [comienzo : final : intervalo]
    
El primer valor de la lista se corresponde al índice 0. El intervalo que se recibe es semi-abierto (indice_primero, indice_segundo], es decir se incluye el primero y no el segundo valor.

Se admiten números negativos, que contabilizan desde el final.

In [28]:
string = "banco interamericano de desarrollo"

In [29]:
string[0]

'b'

In [30]:
string[3::2]

'c neaeiaod earlo'

In [31]:
string[::-2]

'olrae doaieaen ca'

Veamos algunos otros métodos de los strings

In [41]:
banco.upper()

'BANCO INTERAMERICANO DE DESARROLLO'

In [26]:
string.title()

'Banco Interamericano De Desarrollo'

In [52]:
string.split()[-1]

'desarrollo'

In [57]:
# Rellenamos un string con variables.format(query, modales)
query = 'data science'
modales = 'por favor'

'Dame información de {0} si esta disponible, {1}'.format(query, modales)

'Dame información de data science si esta disponible, por favor'

In [70]:
#Otra manera
print(f'Dame información de {query.upper()} si esta disponible, {modales}')
'hola', f'La raiz cuadrada de dos es {2 ** (1/2)}'

Dame información de DATA SCIENCE si esta disponible, por favor


('hola', 'La raiz cuadrada de dos es 1.4142135623730951')

Otros métodos a mencionar son:

In [64]:
"1000".isdigit()

True

In [67]:
string.replace(' ', '...')

'banco...interamericano...de...desarrollo'

In [2]:
"   quitando espacios  ".strip()

'quitando espacios'

In [None]:
# 

## Listas

Las listas son un conjunto de elementos ordenados. Estos elementos pueden ser de cualquier tipo, incluyendo otras listas. Veamos algunas operaciones con ellas.

In [72]:
friends = ['Mateo', 'Nico', 'Claudia', 'Ernestina', 'Paola']
ages = [30, 40, 38, 30, 37]

In [73]:
# Indexación
print(friends[2:5])

['Claudia', 'Ernestina', 'Paola']


In [74]:
# Agregar un nuevo elemento
friends.append('Chicharito')
print(friends)

friend = friends + ['Chicharito']

x = 10

x = x +3

x

['Mateo', 'Nico', 'Claudia', 'Ernestina', 'Paola', 'Chicharito']


13

In [77]:
# Sumarle otra lista
friends = friends + ['Pipi', 'Toto']
print(friends) 

['Mateo', 'Nico', 'Claudia', 'Ernestina', 'Paola', 'Chicharito', 'Pipi', 'Toto', 'Pipi', 'Toto']


In [93]:
# Unir una lista con un separador dado
ejemplo = ['valor1', 'valor2', 'valor3']
';'.join(ejemplo)

'valor1;valor2;valor3'

In [94]:
# Borrado por valor
friends.remove('Mateo')
print(friends)

['Nico', 'Claudia', 'Ernestina', 'Paola', 'Chicharito', 'Pipi', 'Toto']


In [95]:
# Borrado por índice
del friends[0]
print(friends)

['Claudia', 'Ernestina', 'Paola', 'Chicharito', 'Pipi', 'Toto']


In [78]:
# Devuelve un elemento y lo borra de la lista
valor = friends.pop(0)

In [None]:
# Otros métodos

# Cantidad de apariciones
print(ages.count(30))
# Largo de la lista
print(len(ages))
# Ordenar la lista
sorted(ages)

In [84]:
# Total
print(sum(ages))
# Mínimo
print(min(ages))
# Máximo
print(max(ages))

sum(ages) / len(ages)

175
30
40


35.0

## Sets

Un **set** es un conjunto **no ordenado** de elementos **únicos**

In [59]:
un_set = {'primero', 'segundo', 'cuarto'}
otro_set = {'primero', 'segundo', 'quinto', 'octavo'}

In [61]:
# Diferencia
print(otro_set - un_set)
# Union
print(un_set | otro_set) 
# Intersección
print(un_set & otro_set)
# Diferencia (simétrica, el complemento a la intersección)
print(un_set ^ otro_set)

{'octavo', 'quinto'}
{'segundo', 'primero', 'octavo', 'cuarto', 'quinto'}
{'primero', 'segundo'}
{'octavo', 'cuarto', 'quinto'}


In [33]:
lista = [1,1,3,3,7,1]
s1 = set(lista)
s2 = set([5,1,2,7,3])
s1 | s2

{1, 2, 3, 5, 7}

In [38]:
# Veamos qué elementos están en ambos diccionarios

d1 = {'m':'z', 'a':3, 'c': None}
d2 = {'n':2, 'x':True, 'a':9}

set1 = set(d1.keys())
set2 = set(d2.keys())

set(d1.keys())

{'a', 'c', 'm'}

## Diccionarios

Los diccionarios consisten en estructuras que contienen pares de una **llave** y un **valor**. Veamos un ejemplo

In [86]:
dnis = {'Herrera':32676585, 'Guzmán':9564787, 
        'Pérez':5676898, 'Hernández':40565999, 
        'Abraham':28375814} 

In [37]:
# Accedemos al valor de "Abraham"
dnis['Abraham'] 

28375814

In [38]:
# Podemos ver todas las llaves
dnis.keys()

dict_keys(['Herrera', 'Guzmán', 'Pérez', 'Hernández', 'Abraham'])

In [87]:
# Traer todos los pares de elementos
dnis.items()

dict_items([('Herrera', 32676585), ('Guzmán', 9564787), ('Pérez', 5676898), ('Hernández', 40565999), ('Abraham', 28375814)])


In [41]:
# Y utilizar los mismos métodos para borrar y extrar como en las listas
dnis.pop('Herrera')

32676585

## Condicionales

El condicional tiene la siguiente sintáxis:

    if CONDICIÓN:
        código1
    elif CONDICIÓN2:
        código2
    else:
        código3
        
Donde la condición es un operador que devuelve un objeto de tipo booleano. La **indentación** del código define qué parte se incluye como condicional.

In [89]:
precio_dolar = 62

if precio_dolar >= 90:
    print("El dólar se fue por las nubes")
elif (precio_dolar < 90) and (precio_dolar >= 70):
    print("El dolar subió")
else: 
    print("El dólar es menor a 70")

print(precio_dolar)

El dólar es menor a 70
62


## Bucles o Loops

Los bucles son un tipo de sentencia donde se realiza el código contenido repetidamente. Existen dos tipos. En el bucle **for**, se **itera** o recorre un conjunto de elementos actuando por cada uno de ellos. 

También agreguemos la funcion **range** a nuestro repertorio:

In [108]:
for n in [1,2,'3']:
    print(f'EL tipo es {n*2} {type(n*2)}')

EL tipo es 2 <class 'int'>
EL tipo es 4 <class 'int'>
EL tipo es 33 <class 'str'>


In [48]:
lista = [1,2,3,4,5]

for n in lista:
    print(n * 2)

2
4
6
8
10


In [118]:
lista = ['intal',2,3,4]
lista[0][2]

't'

Combinando un poco lo visto

In [121]:
medios = ["cheques", "pesos", "dolares", 10341, "transferencia"]
for x in medios:
    if type(x) == int:
        print(x)

10341


Los bucles **while** se definen con una condición, y el código contenido se ejecuta mientras la misma evalue como True

In [None]:
# Variable contadora

count = 0

while count < 20:
    count + 1
    print(count)

---

## Recursos y tips


- [Google!](https://google.com)
- [StackOverflow](https://stackoverflow.com)
- [Lista de recursos](https://github.com/cerebrock/notes)
- [Kaggle](https://kaggle.com)
- [Google Colab](https://colab.research.google.com)

--- 

## Tips en la práctica

- Ver _docstring_ con Shift + TAB o help()
- Leer Errores
- Print y Debug