In [None]:
print("Hola mundo")

# Introducción a Python

### Lenguajes de programación:
Objetivo: traducir algo entendible en ristras de 1 y 0 (_lenguaje máquina_). Un lenguaje de programación es un set de sintaxis, reglas y especificaciones sobre cómo hacer este proceso.
Es común usar como sinónimos los _lenguajes de programación_, que no son más que esas especificaciones, y su _implementación_, que es el programa (compilador o intérprete) que lleva adelante ese proceso.

#### Lenguajes interpretados vs lenguajes compilados
Imaginemos que tenemos que dar una charla en japonés. Tenemos dos opciones: pasarle la charla antes a un traductor (compilador) y que la traduzca entera, o tener un intérprete, que la traduce en simultáneo.

Compilados: C, Fortran, C++, Rust, Java, Typescript, etc.
Interpretados: Python, R, Ruby, MATLAB, etc.

(algo medio intermedio: Javascript, Julia)

#### Nociones bases
**tipos**: Cada dato tiene asociado un _tipo_. Los tipos más básicos son: enteros (int), números con coma (float), booleanos (True o False), tiras de caracteres (string). Aparte, hay otros tipos como listas, tuplas, vectores, etc.

En Python, los tipos son dinámicos (pueden cambiar) y se asignan solos.


_Nota_: Todos los lenguajes tienen alguna forma de agregar _comentarios_, es decir, algo que el compilador/intérprete ignoran, pero hace más fácil entender el código. En Python, agregamos comentarios de una línea con #.
Podemos agregar comentarios de múltiples líneas rodéandolos con tres comillas.

## Variables

Son _cajas_ donde se guarda algo en memoria. En Python (como en la mayoría de los lenguajes) se asignan con un símbolo de "=". OJO: no comparan, asignan. Para comparar, usamos "=="

In [None]:
# Para analizar un tipo, usamos la función type

print(type(2))

In [None]:
print(type(2.))

In [None]:
print(type("2"))

In [None]:
print(type([2, 2]))

In [None]:
print(type(True))

In [None]:
print(2 == 2)

In [None]:
print(2 == 3)

Cada tipo se comporta distinto

In [None]:
print(2 + 2)

In [None]:
print(2. + 2.)

In [None]:
print("2" + "2")

In [None]:
print([2] + [2])

In [None]:
x = 2
y = 3

print(x == y)
print(x != y) # != es el símbolo para "distinto"

OJO con mezclar tipos de datos

In [None]:
#"2" + 2
#"2" * 2
#"2" * "2"

OJO, no confundir = con ==

In [None]:
x = 2
y = 3

x == y

In [None]:
x = y
x == y

##### Operaciones básicas de números

Suma "+"  
Resta "-"
Multiplicación "\*"
División flotante "/"
División entera "//"
Módulo (el resto que queda de una división entera) "%"
Potencia "\*\*"


In [None]:
x = 10
y = 3

print(" x+y = ", x+y)
print(" x-y = ", x-y)
print(" x*y = ", x*y)
print(" x/y = ", x/y)
print("x//y = ", x//y)
print(" x%y = ", x%y)
print("x**y = ", x**y)

print("\n\nLos flotantes en la computadora se representan de forma medio particular\n" +
      "lo que puede llevar a algunas cosas locas")
print("0.1 + 0.2 = ", 0.1 + 0.2)

## 

## Agrupar

En muchos lenguajes, se agrupa con {}. En Python, en cambio, se agrupa con la indentación

Por ejemplo (vamos a ver qué es una función después)

**def** funcion1():  
&emsp; &ensp;    accion 1    
&emsp; &ensp;    accion 2    

La acción 1 y la acción 2 están en funcion1

**def** funcion2():  
&emsp; &ensp; accion1  
accion2

sólo la acción 1 está adentro de la funcion2

## Condiciones
Hacen algo _si_ se cumple una condición.

En Python, se hacen con 

**if** condicion1:  
&emsp; &ensp;    accion 1  
**elif** condicion2:  
&emsp;  accion 2  
**elif** condicion3:  
&emsp;  accion 3  
**else**:  
&emsp;  accion 4  
    


In [None]:
x = 2

if x == 2:
    print("x es 2, entró el primer if")

print("\n\n+++++++++\n\n") #\n es un "enter"
if x == 3:
    print("x no es 2")
else:
    print("no entró el if")
    print("x es", x)  # Hay formas más piolas de usar el print

## Loops
Un loop es algo que itera sobre algo. Python es famosamente **lento** para ejecutar loops. Hay dos tipios clásicos de loop:
#### for
Itera sobre valores predeterminados (iterables):

In [None]:
for i in range(10):
    print(i)

#### while
Itera siempre que se cumpa una condición (OJO: riesgo de loop infinito si la condición se cumple siempre)

In [None]:
i = 0
while i < 10:
    print(i)
    i = i+1

In [None]:
# Podría hacer algo más loco
# ATENCIÓN: ESTO ES CÓDIGO PÉSIMO, SOLO ESTÁ PARA EJEMPLIFICAR
a = True
i = 0
while a:
    print(i)
    i = i + 1
    if i >= 10:
        a = False
    

## Funciones

En general, todos los lenguajes permiten utilizar **funciones**. Las funciones son una serie de operaciones que se abstraen para simplificar el código. Acá estuvimos, ya, usando funciones. Las funciones _siempre_ se indican con ().
print(), por ejemplo, está entendiendo qué es lo que le damos, y copiándolo al standard output.
type() identifica el tipo de un dato.

En Python, las funciones se definen con **def** . Se devuelve algo con **return**.

In [None]:
def suma_2_y_divide_por_3(x):
    return (x + 2) / 3

print(suma_2_y_divide_por_3(10))

In [None]:
def imprimir_triangulo_pascal():
    print("         1        ")
    print("       1   1      ")
    print("     1   2   1    ")
    print("   1   3   3   1  ")
    print(" 1   4   6   4   1")

imprimir_triangulo_pascal()

### Tipos iterables: Listas y tuplas

**lista**: una colección de objetos. Es _mutable_ (se puede cambiar).

**tupla**: más o menos lo mismo, pero _inmutable_.


#### Indexación
Los índices se indican con un []

Se puede indicar un rango como [inic: final+1]

**OJO**: Python cuenta desde 0, y llega hasta el valor anteúltimo.   
En una lista, por ejemplo, el primer valor será lista[0]

In [None]:
lista_de_enteros = [0, 1, 2, 3, 4]
print(lista_de_enteros)
lista_de_enteros[1] = 10  # fijense que lista_de_enteros[1] es el SEGUNDO valor
print(lista_de_enteros)

print(lista_de_enteros[0:2]) # Equivalente: lista_de_enteros[:2]

Intentemos lo mismo con una tupla: 
- ¿Qué pasa?
- ¿Cómo se lee un error?

In [None]:
print("\n")
tupla_de_enteros = (0, 1, 2, 3, 4)
print(tupla_de_enteros)
tupla_de_enteros[1] = 10
print(tupla_de_enteros)

### Diccionarios

Un diccionario es un tipo de dato en el que cada data se accede a través de una etiqueta en vez de una posición (conceptualmente, son datos "hasheables").

En Python, la forma _por default_ para declarar diccionarios es con llaves ({}), aunque si a alguien le confunden se puede declarar con la función dict().

Puede contener cualquier tipo de datos, incluidas listas o tuplas o, incluso, diccionarios de diccionarios.

In [None]:
pinguinos = {
    "Sudamerica": ["Magallanes", "Humboldt", "Galapagos"],
    "Africa": ["Anteojos"],
    "Antartida": ["Emperador", "Adelia",],
    "Islas_australes": ["Rey", "Saltarrocas austral", "Macaroni", "Azul", "Barbijo", "Papúa"],
    "Oceania": ["Fiordland", "Snares", "Real", "Sclater", "Patas blancas", "Ojigualdo",],
}
print(pinguinos.keys())
print()
print(pinguinos)  # Mostrar qué cambia con display
print()
print(pinguinos["Sudamerica"])
print()
print(pinguinos["Sudamerica"][0])



## Métodos

En primera aproximación, vamos a llamar métodos a funciones internas de un tipo (o, estrictamente, clase).

Se indican con un "."

In [None]:
# Ejemplo, append, opera inplace

lista_de_enteros = [0, 1, 2, 3, 4]
print(lista_de_enteros)

lista_de_enteros.append(5)

print(lista_de_enteros)

In [None]:
#Ejemplo, replace, opera por fuera

hello_world = "hola mundo"
print(hello_world)

hello_world = hello_world.replace("o", "^_^")
print(hello_world)

## Módulos

Son programas (en general, en C o en Python) o conjuntos de funciones/clases que se pueden _importar_.
Podemos crearlos nosotros o importar cosas preexistentes.

Nos van a importar sobre todo tres (hay UN MONTÓN): numpy, matplotlib y pandas.

Se importan como "import ..."

### Numpy: operaciones matemáticas y vectores altamente eficientes
Tiene precargadas una gran cantidad de operaciones. Su fama se debe a la capacidad de trabajar con matrices/vectores (en jerga, "numpy arrays"). Documentación: https://numpy.org/

In [None]:
import numpy as np

x = 5
raiz_x = np.sqrt(5)
print(raiz_x)

In [None]:
# Nuestro primer numpy array
lista_de_enteros = [0, 1, 2, 3, 4]
array_de_enteros = np.array(lista_de_enteros)

raiz_array_enteros = np.sqrt(array_de_enteros)
print(raiz_array_enteros) # Esto no anda sobre una lista

print("\n")
matriz = np.array([
    [0, 1, 2],
    [3, 4, 5],
    [6, 7, 8]
])

print("matriz")
print(matriz)
print("\n")

print("matriz transpuesta")
print(matriz.T)


### Matplotlib: Cómo graficar

Vamos a una librería bastante más compleja: matplotlib. Se basa en la idea de crear figuras, dentro de las cuáles se crean ejes que tienen propiedades. Vamos a ver los casos más simples. Para más detalle, ir a https://matplotlib.org/ .

RECOMENDACIÓN: Para mirar:
1. Notación de objetos en matplotlib (plt.axes, plt.figure, etc.).
2. Otras librerías para graficar (seaborn, hvplot, altair, etc.).
3. Librerías para mapas: cartopy.

In [None]:
# Creemos primero ristras de datos

import numpy as np  # En realidad, ya lo importamos antes, y no hace falta hacerlo de nuevo
import matplotlib.pyplot as plt

x = np.arange(0, 1, 0.1) # Crea un array que va de 0 a 0.9, cada 0.1

y = x ** 2
y2 = x * y
y3 = np.sqrt(x)
plt.plot(x, y, 'o', label="datos cuadráticos")
plt.plot(x, y2, '^-', label="datos lineales")
plt.plot(x, y3, 'x:', label="datos raíz")
plt.xlabel("Eje x")
plt.ylabel("Eje y")
plt.legend()
plt.show()

#### Object notation
Es muy común, en vez de usar plt.plot, definir una "figura", definir "ejes" y trabajar sobre eso. Repitamos el gráfico de arriba.

No voy a entrar en detalles, por ahora créanme que es más flexible, dado que **ax** y **fig** tienen su propia serie de métodos.

#### Un brevísimo comentario sobre los objetos

No vamos a entrar en detalles sobre qué es o no un objeto en computación. Como primera aproximación, podemos pensarlo como un "tipo" de datos, que tiene una serie de características, atributos y métodos (i. e., _funciones_) que le son propios. Un ejemplo simple de objeto son todos los tipos de datos que vimos al principio.

In [None]:
fig, ax = plt.subplots()
ax.plot(x, y, 'o', label="datos cuadráticos")
ax.plot(x, y2, '^-', label="datos lineales")
ax.plot(x, y3, 'x:', label="datos raíz")
ax.set_xlabel("Eje x")
ax.set_ylabel("Eje y")
ax.legend()
plt.show()

<span style="color:red">

### Tarea para el hogar

- Explorar los tipos de gráfico en **matplotlib**
- Hacer un multiplot con 4 gráficos (dos en cada fila)
</span>

### Por último, pandas

Permite trabajar con planillas de cálculo o csv (puede incluso leer excel).  
Se integra muy bien con numpy y matplotlib
Se basa en un objeto llamado "DataFrame", que es como una hoja de cálculo. Recomiendo la lecutra de https://pandas.pydata.org/docs/getting_started/index.html

In [None]:
#import pandas as pd
import numpy as np
import pandas as pd

#### Objetos principales

- pd.Series: es un array de objetos 1D de cualquier tipo
- pd.Dataframe: es una estructura de datos 2D, conceptualmente una tabla de doble entrada. Cada columna es un pd.Series.

##### Para trabajar
Lo más común es leer directamente un archivo csv o una hoja de Excel. Sin embargo, para entender lo que se hace, vamos a empezar creando algunos objetos a mano.

In [None]:
dates = pd.date_range("20150101", periods=50)
print(dates)
# Ejemplo, convirtamos una matriz en un dataframe
matriz = np.random.randn(50, 4)
print()
print(matriz)
print()
df = pd.DataFrame(matriz, index=dates, columns=list("ABCD"))
print(df)

**Funciones básicas**

In [None]:
print(df.describe())

In [None]:
print(df)
print("\nTranspuesta")
print(df.T)

In [None]:
df.plot(style='o:') # Usa matplotlib, y se puede tunear con eso muchísimo.

### Mapeo básico con Cartopy

Supongamos que queremos hacer un mapa. La librería por excelencia para esto es **cartopy**, que funciona muy bien en conjunto con matplotlib (y con las otras librerías de visualización que vamos a ver).

La documentación no tiene, en este caso, un hermoso "10 minutes to..." o ese tipo de cosas, pero es bastante completa y recomiendo mirarla.

In [None]:
import cartopy.crs as ccrs



ax = plt.axes(projection=ccrs.Mollweide(central_longitude=-100)) # PlateCarree es la típica proyección lat-lon

ax.stock_img()
ax.coastlines()
ax.gridlines()

plt.show()

In [None]:
import cartopy.feature as cfeature
#ax = plt.axes(projection=ccrs.Orthographic(central_longitude=-65, central_latitude=-20)) # PlateCarree es la típica proyección lat-lon
ax = plt.axes(projection=ccrs.Mollweide(central_longitude=-65)) # PlateCarree es la típica proyección lat-lon

ax.stock_img()
ax.coastlines()
#ax.coastlines(color='green')
ax.gridlines()
#ax.add_feature(cfeature.BORDERS)
ax.add_feature(cfeature.BORDERS, linestyle='-', edgecolor='gray')
#ax.tissot(facecolor='orange', alpha=0.4)

plt.show()

In [None]:
import cartopy.feature as cfeature

# Imaginemos que tenemos valores de algo en puntos. Se puede aplicar todo lo de matplotlib

lons = np.array([-56, -58, -62, -64, -62, -50])
lats = np.array([-32, -30, -34, -37, -31, -10])
variable_muyimportante = np.array([1, 2, 3, 4, 5, 4])


#ax = plt.axes(projection=ccrs.Orthographic(central_longitude=-65, central_latitude=-20)) # PlateCarree es la típica proyección lat-lon
ax = plt.axes(projection=ccrs.Mollweide(central_longitude=-65)) # PlateCarree es la típica proyección lat-lon

#ax.stock_img()
ax.coastlines()
ax.gridlines()
ax.add_feature(cfeature.BORDERS, linestyle='-', edgecolor='gray')

ax.set_extent([-100, -30, -58, 15])  #[x0, x1, y0, y1]

scatter = ax.scatter(
    lons, lats,
    transform=ccrs.PlateCarree(), # Transform indica en qué proyección están mis datos. Si los tengo en latitud y longitud, es PlateCarre().
    marker='o', c=variable_muyimportante, cmap='magma', linewidth=1, edgecolors='k', # s=variable_muyimportante * 10
)
plt.colorbar(scatter, label="VIV (variable muy importante)") # Hay formas mejores de hacer esto partiendo de definir una figura, pero son un poco más complejas

plt.show()

<span style="color:Red">  
    
### Tarea para el hogar (bastante más difícil)

Tomá un set de datos de los ejemplos de la documentación (o cualquier otro que tengas) y mapeá con cartopy y matplotlib:
- Un set de datos continuo con pcolormesh
- Un set de datos continuo con contourf
- Vectores (por ejemplo, de viento)

## Respondé
- ¿Cuál es la diferencia entre pcolormesh y contourf?
- ¿Puedo graficar vectores y un pcolormesh o contourf a la vez? ¿Cómo lo harías?
</span>

### Visualización y exploración avanzada: hvPlot

El paquete clásico de visualizaciones es **matplotlib**. Sin embargo, en los últimos años se desarrollaron una serie de paquetes alternativos, que buscan agregar funcionalidades o simplificar algunos tipos de gráficos.

Algunos nombres conocidos que puede valer la pena revisar:  
- **seaborn**: construye sobre **matplotlib**, está desarrollado para simplificar los gráficos estadísticos. Tiene _defaults_ claramente más lindos que **matplotlib**.
- **bokeh**: basado en la "gramática para gráficos". Produce gráficos interactivos y es relativamente popular.
- **hvPlot**: Librería de alto nivel, construida sobre **holoviews**, que está a su vez construida para funcionar sobre **bokeh** o **matplotlib**.
- **plotly**: Es muy popular para aplicaciones web. Existe también para JavaScript. Es interactiva.
- **plotnine**: Similar a la librería **ggplot** de R (implementación de la "gramática de gráficos". Todavía relativamente nueva, tiene algunas limitaciones.
- **altair**: Librería declarativa. Nunca entendí bien sus ventajas pero hay gente a la que le gusta.

#### Vamos a trabajar brevemente con hvPlot

hvplot trabaja en base a "accessors", que están hechos para trabajar con el tipo de datos que uno quiera. Puede ser dataframes de pandas, geodataframes de GeoPandas (el pandas geográfico), xarray (una especie de pandas multidimensional, muy útil para datos en formato netCDF) y otros.

In [None]:
import hvplot.pandas
primer_plot = df.hvplot()
primer_plot

Se puede juntar plots, sumándolos.

Para ver plots posibles, usar <\<Tab>\>

In [None]:
#Hagamos un plot doble
plot1 = df["A"].hvplot.area(alpha=0.2, color="purple", width=400)
plot2 = df["B"].hvplot.line(width=400)

plot1 + plot2

In [None]:
#Graficar las 2 cosas en el mismo plot con "*"
plot1 * plot2

##### Es muy útil, cuando recibimos un dato nuevo, la funcionalidad explorer.

Vamos a usar el dataframe del tutorial de bokeh, sobre pingüinos

In [None]:
from bokeh.sampledata.penguins import data as df

display(df)

In [None]:
df.describe()

In [None]:
explorer = df.hvplot.explorer(x='bill_length_mm', y='bill_depth_mm', by=['species'])
explorer

## Simplificando el trabajo con netCDF. Xarray y Dask (sólo si llegamos)

Para trabajar con archivos netCDF, hay dos opciones básicas. Una, netCDF4, es de nivel relativamente bajo, y obliga a trabajar con los procesos internos de la estructura del archivo.

Otra, xarray, es de nivel relativamente alto. Simplifica el trabajo general, a costa de, tal vez, un poco del contro.

_Si me permiten la analogía, podemos pensar a netCDF4 como numpy, y a xarray como pandas_.

Xarray funciona en base a dos clases: Dataset y DataArray. 
Siguiendo con la analogía, un Dataset es como un pd.DataFrame, y un DataArray es como un pd.Serie



In [None]:
# El objeto básico de xarray es un DataArray. Podemos leerlo de un archivo o generarlo:
import xarray as xr
import numpy as np

# Empecemos trabajando con un poco de datos de juguete

ds: xr.Dataset = xr.tutorial.load_dataset("air_temperature")
display(ds)


In [None]:
da: xr.DataArray = ds["air"] # También se puede acceder como  ds.air
display(da)

In [None]:
display(ds["air"].mean(dim="time"))
print("\n\n")
display(ds["air"].mean(dim=["lat", "lon"]))

In [None]:
da_timelat00: xr.DataArray = da[0, 0, :]
display(da_timelat00)

In [None]:
# Para acceder a los valores de un DataArray, podemos usar varias metodologías, cada una con ventajas y desventajas

valores_timelat00: np.array = da.values[0,0,:] # Lo pasé a un np.array
display(valores_timelat00)

In [None]:
# Puedo usar sel para seleccionar por valor. Vale también el slicing, incluse con fechas
da2 = da.sel(time="2013-01-01 00", lat=75.)
display(da2)

print("\n")
da2 = da.sel(time=slice("2013-01-01 00", "2013-01-02 00"), lat=75.)
display(da2)

In [None]:
# Puedo usar isel para seleccionar por índice, pero sin preocuparme por el orden. Vale también el slicing
da2 = da.isel(time=0, lat=slice(0, 5))

display(da2)

In [None]:
import hvplot.xarray
import cartopy as crs
hvexplorer = hvplot.explorer(ds, x='lon', y='lat', geo=True, cmap='inferno')
hvexplorer.geographic.param.update(crs='PlateCarree', global_extent=True, projection="Robinson", features=['coastline', 'borders'])
hvexplorer


---

#### Como se imaginarán, andan todas las funciones clásicas, pero agregan la funcionalidad de elegir dimensiones sobre las que se calculan

En general, andan tanto sobre un DataArray como sobre un Dataset (conceptualmente, un Dataset es un diccionario de DataArrays).

# Un poco de Python avanzado

## Type Hints
Permiten indicar el tipo de un dato. El intérprete _simplemente los ignora_, pero sirven para el debugger y el LSP, así como para documentar y simplificar el código. 
Se indica con ":". Para la salida de funciones, se indican con "->".

Por ejemplo

i: int = 1  
es lo mismo que  
i = 1  

Para una función, se usa como

**def** round(a: int = 2, b: float) -> float:  
&emsp; rounded: float = round(b, a)  
&emsp; **return** rounded

## numba
Es un acelerador para ciertos tipos de código de Python (en algunos casos, varios órdenes de magnitud).

Anda muy bien para loops si lo que está adentro es o bien **Python puro** o mezclado con **Numpy**.  
NO anda bien si hay otros tipos.  
Existen clases y paquetes que están acelerados mediante **numba**.

Si bien tiene más de un modo de funcionar, vamos a ver el JIT.

#### ¿Qué es un JIT?

Es un Just in Time Compiler. A medida que se ejecuta el código, lo lee y lo compila, lo que lo puede acelerar sustancialmente.

Eso implica que:
- Las primeras vueltas del loop son más lentas, porque el JIT tiene que leer lo que pasa, entenderlo, y después compilar (se llama "ramp up").
- Luego el loop se acelera sustancialmente. En algunos casos, algunos JIT pueden incluso superar en velocidad a lenguajes compilados, porque tienen más información respecto de cómo se ejecuta el código. Pasa a veces con JavaScript, que tiene un JIT muy desarrollado.
- Numba funciona así: lee el bytecode generado por el intérprete de Python, y deduce los tipos y operaciones de la función. Después, usa LLVM para generar código máquina optimizado para la computadora en uso. NO lee los type hints.


In [None]:
import numba as nb
from time import time

In [None]:
#import numba as nb

def loop_test():
    i = 1
    for _ in range(int(1e9)):
        i += 1
    return i


init = time()
i = loop_test()
end = time()

print(end - init)
print(i)

# %timeit loop_test()

In [None]:
@nb.jit(nopython=True)
def loop_test():
    i = 1
    for _ in range(int(1e9)):
        i += 1
    return i


init = time()
i = loop_test()
end = time()

print(end - init)
print(i)

# %timeit loop_test()