<a id='introduccion'></a>

Introducción de python para jupyter-notebook 
===

Autores
---
J.P. Calderón & R. Gamen

Resumen
---
*Python* es un lenguaje de programación 'interpretado', 'multiparadigma' y 'multiplataforma', 
utilizado principalmente en análisis de datos. 

Nosotros vamos a usar las funciones básicas, integradas en este formato de **jupyter-notebook** (https://jupyter.org/), que se utiliza directamente en el navegador web. Se puede ejecutar cada
celda apretando "CTRL+enter", que sería lo equivalente a ingresar el código por línea de comando.

Lo que sigue son ejemplos (y herramientas) que van a necesitar para resolver los ejercicios propuestos, 
en cada una de las prácticas de la materia:

1. [Cadena de caracteres (strings)](#cadena_de_caracteres)
2. [Aritmética básica](#aritmetica_basica)
3. [Listas (matrices)](#listas)
4. [Leer archivos de datos (e importar módulos de python)](#leer_archivos)
5. [Graficar datos](#graficar)
6. [Integrales (y funciones especiales)](#integrales)
7. [Aplicación astrofísica](#aplicacion)
8. [Ejercicios](#ejercicios)

Enlaces útiles
---
Les dejo algunos enlaces que pueden resultar útiles [aquí](https://github.com/Astronomia-Estelar-UNLP/Trabajos-Practicos/blob/master/docs/LINKS.md).

---

<a id='cadena_de_caracteres'></a>[<span style="float:right; font-size:1em;color:black;">Volver al inicio</span>](#introduccion)
### 1. Cadena de caracteres

In [None]:
print ("[*] Hola a todes") # Impresión de texto.

In [None]:
print ( '''[*] Hola\na\ntodes''' ) # Para cortar líneas de texto.

Todos los lenguajes de programación tienen una operación que une, junta o pega variables de diferentes tipos (**concatenar**). Esto puede servir para simplemente dar un resultado: texto + variable; o para formar nuevas variables que se usan en el flujo del código.

In [None]:
variable = "todes"
cursada  = 2020

print ( " [*] Hola a " + variable ) # Cómo concatenar texto,

In [None]:
print ( " [*] Bienvenidos y bienvenidas a la cursada", cursada, "B" ) # y variables.

In [None]:
print ( type(variable), type(cursada) ) # Tipo de variable

In [None]:
print ( len(variable), len(str(cursada)) ) # Tamaño de variable

<a id='aritmetica_basica'></a>[<span style="float:right; font-size:1em;color:black;">Volver al inicio</span>](#introduccion)
### 2. Aritmética básica 

In [None]:
print ( "[*] ", 2+2, 2*2, 2**2 )

Para definir funciones (que pueden devolver tanto números como caracteres) se utiliza el comando ```def funcion(argumento):```. Noten que la función se "cierra" una vez que el código deja de estar indentado, es decir, comienza en la columna uno (_esto es mucho muy importante_).

In [None]:
def fahrenheit_to_celsius(grados_fahrenheit):
    """convierte una temperatura en grados Fahrenheit a grados Celsius"""
    grados_celsius = (grados_fahrenheit-32)*5/9
    return round(grados_celsius, 1) # Con la función round, trunco el resultado a un decimal.

temp = 97
print ( "[*] ", fahrenheit_to_celsius(temp) )

<a id='listas'></a>[<span style="float:right; font-size:1em;color:black;">Volver al inicio</span>](#introduccion)
### 3. Listas

Las listas o diccionarios son lo que podríamos pensar como vectores y/o matrices. Se pueden hacer listas dentro de listas, unir dos o mas listas, modificar su contenido, etc.

Lo importante es tener en cuenta que las vamos a usar en el sentido de una _tabla de datos_. Es decir, los datos estarán ordenados en filas y columnas, y lo importante será poder acceder a cada columna por el orden en el que aparece o por el encabezado que tenga (título de la columna). Más adelante tendrán mas ejemplos.

In [None]:
lista = ['A', 's', 't', 'r', 'o', 'n', 'o', 'm', 'í', 'a']

print (lista)

In [None]:
print ( ''.join(lista) )

In [None]:
lista.append ( '10' )

print (lista)

print ( ''.join(lista) )

In [None]:
for l in lista:
    print (l) # indentación = 4 espacios

In [None]:
lista2 = ( 3.2, 7.43, ['L'], 33 ) # Este objeto es un 'tuple'. No puede modificarse.
print (lista2)

In [None]:
print ( lista2[0], lista2[2] )

In [None]:
lista2.append('-5') # Como no puede modificarse, esto generaría un error.

Noten en el siguiente ejemplo que hay dos niveles de indentado (4 espacios). El primero arranca con el ```for```, mientras que el segundo define el ```if```.

In [None]:
for i in range(10, 30, 5):
    if i >= 20:
        print ( "[*] mayor que 20:", i )
    else:
        print ( "[*] menor que 20:", i ) 

<a id='leer_archivos'></a>[<span style="float:right; font-size:1em;color:black;">Volver al inicio</span>](#introduccion)
### 4. Leer archivos

Para leer archivos, en este caso, vamos a importar un módulo o paquete de python que tienen integradas funciones específicas. El módulo ```pandas``` permite trabajar con objetos (tipo matrices), utilizando el nombre de las columnas para (por ejemplo) graficar y correlacionar datos.

#### 4.1 Tabla de datos en archivo local

In [None]:
import pandas as pd

data = pd.read_csv ( 'investigadores-2007.csv', sep = ",", comment = '#' )
data # Se accede a cada columna mediante: data[0], data[1], ...

# Datos de https://cifras.conicet.gov.ar/publica/
# KA: CIENCIAS AGRARIAS, DE LA INGENIERÍA Y DE MATERIALES
# KB: CIENCIAS BIÓLOGICAS Y DE LA SALUD
# KE: CIENCIAS EXACTAS Y NATURALES
# KS: CIENCIAS SOCIALES Y HUMANIDADES
# KT: TECNOLOGÍA

In [None]:
print ( data.loc[4,'BECARIOS'] )

#### 4.2 Construir una tabla de datos

In [None]:
import numpy as np

INV = pd.DataFrame (  np.array( [ [2007, 2400, 2657], [2019, 5874, 5043] ] ) ,
                         columns = ['Año', 'MUJERES', 'HOMBRES'] )

INV

In [None]:
BEC = pd.DataFrame (  np.array( [ [2007, 3363, 2236], [2019, 6079, 4166] ] ) ,
                         columns = ['Año', 'MUJERES', 'HOMBRES'] )
BEC

<a id='graficar'></a>[<span style="float:right; font-size:1em;color:black;">Volver al inicio</span>](#introduccion)
### 5. Graficar datos

#### 5.0 Graficos sencillos

In [None]:
import matplotlib.pyplot as plt

plt.plot ( [4,8,13,17,20], [54, 67, 98, 78, 45] )

In [None]:
x = [4,8,13,17,20]
y = [54, 67, 98, 78, 45]

plt.scatter ( x, y )

In [None]:
import numpy as np
a = np.linspace ( 0, 20, 50 )
a

In [None]:
b = np.sin ( a )
plt.plot ( a, b, color = 'green', linestyle = '--', linewidth = 2 ) 
plt.show()

#### En resumen, la estrucura de cada grafico usando _matplotlib_, tiene esta forma:

   * **1.** Definicion de la figura: tamaño, cantidad de filas y columnas, etc.
   * **2.** Uso de los comandos ax.plot, o ax.scatter, o ax.bar, etc.
   * **3.** Configuración de la figura: titulos, tamaños de letra, legenda de simbolos, grillado, etc.
   * **4.** (opcional) Definiciones de lo que se quiere graficar.


![estructura-matplotlib.png](attachment:estructura-matplotlib.png)

---

In [None]:
fig, ax = plt.subplots ( ncols = 1, nrows = 1, figsize = (18,8), dpi = 50 )

a = np.linspace(0,20,50)
b = np.sin(a)
 
ax.plot ( a, b, color = 'violet', linewidth = 4, label = "Etiqueta1" )
ax.plot ( a, np.cos(a), color = 'orange', linewidth = 4, label = "Etiqueta2" )

ax.scatter ( a + 0.2, b - 1, color = 'black', marker = '+', s = 100*2, linewidths = 4, label = "Etiqueta3" )

ax.set_title ( "velocidad (m/s)", fontsize = 20 )
ax.set_xlabel ( "Tiempo (s)", fontsize = 20 )
ax.set_ylabel ( r"$y (\mu m)$", fontsize = 24, color = 'blue' )

ax.text ( 20, -1.0, "Más texto", color = 'red', fontsize = 34 )
ax.legend ( loc = 'lower right')
 
plt.grid ( True, zorder = -1 )
plt.show()

In [None]:
fig.savefig ( 'ejemplo.png', dpi = 300 ) 

#### 5.1 Desde un archivo local

In [None]:
data

In [None]:
plt.rcParams.update({'font.size': 20})

fig, ax = plt.subplots ( ncols = 1, nrows = 1, figsize = (10,8), dpi = 50 )

ax.set_title ( 'Año 2007' )
ax.set_xlabel ( 'Área de conocimiento' )
ax.set_ylabel ( 'N' )

ax.plot ( 'AREA', data.columns[1], data = data, marker = 'o', markersize = 10, linewidth = 2 )
ax.plot ( 'AREA', data.columns[2], data = data, marker = 'o', markersize = 10, linewidth = 2 )

for column in data.columns[3:]:  # Iteración sobre los nombres de las columnas.
    ax.plot ( 'AREA', column, data = data, marker = 'o', markersize = 10, linewidth = 2 )    

plt.legend ( data.columns[1:], bbox_to_anchor = (1.6,1), ncol = 1 )
plt.show()

#### 5.2 Desde una tabla construida

In [None]:
INV

In [None]:
BEC

In [None]:
fig, (ax0, ax1) = plt.subplots ( ncols = 2, nrows = 1, figsize = (14,5), dpi = 70, 
                                sharex = True,  sharey = True )
plt.rcParams.update({'font.size': 18})

x = np.arange(len(INV['Año'])) 
width = 0.30 

ax0.set_title ( 'Investigadorxs' )
ax0.bar ( x - width/2 , INV['MUJERES'], width, label = 'Mujeres', alpha = 0.9, zorder = 10 ) 
ax0.bar ( x + width/2, INV['HOMBRES'], width, label = 'Hombres', zorder = 10 ) 

ax1.set_title ( 'Becarixs' )
ax1.bar ( x - width/2 , BEC['MUJERES'], width, label = 'Mujeres', zorder = 10 ) 
ax1.bar ( x + width/2, BEC['HOMBRES'], width, label = 'Hombres', zorder = 10 ) 

ax0.set_xticks(x)
ax0.set_xticklabels ( INV['Año'] )

ax0.set_yticks ( np.arange(0, 7000, 500), minor = True )

# Show the major grid lines with dark grey lines
for a in [ ax0, ax1 ]:
    a.grid ( axis ='y', which = 'major', color = 'gray', linestyle = '-',  alpha = 0.5 )
    a.grid ( which = 'minor', color = 'gray', linestyle = '--', alpha = 0.2 )

plt.legend ( bbox_to_anchor = (1.5,1), ncol = 1 )
plt.tight_layout()
plt.show()

<a id='integrales'></a>[<span style="float:right; font-size:1em;color:black;">Volver al inicio</span>](#introduccion)
### 6. Integrales 

Los métodos de integración, como se imaginarán, están contenidos dentro de distintos módulos de *python*.


En el siguiente ejemplo, vamos a:
* importar los módulos necesarios.
* definir la función Gaussiana:
$$\large F(x) = \frac{1}{\sigma \sqrt{2\pi}}\ e^{-(x-\mu)^{2}/2\sigma^{2}} $$
* definir un espacio de valores para evaluar la función.
* graficar la función para diferentes parámetros ($\mu, \sigma$).
* integrar la función en un rango determinado.

Notar que se usa ```np.exp(x)``` y ```np.power(x)``` para las funciones exponencial y potencia, respectivamente. De igual modo se puede usar ```np.log10(x)``` cuando tengan que pasar intensidades a magnitudes.

In [None]:
import numpy as np
x_values = np.linspace(-3, 3, 1000) # Valor inicial, valor final, cantidad total de valores intermedios
x_values

In [None]:
from scipy.integrate import quad

def gaussian(x, mu, sig):
    return 1./(sig* np.sqrt(2.*np.pi) ) * np.exp(-np.power((x - mu)/sig, 2.)/2.)

fig, ax = plt.subplots ( ncols = 1, nrows = 1, figsize = (10,8), dpi = 50 )

x_values = np.linspace(-3, 3, 1000) # Valor inicial, valor final, cantidad total de valores intermedios
mu = 0
sig = 2
ax.plot ( x_values, gaussian(x_values, mu, sig) )

# Esto pinta debajo de la curva entre x1=0 x2=2,
ax.fill_between ( np.linspace(-1, 2, 100), 0, gaussian(np.linspace(-1, 2, 100), 0, 2) )

ax.set_xlabel ( 'x' )
ax.set_ylabel ( 'y' )

plt.show() # Este comando imprime el grafico

In [None]:
int, err = quad( gaussian, -1, 2, args=(0,2) ) # Hacemos la integral
# Para la función de integración 'quad', se necesita: 1. la Función analítica, 
#  2. el rango de x a integrar, y 3. Si, la función tiene argumentos, se los debe 
#  agregar dentro del tuple 'args=(arg1,arg2,...,argn)'.

print ( "[*] Valor de la integral = ", round(int,4) ) # Resultado redondeado a 4 dcimales.

<a id='aplicacion'></a>[<span style="float:right; font-size:1em;color:black;">Volver al inicio</span>](#introduccion)
## 7. Construyamos un diagrama HR 

Los pasos a seguir son:

   **1.** importamos el módulo ```Vizier``` del paquete ```astroquerry``` para acceder a la base de datos [_Vizier_](http://vizier.u-strasbg.fr)
   
   **2.** descargamos el catálogo de [Hipparcos:I/239](http://vizier.u-strasbg.fr/viz-bin/VizieR-3?-source=I/239/hip_main), indicando las columnas que necesitamos


In [None]:
#!conda install -y astroquery

In [None]:
from astroquery.vizier import Vizier

hipparcos = Vizier(catalog="I/239/hip_main", 
                   columns=['HIP', '_RAJ2000', '_DEJ2000', 'Plx','Vmag', 'B-V', 'SpType'],
                   row_limit = -1 ).query_constraints()[0] # row_limit = -1 significa que descargue tada.

print(hipparcos)

**3.** utilizamos las columnas ```Vmag``` (magnitud aparente) y ```Plx``` (paralaje) para calcular la magnitud absoluta en el filtro V

$$\large M_{V} = m_{v} + 5 \log\left(\frac{p[mas]}{100}\right)$$

In [None]:
hipparcos['M_V'] = hipparcos['Vmag'] + 5 * np.log10(hipparcos['Plx']/100.,
                                                    where = hipparcos['Plx'] > 0) 
# where = ... > 0 es para que calcule el log10() solo en el caso de paralaje positiva.

In [None]:
print(hipparcos)

**4.** utilizamos las columnas correspondientes a la magnitud absoluta y el índice de color para graficar el diagrama

In [None]:
fig, ax = plt.subplots ( ncols = 1, nrows = 1, figsize = (8,10), dpi = 50 )

ax.set_xlim ( -0.5,   2.5 )
ax.set_ylim ( 15.0, -10.0 )

ax.set_xlabel ( '(B-V)' )
ax.set_ylabel ( 'V' )

ax.scatter ( hipparcos['B-V'], hipparcos['M_V'], s = 1, color = 'red', edgecolors = 'none', zorder = 10 )

# Configuración del grafico
ax.grid ( linestyle = '--', linewidth = '0.5', color = 'black', alpha = 0.9 ) # Grilla
plt.setp ( ax.spines.values(), linewidth = 3.0 ) # Ancho del borde

# Exportar la figura a formato PNG
plt.savefig ( 'MV_BV.png', bbox_inches = 'tight' )

plt.show()

<a id='ejercicios'></a>[<span style="float:right; font-size:1em;color:black;">Volver al inicio</span>](#introduccion)
### 7.1 Manejo de unidades

Existen diferentes paquetes o módulos de _python_ que puedan encargarse de hacer cálculos de unidades. La idea es que, a cada variable, le asocian una unidad de medida y la mantienen a lo largo de todo el _notebook_ como una característica que puede transformarse a otra, manteniendo las reglas usuales. Es decir, no mezclan peras con manzanas.

En lo que sigue, damos alguno ejemplos del uso de ```units``` en ```astropy```. 

In [None]:
from astropy import constants as const # se carga el módulo que tienen definidas constantes.
import astropy.units as u # de esta forma, la caracteritica de una variable se puede identificar con 'u.'

print (const.sigma_sb)

print ( "\n[*] Transformo a otro juegos de unidades: ", (const.sigma_sb).to('W / K4 cm2') )

Puedo definir constantes:

In [None]:
h = 6.62607015e-27 * u.erg*u.s
c = 29979245800.0  * u.cm/u.s
k = 1.380649e-16   * u.erg/u.K

c1 = 2.*h*c*c # Constantes usuales en la expresión de Planck
c2 = h*(c/k)

L = 1 * u.cm

print ( "[*] c = ", c )
# El '.value' remueve las unidades. Es útil para usar algoritmos que
# no soporten el sistemas de unidades (ejemplo: integrate.quad)
print ( "[*] c = ", c.value ) 

print ( "[*] c2 = ", c2 ) # Notar que se cancelo el 'erg' en el resultado
print ( "[*] L = ", L.to(u.AA) )

<a id='ejercicios'></a>[<span style="float:right; font-size:1em;color:black;">Volver al inicio</span>](#introduccion)
### 8. Ejercicios
En el directorio en el que se encuentra este _notebook_, también tienen el archivo ```investigadores-2019.csv```.

In [None]:
ls investigadores-2019.csv # El comando 'ls' lista el contenido del directorio de trabajo.

**1.** Utilicen el archivo anterior (que corresponde al año 2019) para hacer el mismo grafico que en el [ejemplo](#ejemplo).

In [None]:
# editame

**2.** Grafique la función seno (``` np.sin()```), entre $-\pi$ y $2 \pi$; e intégrela entre $0$ y $\pi$.

$$\large\int_{0}^{\pi} sen(x)\ dx$$

Asigne el resultado de la integral anterior a la variable ```resultado```.

In [None]:
# editame
    
int, err = quad( np.sin, 0, np.pi, args=() ) # Hacemos la integral

print ("[*] Valor de la integral: ", int)

---
[<span style="float:right; font-size:2em;color:black;">Volver al inicio</span>](#introduccion)

![fin](es_todo_por_hoy.jpg) 