# AST332 Introducción a Machine Learning para Astronomía
Pía Amigo, II Semestre 2024

## Repaso Python
Durante este curso estaremos utilizando Python como lenguaje de programación para las actividades prácticas. En este notebook haremos una revisión de los tópicos importantes respecto a programación y manejo de datos en Python. Asegúrese de revisar cada tópico y realizar los ejercicios que aparecen.

**Este notebook incluye los siguientes tópicos:**
* Tipos de datos
    * Números
    * Strings
    * Listas
    * Diccionarios
    * Booleanos
    * Tuplas
* Operadores de comparación
* Sentencias if, elif, else
* Bucles for, while
* range()
* List comprehension
* Funciones
* Función lambda
* map y filter
* métodos

____

Links de interés:
* https://catedu.github.io/python-for-person-in-everybody/es/01-intro.html
* https://realpython.com/python-first-steps/#running-your-python-interpreter
* An Introduction to Statistical Learning with Applications in Python https://www.statlearning.com/ (Chapter 2, section 2.3, Lab: Introduction to Python) 


Para síntaxis de markdown, puede revisar el siguiente link:
* https://www.markdownguide.org/basic-syntax/

print('hola mundo')

In [None]:
print('hola mundo')

##  Asignación de variables
* Sirven para guardar valores
* Se crean al asignarle un valor 
* El nombre de la variable no debe empezar con número o caracter especial 
* Los nombres de las variables son case-sensitive


In [None]:
nombre_var = 2

In [None]:
nombre_var

In [None]:
print(nombre_var)

In [None]:
a = 2
b = 3

In [None]:
c = a + b

In [None]:
c

los keywords en python son palabras reservadas y no se pueden usar para definir una variable

In [None]:
help("keywords")

### Strings 
Un string es una secuencia de caracteres

In [None]:
'comilla simple @ # 😍'

In [None]:
"comilla doble"

In [None]:
x='hola'

In [None]:
print(x)

In [None]:
type(x)

puedo acceder a un caracter del string a través de indexación

In [None]:
string1='Introducción a Machine Learning para Astronomía'

**Ejercicio: Extraiga la secuencia "Learning" de string1**

operador + de concatenación para strings

In [None]:
a = '100'
b = '150'
print(a+b)

In [None]:
a='hola'
b=' amigo'
print(a+b)

la función de python <code>len()</code> indica el tamaño de una variable 

**Ejercicio: encuentre el tamaño de string1**


OJO: Los strings son inmutables

In [None]:
sigla='AST 332'
sigla

In [None]:
sigla[0]='J'

Para separar un string en una lista, se usa el comando <code>split()</code>

In [None]:
string1.split()

### Expresiones booleanas
Una expresión booleana es una expresión que es verdadera o falsa

El operador  <code>==</code> compara dos valores, en cambio el operador <code>=</code> asigna un valor

In [None]:
5 == 5

In [None]:
5=5

In [None]:
5== 6

In [None]:
True

In [None]:
type(True)

In [None]:
type(5)

In [None]:
type(string1)

In [None]:
type(False)

<code>True</code> y <code>False</code> representan booleanos en python, no son strings y no pueden usarse para definir nombre de variable

Otros operadores de comparación
* <code> x != y </code>        x es distinto a y
* <code> x > y </code>         x es mayor que y 
* <code> x < y </code>         x es menor que y 
* <code> x >= y </code>        x es mayor o igual que y 
* <code> x <= y </code>        x es menor o igual que y
* <code> x is y </code>        x es igual a y
* <code> x is not y </code>    x no es igual a y

Hay tres operadores lógicos: and, or, y not. La semántica (significado) de estos operadores es similar a su significado en inglés

In [None]:
5 is 5

In [None]:
x=5
y=5

In [None]:
x is y

In [None]:
x=5

In [None]:
x > 0 and x < 10

<code>and</code>: ambas condiciones deben cumplirse

In [None]:
x > 0 and x < 3

In [None]:
n=36

In [None]:
n%2 == 0 or n% 3 == 0

<code>or</code>: al menos una condición debe cumplirse

In [None]:
n%2 == 0 or n% 5== 0

In [None]:
n%2 == 0 and n% 5== 0

In [None]:
x=5
y=2

In [None]:
x>y

In [None]:
not(x>y)

<code>not</code>: niega una expresión booleana

In [None]:
not(not(x>y))

### tipo de variable

In [None]:
a=-4
b=5.5
c='hola mundo'

**Int**, or integer, es un número entero, positivo o negativo, sin decimales y de largo ilimitado

In [None]:
type(a)

**Float**, o "floating point number"  es un número positivo o negativo que contiene un o más decimales


In [None]:
type(b)

In [None]:
pi=3.1415926535897931

In [None]:
pi

podemos elegir mostrar cierta cantidad de decimales para una variable float

In [None]:
print('Pi es {}'.format(pi))

In [None]:
print('Pi es {:.3f}'.format(pi))

In [None]:
print('Pi es {:.6f}'.format(pi))

In [None]:
print(round(pi,3))

In [None]:
import math

In [None]:
math.trunc(pi)

In [None]:
math.ceil(pi)

In [None]:
math.floor(pi)

### Listas

Una lista es una secuencia de valores. Los valores en la lista se denominan **elementos**.

In [None]:
[1,2,3]

In [None]:
['hola',1,[1,2]]

In [None]:
mi_lista = ['a','b','c']

In [None]:
type(mi_lista)

<code>append()</code> agrega un elemento al final de la lista

In [None]:
mi_lista.append('d')
print(mi_lista)

In [None]:
mi_lista

In [None]:
mi_lista[0]

In [None]:
mi_lista[1]

In [None]:
mi_lista[1:]

In [None]:
mi_lista[:2]

Las listas son **mutables**

In [None]:
mi_lista[0]='NUEVA'

In [None]:
mi_lista

In [None]:
lista_anidada = [1,2,3,[4,5,['hello','goodbye']]]

In [None]:
lista_anidada

In [None]:
lista_anidada[3]

In [None]:
lista_anidada[2]

In [None]:
lista_anidada[3][2]

In [None]:
lista_anidada[3][3]

In [None]:
lista_anidada[3][2][1]

In [None]:
lista_vacia=[]

In [None]:
lista_vacia

In [None]:
lista=[2,4,6,8,10]

<code>sum()</code>, <code>min()</code> y <code>max()</code> para listas con valores numéricos

In [None]:
print("Suma valores lista:", sum(lista))
print("Mínimo valor de la lista:", min(lista))
print("Máximo valor de la lista:", max(lista))

**Ejercicio: Dada la siguiente lista, use índices para extraer la palabra estudiante**

lst = [1,2,[3,4],[5,[100,200,['alumno']],23,11],1,7]

### Diccionarios

Un diccionario es como una lista, pero más general. En una lista, las posiciones del índice deben ser enteros; en un diccionario, los índices pueden ser (casi) de cualquier tipo.

In [None]:
d = {'key1':'valor1','key2':'valor2'}

In [None]:
d

In [None]:
type(d)

los diccionarios se indexan con el nombre del índice

In [None]:
d['key2']

In [None]:
d[0]

In [None]:
eng2sp = {'one': 'uno', 'two': 'dos', 'three': 'tres'}

In [None]:
print(eng2sp)

el tamaño del diccionario es la cantidad de pares índice-valor 

In [None]:
eng2sp

In [None]:
len(eng2sp)

In [None]:
estudiante1 = {"nombre": "María José", "edad": 25, "curso": "AST 332"}

In [None]:
estudiante1.keys()


In [None]:
estudiante1.values()

In [None]:
estudiante1.items()

In [None]:
estudiante1['tel']=555555

In [None]:
estudiante1

In [None]:
del estudiante1['tel']

In [None]:
estudiante1

In [None]:
estudiante1['nombre']=['María José', 'Diego']

In [None]:
estudiante1

**Dado el siguiente diccionario, extraiga la palabra hola**

d = {'k1':[1,2,3,{'truco':['este','diccionario','anidado',{'blanco':[1,2,3,'hola']}]}]}

### Tuplas
Una tupla es una secuencia de valores muy parecida a una lista. Los valores almacenados en una tupla pueden ser de cualquier tipo, y están indexados por enteros. La diferencia importante es que las tuplas son inmutables

In [None]:
t = (1,2,3)

In [None]:
print(t)

In [None]:
type(t)

In [None]:
t2=2,4,6

In [None]:
print(t2)

In [None]:
type(t2)

In [None]:
t2[4]

In [None]:
t[0]=2

Los diccionarios tienen un método llamado items que devuelve una lista de tuplas, donde cada tupla es un par clave-valor

In [None]:
d = {'a':10, 'b':1, 'c':22}



In [None]:
t = list(d.items())
print(t)

**Ejercicio: Modifique las variables de manera que al evaluar las sentencias de más abajo, los resultados sean True**

In [None]:
var1 =
var2 =
var3 =
var4 =
var5 =
var6 = 

#No edite nada desde esta línea hacia abajo

# Numbers
print(isinstance(var1, int))
print(isinstance(var6, float))
print(var1 < 35)
print(var1 <= var6)

# Strings
print(isinstance(var2, str))
print(var2[5] == "n" and var2[0] == "p")

# Lists
print(isinstance(var3, list))
print(len(var3) == 5)

# Tuples
print(isinstance(var4, tuple))
print(var4[2] == "naranja")

# Dictionaries
print(isinstance(var5, dict))
print("edad" in var5)
print(7 in var5.values())
print(var5.get("nombre") == "Juan")
print(len(var5) == 3)
var5["juguete"] = "auto"
print(len(var5) == 3)

## Sentencias if, else if, else

In [None]:
if 4>1:
    print('indentacion')
    

In [None]:
if 4>1:
    print('hola')
    print('chao')

In [None]:
if 1 < 2:
    print('Sip')

In [None]:
if 1>2: #no se cumple
    print('Sip')

In [None]:
x = 3
if x < 10:
    print('Menor')

In [None]:
if 1 > 2:
    print('Sip')
else:
    print('Nop')

In [None]:
if 1 == 2:
    print('primera')
elif 3 == 3:
    print('segunda')
else:
    print('tercera')

In [None]:
var=5

In [None]:
if var >0 and var<3:
    print('Sip')
else:
    print('Nop')


In [None]:
x=10

In [None]:
if x>100:
    print('hola')
    print('chao')
    if x>5:
        print('si')
        if x>20:
            print('no')
else: print('fin')

## Bucles

### For

In [None]:
seq = [1,2,3,4,5]

In [None]:
for gatito in seq:
    print(gatito)

In [None]:
for item in seq:
    print('sip')

In [None]:
seq

In [None]:
for item in seq:
    print(item+item+1)

In [None]:
count = 0
for ix in [3, 41, 12, 9, 74, 15]:
    count = count + 1
    print(count)
    #print(ix)
    #print(' ')
    
print('Count: ', count)

In [None]:
total = 0
for itervar in [3, 41, 12, 9, 74, 15]:
    total = total + itervar
    print(total)
print('Total: ', total)

**Pregunta: ¿ Cuál es la diferencia entre las celdas anteriores?**

### While

In [None]:
i = 1
while i < 10:
    i = i+1
    print('i es: {}'.format(i))
    

## <code>range()</code>
    
Es un tipo que se utiliza para representar una secuencia inmutable de números. Uno de sus principales usos es junto a la sentencia for, para definir un bucle sobre el que se itera un número determinado de veces.
<code>range()</code> calcula los ítems cuando los necesita

In [None]:
range(5)

In [None]:
list(range(5)) #no incluye el 5

In [None]:
for i in range(5):
    print(i)

In [None]:
list(range(5))

In [None]:
list(range(5, 10))

In [None]:
list(range(0, 10, 5))

## List comprehension

Son una forma de crear listas de una manera elegante simplificando el código al máximo

In [None]:
numeros = [1, 2, 34, 86, 4, 5, 99, 890, 45]
pares = []
for num in numeros:
    print(num)
    print(' ')
    if num % 2 == 0:
        pares.append(num)
        #print(pares)
print(pares)

In [None]:
numeros = [1, 2, 34, 86, 4, 5, 99, 890, 45]


In [None]:
pares = [num for num in numeros if num % 2 == 0]


In [None]:
print(pares)

In [None]:
x = [1,2,3,4]

In [None]:
out = []
for item in x:
    out.append(item**2)
print(out)

In [None]:
[item**2 for item in x]

## Funciones

<code>def nombre_funcion(arg1, arg2, ..., argN):
    # Haz algo con arg1, arg2, ..., argN
    return valor_salida<code>
    

In [None]:
def my_func(param1='default'):
    """
    Docstring goes here.
    """
    print(param1)

In [None]:
my_func

In [None]:
my_func()

In [None]:
my_func('nuevo param')

In [None]:
my_func(param1='nuevo param')

In [None]:
x

In [None]:
def cuadrado(x):
    return x**2

In [None]:
resultado=cuadrado(5)

In [None]:
print(resultado)

In [None]:
cuadrado(3)

In [None]:
cuadrado(2.5)

In [None]:
cuadrado(34572)

In [None]:
cuadrado('hola')

In [None]:
def arroba(texto):
    if texto=='pia':
        return texto+'@'
    else:
        return('no')

In [None]:
arroba('paula')

## Expresiones Lambda
Las expresiones lambda se usan idealmente cuando necesitamos hacer algo simple y estamos más interesados en hacer el trabajo rápidamente en lugar de nombrar formalmente la función

In [None]:
cubo= lambda x: x ** 3


In [None]:
cubo(5)

## <code>map()</code> y <code>filter()</code>

La función <code>map()</code> en Python aplica una función a cada uno de los elementos de una lista

Tenemos una lista de enteros lista de enteros y queremos obtener una nueva lista con el cuadrado de cada uno de ellos.

Con un <code>for<code>

In [None]:
enteros = [1, 2, 4, 7]
cuadrados = []
for e in enteros:
    cuadrados.append(e ** 2)
     
print(cuadrados)

Con <code>map()</code> combinado con una función lambda

In [None]:
#enteros = [1, 2, 4, 7]
cuadrados2 = list(map(lambda x : x ** 2, enteros)) #sólo una línea!!
print(cuadrados2)

La función <code>filter()</code> filtra una lista de elementos para los que una función devuelve True.



Imagina que quieres filtrar una lista de números para obtener solo los valores pares.

Con <code>for()</code>

In [None]:
valores = [1, 2, 3, 4, 5, 6, 7, 8, 9]
pares = []
for valor in valores:
    if valor % 2 == 0:
        pares.append(valor)
print(pares)

In [None]:
#valores = [1, 2, 3, 4, 5, 6, 7, 8, 9]
pares = list(filter(lambda x : x % 2 == 0, valores))
print(pares)

**Ejercicio:  Cree una función que cuente los caracteres del siguiente string (sin espacios)**

frase = "Python es un lenguage muy entretenido"

**Ejercicio:  Use una expresión lambda en combinación con  filter() para filtrar palabras de una lista que no empiezan con letra s.** 

Por ejemplo, 

    lista = ['sopa','perro','salmón','gato','precio']

**debe filtrarse a:**

    ['sopa','salmón']

**Ejercicio: Usted está manejando un poco rápido y un policía lo detiene. Escriba una función que retorne una de las 3 siguientes posibilidades: 'sin infracción', 'infracción leve', 'infracción grave'. Si su velocidad es menor a 50 km/h, el resultado es 'sin infracción'. Si la velocidad está entre 51 y 80 km/h (incluído), el resultado es 'infracción leve'. Si la velocidad es mayor a 80 km/h, el resultado es 'infracción grave'.  En caso que sea su cumpleaños (variable booleana),  usted puede ir 5 km/h más rápido en todos los casos.**