<font size=6>

<b>Taller de Análisis de Datos</b>
</font>

<font size=4>
    
InpsiraSTEM 2025 <br/>
23 de Julio de 2025

</font>

https://github.com/michaelsanchez2025/inspirastem2025-data-analises/

<br/>

# Programación en Python

## Objetivos

- Repasar los conceptos fundamentales del lenguaje Python.
- Hacer énfasis en las estructuras y funcionalidades más útiles en general.

## Referencia

https://github.com/andelpe/curso-intro-python

## Objetos de datos y atributos

En python cualquier _dato_ (o _valor_) es un objeto:    
- Números, listas, funciones, clases...

Los objetos tienen atributos (miembros):
- **Datos**: Información útil para el objeto
- **Métodos** (funciones): Operaciones sobre el propio objeto

![objeto](https://github.com/michaelsanchez2025/inspirastem2025-data-analises/blob/main/images/t2_objeto.png?raw=1)

Los atributos son accesibles con la notación `objeto.atributo`

Podemos inspeccionar los atributos de un objeto de varias maneras:
- Funciones de introspección: `dir`, `help`
- Ayudas del interpréte/IDE/entorno: `TAB`, `SHIFT+TAB`, `magic ?`
- Documentación

### Tipos y variables

Todo objeto de datos tiene un tipo asociado.
- En general, no hay conversión de tipos automático (solo en casos concretos).
- Los operadores varían de función según el tipo de datos sobre el que actúan.

Una variable _referencia_ un objeto de datos
- Cuando se usa una variable, se usa el objeto referenciado
- Las variables NO tienen un tipo asociado
  - No se declaran (no se les asigna un tipo)
  - _Parecen_ tener el tipo del objeto al que referencian

In [5]:
a = '3'
print("Tipo de  3 ", type(3))
print("Tipo de 'a'", type(a))
print(3 + int(a))
print(str(3) + a)
print(3 + a)

Tipo de  3  <class 'int'>
Tipo de 'a' <class 'str'>
6
33


TypeError: unsupported operand type(s) for +: 'int' and 'str'

### Tipos de datos incorporados (_built-in_)

Son tipos de datos disponibles de inicio

- Suelen ser más eficientes que los definidos por los usuarios
- Extensibles (por nuevas _clases_)

Estos tipos son (entre otros):

- Números: `int`, `float`, `complex`

  - Algunos _especiales_: `float('nan')`, `float('inf')`, `float('-inf')`


- Booleans: `False`, `True`

  - Evaluación de una comparación o expresión lógica, o un objeto Python: `if X: print(...)`
  - Todos los objetos se evalúan a `True` excepto `False`, `None`, `0`, secuencias vacías...


- Nulo: `None`

- Strings (`str`): `"abcdef"`

  - Cadenas (iterables) _inmutables_ de caracteres
  - La manera recomendad de incluir variables y formatos son las _fstrings_: `f"..."`

```python
    a, b = 1, 3
    print('a es', a, ' b es', b, ' y su cociente es', a/b)
    print(f'a es {a}, b es {b}, y su cociente es {a/b:.2f}')
```
```
    a es 1  b es 3  y su cociente es 0.3333333333333333
    a es 1, b es 3, y su cociente es 0.33
```

- Ficheros:

  - Objetos de tipo `file` devueltos por la función `open`
  - Soportan operaciones con _strings_: `read, readline, readlines, write`
  - Para manejar otros tipos de datos es conveniente usar `json`, `yaml`, `pickle` o similares
  
    - `json` y `yaml` son estándares, y pueden incluir números, strings, listas y diccionarios
    - `pickle` es exclusivo de Python, puede almacenar cualquier objeto (p.ej. de usuario), ¡incluido código!
  
```python
    with open('myfile.txt') as f:
        for line in f:
            print(line.strip())

    with open('myfile.txt', 'w') as f:
        json.dump(mydict)
```


- Otros: secuencias, diccionarios, ficheros, clases, módulos, funciones, tipos...

### Referencias compartidas

Es importante distinguir entre variables y objetos

In [6]:
a = [0, 1]  # Objeto lista, con dos elementos 0 y 1
b = a       # La variable 'b' apunta al objeto apuntado por 'a'

![t2_refs_1](https://github.com/michaelsanchez2025/inspirastem2025-data-analises/blob/main/images/t2_refs_1.png?raw=1)

Podemos usar los operadores `==` y `is`:
- `==`: Compara el _valor_ de los operandos
- `is`: Compara la _identidad_, es decir, si los dos operandos son el mismo objeto en memoria

In [7]:
print(a == b, a is b)

True True


In [8]:
b[0] = 5  # Modificamos un elemento de 'b'

![t2_refs_2](https://github.com/michaelsanchez2025/inspirastem2025-data-analises/blob/main/images/t2_refs_2.png?raw=1)


In [9]:
print(a == b,  a is b)
print(a)

True True
[5, 1]


In [10]:
b = [5, 1] # Asignamos otro objeto a la variable 'b'

![t2_refs_3](https://github.com/michaelsanchez2025/inspirastem2025-data-analises/blob/main/images/t2_refs_3.png?raw=1)


In [11]:
print(a == b,  a is b)
print(id(a))
print(id(b))

True False
138412719289920
138412305198976


### Gestión de memoria

La gestión de memoria es realizada por python automáticamente
- Menos eficiente, pero mucho más sencillo y menos propenso a errores que los sistemas de gestión explícita

Cuando el número de referencias a un objeto llega a 0, el objeto es eliminado
- Las referencias pueden eliminarse por _scope_ (dejan de ser _visibles_)...
- ... o con la instrucción `del` (infrecuente)

## Expresiones y sentencias

Una _expresión_ es una porción de código que se evalúa a un valor.

Una _sentencia_ es una instrucción que python puede interpretar (ejecutar)

### Algunas sentencias en Python

- **Asignación**: `variable = expresión`

  - Enlaza (_bind_) una variable con un valor
  - Para objetos modificables, también sirve para alterar su contenido (p.ej. `milista[2] = 5`)


- **Condicional IF**: Control de flujo
```python
      if <condicion>:
          ...
      elif <otra condicion>:
          ...  
      else:
          ...      
```
- **Bucles**:

  - **FOR**: Itera recorriendo los elementos de un _iterable_  
  
  ```python
  
      for <variable> in <iterable>:
        ...
        
  ```
  
  - **WHILE**: Itera en base a una condición
  
  ```python
  
      while <condicion-es-True>:
        ...   
        
  ```
  
  - **BREAK** y **CONTINUE**: Alteran la ejecución normal de un bucle
  
    - `break` provoca que acabe el bucle actual, y se pase a la instrucción que sigue al bucle.

    - `continue` salta a la siguiente iteración, sin ejecutar las instrucciones que faltan de la  actual.

## Iterables, secuencias y diccionarios

### Iterables

Un _iterable_ en Python es un objeto que puede recorrerse elemento a elemento.

- Ejemplos de iterables son las secuencias (listas, tuplas, etc.), pero también los diccionarios, y otros.
- Muchas funciones o operadores son capaces de actuar sobre un iterable, no importa qué otras características tenga (p.ej. `len`)
- Nota: una función _generador_ es similar a un iterable, en cuanto a que va ofreciendo elementos uno a uno, pero de forma _perezosa_ (solo produce los elementos conforme se van pidiendo).

### Secuencias

Las secuencias son contenedores de elementos, iterables.

- _Listas_ (mutables) y _tuplas_ (inmutables): cualquier tipo de elementos, ordenadas, y con repetición.

```python
t = ('a', 'b', 'c')    #  t = 'a', 'b', 'c'
l = ['a', 'b', 'c']
l[1] = 'x'
l[ini:end:step]
if 'j' in l...
l.append('d')
l + l + l    # l*3
```

- _Ranges_: inmutables, ordenadas, solo enteros, de evaluación perezosa:

```python
for val in range(5):  print(val)
```

- _Sets_ (mutables) y _frozensets_ (inmutables): cualquier tipo de elementos, sin order ni repetición.

```python
s = {0, 0, 2, 1, 1}
print(s)
```
```
{0, 1, 2}
```

- _Strings_: secuencias inmutables de caracteres

<div style="background-color:powderblue;">

**EJERCICIO 1:**
    
- Obtener un string `s2` tomando una letra de cada dos del string `s` dado, usando el operador de _slice_: `[]`.

- Hacer ahora lo mismo usando `for` para crear, primero, una lista con las letras, y después convertirlo a string usando el método `str.join`.

In [1]:
s = 'Exsxtxax xexsx xmxix xfxrxaxsxex xsxexcxrxextxax'

In [2]:
s2 = s[::2]
print(s2)

Esta es mi frase secreta


In [3]:
lista_letras = []
for i in range(0, len(s), 2):
    lista_letras.append(s[i])

s2_bucle = ''.join(lista_letras)
print("s2 con bucle:", s2_bucle)

s2 con bucle: Esta es mi frase secreta


### Diccionarios

Iterables que asocian claves y valores (mapas, _hash arrays_).

- Las claves deben ser inmutables (enteros, strings, tuplas).
- Los valores pueden ser cualquier tipo de objeto.
- Cuando se recorre (itera) un diccionario, se recorren las claves.
  - *Desde Python 3.7:* el orden de las claves es el de inserción (previamente estaba indefinido)

In [None]:
d = {'a': 1, 'b': 5}
d = dict(a=1, b=5)

print(d['a'])

In [None]:
d['c'] = 10

for k in d:
    print(k, '-->', d[k])

In [None]:
for k, x in d.items():
    print(k, '-->', x)

In [None]:
for x in d.values():
    print(x)

<div style="background-color:powderblue;">

**EJERCICIO 2:**

- Leer el fichero de entrada `data/notas.txt` que contiene una asignatura y una nota por cada línea. Crear un diccionario que contenga como claves las asignaturas y como valores las notas.

- Usando _fstrings_, mostrar por pantalla la siguiente línea por cada asignatura: `En la <asignatura> has obtenido <nota>`, sustituyendo apropiadamente el nombre de la asignatura y la nota para cada una.

- Repetir el punto anterior, pero añadiendo al final de la línea la palabra `Aprobado`, si la nota es mayor de 5, y `Suspendido` si es menor.

### Comprenhentions

Expresiones concisas para generar listas, diccionarios y generadores.

```python
[expr(x)  for x in iterable]

{expr1(x): expr2(x)  for x in iterable}

(expr(x)  for x in iterable)
```

Existe una forma algo más compleja:
```python
[<expr(x,y)>  for x in I1   for y in I2   if <cond(x,y)>]
```

In [None]:
strings = ['this', 'and', 'those']
l1 = [len(s) for s in strings]
g1 = (len(s) for s in strings)

print('List:', l1)
print('Generator:', g1)

In [None]:
print('Iteration on generator:')
for x in g1:  print(x)

In [None]:
d1 = {x+1: x**2 for x in (2, 4, 6)}
print('\nDict:', d1)

<div style="background-color:powderblue;">

**EJERCICIO 3:**
    
Sin usar `for` ni `while`:
    
- Repetir el primer punto del ejercicio `1`.
- Generar el string `s` del ejercicio `1` a partir del string dado `s0`.

## Funciones y módulos

### Funciones en Python

Una función es un objeto que contiene un bloque de instrucciones que se ejecutan cuando la función _es llamada_: `mi_funcion(args)`. Lafunción se define (se crea) con la sentencia `def`:

```python
def mi_funcion(arg1, arg2, ...):
    instruccion
    instruccion
    return ...
```
La sentencia `return` especifica el valor devuelto por la función (si no aparece, es `None`)

#### Argumentos de funciones

Los argumentos de una función de Python se _pasan por asignación_.

- El valor pasado _se asigna_ a una variable local dentro de la función (no se hace una copia)
- Si el valor es modificable, y se modifica, la variable externa verá el mismo cambio
- Como las variables no tienen tipo, tampoco lo tienen los argumentos de una función

Formas de pasar argumentos:

- Por posición: `f(3, 4)`
- Nombrados: `f(x=3, y=4)`  (siempre después de los de posición)
- Expandidos (siempre después de los no expandidos)
  - `f(*(3, 4))` equivale a `f(3, 4)`
  - `f(**{x:3, y:4}` equivale a `f(x=3, y=4)`

Formas de recoger argumentos:

- Argumentos con valores por defecto (si no son especificados por el llamante): `def f1(a1, a2=0)`
- Resto de argumentos recogidos en una tupla: `def f2(a1, *rest)`
- Resto de argumentos _nombrados_ recogidos en un diccionario: `def f3(a1, **res)`
- Combinación de las anteriores: `def f3(a1, a2=3, *vrest, **drest)`

<div style="background-color:powderblue;">

**EJERCICIO 4:**
    
Escribir una función `f` que reciba un primer argumento `a1` obligatorio, un segundo `a2` optativo (con valor por defecto _None_, y un número arbitrario de argumentos nombrados (_keywords_). La función deberá mostrar los argumentos recibidos, y su valor, en una línea diferente para cada uno.
    
Probarla con las llamadas mostradas a continuación.

In [None]:
f(1)
f(1, 2)
f(1, 2, juan=35, pepe='verde')
f(a1=1, juan=35, pepe='verde')
d = {'juan': 35, 'pepe': 'verde'}
f(a1=1, a2=2, **d)

### Namespace y scope

Los _namespaces_ dividen el conjunto de identificadores de objetos, de manera que sea posible repetir el mismo nombre en dos espacios independientes, sin que haya colisión.

Python define muchos espacios de nombres diferentes: el de un módulo, el de una función (variables locales), el _built-in_...

Una variable siempre puede identificarse como: `namespace.identificador`, p.ej: `math.log` o `__builtins__.print`.

El _scope_ de un identificador (variable) define en qué partes del programa es accesible, sin indicar el namespace (usando el prefijo). En ese caso, una variable se busca primero en el namespace local (función), luego en el global (módulo), y luego en el _built-in_ (siempre accesible).

### Módulos y paquetes

#### Módulos

Un módulo es un fichero que agrupa código Python. Habitualmente, un módulo `foo` corresponde al fichero `foo.py`, aunque también puede ser un fichero compilado, `foo.so`).

Un módulo crea su propio espacio de nombres, que se hace accesible al importar el módulo (`import`), y accedemos a sus objetos con la notación `modulo.objeto`

El código de un módulo consiste principalmente en definiciones de objetos, para su reutilización, pero puede incluir cualquier tipo de instrucción (p.ej. de inicialización, o para usarlo como _script_), y se ejecuta la primera vez que se llama a `import`.

In [1]:
import math         # Ligamos el identificador 'math' al namespace del módulo
print(math.pi)      # Accedemos al objeto `pi` en ese namespace

import math as mod  # Ligamos el identificador 'mod' al namespace del módulo 'math'
print(mod.pi)

from math import pi as PI   # Ligamos el id 'PI' al objeto 'pi' del módulo 'math'
print(PI)

from math import pi
print(pi)

3.141592653589793
3.141592653589793
3.141592653589793
3.141592653589793


**Búsqueda de módulos**

Cuando se usa la instrucción `import`, el módulo se busca primero en los _built-in_. Si no se encuentra, se busca en los directorios contenidos en la variable `sys.path`. Esta variable contiene:

- El directorio del script en ejecución
- Los directorios de la variable de entorno `PYTHONPATH`
- Los directorios por defecto de la instalación (librerías del sistema)

#### Paquetes

Los paquetes son agrupaciones de módulos.

- Físicamente, se corresponden con directorios que albergan ficheros `.py`

      mypack/__init__.py
      mypack/mymod1.py
      mypack/subpack/__init__.py  
      mypack/subpack/mymod1.py


- Desde el punto de vista lógico, organizan jerárquicamente los namespaces:

  ```python
  import  mypack.mymod1
  mypack.mymod1.some_function()

  from  mypack.subpack  import  mymod1
  mymod1.other_func()
  ```


- Para que un directorio se considere un paquete, debe contener el fichero `__init__.py`, aunque sea vacío.

## Clases y objetos

### Programación orientada a objetos

La programación orientada a objetos (O.O.P.) es un modelo (paradigma) de programación en el que se agrupan datos y funciones en objetos que pertenecen a clases (nuevos tipos de datos, definidos por el programador).

La encapsulación de código en los objetos permite ocultar los detalles de la implementación tras el interfaz.

En Python, usar O.O.P como estilo de programación es opcional. Aunque implícitamente siempre usamos clases y objetos, no siempre optamos por definir nuevas clases.

### Clases e instancias

Las clases definen un _tipo_ de objetos

- Crean su propio namespace
- Definen atributos (miembros): datos y funciones (métodos)
    
Las _instancias_ de una clase son los _objetos_, cuyo tipo es esa clase.
  
### Nuevas clases
Podemos crear nuevos tipos de datos, definiendo clases con:

```python
class <nombre>:
    instrucción
    ...
```

Lo más esencial de una clase son las funciones miembro:

- El primer argumento de todos los métodos (`self`) es una referencia a la instancia llamante (pasada automáticamente)
- Si definimos atributos de `self` estamos creando un atributo de instancia (diferente para cada instancia)

Convenciones:

- Los atributos privados comienzan con `_` (es preferible no utilizarlos directamente)
- Las miembros `__<nombre>__`, tienen usos especiales, no se les suele invocar explícitamente.
- El método `__init__` es el _constructor_. Se llama automáticamente cuando se crea una nueva instancia de la clase.


In [None]:
class Persona:

    def __init__(self, nombre, edad):
        self.nombre = nombre
        self.edad = edad

    def saludo(self):
        return f'Hola. Me llamo {self.nombre} y tengo {self.edad} años.'

In [None]:
juan = Persona('Juan', 25)

print("Nombre:", juan.nombre)
print("Saludo:", juan.saludo())

print("\nEl tipo de 'juan' es", type(juan))

Nombre: Juan
Saludo: Hola. Me llamo Juan y tengo 25 años.

El tipo de 'juan' es <class '__main__.Persona'>


### Herencia

Una clase que extiende a otra, hereda sus atributos, de manera que puede usarlos directamente (reutilización de código). También podría redefinir alguno de ellos, o añadir nuevos.

P. ej.:
```python
class Cientifico(Persona):
        
    def investigar(self):
        bla bla
```        