# Sesión 6: ficheros y recursividad

##  Ficheros
Aunque se volverá a tratar el tema de ficheros al usar Numpy y Pandas, hablamos brevemente de ficheros en Python. La documentación adecuada es [el tutorial de Python](https://docs.python.org/3/tutorial/inputoutput.html#reading-and-writing-files).

Modos de apertura de un fichero:
  - 'r': lectura
  - 'w': escritura (borra el contenido anterior)
  - 'a': añade al final



Estamos acostumbrados a tratar ficheros de un modo similar.
En la Sección 7.2 del tutorial está todo lo que necesitamos por el momento.
Usamos: open, close, read, readline, write.

In [None]:
f = open('mifich.txt','a')
f.write('hola')
f.close()


In [None]:
#Obtenemos una estructura
#modo lectura por defecto, por lo que podemos quitar 'r'
#Sin argumento size (opcional) proporciona el contenido completo del fichero
f=open('mifich.txt','r')
d = f.read()
d

'Habia una vez un barquito chiqui\nque no podia, que no podia\nnavegar.holahola'

In [None]:
f.close()

In [None]:
#Para tratar por líneas un fichero de texto se usa readline
f=open('mifich.txt')
#La forma más cómoda de tratarlo por líneas
print(f.readline())
f.readline()


Habia una vez un barquito chiqui



'que no podia, que no podia\n'

In [None]:
f.readline()

'navegar.holahola'

In [None]:
#Una lectura tras el final de fichero resulta la secuencia vacía
f.readline()

''

In [None]:
#Aprovechando que open devuelve un objeto file (iterable)
f.close()
f=open('mifich.txt')
for line in f:
  print(line,end=' ')

Habia una vez un barquito chiqui
 que no podia, que no podia
 navegar.holahola 

Con ``list(f)`` o f``.readlines()`` se obtiene la lista de líneas de ``f``.

##### Forma recomendada para el tratamiento en Python

In [None]:
#Estaba abierto
f.close()
#La estructura with hace que el fichero se cierre incluso si hay problemas (excepciones)
with open('mifich.txt') as f:
  d = f.read()
  for line in d:
      print(line,end=' ')

In [None]:
with open('mifich.txt') as f:
    d = f.readlines()
print(d)

In [None]:
#Resulta muy útil para el manejo por líneas usar enumerate
with open('mifich.txt') as f:
    for idx, linea in enumerate(f):
        print(f'{idx}: {linea.strip()}')


In [None]:
linea.split('v')

In [None]:
linea

In [None]:
linea.split('o')

In [None]:
palabras = linea.split()

In [None]:
palabras

In [None]:
s=' '.join(palabras)
s

## Recursividad

La recursividad o recursión es un concepto que proviene de las matemáticas, y que aplicado al mundo de la programación nos permite resolver problemas o tareas donde las mismas pueden ser divididas en subtareas cuya funcionalidad es la misma. Dado que los subproblemas a resolver son de la misma naturaleza, se puede usar la misma función para resolverlos. Dicho de otra manera, una función recursiva es aquella que está definida en función de sí misma, por lo que se llama repetidamente a sí misma hasta llegar a un punto de salida.

Cualquier función recursiva tiene dos secciones de código claramente divididas:

- Por un lado tenemos la sección en la que la función se llama a sí misma.
- Por otro lado, tiene que existir siempre una condición en la que la función retorna sin volver a llamarse. Es muy importante porque de lo contrario, la función se llamaría de manera indefinida

### Factorial

Uno de los ejemplos mas usados para entender la recursividad, es el cálculo del factorial de un número n!. El factorial de un número n se define como la multiplicación de todos sus números predecesores hasta llegar a uno. Por lo tanto $5!$, leído como cinco factorial, sería $5\times 4\times 3\times 2\times 1$. Es decir, $5!$ es igual a $5 \times 4!$ y $4!$ es igual a $4 \times 3!$ y así sucesivamente hasta llegar a 1.

In [None]:
def factorial_normal(n):
    r = 1
    i = 2
    while i <= n:
        r *= i
        i += 1
    return r

factorial_normal(5)

120

In [None]:
def factorial_recursivo(n):
    if n == 1:
        return 1
    else:
        return n * factorial_recursivo(n-1)

factorial_recursivo(5)

120

In [None]:
%timeit factorial_normal(5)

201 ns ± 6.38 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [None]:
%timeit factorial_recursivo(5)

310 ns ± 16.4 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


### Hojas de listas anidadas (ejemplo extraído de [Real Python](https://realpython.com/python-recursion/))

Suponer que disponemos de la siguiente lista anidada en Python:

```python
names = [
    "Adam",
    [
        "Bob",
        [
            "Chet",
            "Cat",
        ],
        "Barb",
        "Bert"
    ],
    "Alex",
    [
        "Bea",
        "Bill"
    ],
    "Ann"
]
```

Que puede representarse mediante:
![lista anidada](https://realpython.com/cdn-cgi/image/width=946,format=auto/https://files.realpython.com/media/jsturtz-nested-list.20eb8fe32366.png)

Si ahora queremos contar el número de nodos hoja en esta lista, lo podemos hacer de manera recursiva:
1. Avanzamos en cada elemento de la lista y lo examinamos.
2. Si encontramos un nodo hoja, entonces lo añadimos al contador.
3. Si se encuentra una sublista, entonces contamos los nodos hoja para esa sublista.

In [None]:
def cuenta_recursivo(lista):
  if(len(lista)==0):
    return 0
  else:
    if(isinstance(lista[0],list)):
      return cuenta_recursivo(lista[0]) + cuenta_recursivo(lista[1:])
    else:
      return 1 + cuenta_recursivo(lista[1:])

In [None]:
def cuenta_no_recursivo(item_list):
    count = 0
    stack = []
    current_list = item_list
    i = 0

    while True:
        if i == len(current_list):
            if current_list == item_list:
                return count
            else:
                current_list, i = stack.pop()
                i += 1
                continue

        if isinstance(current_list[i], list):
            stack.append([current_list, i])
            current_list = current_list[i]
            i = 0
        else:
            count += 1
            i += 1

# Ejercicios

**Ejercicio:**
1. Crear un fichero de texto con el contenido que quieras, darle mombre Pru.txt.
2. Leer el contenido del fichero y convertir las lineas a notación [CamelCase](https://es.wikipedia.org/wiki/Camel_case).
3. Leer el contenido del fichero y convertir las lineas a notación [snake_case](https://es.wikipedia.org/wiki/Snake_case).
4. Generar los ficheros PruCamelCase.txt y Pru_snake_case.txt

In [7]:
f = open('Pru.txt','w')
f.write('Hola que tal')
f.close()

def to_camel(s):
  return "".join([x.capitalize() for x in s.split(' ')])

def to_snake(s):
  return "_".join([x[0].lower() + x[1:] if x else x for x in s.split(' ')])

f = open('Pru.txt','r')
d = f.read()

f1 = open('PruCamelCase.txt','w')
f1.write(to_camel(d))
f1.close()

f2 = open('Pru_snake_case.txt','w')
f2.write(to_snake(d))

12

**Ejercicio:**
Crea un fichero “produccion.txt” que se supone contiene datos de las producciones diarias de una fábrica de zapatillas (en un periodo de tiempo que no viene al caso). Elige el formato que consideres más adecuado. A partir de dicho fichero:
- Define una función que, desde el nombre de un fichero con ese formato, calcule una lista con las 10 mejores producciones diarias. Puedes hacerlo a pelo o, para que sea más eficiente desde el punto de vista de la memoria, usando solo una lista de tamaño 10, que se vaya actualizando conforme se van tratando los datos del fichero.
- Define una función que, desde el nombre de un fichero con ese formato, decida si existe algún día en el que la producción superó el doble de la media.



In [30]:
# Formato:  fecha,produccion
#           2025-10-01,1500

f = open('produccion.txt','w')
f.write("""fecha,produccion
  2025-10-01,1500
  2025-10-02,1475
  2025-10-03,1600
  2025-10-04,1520
  2025-10-01,0
  2025-10-02,1
  2025-10-03,2
  2025-10-04,3
  2025-10-01,4
  2025-10-02,5
  2025-10-03,6
  2025-10-04,7
  2025-10-02,8
  2025-10-03,9
  2025-10-04,10
  """)
f.close()

def top10_producciones(fich):
  def lee_linea(x):
    linea = x.readline()
    eltos = linea.strip().split(',')
    if(len(eltos) != 2):
      return False, '', ''
    return True, eltos[0], int(eltos[1])
  f = open(fich, 'r')
  f.readline() #la primera linea es la cabecera

  lista = []
  flag, fecha, prod = lee_linea(f)
  while(flag):
    if len(lista)<10:
      lista.append({'fecha': fecha, 'prod': prod})
    else:
      if(lista[0]['prod']<prod):
        del lista[0]
        lista.append({'fecha': fecha, 'prod': prod})
    lista = sorted(lista, key=lambda r: r['prod'])
    flag, fecha, prod = lee_linea(f)
  return lista

top10_producciones('produccion.txt')

[{'fecha': '2025-10-02', 'prod': 5},
 {'fecha': '2025-10-03', 'prod': 6},
 {'fecha': '2025-10-04', 'prod': 7},
 {'fecha': '2025-10-02', 'prod': 8},
 {'fecha': '2025-10-03', 'prod': 9},
 {'fecha': '2025-10-04', 'prod': 10},
 {'fecha': '2025-10-02', 'prod': 1475},
 {'fecha': '2025-10-01', 'prod': 1500},
 {'fecha': '2025-10-04', 'prod': 1520},
 {'fecha': '2025-10-03', 'prod': 1600}]

In [35]:
def supera_doble_media(nombre):
  def lee_linea(x):
    linea = x.readline()
    eltos = linea.strip().split(',')
    if(len(eltos) != 2):
      return False, '', ''
    return True, eltos[0], int(eltos[1])
  f = open(nombre, 'r')
  f.readline() #la primera linea es la cabecera

  lista = []
  flag, fecha, prod = lee_linea(f)
  while flag:
    lista.append({'fecha': fecha, 'prod': prod})
    flag, fecha, prod = lee_linea(f)

  media = sum([x['prod'] for x in lista]) / len(lista)

  return [x for x in lista if x['prod']>2*media]


supera_doble_media('produccion.txt')

[{'fecha': '2025-10-01', 'prod': 1500},
 {'fecha': '2025-10-02', 'prod': 1475},
 {'fecha': '2025-10-03', 'prod': 1600},
 {'fecha': '2025-10-04', 'prod': 1520}]

**Ejercicio**: Usamos la representación habitual de un grafo mediante un diccionario (vértice, lista de vértices adyacentes).
- Define una función que, dado un grafo G y un conjunto de vértices S, calcula todos los vértices de G alcanzables desde vértices de S.
- Define una función que, dados dos grafos, decida si el primero es subgrafo del segundo.

In [49]:
grafo = {'A': ['C', 'B'], 'C': [], 'B': ['C','D'], 'D':['E','F'], 'E':['A'],'F':['G'],'G':['C']}

def vertices_alcanzables(grafo, s):
  l = set(s)
  for x in s:
    l.add(x)
    l = l | set(grafo[x])
  if(l == set(s)):
    return s
  else:
    return vertices_alcanzables(grafo,list(l))

vertices_alcanzables(grafo, ['F'])


['G', 'C', 'F']

In [51]:
g1 = {'A': ['C', 'B'], 'C': [], 'B': ['C','D'], 'D':['E','F'], 'E':['A'],'F':['G'],'G':['C']}
g2 = {'B': ['C','D'], 'D':['E','F'], 'E':[],'F':['G'],'G':['C']}
g3 = {'A': ['C', 'B', 'F']}


def es_subgrafo(g1,g2):
  for x in g1:
    if(x not in g2):
      return False
    for y in g1[x]:
      if(y not in g2[x]):
        return False
  return True

print(es_subgrafo(g2,g1))
print(es_subgrafo(g3,g1))

True
False


**Ejercicio**: Desarrollar ``borrarUno`` que elimina todas las apariciones de un
dato en una lista. A partir de dicha función crear una función ``borrarMuchos``, que elimina de una lista todos los elementos que aparecen en una lista. Se pide implementar ``borrarMuchos`` de tres formas: usando un bucle ``for``, usando ``filter`` y usando recursividad.

In [63]:
def borrarUno(lista, dato):
  return [x for x in lista if x !=dato]

borrarUno([1,2,1,2,1,2],1)

def borrarMuchos1(l1, l2):
  for x in l2:
    l1 = borrarUno(l1,x)
  return l1

print(borrarMuchos1([1,2,1,2,1,2,3,3,4],[1,3]))

def borrarMuchos2(l1,l2):
  return list(filter(lambda x: x not in l2,l1))

print(borrarMuchos2([1,2,1,2,1,2,3,3,4],[1,3]))

def borrarMuchos3(l1,l2):
  if(len(l2)==0):
    return l1
  else:
    return borrarMuchos3(borrarUno(l1,l2[0]),l2[1:])

print(borrarMuchos3([1,2,1,2,1,2,3,3,4],[1,3]))

[2, 2, 2, 4]
[2, 2, 2, 4]
[2, 2, 2, 4]


**Ejercicio**: trabajamos sobre matrices representadas como listas de listas. Construye una función para obtener la lista de pares que corresponden a entradas no nulas de una matriz. Hazlo mediante listas por comprensión, con bucles "normales" y con recursividad.

In [71]:
m = [[1,2,3],[4,5,None],[None,8,9]]

def lista_no_nulos1(m):
  return [(i, j) for i, fila in enumerate(m) for j, val in enumerate(fila) if val is not None]

print(lista_no_nulos1(m))

def lista_no_nulos2(m):
  lista = []
  for i in range(len(m)):
    for j in range(len(m[i])):
      if(m[i][j] is not None):
        lista.append((i,j))
  return lista

print(lista_no_nulos2(m))

def lista_no_nulos2(m):
  lista = []
  for i in range(len(m)):
    for j in range(len(m[i])):
      if(m[i][j] is not None):
        lista.append((i,j))
  return lista

print(lista_no_nulos2(m))

[(0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (2, 1), (2, 2)]
[(0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (2, 1), (2, 2)]


# Entrega

Recuerda guardar este notebook en tu repositorio de GitHub.