# Lectura y escritura de ficheros

En la mayoría de problemas de ciencia de datos necesitamos leer los datos desde algún archivo y podemos necesitar escribir los resultados en otro.  
<ul style="list-style-type:none">
    <li><a href='#1.-Ficheros-de-texto'>1. Ficheros de texto</a></li>
       <li><a href='#2.-Librería-os'>2. Librería os</a></li>
      <li><a href="#3.-Ejercicios-para-practicar">3. Ejercicios </a></li>
    <ul style="list-style-type:none">
</ul>

## 1. Ficheros de texto
Para abrir un fichero usaremos la función predeterminada `open` y para cerrarla el método `close`.

In [73]:
f = open('test2.txt', 'w') # path puede ser absoluto o relativo
# Escribimos la palabra 'prueba' en el archivo
f.write("prueba")

6

In [74]:
# Como no hemos cerrado el archivo podemos seguir escribiendo 
f.write("\n")
f.write("prueba 2")
f.write("\n")
f.write("prueba 3")
# Cerramos el archivo
f.close()

In [75]:
# ahora que está cerrado ya no podemos escribir más
f.write("prueba 4")

ValueError: I/O operation on closed file.

Siempre hay que recordar cerrar el archivo al terminar, porque si no estamos gastanto recursos innecesariamente. Alternativamente, podemos usar la sentencia `with` al abrir el archivo, así cuando salimos de ese contexto, Python cierra automáticamente el archivo.

In [76]:
with open('test3.txt', 'w') as f:
    # Escribimos 'otra prueba' en el archivo
    f.write("otra prueba")

La función `open` coge como primer argumento el *path* (relativo o absoluto) y como segundo el modo de apertura. Con este modo especificamos con qué finalidad se abre el fichero. Los más comunes son:

En relación con el modo de apertura, Python reconoce los siguientes modificadores, que se pueden combinar entre ellos para especificar cómo y con qué finalidad se abre el fichero:

* `r`, modo de lectura (del inglés, _**r**eading_).
* `w`, modo de escritura (del inglés, _**w**riting_), sobrescribe el contenido del archivo si éste ya existe, o bien crea el archivo si no existe.
* `a`, modo de escritura, escribe al final del archivo, después del contenido ya existente en el archivo (del inglés, _**a**ppend_), o bien crea el archivo si no existe.

Podéis ver todos los posibles modos [aquí](https://docs.python.org/3/library/functions.html#open)

In [77]:
# vemos un ejemplo. COm "a" añadimos texto al archivo
with open('test3.txt', 'a') as f:
    f.write("\n")  # añadimos un salto de línea
    f.write("más pruebas")

In [78]:
# mientras que con "w" se borra todo lo que haya y se escribe
with open('test3.txt', 'w') as f:
    # Añadimos texto en el archio
     f.write("siguiente prueba")

In [79]:
# "r" nos permite leer
with open('test3.txt', 'r') as f:
    print(f.read())
    

siguiente prueba


Tal como hemos usado el método `read` leemos todo el contenido del fichero a la vez. Cuando el fichero es muy grande esto puede no ser lo más eficiente, sobretodo si no necesitamos todo el contenido del archivo. Para eso podemos ir línea a línea:

In [80]:
with open('test2.txt', 'r') as f:
    for line in f:
        print(line)

prueba

prueba 2

prueba 3


## 2. Librería os
El módulo `os` nos permite interaccionar con el sistema, aquí veremos algunas cosas como abrir y cerrar carpetas, pero podéis ver los detalles [aquí](https://docs.python.org/3/library/os.html). 

In [81]:
import os  # cargamos módulo

folder = "nueva_carpeta"

os.mkdir(folder)

FileExistsError: [Errno 17] File exists: 'nueva_carpeta'

También podríamos abrir varias carpetas contenidas unas en otras a la vez, por ejemplo:


In [82]:
folder = "nueva_carpeta/test1/test2"
os.makedirs(folder)

FileExistsError: [Errno 17] File exists: 'nueva_carpeta/test1/test2'

Y ahora ya podríamos escribir un archivo dentro de algunas de estas carpetas: 

In [83]:
with open('nueva_carpeta/fichero_de_prueba.txt', 'a') as f:
    f.write("más pruebas")

with open('nueva_carpeta/test1/test2/fichero_de_prueba.txt', 'a') as f:
    f.write("más pruebas")

También podemos borrar archivos o carpetas

In [84]:
os.remove('test3.txt')

In [85]:
os.rmdir('nueva_carpeta/test1')

OSError: [Errno 66] Directory not empty: 'nueva_carpeta/test1'

No nos deja borrar directorios que no estén vacíos, habría que borrar primero el contenido y después la carpeta. También podríamos cambiar el nombre de un archivo o de una carpeta

In [86]:
os.rename('test2.txt',
          'test2_v2.txt')

Otra función de ´os´ muy útil es poder hacer una lista de los archivos que tenemos en una carpeta. 

In [41]:
os.listdir()

['Primeros_pasos.ipynb',
 'N6_Variables_logicas_y_condiciones.ipynb',
 'N1_PythonBasic.ipynb',
 'N4_lectura_y_escritura_de_ficheros.ipynb',
 'N3_Funciones_avanzado.ipynb',
 'N5_Modulos_matplotlib.ipynb',
 '__pycache__',
 'test.py',
 'N2_Funciones_y_estructuras_de_control.ipynb',
 'N7_Loops.ipynb',
 'untitled.txt',
 'Numpy_y_visualization.ipynb',
 '.ipynb_checkpoints',
 'Numpy_Pandas.ipynb',
 'test2_v2.txt',
 'PythonPorjects.ipynb',
 'nueva_carpeta',
 'smoothIntroPython.ipynb']

Para escoger solo los archivos de texto solo tendría que analizar la lista 

In [49]:
l_txt = []
for file_name in os.listdir():
    if file_name.endswith(".txt"):
        l_txt.append(file_name)

In [50]:
# o de forma más compacta:
l2_txt = [file_name for file_name in os.listdir() if file_name.endswith(".txt")]

In [51]:
print(l_txt)
print(l2_txt)

['untitled.txt', 'test2_v2.txt']
['untitled.txt', 'test2_v2.txt']


Por útlimo comentamos también que hay varias funciones auxiliares de path que puede ser útiles. Damos aquí unos ejemplos pero podéis verlo [aquí](https://docs.python.org/3/library/os.path.html#module-os.path).

In [52]:
# os.path.join permite unir paths, /home/User/Desktop/filename.txt'
path = "/home"
full_path = os.path.join(path, "User/Desktop", "filename.txt")
print(full_path)

/home/User/Desktop/filename.txt


In [59]:
# podemos obtener facilmente el path absoluto
os.path.abspath('test2_v2.txt')

'/Users/casaponsa/WORK/DOCENCIA/BigDataPython/2021Course/BasicPython/test2_v2.txt'

In [55]:
# puede separate el directorio y el archivo 
print(os.path.dirname(full_path))
print(os.path.basename(full_path))

/home/User/Desktop
filename.txt


In [56]:
# Nos puede decir si un archivo o carpeta existe o no 
os.path.exists(full_path)

False

In [60]:
 os.path.exists('/Users/casaponsa/WORK/DOCENCIA/BigDataPython/2021Course/BasicPython/test2_v2.txt')

True

In [64]:
# También podemos saber cuantos bytes ocupa una carpeta o fichero
os.path.getsize('.')

640

Otra manera de interactuar con el sistema desde una notebook es usando ! antes. 
 

In [65]:
!mkdir nueva_carpeta_2

En esta notebook hemos visto como arbir y cerrar archivos de texto, para leer bases de datos en otros formatos se suele usar `pandas` y `PySQL`.

## 3. Ejercicios para practicar

1. Cread una carpeta que se llame "vecinos" en vuestro `home` (`~`). Dentro de esta carpeta abriréis 2 carpetas, una para cada uno de los compañeros o compañeras sentadas a vuestro lado en la clase. Dentro generáis un fichero y escribid 3 líneas sobre él o ella, apuntando el momento (día y hora/minutos/segundos) en qué escribís la observación.

Para saber el momento podéis usar el módulo `time` para eso. Podéis ver ejemplos [aquí](https://www.programiz.com/python-programming/time).


La idea es que os quede

/home/victor/observaciones.txt 
/home/lara/observaciones.txt

y dentro de observaciones.txt

Sat Jul 10 23:13:10 2021  $\;\;\;\;\;\;$   pelo negro

Sat Jul 10 23:15:02 2021  $\;\;\;\;\;\;$    sonríe

In [None]:
# Código

2. Teniendo en cuenta que el path de cada fichero es full_path = '/Users/casaponsa/vecinos/victor.txt'.
Recuperad por separado el nombre del directorio y el del fichero (sin hacerlo a mano) y volvedlo a reconstruir usando `join`. 

In [96]:
# Código
print(os.uname)
os.path.abspath('')

<built-in function uname>


'/Users/casaponsa/WORK/DOCENCIA/BigDataPython/2021Course/BasicPython'

3. Escribe un programa de Python que te devuelva el sistema operativo, información más detallada del sistema opertivo como la versión, el directorio en el que estamos y que te de una lista de los archivos y carpetas que hay en ese directorio.

In [None]:
# Código

4. Ahora haz un programa que te haga una lista con los archivos solo y otra con solo las carpetas. (si solo tienes archivos, genera un par de carpetas antes)

In [97]:
# Código

5. Escribe una función que coja un path de un directorio, compruebe que el directorio exista, que cuente cuántos archivos hay dentro y qué extensión tienen.

5.1 Aplica esta función a la carpeta images que tendréis en este directorio. 



In [None]:
# Código 