
<img style="float: left;;" src='Figures/alinco.png' /></a>

# Introducción: Trabajando Con Archivos de Texto
___

En esta sección trabajaremos:

 * Con f-strings para impresión de texto
 * Con archivos: abrir, leer, escribir y agregar archivos de texto

## f-strings

Introducido en Python 3.6, <strong> f-strings </strong> ofrece varios beneficios sobre el antiguo método de impresión de una cadena `.format ()`. <br> Por un lado, puede traer variables externas inmediatamente a la cadena en lugar de pasarlas como argumentos en la función:

In [1]:
name = 'Luis'

print('Un integrante del curso de NLP es: {var}'.format(var=name))



Un integrante del curso de NLP es: Luis


In [2]:
print(f'Un integrante del curso de NLP es: {name}')

Un integrante del curso de NLP es: Luis


Agregando `!r` se obtiene <strong>la representación de la cadena</strong>:

In [3]:
print(f'Un integrante del curso de NLP es: {name!r}')

Un integrante del curso de NLP es: 'Luis'


Hay que tener cuidado de no permitir que las comillas en los campos de reemplazo entren en conflicto con las comillas utilizadas en la cadena exterior:

In [4]:
d = {'a':123, 'b':456}
print(f'La dirección es: {d['a']} ')

SyntaxError: invalid syntax (<ipython-input-4-265868b6ae5b>, line 2)

En vez de eso, hay que usar diferentes estilos de comillas:

In [5]:
d = {'a':123, 'b':456}
print(f"La dirección es: {d['a']} ")

La dirección es: 123 


### Anchos mínimos, alineación y rellenado
Podemos pasar argumentos dentro de un conjunto anidado de llaves para establecer un ancho mínimo para el campo, la alineación e incluso los caracteres de relleno.

In [7]:
library = [('Autor', 'Tópico', 'Páginas'),('Twain', 'Rafting', 601),
           ('Feynman', 'Physics',95),('Hamilton', 'Mithology', 144)]

for book in library:
    print(f'{book[0]:{10}} {book[1]:{8}} {book[2]:{7}}' )

Autor      Tópico   Páginas
Twain      Rafting      601
Feynman    Physics       95
Hamilton   Mithology     144


Aquí las primeras tres líneas se alinean, excepto que `Pages` sigue una alineación predeterminada a la izquierda, mientras que los números están alineados a la derecha. Además, el número de página de la cuarta línea se desplaza hacia la derecha ya que "Mitología" supera el ancho de campo mínimo de "8". Al configurar los anchos de campo mínimos, asegúrese de tener en cuenta el elemento más largo.

Para establecer la alineación, utilice el carácter `<` para alinear a la izquierda, `^` para el centro, `>` para la derecha. <br>
Para configurar el relleno, preceda el carácter de alineación con el carácter de relleno (`-` y` .` son opciones comunes).

Hagamos algunos ajustes:

In [11]:
for book in library:
    print(f'{book[0]:{10}} {book[1]:{10}} {book[2]:.>{7}}' )

Autor      Tópico     Páginas
Twain      Rafting    ....601
Feynman    Physics    .....95
Hamilton   Mithology  ....144


### Formato de fecha

In [13]:
from datetime import datetime

today = datetime(year=2021, month=7, day= 9)

print(f'{today: %B %d, %Y}')

 July 09, 2021


Para mayor información: https://docs.python.org/3/reference/lexical_analysis.html#f-strings

***

# Archivos

Python usa objetos de archivo para interactuar con archivos externos en su computadora. Estos objetos de archivo pueden ser cualquier tipo de archivo que tenga en su computadora, ya sea un archivo de audio, un archivo de texto, correos electrónicos, documentos de Excel, etc. Nota: Probablemente necesitará instalar ciertas bibliotecas o módulos para interactuar con esas diversas tipos de archivos, pero están fácilmente disponibles. 

Python tiene una función de apertura incorporada que nos permite abrir y jugar con tipos de archivos básicos. Sin embargo, primero necesitaremos un archivo. ¡Usaremos algo de magia de IPython para crear un archivo de texto!

## Creación de un archivo con IPython
#### ¡Esta función es específica de los cuadernos jupyter! Una manera alternativa es crear rápidamente un archivo .txt simple con algún editor de texto.

In [14]:
%%writefile test.txt
Hola, este es mi primer archivo de texto.
Esta es la segunda linea de mi archivo de texto.

Overwriting test.txt


## Abriendo un archivo en Python

### Hay que conocer la ubicación de nuestro archivo

Es fácil obtener un error en este paso:

In [17]:
myfile = open('test.txt')

Para evitar este error, asegúrese de que su archivo .txt esté guardado en la misma ubicación que su computadora portátil. Para verificar la ubicación de su computadora portátil, use ** pwd **:

In [16]:
pwd

'/home/gaddiel/OneDrive/ALINNCO/IA_Master/Procesamiento Natural del Lenguaje/NLP_Course/Introduction/Notebooks_Clase'

**Alternativamente, para tomar archivos de cualquier ubicación en su computadora, simplemente pase la ruta completa del archivo.**

Para Windows, debe usar doble \ para que Python no trate el segundo \ como un carácter de escape, una ruta de archivo tiene la forma:

    myfile = open("C:\\Users\\YourUserName\\Home\\Folder\\myfile.txt")

Para MacOS y Linux hay que usar las diagonales invertidas:

    myfile = open("/Users/YourUserName/Folder/myfile.txt")

In [18]:
myfile

<_io.TextIOWrapper name='test.txt' mode='r' encoding='UTF-8'>

`my_file` es ahora un objeto de archivo abierto almacenado en la memoria. Realizaremos algunos ejercicios de lectura y escritura, y luego tendremos que cerrar el archivo para liberar memoria.

### .read() y .seek()

In [19]:
myfile.read()

'Hola, este es mi primer archivo de texto.\nEsta es la segunda linea de mi archivo de texto.\n'

In [20]:
myfile.read()

''

Esto sucede porque puedes imaginar que el "cursor" de lectura está al final del archivo después de haberlo leído. Entonces no queda nada por leer. Podemos restablecer el "cursor" así:

In [21]:
myfile.seek(0)

0

In [22]:
myfile.read()

'Hola, este es mi primer archivo de texto.\nEsta es la segunda linea de mi archivo de texto.\n'

In [26]:
myfile.seek(0)

0

In [25]:
myfile.read()

' es mi primer archivo de texto.\nEsta es la segunda linea de mi archivo de texto.\n'

### .readlines()
Puede leer un archivo línea por línea utilizando el método readlines. Tenga cuidado con los archivos grandes, ya que todo se guardará en la memoria. Aprenderemos cómo iterar sobre archivos grandes más adelante en el curso.

In [27]:
myfile.seek(0)

0

In [28]:
myfile.readlines()

['Hola, este es mi primer archivo de texto.\n',
 'Esta es la segunda linea de mi archivo de texto.\n']

Cuando haya terminado de usar un archivo, siempre es una buena práctica cerrarlo.

In [29]:
myfile.close()

## Escribir en un archivo

Por defecto, la función `open ()` solo nos permitirá leer el archivo. Necesitamos pasar el argumento `'w'` para escribir sobre el archivo. Por ejemplo:

In [30]:
myfile = open('test.txt', 'w+')

<div class="alert alert-danger" style="margin: 20px">**Cuidado!**<br>
Abrir un archivo con 'w' o 'w +' * trunca el original *, lo que significa que todo lo que estaba en el archivo original ** se elimina **.</div>

In [31]:
myfile.write('Esta es una nueva linea')

23

In [32]:
myfile.seek(0)
myfile.read()

'Esta es una nueva linea'

In [33]:
myfile.close()

## Agregar a un archivo
Pasar el argumento `'a'` abre el archivo y coloca el puntero al final, por lo que se agrega todo lo escrito. Como `` 'w +' '', `` 'a +' 'nos permite leer y escribir en un archivo. Si el archivo no existe, se creará uno.

In [34]:
myfile = open('test.txt', 'a+')
myfile.write('\n esta linea se concatena con las anteriores')
myfile.write('\n Esta es otra nueva linea que se concatena con las anteriores')

62

In [35]:
myfile.seek(0)

0

In [36]:
print(myfile.read())

Esta es una nueva linea
 esta linea se concatena con las anteriores
 Esta es otra nueva linea que se concatena con las anteriores


In [37]:
myfile.close()

### Anexando con `%% writefile`
Con jupyter notebook también se pueden hacer lo mismo con una celda mágica de IPython:

In [39]:
%%writefile -a test.txt
este es más contenido para el archivo test.txt
otra linea

Appending to test.txt


Agregamos un espacio en blanco si desea que la primera línea comience en su propia línea, ya que Jupyter no reconocerá secuencias de escape como `\ n`

## Alias y gestores de contexto
Podemos asignar nombres de variables temporales como alias y administrar la apertura y el cierre de archivos automáticamente utilizando un administrador de contexto:

In [43]:
with open('test.txt', 'r') as txt:
    first_line = txt.readlines()[0]
    txt.seek(0)
    second_line = txt.readlines()[1]
    
print(first_line)
print(second_line)

Esta es una nueva linea

 esta linea se concatena con las anteriores



Tenga en cuenta que el administrador de contexto `with ... as ...:` cerró automáticamente `test.txt` después de asignar la primera línea de texto a first_line:

## Iterar sobre un archivo

In [50]:
with open('test.txt','r') as txt:
    for line in txt:
        print(line, end='')

Esta es una nueva linea
 esta linea se concatena con las anteriores
 Esta es otra nueva linea que se concatena con las anterioreseste es más contenido para el archivo test.txt
otra linea
