# Leer y escribir datos de texto

5.1

- Problema
        Necesita leer o escribir datos de texto, posiblemente en diferentes codificaciones de texto como ASCII,UTF-8 o UTF-16.  
        
        
- Solución
        Utilice la función open () con el modo rt para leer un archivo de texto.   
        
Por ejemplo:

In [1]:
# Leer todo el archivo como una sola cadena
with open('ejemplo.txt', 'rt') as f:
    data = f.read()

In [2]:
print(data)

5.1. Reading and Writing Text Data
Problem
You need to read or write text data, possibly in different text encodings such as ASCII,
UTF-8, or UTF-16.
Solution
Use the open() function with mode rt to read a text file. For example:
# Read the entire file as a single string
with open('somefile.txt', 'rt') as f:
data = f.read()
# Iterate over the lines of the file
with open('somefile.txt', 'rt') as f:
for line in f:
# process line


In [3]:
# Itera sobre las líneas del archivo
with open('ejemplo.txt', 'rt') as f:
    for line in f:
        print(line)

5.1. Reading and Writing Text Data

Problem

You need to read or write text data, possibly in different text encodings such as ASCII,

UTF-8, or UTF-16.

Solution

Use the open() function with mode rt to read a text file. For example:

# Read the entire file as a single string

with open('somefile.txt', 'rt') as f:

data = f.read()

# Iterate over the lines of the file

with open('somefile.txt', 'rt') as f:

for line in f:

# process line


# Alternativa moderna con `pathlib`

Además de la función incorporada `open()`, Python ofrece la clase `Path` del módulo `pathlib`, que proporciona métodos muy cómodos para leer y escribir texto.

Esto puede hacer el código más claro y expresivo cuando trabajas con rutas de archivos.

Por ejemplo, para leer y escribir usando `Path.read_text()` y `Path.write_text()`:

In [4]:
from pathlib import Path

ruta = Path('ejemplo_pathlib.txt')

# Escribir texto en el archivo
ruta.write_text('Hola desde pathlib!\nSegunda línea.','utf-8')

# Leer todo el contenido como una sola cadena
contenido = ruta.read_text(encoding='utf-8')
print(contenido)

Hola desde pathlib!
Segunda línea.


De manera similar, para escribir un archivo de texto, use open () con el modo wt para escribir un archivo, borrando y
sobrescribiendo el contenido anterior (si lo hubiera).   
Por ejemplo:

In [5]:
text1="""De manera similar, para escribir un archivo de texto, 
use open () con el modo wt para escribir un archivo, 
borrando y sobrescribiendo el contenido anterior (si lo hubiera).
Por ejemplo:"""

# Escribe fragmentos de datos de texto
with open('somefile.txt', 'wt') as f:
    f.write(text1)

In [6]:
linea1="hola que tal"
linea2="Soy emiliano y estoy estudiando python"
linea3="Desde un libro de recetas de python"


In [7]:
# EScribimos un archivo con la funcion print
with open ("readme.txt","w") as f:
    print(linea1,file=f)
    print(linea2,file=f)
    print(linea3,file=f)

Para agregar contenido al final de un archivo de texto existente, utiliza `open()` con el modo `'a'` (append).

De forma predeterminada, los archivos se leen y escriben utilizando la codificación de texto por defecto del sistema, que puedes consultar con `sys.getdefaultencoding()`. En la mayoría de las máquinas modernas suele ser `'utf-8'`.

Si sabes que el texto que vas a leer o escribir está en una codificación diferente, proporciona el parámetro opcional `encoding` a `open()`. Por ejemplo:

```python
with open('somefile.txt', 'rt', encoding='latin-1') as f:
    ...
```

Python reconoce varios cientos de posibles codificaciones de texto. Algunas de las más comunes son:

- ascii
- latin-1
- utf-8
- utf-16

UTF-8 suele ser una apuesta segura si trabajas con aplicaciones web.

`ascii` corresponde a los caracteres de 7 bits en el rango U+0000 a U+007F.

`latin-1` es un mapeo directo de los bytes 0–255 a los caracteres Unicode U+0000 a U+00FF. La codificación latin-1 es interesante porque nunca producirá un error de decodificación al leer texto de una codificación posiblemente desconocida.

Leer un archivo como `latin-1` puede no producir una decodificación de texto completamente correcta, pero aun así puede ser suficiente para extraer datos útiles de él.

Además, si luego vuelves a escribir los datos, se conservarán los bytes originales de entrada.

La lectura y escritura de archivos de texto suele ser sencilla, pero hay varios detalles sutiles que conviene conocer.

El uso de la instrucción `with` en los ejemplos crea un *contexto* en el que se usa el archivo. Cuando la ejecución sale del bloque `with`, el archivo se cierra automáticamente, incluso si se ha producido una excepción. Esta es la forma **recomendada y moderna** de trabajar con archivos en Python.

No es obligatorio usar `with`, pero si no lo usas debes acordarte de cerrar el archivo manualmente con `close()`:

```python
f = open('somefile.txt', 'rt')
data = f.read()
f.close()
```

Otro detalle tiene que ver con el reconocimiento de saltos de línea, que es diferente en Unix y Windows (es decir, `\n` frente a `\r\n`). De forma predeterminada, Python trabaja en el llamado modo de «nueva línea universal». En este modo se reconocen todas las convenciones habituales de salto de línea y, al leer, todas se normalizan a un único carácter `\n`.

De forma similar, al escribir, el carácter `\n` se convierte en el salto de línea por defecto del sistema. Si no quieres que se haga esta traducción, proporciona el argumento `newline=''` a `open()`, por ejemplo:

In [8]:
with open('ejemplo.txt', 'rt', newline='\r\n') as f:
    for line in f:
        print(line, end='')

5.1. Reading and Writing Text Data
Problem
You need to read or write text data, possibly in different text encodings such as ASCII,
UTF-8, or UTF-16.
Solution
Use the open() function with mode rt to read a text file. For example:
# Read the entire file as a single string
with open('somefile.txt', 'rt') as f:
data = f.read()
# Iterate over the lines of the file
with open('somefile.txt', 'rt') as f:
for line in f:
# process line

Un último problema se refiere a posibles errores de codificación en archivos de texto. Al leer o escribir un archivo de texto, puede encontrar un error de codificación o decodificación.   
Por ejemplo:


```python
>>> f = open('sample.txt', 'rt', encoding='ascii')
>>> f.read()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/local/lib/python3.3/encodings/ascii.py", line 26, in decode
return codecs.ascii_decode(input, self.errors)[0]
UnicodeDecodeError: 'ascii' codec can' t decode byte 0xc3 in position 12: 
ordinal not in range(128)
>>>
```

Si recibe este error, generalmente significa que no está leyendo el archivo con la codificación correcta. Debe leer atentamente la especificación de lo que sea que esté leyendo y comprobar que lo está haciendo bien (por ejemplo, leer datos como UTF-8 en lugar de Latin-1 o lo que sea necesario). Si los errores de codificación aún son posibles, puede proporcionar un argumento de errores opcional para open() para tratar los errores. A continuación, se muestran algunos ejemplos de esquemas de manejo de errores comunes:

In [1]:
f = open('saludo.txt', 'rt', encoding='ascii')
f.read()

UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 7: ordinal not in range(128)

In [6]:
with open('saludo.txt', 'rt', encoding='ascii', errors='replace') as f:
    texto =f.read()
print(texto)

Feliz a��o 2026
A��o nuevo , vida nueva

A��o nuevo , vida nueva



In [7]:
with open('saludo.txt', 'rt', encoding='ascii', errors='ignore') as f:
    texto = f.read()
print(texto)

Feliz ao 2026
Ao nuevo , vida nueva

Ao nuevo , vida nueva



Si constantemente está jugando con la codificación y los argumentos de error para open() y haciendo muchos trucos, probablemente esté haciendo la vida más difícil de lo necesario. La regla número uno con el texto es que simplemente debes asegurarte de usar siempre la codificación de texto adecuada. En caso de duda, utilice la configuración predeterminada (normalmente UTF-8).

In [9]:
with open('saludo.txt', 'rt', encoding='utf-8') as f:
    texto = f.read()
print(texto)

Feliz año 2026
Año nuevo , vida nueva

Año nuevo , vida nueva



In [10]:
with open('saludo.txt', 'rt', encoding='latin-1') as f:
    texto = f.read()
print(texto)

Feliz aÃ±o 2026
AÃ±o nuevo , vida nueva

AÃ±o nuevo , vida nueva



# Imprimir en un archivo

5.2

- Problema
        Quiere redirigir la salida de la función print() a un archivo.  


- Solución
        Utilice el argumento de fle clave de archivo para print(), así:

In [11]:
with open('saludo2.txt', 'a') as f:
    print("\nAño nuevo , vida nueva",file=f)

# Impresión con un separador o final de línea diferente

5.3

- Problema
        Desea generar datos usando print (), pero también desea cambiar el separador carácter o final de línea.


- Solución
        Utilice los argumentos de las palabras clave sep y end para imprimir () para cambiar la salida como desee.

Por ejemplo:

In [12]:
print('ACME', 50, 91.5)

ACME 50 91.5


In [13]:
print('ACME', 50, 91.5, sep=',')

ACME,50,91.5


In [None]:
print('ACME', 50, 91.5, sep=',', end='!!\n')

ACME,50,91.5!!


In [14]:
# El uso del argumento final también es la forma de suprimir la salida de nuevas líneas en la salida.
for i in range(11):
    print(i,end=" ")

0 1 2 3 4 5 6 7 8 9 10 

# Leer y escribir datos binarios

5.4

- Problema
        Necesita leer o escribir datos binarios, como los que se encuentran en imágenes, archivos de sonido, etc.


- Solución
        Utilice la función open () con el modo rb o wb para leer o escribir datos binarios.   
        
Por ejemplo:

In [15]:
with open('somefile.bin', 'wb') as f:
    f.write(b'Hello World')

In [16]:
with open('somefile.bin', 'rb') as f:
    print(f.read())

b'Hello World'


Al leer binario, es importante enfatizar que todos los datos devueltos estarán en el formulario de cadenas de bytes, no cadenas de texto. Del mismo modo, al escribir, debe proporcionar datos en el forma de objetos que exponen datos como bytes (por ejemplo, cadenas de bytes, objetos bytearray, etc.).  

Al leer datos binarios, las sutiles diferencias semánticas entre las cadenas de bytes y el texto las cadenas plantean un problema potencial.   
En particular, tenga en cuenta que la indexación y la iteración devuelven
valores de bytes enteros en lugar de cadenas de bytes.   
Por ejemplo

In [18]:
t = 'Hello World'
t[0]

'H'

In [19]:
for i in t:
    print(i,end=" ")

H e l l o   W o r l d 

In [20]:
b = b'Hello World'
b[0]

72

In [21]:
for i in b:
    print(i,end=" ")

72 101 108 108 111 32 87 111 114 108 100 

Si alguna vez necesita leer o escribir texto desde un archivo en modo binario, asegúrese de recordar para decodificarlo o codificarlo.   
Por ejemplo:

In [23]:
with open('somefile.bin', 'rb') as f:
    data = f.read(16)
    text = data.decode('utf-8')
print(text)

Hello World


In [24]:
with open('somefile.bin', 'rb') as f:
    data = f.read(16)
print(data)

b'Hello World'


In [25]:
with open('somefile2.bin', 'wb') as f:
    text = 'Hola Mundo'
    f.write(text.encode('utf-8'))

In [26]:
with open('somefile2.bin', 'rb') as f:
    data = f.read(16)
print(data)

b'Hola Mundo'


Un aspecto menos conocido de la E / S binaria es que los objetos como matrices y estructuras C pueden ser utilizado para escribir sin ningún tipo de conversión intermedia a un objeto de bytes.   
por ejemplo:

In [27]:
import array
nums = array.array('i', [1, 2, 3, 4,5,6,7])
with open('data.bin','wb') as f:
    f.write(nums)

In [28]:
with open('data.bin','rb') as f:
    data = f.read()

In [None]:
data

b'\x01\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00\x04\x00\x00\x00\x05\x00\x00\x00\x06\x00\x00\x00\x07\x00\x00\x00'

In [29]:

a = array.array('i', [0,0,0,0,0,0,0,])
with open('data.bin', 'rb') as f:
    f.readinto(a)

In [30]:
a

array('i', [1, 2, 3, 4, 5, 6, 7])

Sin embargo, se debe tener mucho cuidado al utilizar esta técnica, ya que a menudo es una plataforma
específico y puede depender de cosas como el tamaño de la palabra y el orden de bytes (es decir, big bytes versus little bytes). Consulte la Receta 5.9 para ver otro ejemplo de lectura de datos binarios.
en un búfer mutable.

# Escribir en un archivo no existe

5.5

- Problema
        Desea escribir datos en un archivo, pero solo si aún no existe en el sistema de archivos.


- Solución
        Este problema se resuelve fácilmente utilizando el modo x poco conocido para open() en lugar del modo w habitual.   
        
Por ejemplo:

In [31]:
with open('somefile3', 'wt') as f:
    f.write('Hello\n')

In [32]:
with open('somefile3', 'xt') as f:
    f.write('Hello\n')

FileExistsError: [Errno 17] File exists: 'somefile3'

In [33]:
with open('somefile4', 'xt') as f:
    f.write('archivo somefile4\n')

Si el archivo está en modo binario, use el modo xb en lugar de xt.  

Claramente, usar el modo de archivo x es mucho más sencillo. Es importante observar que
el modo x es una extensión específica de Python 3 para la función open ().   
En particular, no tal modo existe en versiones anteriores de Python o en las bibliotecas C subyacentes utilizadas en Python
implementación

Esta receta ilustra una solución extremadamente elegante a un problema que a veces surge al escribir archivos (es decir, sobrescribir accidentalmente un archivo existente). Una solución alternativa es probar primero el archivo como este

In [35]:
import os
if not os.path.exists('somefile'):
    with open('somefile', 'wt') as f:
        f.write('Hello\n')
else:
    print('File already exists!')

File already exists!


# Realización de operaciones de E / S en una cadena

5.6

- Problema
        En su lugar, desea alimentar un texto o una cadena binaria al código que se ha escrito para operar en objetos similares a archivos.


- Solución
        Utilice las clases io.StringIO () y io.BytesIO () para crear objetos similares a archivos que operan en datos de cadena.  
        
Por ejemplo:

In [36]:
import io

In [37]:
s = io.StringIO()
s.write('Hello World\n')

12

In [38]:
print('This is a test', file=s)

In [None]:
s

<_io.StringIO at 0x7f9ad86cfd70>

In [39]:
s.getvalue()

'Hello World\nThis is a test\n'

In [40]:
# Envuelva una interfaz de archivo alrededor de una cadena existente
s = io.StringIO('Hello\nWorld\n')
s.read(4)

'Hell'

In [41]:
s.read()

'o\nWorld\n'

La clase io.StringIO solo debe usarse para texto. Si está operando con binario
datos, use la clase io.BytesIO en su lugar.   
Por ejemplo:

In [42]:
s = io.BytesIO()
s.write(b'binary data')
s.getvalue()

b'binary data'

Las clases StringIO y BytesIO son más útiles en escenarios donde necesita imitar un archivo normal por alguna razón. Por ejemplo, en las pruebas unitarias, puede usar StringIO para crear un objeto similar a un archivo que contenga datos de prueba que se introducen en una función que, de otro modo, funcionaría con un archivo normal.
Tenga en cuenta que las instancias de StringIO y BytesIO no tienen un descriptor de archivos entero adecuado. Por lo tanto, no funcionan con código que requiera el uso de un archivo de nivel de sistema real, como un archivo, tubería o socket.

# Lectura y escritura de archivos de datos comprimidos

5.7

- Problema
        Necesita leer o escribir datos en un archivo con compresión gzip o bz2. Los módulos gzip y bz2 facilitan el trabajo con dichos archivos. 
        

- Solucion        
        Ambos módulos proporcionan una implementación alternativa de open () que se puede utilizar para este propósito.   
        
Por ejemplo, para leer archivos comprimidos como texto, haga esto:

```python 
        # gzip compression
        import gzip
        with gzip.open('somefile.gz', 'rt') as f:
            text = f.read()
        # bz2 compression
        import bz2
        with bz2.open('somefile.bz2', 'rt') as f:
            text = f.read()
```
Del mismo modo, para escribir datos comprimidos, haga lo siguiente:
```python
        # gzip compression
        import gzip
        with gzip.open('somefile.gz', 'wt') as f:
            f.write(text)
        # bz2 compression
        import bz2
        with bz2.open('somefile.bz2', 'wt') as f:
            f.write(text)
```
Como se muestra, todas las operaciones de I / DO utilizarán texto y realizará codificación Unicode  

En su mayor parte, leer o escribir datos comprimidos es sencillo. Sin embargo, sea
consciente de que elegir el modo de archivo correcto es de vital importancia. Si no especifica un modo, el modo predeterminado es binario, que romperá los programas que esperan recibir texto.
Tanto gzip.open() como bz2.open() aceptan los mismos parámetros que el open() ,incluida la codificación, los errores, la nueva línea, etc.
Al escribir datos comprimidos, el nivel de compresión se puede especificar opcionalmente usando el argumento compresslevel.   
Por ejemplo:
```python
    with gzip.open('somefile.gz', 'wt', compresslevel=5) as f:
        f.write(text)
```

El nivel predeterminado es 9, que proporciona el nivel más alto de compresión. Niveles inferiores tienen mejor rendimiento, pero no tanta compresión.
Finalmente, una característica poco conocida de gzip.open() y bz2.open() es que se pueden superponer sobre un archivo existente abierto en modo binario.   
Por ejemplo, esto funciona:
```python
        import gzip
        f = open('somefile.gz', 'rb')
        with gzip.open(f, 'rt') as g:
            text = g.read()
```
Esto permite que los módulos gzip y bz2 funcionen con varios objetos similares a archivos, como sockets, tuberías y archivos en memoria.