# 7. Manejo de Cadenas de Texto en Python

- *Autor*: [Dr. Mario Abarca](https://www.knkillname.org/)
- *Objetivo*: Aprender a manipular cadenas de texto y trabajar con archivos de texto

<a href="https://colab.research.google.com/github/knkillname/uaem.notas.introcomp/blob/master/cuadernos/7.TrabajoConTexto.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## 7.1. Cadenas de Texto

Las cadenas (`str`) en Python son **inmutables** ([Documentación de Python](https://docs.python.org/es/3/library/stdtypes.html#text-sequence-type-str)). Cualquier operación que las modifique devuelve una nueva cadena.

### Alfabetos y lenguajes

Un **alfabeto** $\Sigma$ es un conjunto finito de símbolos.

**Estándar ASCII**: El [ASCII](https://es.wikipedia.org/wiki/ASCII) (American Standard Code for Information Interchange) es un código de caracteres de 7 bits que representa texto en computadoras y dispositivos de comunicación. Aunque ya no se usa ampliamente debido a sus limitaciones (solo puede representar 128 caracteres), tiene importancia histórica y es la base de muchos otros sistemas de codificación.

In [None]:
# Ejemplo de caracteres ASCII
alfabeto_ascii = ''.join(chr(i) for i in range(128))
print(alfabeto_ascii)

**Alfabeto `string.printable`**: Este alfabeto incluye el subconjunto imprimible de caracteres ASCII, es decir, los caracteres que se pueden mostrar en pantalla. Incluye dígitos, letras, signos de puntuación y espacios.

In [None]:
import string
alfabeto_imprimible = string.printable
print(alfabeto_imprimible)

**Alfabeto Unicode**: [Unicode](https://es.wikipedia.org/wiki/Unicode) es un estándar de codificación de caracteres diseñado para soportar el intercambio, procesamiento y visualización de texto en diferentes lenguajes y disciplinas técnicas. Unicode asigna un número único a cada carácter, sin importar la plataforma, el programa o el lenguaje. Este estándar incluye más de 143,000 caracteres, cubriendo los sistemas de escritura más utilizados en el mundo.

In [None]:
# Ejemplo de una cadena Unicode
cadena_unicode = "Hola, mundo! 🌍"
print(cadena_unicode)

# Obtener el código Unicode de un carácter
codigo = ord('á')
print(codigo)

# Obtener el carácter a partir de un código Unicode
caracter = chr(225)
print(caracter)

**Discusión**: Investiga y discute con ChatGPT u otro asistente sobre las diferencias y similitudes entre ASCII y Unicode. ¿Por qué es importante Unicode en el contexto de la globalización y la representación de múltiples lenguajes?

Las **potencias del alfabeto** $\Sigma^n$ son el conjunto de todas las secuencias de longitud $n$ formadas por símbolos de $\Sigma$. Formalmente,

$$\Sigma^0 = \{\epsilon\}$$

donde $\epsilon$ es la cadena vacía, y para $n > 0$, y

$$\Sigma^n = \{a_1a_2\ldots a_n \mid a_i \in \Sigma \text{ para } 1 \leq i \leq n\}$$

A cada uno de los elementos de $\Sigma^n$ se le llama **palabra** o **cadena** de longitud $n$, y a cualquier conjunto arbitrario de palabras se le llama **lenguaje**.

In [None]:
# Ejemplo de un lenguaje (conjunto de palabras) en Python
itacate = {"taco", "quesadilla", "tamal", "pozole", "enchilada"}
print(itacate)

La cadena vacía $\epsilon$ es una palabra de longitud cero, y es la única palabra en $\Sigma^0$, y en Python se representa como `''`.

**Ejercicio**: Crea el conjunto de todas las palabras de longitud 2 formadas por los símbolos `'a'` y `'b'`.

**Ejercicio**: Investiga `itertools.product` y `''.join`. ¿Cómo se pueden generar todas las palabras de longitud 3 formadas por los símbolos `'a'` y `'b'`?

**Ejercicio**: Crea una función que reciba un alfabeto $\Sigma$ y un entero $n$, y devuelva el conjunto de todas las palabras de longitud $n$ formadas por los símbolos de $\Sigma$.

El **lenguaje estrella** $\Sigma^*$ es el conjunto de todas las secuencias finitas de símbolos de $\Sigma$, incluyendo la cadena vacía:

$$\Sigma^* = \bigcup_{n=0}^{\infty} \Sigma^n$$

La cadena vacía $\epsilon$ es importante porque actúa como el elemento neutro en la concatenación de cadenas.

**Ejercicio**: Crea una función generadora que reciba un alfabeto $\Sigma$ y produzca todas las palabras del lenguaje estrella $\Sigma^*$ en orden de longitud creciente.

### Creación de cadenas

En Python, las cadenas se pueden crear de varias formas:

- Usando comillas simples (`'`):

In [None]:
s1 = 'Hola, mundo!'

- Usando comillas dobles (`"`):

In [None]:
s2 = "Hola, mundo!"

- Usando comillas triples (`'''` o `"""`) para cadenas de múltiples líneas:

In [None]:
s3 = '''Esta es una cadena
de múltiples líneas.'''

s4 = """También se puede usar
comillas dobles triples."""

- Cuando dos cadenas están juntas, Python las concatena automáticamente:

In [None]:
s5 = 'Hola, ' 'mundo!'

s6 = ('Esta es una cadena larga que se puede dividir en dos líneas, pero en '
      'realidad contiene un único renglón.')

- Si se necesita una cadena con comillas simples o dobles, se pueden usar las otras para delimitarla:

In [None]:
s7 = "Ella dijo: 'Hola, mundo!'"

s8 = 'Él dijo: "Hola, mundo!"'

- A veces se necesita tener ambas comillas en una cadena. En ese caso, se pueden escapar con una barra invertida (`\`):

In [None]:
s9 = "In the 90's, people used to say \"Hello, world!\""

**Discusión**: Explora con ChatGPT u otro asistente las ventajas y desventajas de usar comillas simples, dobles y triples en Python. ¿En qué situaciones es más conveniente usar cada tipo de comillas?

### Operaciones básicas de cadenas

La **concatenación** de dos cadenas $s$ y $t$ es una nueva cadena formada por los caracteres de $s$ seguidos por los caracteres de $t$. En Python, se utiliza el operador `+` para concatenar cadenas.

In [None]:
s = "Cara"
t = "cola"
concatenacion = s + ", " + t + "!"
print(concatenacion)

La **potenciación** de una cadena $s$ por un entero $n$ es una nueva cadena formada por $s$ repetida $n$ veces. En Python, se utiliza el operador `*` para la potenciación de cadenas.

In [None]:
s = "ja "
potenciacion = s * 3
print(potenciacion)

### Indexación y rebanado

La indexación y el rebanado (slicing) son técnicas poderosas para acceder a partes específicas de una cadena. En Python, los índices comienzan en 0, lo que significa que el primer carácter de una cadena tiene el índice 0. Los índices negativos se utilizan para contar desde el final de la cadena.

In [None]:
texto = "Python"
print(texto[0], texto[-1])
print(texto[1:4], texto[:2], texto[2:], texto[::2])

- `texto[0]` devuelve el primer carácter.
- `texto[-1]` devuelve el último carácter.
- `texto[1:4]` devuelve una subcadena desde el índice 1 hasta el 3 (excluyendo el 4).
- `texto[:2]` devuelve una subcadena desde el inicio hasta el índice 1 (excluyendo el 2).
- `texto[2:]` devuelve una subcadena desde el índice 2 hasta el final.
- `texto[::2]` devuelve una subcadena con cada segundo carácter.

También se pueden crear objetos `slice` para reutilizar rebanados, incluyendo el uso de `None` para indicar el inicio o el final de la cadena:

In [None]:
texto = "Python"

# Rebanado desde el inicio hasta el índice 4 (excluyendo el 4)
s1 = slice(None, 4)
print(texto[s1])

# Rebanado desde el índice 2 hasta el final
s2 = slice(2, None)
print(texto[s2])

# Rebanado completo
s3 = slice(None, None)
print(texto[s3])

# Rebanado con paso de 2
s4 = slice(None, None, 2)
print(texto[s4])

**Ejercicio**: Dada la cadena `s = "abcdefghij"`, utiliza rebanado para obtener las siguientes subcadenas:

1. `"abc"`
2. `"def"`
3. `"ghi"`
4. `"j"`
5. `"aceg"`
6. `"bdfh"`


### Métodos Comunes

Referencia: [Métodos de cadena en la documentación](https://docs.python.org/es/3/library/stdtypes.html#string-methods).

| Método | Descripción | Ejemplo |
|---|---|---|
| `.lower()` | Convertir a minúsculas | `'ABC'.lower()` |
| `.upper()` | Convertir a mayúsculas | `'abc'.upper()` |
| `.strip()` | Elimina espacios en extremos | `'  texto  '.strip()` |
| `.replace(a,b)` | Reemplaza subcadenas | `'hola'.replace('h','H')` |
| `.split(sep)` | Divide en lista | `'a,b,c'.split(',')` |
| `.join(iterable)` | Une con separador | `'-'.join(['a','b','c'])` |
| `.startswith(prefix)` | Comienza con prefijo | `'hola'.startswith('h')` |
| `.endswith(suffix)` | Termina con sufijo | `'hola'.endswith('a')` |
| `.find(sub)` | Índice de subcadena | `'hola'.find('o')` |
| `.count(sub)` | Cuenta subcadenas | `'hola'.count('o')` |
| `.isalpha()` | Solo letras | `'abc'.isalpha()` |
| `.isdigit()` | Solo dígitos | `'123'.isdigit()` |
| `.isalnum()` | Letras y dígitos | `'abc123'.isalnum()` |
| `.isspace()` | Solo espacios | `' '.isspace()` |

Ejemplos:

In [None]:
texto = "  ¡Órale, cuate! 123 "

# Convertir a minúsculas y eliminar espacios en extremos
resultado = texto.lower().strip()
print(resultado)

# Reemplazar subcadenas y contar ocurrencias
resultado = texto.replace("Órale", "Ándale").count("a")
print(resultado)

# Dividir en lista y unir con separador
lista = texto.split()
resultado = '-'.join(lista)
print(resultado)

# Verificar prefijo y sufijo
print(texto.startswith(" "))
print(texto.endswith("123 "))

# Encontrar índice de subcadena y verificar si es alfanumérico
indice = texto.find("cuate")
print(indice)
print(texto.isalnum())

**Ejercicio**: Dada la cadena `s = "¡Hola, mundo! 123"`, realiza las siguientes operaciones utilizando los métodos de cadena:

1. Convierte la cadena a mayúsculas.
2. Reemplaza "Hola" por "Adiós".
3. Elimina los signos de exclamación.
4. Divide la cadena en palabras.
5. Cuenta cuántas veces aparece la letra "o".
6. Verifica si la cadena contiene solo letras y dígitos.
7. Encuentra el índice de la palabra "mundo".
8. Verifica si la cadena termina con "123".

## 7.2. Interpolación y Formato de Cadenas

La interpolación y el formato de cadenas permiten insertar valores dentro de una cadena de texto de manera flexible y legible.

### `str.format`

El método `str.format` permite insertar valores en una cadena utilizando llaves `{}` como marcadores de posición.

In [None]:
nombre = "Ana"
edad = 30
print("{} tiene {} años".format(nombre, edad))

### F‑Strings

Las f-strings (cadenas formateadas) son una forma más concisa y legible de interpolar valores en una cadena. Se introdujeron en Python 3.6 y utilizan la sintaxis `f"..."`.

In [None]:
nombre = "Ana"
edad = 30
print(f"{nombre} cumple {edad} años")

### Mini‑lenguaje de Formato

El [mini-lenguaje de formato](https://docs.python.org/es/3/library/string.html#format-specification-mini-language) permite especificar cómo se deben presentar los valores interpolados, incluyendo la precisión de los números decimales, el relleno de ceros, y más.

#### Formato Numérico

- **Precisión de decimales**: Se puede especificar el número de decimales a mostrar utilizando `.Nf`, donde `N` es el número de decimales.

In [None]:
valor = 1234.56789
print(f"{valor:.2f}")

- **Separadores de miles**: Se puede usar `,` para incluir separadores de miles.

In [None]:
valor = 1234567.89
print(f"{valor:,.1f}")

- **Relleno de ceros**: Se puede usar `0` seguido del ancho total del campo para rellenar con ceros a la izquierda.

In [None]:
numero = 42
print(f"{numero:08}")

- **Formato hexadecimal**: Se puede usar `#` para incluir el prefijo `0x` en números hexadecimales.

In [None]:
numero = 42
print(f"{numero:#08x}")

#### Alineación y Ancho

- **Alineación a la izquierda**: Se usa `<` seguido del ancho total del campo.

In [None]:
texto = "Python"
print(f"{texto:<10}")

- **Alineación a la derecha**: Se usa `>` seguido del ancho total del campo.

In [None]:
texto = "Python"
print(f"{texto:>10}")

- **Alineación centrada**: Se usa `^` seguido del ancho total del campo.

In [None]:
texto = "Python"
print(f"{texto:^10}")

**Ejercicio**: Utiliza el mini-lenguaje de formato para realizar las siguientes tareas:

1. Formatea el número `9876.54321` para que tenga 3 decimales y separadores de miles.
2. Rellena con ceros a la izquierda el número `123` para que tenga un ancho total de 6 caracteres.
3. Muestra el número `255` en formato hexadecimal con el prefijo `0x` y un ancho total de 6 caracteres.
4. Centra el texto `"Hola"` en un campo de 20 caracteres de ancho.

## 7.3. Expresiones Regulares (`re`)

Documentación: [Expresiones regulares en Python](https://docs.python.org/es/3/library/re.html).

Las **expresiones regulares** son secuencias de caracteres que forman un patrón de búsqueda. Se utilizan para realizar coincidencias y manipulaciones de texto basadas en patrones específicos.

Formalmente, una expresión regular es una notación que describe un **lenguaje regular**. Los lenguajes regulares son un tipo de lenguaje formal que puede ser descrito por autómatas finitos. Las operaciones básicas en expresiones regulares incluyen:

- **Concatenación**: Si $A$ y $B$ son lenguajes, entonces $AB$ es el lenguaje que contiene todas las cadenas formadas por una cadena de $A$ seguida de una cadena de $B$.
- **Unión**: Si $A$ y $B$ son lenguajes, entonces $A \cup B$ es el lenguaje que contiene todas las cadenas que están en $A$ o en $B$.
- **Cierre de Kleene**: Si $A$ es un lenguaje, entonces $A^*$ es el lenguaje que contiene todas las cadenas formadas por cero o más repeticiones de cadenas de $A$.

En Python, estas operaciones se pueden realizar utilizando concatenación con `+`, unión con `|` (operador `or`), y cierre de Kleene con `*` (operador de repetición).

In [1]:
import re

# Concatenación: buscar 'abc' seguido de 'def'
patron_concatenacion = re.compile(r'abc' + r'def')
print(patron_concatenacion.search('abcdef').group())

# Unión: buscar 'abc' o 'def'
patron_union = re.compile(r'abc|def')
print(patron_union.findall('abcdef abc def'))

# Cierre de Kleene: buscar 'abc' repetido cero o más veces
patron_kleene = re.compile(r'(abc)*')
print(patron_kleene.search('abcabc').group())

abcdef
['abc', 'def', 'abc', 'def']
abcabc


### Expresiones Regulares en Python

En los lenguajes de programación modernos como Python existen particularidades en la sintaxis de las expresiones regulares que permiten realizar búsquedas y manipulaciones de texto de manera eficiente.
En las expresiones regulares, las secuencias `\w` y `\d` tienen significados específicos:

- `\w`: Coincide con cualquier carácter alfanumérico (letras y dígitos) y el guion bajo (`_`).
- `\d`: Coincide con cualquier dígito (equivalente a `[0-9]`).
- `\W`: Coincide con cualquier carácter que no sea alfanumérico (es decir, lo opuesto a `\w`).
- `*?`: Es un operador de cuantificación no codicioso que coincide con cero o más repeticiones del patrón anterior, pero de la manera más corta posible.

In [None]:
import re

# Buscar una dirección de correo electrónico
patron = r'[\w\.]+@[\w\.]+\.[a-z]+'
print(re.search(patron, 'ejemplo@mail.com').group())

# Encontrar todos los números en una cadena
print(re.findall(r'\d+', '123-456-7890'))

# Reemplazar una dirección de correo electrónico con '<oculto>'
print(re.sub(patron, '<oculto>', 'correo@example.com'))

# Buscar caracteres no alfanuméricos
print(re.findall(r'\W+', 'Hello, World!'))

# Coincidencia no codiciosa
texto = "<tag>contenido</tag>"
patron_no_codicioso = r'<.*?>'
print(re.findall(patron_no_codicioso, texto))

Otros detalles relevantes de la sintaxis de expresiones regulares en Python incluyen:

- `.`: Coincide con cualquier carácter excepto una nueva línea.
- `^`: Coincide con el inicio de una cadena.
- `$`: Coincide con el final de una cadena.
- `[]`: Define un conjunto de caracteres, por ejemplo, `[a-z]` coincide con cualquier letra minúscula.
- `|`: Operador OR, por ejemplo, `a|b` coincide con `a` o `b`.
- `()`: Agrupa patrones y captura coincidencias.

In [2]:
# Coincidir con cualquier carácter excepto una nueva línea
print(re.findall(r'.', 'abc\ndef'))

['a', 'b', 'c', 'd', 'e', 'f']


In [3]:
# Coincidir con el inicio de una cadena
print(re.match(r'^Hola', 'Hola, mundo!'))

<re.Match object; span=(0, 4), match='Hola'>


In [4]:
# Coincidir con el final de una cadena
print(re.search(r'mundo!$', 'Hola, mundo!'))

<re.Match object; span=(6, 12), match='mundo!'>


In [5]:
# Coincidir con cualquier letra minúscula
print(re.findall(r'[a-z]', 'Python 3.8'))

['y', 't', 'h', 'o', 'n']


In [6]:
# Coincidir con 'a' o 'b'
print(re.findall(r'a|b', 'abc'))

['a', 'b']


In [7]:
# Agrupar patrones y capturar coincidencias
patron_grupo = r'(abc|def)'
print(re.findall(patron_grupo, 'abcdef'))

['abc', 'def']


Un uso interesante de las expresiones regulares es validar contraseñas. Supongamos que queremos una contraseña que tenga al menos 8 caracteres, incluya al menos una letra mayúscula, una letra minúscula, un número y un carácter especial.

In [8]:
import re

def validar_contraseña(contraseña):
    patron = r'^(?=.*[A-Z])(?=.*[a-z])(?=.*\d)(?=.*[@$!%*?&])[A-Za-z\d@$!%*?&]{8,}$'
    return bool(re.match(patron, contraseña))

print(validar_contraseña('Password123!'))  # True
print(validar_contraseña('password'))      # False

True
False


**Ejercicios**

1. Escribe una expresión regular para validar números de teléfono en el formato `(123) 456-7890`.
2. Crea una expresión regular que encuentre todas las palabras que comienzan con una letra mayúscula en una cadena.
3. Escribe una función que use expresiones regulares para extraer todas las direcciones URL de un texto.

## 7.4. Manejo de Archivos

### Sistemas de Archivos

Un **sistema de archivos** organiza y gestiona archivos en dispositivos de almacenamiento como discos duros o unidades SSD. Ejemplos comunes incluyen NTFS, FAT32, ext4 y HFS+.

Un archivo tiene dos partes principales:

1. **Datos del archivo**: El contenido real (texto, imágenes, audio, etc.).
2. **Metadatos del archivo**: Información sobre el archivo (nombre, tamaño, permisos, fechas de creación y modificación, etc.).

Operaciones básicas en archivos:

- **Crear**: Crear un nuevo archivo.
- **Abrir**: Abrir un archivo existente.
- **Leer**: Leer datos de un archivo.
- **Escribir**: Escribir datos en un archivo.
- **Cerrar**: Cerrar un archivo.
- **Eliminar**: Eliminar un archivo.

Al abrir un archivo, el sistema operativo asigna un **manejador de archivos** o **descriptor de archivo**, una referencia única para realizar operaciones de lectura y escritura.

El **buffering** mejora la eficiencia de las operaciones de E/S al almacenar temporalmente datos en un búfer en memoria, reduciendo la cantidad de operaciones directas en el dispositivo de almacenamiento.

Los permisos de archivos controlan el acceso y pueden incluir:

- **Lectura (r)**: Permite leer el archivo.
- **Escritura (w)**: Permite modificar el archivo.
- **Ejecución (x)**: Permite ejecutar el archivo como un programa.

En sistemas Unix, los permisos se gestionan mediante un modelo de propietario-grupo-otros, estableciendo permisos específicos para cada uno.

### Uso de `pathlib`

La biblioteca `pathlib` en Python proporciona una forma orientada a objetos de trabajar con rutas de archivos y directorios. Es parte de la biblioteca estándar de Python desde la versión 3.4.

#### Crear y Manipular Rutas

In [None]:
from pathlib import Path

# Crear un objeto Path
ruta = Path('ej.txt')

# Verificar si la ruta existe
print(ruta.exists())

# Obtener el nombre del archivo
print(ruta.name)

# Obtener la extensión del archivo
print(ruta.suffix)

# Obtener el directorio padre
print(ruta.parent)

# Cambiar la extensión del archivo
nueva_ruta = ruta.with_suffix('.md')
print(nueva_ruta)

#### Leer y Escribir Archivos

In [None]:
from pathlib import Path

# Crear un objeto Path
ruta = Path('ej.txt')

# Escribir en un archivo
ruta.write_text('Hola, mundo!', encoding='utf-8')

# Leer desde un archivo
contenido = ruta.read_text(encoding='utf-8')
print(contenido)

#### Trabajar con Directorios

In [None]:
from pathlib import Path

# Crear un objeto Path para un directorio
directorio = Path('mi_directorio')

# Crear el directorio
directorio.mkdir(exist_ok=True)

# Listar archivos en el directorio
for archivo in directorio.iterdir():
    print(archivo)

# Eliminar el directorio
directorio.rmdir()

### Texto

[Leer y escribir archivos en Python](https://docs.python.org/es/3/tutorial/inputoutput.html#reading-and-writing-files).

In [None]:
# Escribir en un archivo de texto
with open('ej.txt', 'w', encoding='utf-8') as f:
    f.write('Hola, mundo!')

# Leer desde un archivo de texto
with open('ej.txt', 'r', encoding='utf-8') as f:
    contenido = f.read()
    print(contenido)

#### Leer y escribir líneas

In [None]:
# Escribir múltiples líneas en un archivo de texto
with open('ej.txt', 'w', encoding='utf-8') as f:
    lineas = ['Primera línea\n', 'Segunda línea\n', 'Tercera línea\n']
    f.writelines(lineas)

# Leer líneas desde un archivo de texto
with open('ej.txt', 'r', encoding='utf-8') as f:
    for linea in f:
        print(linea, end='')

### JSON

JSON (JavaScript Object Notation) es un formato ligero de intercambio de datos que es fácil de leer y escribir para los humanos, y fácil de parsear y generar para las máquinas. JSON se utiliza comúnmente para transmitir datos en aplicaciones web (por ejemplo, enviar datos desde el servidor al cliente, para que puedan ser mostrados en una página web, o viceversa). [Documentación oficial de JSON](https://www.json.org/json-es.html)

#### Estructura de JSON

Un documento JSON es una colección de pares clave/valor. Las claves son cadenas (strings) y los valores pueden ser cadenas, números, objetos, arreglos, booleanos (`true` o `false`) o `null`.

Ejemplo de un objeto JSON:

```json
{
    "nombre": "Ana",
    "edad": 30,
    "ciudad": "México",
    "hobbies": ["leer", "viajar", "cocinar"],
    "casado": false
}
```

#### Trabajar con JSON en Python

Python proporciona el módulo `json` para trabajar con datos JSON. Este módulo permite convertir datos de Python a JSON y viceversa.

##### Convertir de Python a JSON

Para convertir un diccionario de Python a una cadena JSON, se utiliza la función `json.dumps()`:

In [9]:
import json

# Diccionario de Python
datos = {
    "nombre": "Ana",
    "edad": 30,
    "ciudad": "México",
    "hobbies": ["leer", "viajar", "cocinar"],
    "casado": False
}

# Convertir a JSON
json_datos = json.dumps(datos, ensure_ascii=False, indent=4)
print(json_datos)

{
    "nombre": "Ana",
    "edad": 30,
    "ciudad": "México",
    "hobbies": [
        "leer",
        "viajar",
        "cocinar"
    ],
    "casado": false
}


##### Convertir de JSON a Python

Para convertir una cadena JSON a un diccionario de Python, se utiliza la función `json.loads()`:

In [None]:
import json

# Cadena JSON
json_datos = '''
{
    "nombre": "Ana",
    "edad": 30,
    "ciudad": "México",
    "hobbies": ["leer", "viajar", "cocinar"],
    "casado": false
}
'''

# Convertir a diccionario de Python
datos = json.loads(json_datos)
print(datos)

##### Leer y Escribir Archivos JSON

Para escribir un diccionario de Python en un archivo JSON, se utiliza la función `json.dump()`:

In [None]:
import json

# Diccionario de Python
datos = {
    "nombre": "Ana",
    "edad": 30,
    "ciudad": "México",
    "hobbies": ["leer", "viajar", "cocinar"],
    "casado": False
}

# Escribir en un archivo JSON
with open('datos.json', 'w', encoding='utf-8') as f:
    json.dump(datos, f, ensure_ascii=False, indent=4)

Para leer un archivo JSON y convertirlo a un diccionario de Python, se utiliza la función `json.load()`:

In [None]:
import json

# Leer desde un archivo JSON
with open('datos.json', 'r', encoding='utf-8') as f:
    datos = json.load(f)
    print(datos)

**Discusión**: Investiga y discute con ChatGPT u otro asistente sobre las ventajas y desventajas de usar JSON en comparación con otros formatos de intercambio de datos como XML o YAML. ¿En qué situaciones es más adecuado usar JSON?

### CSV

CSV (Comma-Separated Values) es un formato simple y comúnmente utilizado para almacenar datos tabulares en texto plano. Cada línea en un archivo CSV corresponde a una fila en la tabla, y los valores en cada fila están separados por comas (u otros delimitadores como punto y coma o tabulaciones). [Documentación oficial de CSV](https://tools.ietf.org/html/rfc4180)

#### Estructura de CSV

Un archivo CSV típico puede verse así:

```csv
Nombre,Edad,Ciudad
Ana,30,México
Luis,25,Guadalajara
```

Cada línea representa una fila de datos, y cada valor está separado por una coma.

#### Trabajar con CSV en Python

Python proporciona el módulo `csv` para trabajar con archivos CSV. Este módulo permite leer y escribir archivos CSV de manera eficiente.

##### Leer Archivos CSV

Para leer un archivo CSV, se utiliza la función `csv.reader()`:

import csv

# Leer desde un archivo CSV
with open('datos.csv', 'r', encoding='utf-8') as f:
    lector = csv.reader(f)
    for fila in lector:
        print(fila)

##### Escribir Archivos CSV

Para escribir en un archivo CSV, se utiliza la función `csv.writer()`:

In [None]:
import csv

# Escribir en un archivo CSV
with open('datos.csv', 'w', newline='', encoding='utf-8') as f:
    escritor = csv.writer(f)
    escritor.writerow(['Nombre', 'Edad', 'Ciudad'])
    escritor.writerow(['Ana', 30, 'México'])
    escritor.writerow(['Luis', 25, 'Guadalajara'])

##### Usar `DictReader` y `DictWriter`

El módulo `csv` también proporciona las clases `DictReader` y `DictWriter` para trabajar con archivos CSV utilizando diccionarios. Esto puede ser útil cuando se trabaja con archivos CSV que tienen encabezados.

In [None]:
import csv

# Escribir en un archivo CSV usando DictWriter
with open('datos_dict.csv', 'w', newline='', encoding='utf-8') as f:
    campos = ['Nombre', 'Edad', 'Ciudad']
    escritor = csv.DictWriter(f, fieldnames=campos)
    escritor.writeheader()
    escritor.writerow({'Nombre': 'Ana', 'Edad': 30, 'Ciudad': 'México'})
    escritor.writerow({'Nombre': 'Luis', 'Edad': 25, 'Ciudad': 'Guadalajara'})

# Leer desde un archivo CSV usando DictReader
with open('datos_dict.csv', 'r', encoding='utf-8') as f:
    lector = csv.DictReader(f)
    for fila in lector:
        print(fila)

**Discusión**: Explora con ChatGPT u otro asistente las ventajas y desventajas de usar CSV en comparación con otros formatos de almacenamiento de datos tabulares como Excel o bases de datos SQL. ¿En qué situaciones es más adecuado usar CSV?

### Ejercicio

1. Crea un archivo de texto llamado `notas.txt` y escribe en él las calificaciones de tres estudiantes en tres materias diferentes. Luego, lee el archivo y muestra las calificaciones en la consola.
2. Crea un archivo JSON llamado `estudiantes.json` que contenga una lista de diccionarios, cada uno representando a un estudiante con su nombre, edad y calificaciones. Luego, lee el archivo y muestra la información de los estudiantes en la consola.
3. Crea un archivo CSV llamado `productos.csv` que contenga una lista de productos con sus nombres, precios y cantidades. Luego, lee el archivo y muestra la información de los productos en la consola.
