# Reto 1: Lista de todos los archivos de tipo texto

## Descripción
Obtener la lista de todos los archivos de tipo texto a partir de una carpeta proporcionada por el usuario incluyendo todas las subcarpetas. Algunas de las extensiones de archivos de tipo texto son `.txt`, `.py`, `.csv`, `.html`, `.json`, etc.

Pero ¿será conveniente filtrar los archivos sólo por su extensión? ¿Habrá alguna otra forma de determinar si un archivo es de tipo texo? ¿Has oido hablar de los tipos mime (mimetypes)?

Por ejemplo si se tuviera unas carpetas con los siguientes archivos:

```
carpeta/
|- archivo1.txt
|- archivo2.txt
|- archivo3.exe
|- archivo4.xlsx
|- subcarpeta/
   |- archivo5.html
   |- archivo6.jpg
   |- archivo7.png
   |- archivo8.csv
```
El resultado debería de ser el siguiente:
```
/carpeta/archivo1.txt
/carpeta/archivo2.txt
/carpeta/subcarpeta/archivo5.html
/carpeta/subcarpeta/archivo8.csv
```

El reto consiste de dos partes:

1. Complementa éste Notebook hasta obtener el resultado solicitado
2. Crea un script en python llamado `lst.py` que al ser ejecutado en una Consola o Terminal para el caso de la carpeta de ejemplo muestre lo siguiente:

```bash
$ python lst.py carpeta
/carpeta/archivo1.txt
/carpeta/archivo2.txt
/carpeta/subcarpeta/archivo5.html
/carpeta/subcarpeta/archivo8.csv
$
```

## Desarrollo

El desarrollo se realiza utilizando una meotodología de lo general a lo particular, así que primero se planea una solución a nivel general y se hace uso de la programación modular creando funciones que aún no existen, pero que hagan justo lo que necesitamos, así que la primera aproximación sería:

In [4]:
import pathlib

# Se obtiene carpeta desde el usuario
ruta_str = input("Escribe la carpeta ")
ruta = pathlib.Path(ruta_str)

# Se obtiene la lista de archivos a partir de ruta
archivos = obtener_archivos_texto(ruta)  # Se asume que existirá una función que resolverá la tarea

# Se imprime la lista
print("La lista de archivos de texto es:")
for nom in archivos:
    print(nom)

Escribe la carpeta  .


La lista de archivos de texto es:
carpeta/archivo3.exe
carpeta/archivo1.txt
carpeta/archivo2.txt
carpeta/archivo4.xlsx
carpeta/subcarpeta/archivo8.csv
carpeta/subcarpeta/archivo7.png
carpeta/subcarpeta/archivo5.html
carpeta/subcarpeta/archivo6.jpg
clientes-pedidos.sqlite3
Trabajando-con-bases-de-datos.ipynb
carpeta.zip
peliculas.sqlite3
.ipynb_checkpoints/Reto-1-checkpoint.ipynb
.ipynb_checkpoints/Trabajando-con-bases-de-datos-checkpoint.ipynb
.ipynb_checkpoints/lst-checkpoint.ipynb
refs/lst.ipynb
refs/crear-tablas.mysql
refs/clientes-pedidos.sqlite3
refs/registros-ejemplo.mysql
refs/Trabajando-con-bases-de-datos.ipynb
refs/.ipynb_checkpoints/Reto-1-checkpoint.ipynb
refs/.ipynb_checkpoints/intel-checkpoint.mysql
refs/.ipynb_checkpoints/Trabajando-con-bases-de-datos-checkpoint.ipynb
refs/.ipynb_checkpoints/registros-ejemplo-checkpoint.sql
refs/.ipynb_checkpoints/crear-tablas-checkpoint.mysql
refs/.ipynb_checkpoints/crear-tablas-checkpoint.sql
refs/.ipynb_checkpoints/registros-ejemplo-ch

Así que nos falta crear la función `obtener_archivos_texto()`, así que vamos a ello:

In [3]:
def obtener_archivos_texto(ruta):
    """ Obtiene la lista de archivos de ruta y regresa sólo los que son
    archivos de texto """
    archivos = []
    for item in ruta.iterdir():  # como ruta es de tipo PosixPath o WindowsPath
        if item.is_file():  # Si el item es un archivo lo agregamos a la lista
            ## Complementa con un if y una función para determinar si el archivo es de
            ## texto entonces lo agregamos a la lista, si no, no hacemos nada y pasamos
            ## al siguiente
            archivos.append(item)
        else:  # Si el item no es un archivo entonces es una carpeta y otenemos la lista de arcivos
            lista_archivos_subruta = obtener_archivos_texto(item)  # <-ruta
            archivos = archivos + lista_archivos_subruta  # Lo concatemos a la lista de archivos[]
    return archivos

**Sugerencias:**

- Realiza una copia de la celda de código anterior y modifícala hasta obtener el resultado esperado.
- Crea una función llamada `es_archivo_texto(nombre_archivo)` que al pasarle la ruta y nombre de un archivo regrese `True`si el archivo es de texto o `False` si no lo es, luego emplea esa función con un `if` para decidir si se agrega o no el archivo a la lista.
- Revisa la documentación del módulo [mimetypes](https://docs.python.org/3/library/mimetypes.html) puede ser útil para determinar si un archivo es de texto o puedes crear tu propia lista de extensiones de archivos válidas como archivos de texto (`[".csv", ".txt", ".json", ...]`)
- Usa la `carpeta/` de ejemplo para revisar tu resultado, pero debería de funcionar con cualquier carpeta.