# **Bucles for-while y archivos .txt**

Luisa Gomez (luisa.gomez@pucp.edu.pe)

https://pcc-interactivo.streamlit.app

## **Objetivos**
- Comprender el uso de bucles for y while
- Comprender las declaraciones break y continue
- Trabajar con archivos .txt

## **Contenidos**
1. Bucle for

  1.1. Iterando sobre una cadena de caracteres

  1.2. Iterando sobre una lista

  1.3. Iterando utilizando range()

  1.4. Instrucción break

  1.5. Instrucción continue

2. Bucle while
3. Abrir archivos desde nuestro escritorio (.txt)

---

## **1. Bucles for**

En general, un bucle es una estructura de control que repite un bloque de instrucciones (declaraciones condicionales).

El **bucle for** es un tipo de bucle que ejecuta el bloque de instrucciones un número predeterminado de veces. El conjunto de instrucciones que se repite se conoce como el **cuerpo del bucle**, y cada repetición se denomina **iteración**.

El **bucle for** se utiliza para iterar sobre una secuencia, que puede ser una lista, un diccionario, una cadena de texto, entre otros tipos de datos.

A diferencia de otros bucles, el número de iteraciones en un **bucle for** está definido desde el principio. Asimismo, un iterable (como un string, una lista o rango) determina cuántas veces se ejecutará el código.

### **1.1. Iterando sobre una cadena de caracteres**

En Python, se puede iterar prácticamente todo, como por ejemplo un string.

Los iterables son aquellos objetos que pueden ser iterados (string, listas, diccionairos, entre otros).

i → Es la variable de iteración, que toma el valor de cada letra del string en cada vuelta del bucle.




In [None]:
for caracter in "Python":
    print(caracter)


P
y
t
h
o
n


### **1.2. Iterando sobre una lista**



In [None]:
redes = ["Instagram", "TikTok", "YouTube"]

for elemento in redes:
    print("Publicando en:", elemento)

Publicando en: Instagram
Publicando en: TikTok
Publicando en: YouTube


### **¿Qué pasa aquí?**
La lista tiene 3 elementos, así que el bucle se repite 3 veces (3 iteraciones):

**Primera iteración:**

A red  se le asigna el valor "Instagram"

Se imprime: Publicando en: Instagram

**Segunda iteración:**

A red  se le asigna el valor "TikTok"

Se imprime: Publicando en: TikTok

**Tercera iteración:**

A red  se le asigna el valor "YouTube"

Se imprime: Publicando en: YouTube




In [None]:
for numero in [1, 2, 3]:
    print(numero)

1
2
3


In [None]:
for numero in []:
    print(numero)

In [None]:
# Este bucle for itera sobre cada elemento de la lista. En cada iteración, la variable palabra toma el valor de un elemento diferente de la lista.
lista = ['¿Python', 'es', 'genial,', 'verdad?']
for palabra in lista:
    if palabra.startswith('g'): # La función startswith() indica que el string empieza con un caracter determinado
        print(palabra, ': Empieza con la letra g') # Si la palabra comienza con 'g', se imprime un mensaje indicando que la palabra empieza con esa letra.
    else: # Si la palabra no comienza con 'g', se imprime un mensaje indicando que la palabra no empieza con la letra 'g'.
        print(palabra, ': No empieza con la letra g')

¿Python : No empieza con la letra g
es : No empieza con la letra g
genial, : Empieza con la letra g
verdad? : No empieza con la letra g


In [None]:
lista_2 = ["palabra", 3.14, 10]
for elemento in lista_2:
    if type(elemento) == str:
        print("Es un string")
    else:
        print("No es un string.")

Es un string
No es un string.
No es un string.


### **1.3. Iterando utilizando `range()`**
`range()` es una función que se usa para generar una secuencia de números, ideal para repetir algo varias veces en un bucle for.

Por ejemplo, range(5) crea la lista [0, 1, 2, 3, 4].

**¿Por qué utilizamos `range()` en lugar de simplemente escribir la lista?**

`range()` es una función que crea una lista de números, pero no crea la lista hasta que la necesitamos. Esto significa que podemos crear una lista de números muy larga sin tener que escribirlo manualmente. Esto es especialmente útil cuando queremos iterar sobre una lista de números muy larga.

La sintaxis de `range()` es range(start, stop, step).

`start` es el primer número en la lista, `stop` es el último número en la lista, y `step` es la diferencia entre dos números consecutivos en la lista.

Por defecto, start es 0, step es 1, y stop es 0.

Por ejemplo, range(0, 5, 1) es equivalente a range(5), y crea la lista [0, 1, 2, 3, 4].

In [None]:
for numero in range(50,101,5):
    print(numero)

50
55
60
65
70
75
80
85
90
95
100


In [None]:
# El bucle for se usa para recorrer la secuencia de números generada por range(5)
for i in range(5):
    print(i)

0
1
2
3
4


In [None]:
for i in range(0, 5, 1):
    print(i)

0
1
2
3
4


In [None]:
for i in range(0, 5, 2): ### de dos en dos
    print(i)

0
2
4


In [None]:
for i in range(5, 0, -1): ### al revés
    print(i)

5
4
3
2
1


### **1.4. Instrucción `break`**
`break` es una instrucción en Python que sirve para salir de un bucle antes de que termine naturalmente.

In [None]:
for elemento in [1, 2, 3, 4, 5]:
    if elemento == 6:
        print(elemento)

In [None]:
# El bucle for recorre cada número en la lista. En cada iteración, la variable elemento toma el valor de uno de los números de la lista.
for elemento in [1, 2, 3, 4, 5]:
    if elemento == 4: # La instrucción if verifica si el valor de elemento es igual a 3.
        #print(elemento)
        break # Si esto es cierto, se ejecuta la instrucción break, que detiene el bucle inmediatamente.
    print(elemento) # El código que esté después de break dentro del bucle no se ejecutará y el bucle no continuará iterando.

1
2
3


In [None]:
palabra = "esternocleidomastoideo"

for letra in palabra:
    print(letra)
    if letra == "o":
        break

e
s
t
e
r
n
o


In [None]:
palabra = "esternocleidomastoideo"

for letra in palabra:
    if letra == "o":
        break
    print(letra)

e
s
t
e
r
n


### **1.5. Instrucción `continue`**
La instrucción `continue` se usa para saltar una vuelta del bucle y pasar directamente a la siguiente.

In [None]:
for elemento in [1, 2, 3, 4, 5]:
    if elemento == 3:
        continue
    print(elemento)

1
2
4
5


In [None]:
for elemento in [1, 2, 3, 4, 5]:
    print(elemento)
    if elemento == 3:
        continue

1
2
3
4
5


In [None]:
# Se asigna la cadena de texto "esternocleidomastoideo" a la variable palabra. Esta palabra será recorrida letra por letra usando el bucle for.
palabra = "esternocleidomastoideo"
# Este bucle for recorre cada una de las letras de la palabra. En cada iteración, la variable letra toma el valor de una letra de la cadena.
for letra in palabra:
    if letra == "o": # La instrucción if verifica si la letra actual es igual a 'o'. Si es así, la instrucción continue se ejecuta.
        continue # continue hace que se salte la iteración actual del bucle, por lo que el código que esté después de continue no se ejecutará para esa letra, y el bucle pasará a la siguiente letra.
    print(letra)


## **2. Bucle while**

Un **bucle while** permite repetir la ejecución de un grupo de instrucciones mientras se cumpla una condición (es decir, **mientras la condición sea True**).

**El código se ejecutará mientras se cumpla una condición determinada. Cuando la condición deje de cumplirse, se saldrá del bucle**.




El **bucle while** en programación se utiliza para repetir un bloque de código mientras se cumpla una condición específica. La estructura básica de un **bucle while** es la siguiente:

In [None]:
while condición:
      # Código a ejecutar mientras la condición sea verdadera

Aquí, **condición** es una expresión que el bucle evalúa antes de cada **iteración**. Si la condición es verdadera (True), el bucle ejecuta el bloque de código contenido dentro de él. Después de cada iteración, la condición se evalúa nuevamente. El bucle continúa ejecutándose hasta que la condición se evalúa como falsa (False), en cuyo momento el flujo del programa sale del **bucle while**.

In [None]:
# Supongamos que queremos imprimir números del 1 al 5. Podemos usar un bucle while con un contador.

# Se crea una variable llamada contador y se le asigna el valor inicial de 1.
contador = 1

# El bucle while continuará ejecutándose mientras la condición contador <= 5 sea verdadera, es decir, mientras el valor de contador sea menor o igual a 5.
while contador <= 5:
    print(contador) # Se imprime el número de cada iteración
    # Después de imprimir el valor del contador, esta línea incrementa su valor en 1
    contador = contador + 1  # contador += 1


1
2
3
4
5


In [None]:
contador = 1
while contador <= 5:
    print(contador)

En este ejemplo, el **bucle while** se ejecutará mientras contador sea menor o igual a 5. En cada **iteración**, imprime el valor de contador y luego incrementa contador en 1. Cuando contador llega a 6, la condición contador <= 5 se convierte en falsa, y el bucle termina.

In [None]:
# Podemos usar un bucle while para buscar un elemento en una lista y detenernos cuando lo encontremos.

nombres = ["Ana", "Luis", "Mario", "Carla"]
nombre_buscado = "María"

indice = 0
encontrado = False

while indice < len(nombres):
    if nombres[indice] == nombre_buscado:
        encontrado = True
        break  # Se detiene el bucle si encontramos el nombre
    indice += 1 # indice = indice + 1

if encontrado:
    print(f"El nombre {nombre_buscado} fue encontrado en la posición {indice}.")
else:
    print(f"El nombre {nombre_buscado} no está en la lista.")

El nombre María no está en la lista.


In [None]:
# Se crea una variable i con un valor inicial de 1. Esta variable servirá como contador en el bucle
i = 1
while i < 6: # El bucle while continuará ejecutándose mientras el valor de i sea menor que 6.
  print(i) # Durante cada iteración, el valor actual de i se imprime.
  if i == 3: # Si el valor de i es igual a 3, el bucle se interrumpe utilizando el comando break.
    break
  i = i + 1 # Después de imprimir el valor de i y comprobar si es 3, la variable i se incrementa en 1

1
2
3


In [None]:
i = 1
while i < 6:
    if i == 3:
       break
    print(i)
    i = i + 1


1
2


In [None]:
# Se crea una variable i con un valor inicial de 0. Esta variable servirá como contador en el bucle.
i = 0
while i < 6: # El bucle while continuará ejecutándose mientras el valor de i sea menor que 6.
  i = i + 1 # Al principio de cada iteración del bucle, la variable i se incrementa en 1.
  if i == 3: # Si el valor de i es igual a 3, se activa la instrucción continue.
    continue
  print(i) # Durante cada iteración, el valor de i se imprime.

1
2
4
5
6


## **3. Abrir archivos desde nuestro escritorio (.txt)**

`from google.colab import files`

Este código proporciona funciones para interactuar con archivos en un entorno de Google Colab, especialmente para cargar y descargar archivos desde el escritorio hacia el entorno de Colab.

`uploaded = files.upload()`

Esta función permite al usuario cargar archivos desde su sistema local al entorno de Google Colab. Después de ejecutar esta línea, se solicitará al usuario que seleccione un archivo de su sistema local para cargarlo.

La tercera línea de código abre el archivo seleccionado llamado "Cien años de soledad.txt" en modo de lectura ("r") utilizando la declaración with. Esta declaración garantiza que el archivo se cierre correctamente después de su uso, incluso si ocurren excepciones durante la lectura.

Finalmente, el contenido del archivo se lee y se almacena en la variable texto. Después de ejecutar estas líneas de código, el contenido del archivo seleccionado estará disponible en la variable texto para su posterior procesamiento en el entorno de Google Colab.

In [None]:
from google.colab import files
uploaded = files.upload()


Saving Cien años de soledad.txt to Cien años de soledad.txt


In [None]:
with open("Cien años de soledad.txt", "r") as file:
    texto = file.read()

In [None]:
texto

'Muchos años después, frente al pelotón de fusilamiento, el coronel Aureliano Buendía había de recordar aquella tarde remota en que su padre lo llevó a conocer el hielo. Macondo era entonces una aldea de veinte casas de barro y cañabrava construidas a la orilla de un río de aguas diáfanas que se precipitaban por un lecho de piedras pulidas, blancas y enormes como huevos prehistóricos. El mundo era tan reciente, que muchas cosas carecían de nombre, y para mencionarlas había que señalarlas con el dedo. Todos los años, por el mes de marzo, una familia de gitanos desarrapados plantaba su carpa cerca de la aldea, y con un grande alboroto de pitos y timbales daban a conocer los nuevos inventos. Primero llevaron el imán. Un gitano corpulento, de barba montaraz y manos de gorrión, que se presentó con el nombre de Melquíades, hizo una truculenta demostración pública de lo que él mismo llamaba la octava maravilla de los sabios alquimistas de Macedonia. Fue de casa en casa arrastrando dos lingote

In [None]:
with open("Viva la vida.txt", "r") as file:
    cancion = file.read()

In [None]:
cancion

"I used to rule the world\nSeas would rise when I gave the word\nNow in the morning, I sleep alone\nSweep the streets I used to own\nI used to roll the dice\nFeel the fear in my enemy's eyes\nListen as the crowd would sing\nNow the old king is dead, long live the king\nOne minute, I held the key\nNext the walls were closed on me\nAnd I discovered that my castles stand\nUpon pillars of salt and pillars of sand\nI hear Jerusalem bells a-ringin'\nRoman Cavalry choirs are singin'\nBe my mirror, my sword and shield\nMy missionaries in a foreign field\nFor some reason, I can't explain\nOnce you'd gone, there was never, never an honest word\nAnd that was when I ruled the world\nIt was a wicked and wild wind\nBlew down the doors to let me in\nShattered windows and the sound of drums\nPeople couldn't believe what I'd become\nRevolutionaries wait\nFor my head on a silver plate\nJust a puppet on a lonely string\nAw, who would ever wanna be king?\nI hear Jerusalem bells a-ringin'\nRoman Cavalry ch

----

In [None]:
# Visualizamos el texto
texto

'Muchos años después, frente al pelotón de fusilamiento, el coronel Aureliano Buendía había de recordar aquella tarde remota en que su padre lo llevó a conocer el hielo. Macondo era entonces una aldea de veinte casas de barro y cañabrava construidas a la orilla de un río de aguas diáfanas que se precipitaban por un lecho de piedras pulidas, blancas y enormes como huevos prehistóricos. El mundo era tan reciente, que muchas cosas carecían de nombre, y para mencionarlas había que señalarlas con el dedo. Todos los años, por el mes de marzo, una familia de gitanos desarrapados plantaba su carpa cerca de la aldea, y con un grande alboroto de pitos y timbales daban a conocer los nuevos inventos. Primero llevaron el imán. Un gitano corpulento, de barba montaraz y manos de gorrión, que se presentó con el nombre de Melquíades, hizo una truculenta demostración pública de lo que él mismo llamaba la octava maravilla de los sabios alquimistas de Macedonia. Fue de casa en casa arrastrando dos lingote

In [None]:
# Convertimos en mayúsculas con la función .upper()
texto_mayuscula = texto.upper()

# Visualizamos
texto_mayuscula

'MUCHOS AÑOS DESPUÉS, FRENTE AL PELOTÓN DE FUSILAMIENTO, EL CORONEL AURELIANO BUENDÍA HABÍA DE RECORDAR AQUELLA TARDE REMOTA EN QUE SU PADRE LO LLEVÓ A CONOCER EL HIELO. MACONDO ERA ENTONCES UNA ALDEA DE VEINTE CASAS DE BARRO Y CAÑABRAVA CONSTRUIDAS A LA ORILLA DE UN RÍO DE AGUAS DIÁFANAS QUE SE PRECIPITABAN POR UN LECHO DE PIEDRAS PULIDAS, BLANCAS Y ENORMES COMO HUEVOS PREHISTÓRICOS. EL MUNDO ERA TAN RECIENTE, QUE MUCHAS COSAS CARECÍAN DE NOMBRE, Y PARA MENCIONARLAS HABÍA QUE SEÑALARLAS CON EL DEDO. TODOS LOS AÑOS, POR EL MES DE MARZO, UNA FAMILIA DE GITANOS DESARRAPADOS PLANTABA SU CARPA CERCA DE LA ALDEA, Y CON UN GRANDE ALBOROTO DE PITOS Y TIMBALES DABAN A CONOCER LOS NUEVOS INVENTOS. PRIMERO LLEVARON EL IMÁN. UN GITANO CORPULENTO, DE BARBA MONTARAZ Y MANOS DE GORRIÓN, QUE SE PRESENTÓ CON EL NOMBRE DE MELQUÍADES, HIZO UNA TRUCULENTA DEMOSTRACIÓN PÚBLICA DE LO QUE ÉL MISMO LLAMABA LA OCTAVA MARAVILLA DE LOS SABIOS ALQUIMISTAS DE MACEDONIA. FUE DE CASA EN CASA ARRASTRANDO DOS LINGOTE

In [None]:
# Convertimos en minúsculas con la función .lower()
texto_minuscula = texto.lower()

# Visualizamos
texto_minuscula


'muchos años después, frente al pelotón de fusilamiento, el coronel aureliano buendía había de recordar aquella tarde remota en que su padre lo llevó a conocer el hielo. macondo era entonces una aldea de veinte casas de barro y cañabrava construidas a la orilla de un río de aguas diáfanas que se precipitaban por un lecho de piedras pulidas, blancas y enormes como huevos prehistóricos. el mundo era tan reciente, que muchas cosas carecían de nombre, y para mencionarlas había que señalarlas con el dedo. todos los años, por el mes de marzo, una familia de gitanos desarrapados plantaba su carpa cerca de la aldea, y con un grande alboroto de pitos y timbales daban a conocer los nuevos inventos. primero llevaron el imán. un gitano corpulento, de barba montaraz y manos de gorrión, que se presentó con el nombre de melquíades, hizo una truculenta demostración pública de lo que él mismo llamaba la octava maravilla de los sabios alquimistas de macedonia. fue de casa en casa arrastrando dos lingote

### **Signos de puntuación:**
| Símbolo | Nombre                             |
|---------|------------------------------------|
| `!`     | Signo de exclamación               |
| `"`     | Comillas dobles                    |
| `'`     | Comillas simples                   |
| `()`    | Paréntesis                         |
| `,`     | Coma                               |
| `.`     | Punto                              |
| `;`     | Punto y coma                       |
| `:`     | Dos puntos                         |
| `?`     | Signo de interrogación             |
| `/`     | Barra diagonal                     |
| `_`     | Guion bajo                         |
| `-`     | Guion                              |
| `—`     | Raya                               |
| `« »`   | Comillas españolas                 |


In [None]:
texto_sin_comas = texto_minuscula.replace(",", "")
texto_sin_comas

'muchos años después frente al pelotón de fusilamiento el coronel aureliano buendía había de recordar aquella tarde remota en que su padre lo llevó a conocer el hielo. macondo era entonces una aldea de veinte casas de barro y cañabrava construidas a la orilla de un río de aguas diáfanas que se precipitaban por un lecho de piedras pulidas blancas y enormes como huevos prehistóricos. el mundo era tan reciente que muchas cosas carecían de nombre y para mencionarlas había que señalarlas con el dedo. todos los años por el mes de marzo una familia de gitanos desarrapados plantaba su carpa cerca de la aldea y con un grande alboroto de pitos y timbales daban a conocer los nuevos inventos. primero llevaron el imán. un gitano corpulento de barba montaraz y manos de gorrión que se presentó con el nombre de melquíades hizo una truculenta demostración pública de lo que él mismo llamaba la octava maravilla de los sabios alquimistas de macedonia. fue de casa en casa arrastrando dos lingotes metálicos

In [None]:
# Borramos los signos de puntuación y los saltos de lineas \n
texto_depurado = texto_minuscula.replace(".", "").replace(",", "").replace("«", "").replace("»", "").replace("—","").replace(":","")

# Visualizamos
texto_depurado

'muchos años después frente al pelotón de fusilamiento el coronel aureliano buendía había de recordar aquella tarde remota en que su padre lo llevó a conocer el hielo macondo era entonces una aldea de veinte casas de barro y cañabrava construidas a la orilla de un río de aguas diáfanas que se precipitaban por un lecho de piedras pulidas blancas y enormes como huevos prehistóricos el mundo era tan reciente que muchas cosas carecían de nombre y para mencionarlas había que señalarlas con el dedo todos los años por el mes de marzo una familia de gitanos desarrapados plantaba su carpa cerca de la aldea y con un grande alboroto de pitos y timbales daban a conocer los nuevos inventos primero llevaron el imán un gitano corpulento de barba montaraz y manos de gorrión que se presentó con el nombre de melquíades hizo una truculenta demostración pública de lo que él mismo llamaba la octava maravilla de los sabios alquimistas de macedonia fue de casa en casa arrastrando dos lingotes metálicos y tod

In [None]:
# Creamos una lista de palabras con la función .split()

lista_palabras = texto_depurado.split()

# Visualizamos
print(lista_palabras)


['muchos', 'años', 'después', 'frente', 'al', 'pelotón', 'de', 'fusilamiento', 'el', 'coronel', 'aureliano', 'buendía', 'había', 'de', 'recordar', 'aquella', 'tarde', 'remota', 'en', 'que', 'su', 'padre', 'lo', 'llevó', 'a', 'conocer', 'el', 'hielo', 'macondo', 'era', 'entonces', 'una', 'aldea', 'de', 'veinte', 'casas', 'de', 'barro', 'y', 'cañabrava', 'construidas', 'a', 'la', 'orilla', 'de', 'un', 'río', 'de', 'aguas', 'diáfanas', 'que', 'se', 'precipitaban', 'por', 'un', 'lecho', 'de', 'piedras', 'pulidas', 'blancas', 'y', 'enormes', 'como', 'huevos', 'prehistóricos', 'el', 'mundo', 'era', 'tan', 'reciente', 'que', 'muchas', 'cosas', 'carecían', 'de', 'nombre', 'y', 'para', 'mencionarlas', 'había', 'que', 'señalarlas', 'con', 'el', 'dedo', 'todos', 'los', 'años', 'por', 'el', 'mes', 'de', 'marzo', 'una', 'familia', 'de', 'gitanos', 'desarrapados', 'plantaba', 'su', 'carpa', 'cerca', 'de', 'la', 'aldea', 'y', 'con', 'un', 'grande', 'alboroto', 'de', 'pitos', 'y', 'timbales', 'daban',

---
nltk es una librería de Python llamada Natural Language Toolkit, que contiene herramientas y recursos para trabajar con texto en el procesamiento de lenguaje natural (PLN).

https://pypi.org/project/stop-words/

In [None]:
import nltk

In [None]:
nltk.download('stopwords') # stopwords es un conjunto de palabras comunes que se suelen eliminar en el análisis de texto, ya que no aportan mucha información significativa

[nltk_data] Downloading package stopwords to /root/nltk_data...
[nltk_data]   Unzipping corpora/stopwords.zip.


True

In [11]:
from nltk.corpus import stopwords # Se usa para acceder a las listas de palabras vacías (stopwords) en diferentes idiomas.

stopwords_español = stopwords.words('spanish')

new_words=['re','name', 'user', 'ct']
for i in new_words:
    stopwords_español.append(i)
print("re" in stopwords_español)

#type(stopwords_español)
#print(stopwords_español)
#print("años" in stopwords_español) # Verificar si está un elemento en nuestra lista

True


In [None]:
lista_depurada = []  # Creamos una lista vacía llamada lista_depurada
# lista_depurada = list()
for palabra in lista_palabras:  # Iteramos sobre cada palabra en la lista lista_palabras
    if palabra not in stopwords_español:  # Comprobamos si la palabra no está en la lista de stopwords en español (stopwords_es)
        lista_depurada.append(palabra)  # Si la palabra no es una stopword, la agregamos a lista_depurada

print(lista_depurada)  # Imprimimos la lista depurada, que contiene solo las palabras no vacías

['años', 'después', 'frente', 'pelotón', 'fusilamiento', 'coronel', 'aureliano', 'buendía', 'recordar', 'aquella', 'tarde', 'remota', 'padre', 'llevó', 'conocer', 'hielo', 'macondo', 'entonces', 'aldea', 'veinte', 'casas', 'barro', 'cañabrava', 'construidas', 'orilla', 'río', 'aguas', 'diáfanas', 'precipitaban', 'lecho', 'piedras', 'pulidas', 'blancas', 'enormes', 'huevos', 'prehistóricos', 'mundo', 'tan', 'reciente', 'muchas', 'cosas', 'carecían', 'nombre', 'mencionarlas', 'señalarlas', 'dedo', 'años', 'mes', 'marzo', 'familia', 'gitanos', 'desarrapados', 'plantaba', 'carpa', 'cerca', 'aldea', 'grande', 'alboroto', 'pitos', 'timbales', 'daban', 'conocer', 'nuevos', 'inventos', 'primero', 'llevaron', 'imán', 'gitano', 'corpulento', 'barba', 'montaraz', 'manos', 'gorrión', 'presentó', 'nombre', 'melquíades', 'hizo', 'truculenta', 'demostración', 'pública', 'mismo', 'llamaba', 'octava', 'maravilla', 'sabios', 'alquimistas', 'macedonia', 'casa', 'casa', 'arrastrando', 'dos', 'lingotes', '

In [None]:
# Visualizamos los 10 primeros elementos de la lista
print(lista_palabras[:10])
print(lista_depurada[:10])

['muchos', 'años', 'después', 'frente', 'al', 'pelotón', 'de', 'fusilamiento', 'el', 'coronel']
['años', 'después', 'frente', 'pelotón', 'fusilamiento', 'coronel', 'aureliano', 'buendía', 'recordar', 'aquella']


In [None]:
# Contamos la lista de palabras con la función len()

print(len(lista_palabras))
print(len(lista_depurada))

479
258


In [None]:
# Nos falta determinar las frecuencias de las palabras (número de veces que aparece en el texto) y generar un gráfico a partir de ello
print(lista_depurada.count("arcadio"))
print(lista_depurada.count("buendía"))

## diccionarios y wordcloud

3
4


In [None]:
with open("Viva la vida.txt", "r") as file:
    cancion = file.read()

In [None]:
cancion

"I used to rule the world\nSeas would rise when I gave the word\nNow in the morning, I sleep alone\nSweep the streets I used to own\nI used to roll the dice\nFeel the fear in my enemy's eyes\nListen as the crowd would sing\nNow the old king is dead, long live the king\nOne minute, I held the key\nNext the walls were closed on me\nAnd I discovered that my castles stand\nUpon pillars of salt and pillars of sand\nI hear Jerusalem bells a-ringin'\nRoman Cavalry choirs are singin'\nBe my mirror, my sword and shield\nMy missionaries in a foreign field\nFor some reason, I can't explain\nOnce you'd gone, there was never, never an honest word\nAnd that was when I ruled the world\nIt was a wicked and wild wind\nBlew down the doors to let me in\nShattered windows and the sound of drums\nPeople couldn't believe what I'd become\nRevolutionaries wait\nFor my head on a silver plate\nJust a puppet on a lonely string\nAw, who would ever wanna be king?\nI hear Jerusalem bells a-ringin'\nRoman Cavalry ch

In [None]:
# Convertimos en minúsculas con la función .lower()
cancion_minuscula = cancion.lower()

# Visualizamos
cancion_minuscula

"i used to rule the world\nseas would rise when i gave the word\nnow in the morning, i sleep alone\nsweep the streets i used to own\ni used to roll the dice\nfeel the fear in my enemy's eyes\nlisten as the crowd would sing\nnow the old king is dead, long live the king\none minute, i held the key\nnext the walls were closed on me\nand i discovered that my castles stand\nupon pillars of salt and pillars of sand\ni hear jerusalem bells a-ringin'\nroman cavalry choirs are singin'\nbe my mirror, my sword and shield\nmy missionaries in a foreign field\nfor some reason, i can't explain\nonce you'd gone, there was never, never an honest word\nand that was when i ruled the world\nit was a wicked and wild wind\nblew down the doors to let me in\nshattered windows and the sound of drums\npeople couldn't believe what i'd become\nrevolutionaries wait\nfor my head on a silver plate\njust a puppet on a lonely string\naw, who would ever wanna be king?\ni hear jerusalem bells a-ringin'\nroman cavalry ch

In [None]:
# Borramos los signos de puntuación y los saltos de lineas \n
cancion_depurado = cancion_minuscula.replace("\n", " ").replace("?", "").replace("-", "").replace(",", "")

# Visualizamos
cancion_depurado

"i used to rule the world seas would rise when i gave the word now in the morning i sleep alone sweep the streets i used to own i used to roll the dice feel the fear in my enemy's eyes listen as the crowd would sing now the old king is dead long live the king one minute i held the key next the walls were closed on me and i discovered that my castles stand upon pillars of salt and pillars of sand i hear jerusalem bells aringin' roman cavalry choirs are singin' be my mirror my sword and shield my missionaries in a foreign field for some reason i can't explain once you'd gone there was never never an honest word and that was when i ruled the world it was a wicked and wild wind blew down the doors to let me in shattered windows and the sound of drums people couldn't believe what i'd become revolutionaries wait for my head on a silver plate just a puppet on a lonely string aw who would ever wanna be king i hear jerusalem bells aringin' roman cavalry choirs are singing be my mirror my sword 

In [None]:
lista_cancion = cancion_depurado.split()
print(lista_cancion)

['i', 'used', 'to', 'rule', 'the', 'world', 'seas', 'would', 'rise', 'when', 'i', 'gave', 'the', 'word', 'now', 'in', 'the', 'morning', 'i', 'sleep', 'alone', 'sweep', 'the', 'streets', 'i', 'used', 'to', 'own', 'i', 'used', 'to', 'roll', 'the', 'dice', 'feel', 'the', 'fear', 'in', 'my', "enemy's", 'eyes', 'listen', 'as', 'the', 'crowd', 'would', 'sing', 'now', 'the', 'old', 'king', 'is', 'dead', 'long', 'live', 'the', 'king', 'one', 'minute', 'i', 'held', 'the', 'key', 'next', 'the', 'walls', 'were', 'closed', 'on', 'me', 'and', 'i', 'discovered', 'that', 'my', 'castles', 'stand', 'upon', 'pillars', 'of', 'salt', 'and', 'pillars', 'of', 'sand', 'i', 'hear', 'jerusalem', 'bells', "aringin'", 'roman', 'cavalry', 'choirs', 'are', "singin'", 'be', 'my', 'mirror', 'my', 'sword', 'and', 'shield', 'my', 'missionaries', 'in', 'a', 'foreign', 'field', 'for', 'some', 'reason', 'i', "can't", 'explain', 'once', "you'd", 'gone', 'there', 'was', 'never', 'never', 'an', 'honest', 'word', 'and', 'tha

In [None]:
stopwords_inglés = stopwords.words('english')

print(stopwords_inglés)

['a', 'about', 'above', 'after', 'again', 'against', 'ain', 'all', 'am', 'an', 'and', 'any', 'are', 'aren', "aren't", 'as', 'at', 'be', 'because', 'been', 'before', 'being', 'below', 'between', 'both', 'but', 'by', 'can', 'couldn', "couldn't", 'd', 'did', 'didn', "didn't", 'do', 'does', 'doesn', "doesn't", 'doing', 'don', "don't", 'down', 'during', 'each', 'few', 'for', 'from', 'further', 'had', 'hadn', "hadn't", 'has', 'hasn', "hasn't", 'have', 'haven', "haven't", 'having', 'he', "he'd", "he'll", 'her', 'here', 'hers', 'herself', "he's", 'him', 'himself', 'his', 'how', 'i', "i'd", 'if', "i'll", "i'm", 'in', 'into', 'is', 'isn', "isn't", 'it', "it'd", "it'll", "it's", 'its', 'itself', "i've", 'just', 'll', 'm', 'ma', 'me', 'mightn', "mightn't", 'more', 'most', 'mustn', "mustn't", 'my', 'myself', 'needn', "needn't", 'no', 'nor', 'not', 'now', 'o', 'of', 'off', 'on', 'once', 'only', 'or', 'other', 'our', 'ours', 'ourselves', 'out', 'over', 'own', 're', 's', 'same', 'shan', "shan't", 'she

In [None]:
lista_depurada_2 = []  # Creamos una lista vacía llamada lista_depurada
# lista_depurada = list()
for palabra in lista_cancion:  # Iteramos sobre cada palabra en la lista lista_palabras
    if palabra not in stopwords_inglés:  # Comprobamos si la palabra no está en la lista de stopwords en español (stopwords_es)
        lista_depurada_2.append(palabra)  # Si la palabra no es una stopword, la agregamos a lista_depurada

print(lista_depurada_2)  # Imprimimos la lista depurada, que contiene solo las palabras no vacías

['used', 'rule', 'world', 'seas', 'would', 'rise', 'gave', 'word', 'morning', 'sleep', 'alone', 'sweep', 'streets', 'used', 'used', 'roll', 'dice', 'feel', 'fear', "enemy's", 'eyes', 'listen', 'crowd', 'would', 'sing', 'old', 'king', 'dead', 'long', 'live', 'king', 'one', 'minute', 'held', 'key', 'next', 'walls', 'closed', 'discovered', 'castles', 'stand', 'upon', 'pillars', 'salt', 'pillars', 'sand', 'hear', 'jerusalem', 'bells', "aringin'", 'roman', 'cavalry', 'choirs', "singin'", 'mirror', 'sword', 'shield', 'missionaries', 'foreign', 'field', 'reason', "can't", 'explain', 'gone', 'never', 'never', 'honest', 'word', 'ruled', 'world', 'wicked', 'wild', 'wind', 'blew', 'doors', 'let', 'shattered', 'windows', 'sound', 'drums', 'people', 'believe', 'become', 'revolutionaries', 'wait', 'head', 'silver', 'plate', 'puppet', 'lonely', 'string', 'aw', 'would', 'ever', 'wanna', 'king', 'hear', 'jerusalem', 'bells', "aringin'", 'roman', 'cavalry', 'choirs', 'singing', 'mirror', 'sword', 'shiel

In [None]:
print(len(lista_cancion))
print(len(lista_depurada_2))

296
165
