[Loops and List Comprehensions](https://www.kaggle.com/colinmorris/loops-and-list-comprehensions) 

## Loops

Los bucles son una forma de ejecutar código repetidamente. He aquí un ejemplo:

In [1]:
planets = ['Mercury', 'Venus', 'Earth', 'Mars', 'Jupiter', 'Saturn', 'Uranus', 'Neptune']
for planet in planets:
    print(planet, end=' ') # print all on same line

Mercury Venus Earth Mars Jupiter Saturn Uranus Neptune 

The for loop specifies

* the variable name to use (in this case, planet)  
* the set of values to loop over (in this case, planets)

You use the word "in" to link them together.

The object to the right of the "in" can be any object that supports iteration. 

Basically, if it can be thought of as a group of things, you can probably loop over it. 

In addition to lists, we can iterate over the elements of a tuple:

In [None]:
multiplicands = (2, 2, 2, 3, 3, 5)
product = 1
for mult in multiplicands:
    product = product * mult
product

Incluso puede recorrer cada carácter en una cadena:

In [None]:
s = 'steganograpHy is the practicE of conceaLing a file, message, image, or video within another fiLe, message, image, Or video.'
msg = ''
# print all the uppercase letters in s, one at a time
for char in s:
    if char.isupper():
        print(char, end='')   

`range()`  
`range()` es una función que devuelve una secuencia de números.

Resulta muy útil para escribir bucles.

Por ejemplo, si queremos repetir alguna acción 5 veces:

In [None]:
for i in range(5):
    print("Doing important work. i =", i)

## while loops

El otro tipo de bucle en Python es un bucle `while`, que se repite hasta que se cumple alguna condición:

In [None]:
i = 0
while i < 10:
    print(i, end=' ')
    i += 1 # increase the value of i by 1

The argument of the `while` loop is evaluated as a boolean statement, and the loop is executed until the statement evaluates to `False`.

## List comprehensions

## Lista por comprensiones

Las listas por comprensión son una de las características más queridas y únicas de Python.

Probablemente, la forma más fácil de entenderlos es simplemente mirar algunos ejemplos:

In [None]:
squares = [n**2 for n in range(10)]
squares 

Así es como haríamos lo mismo sin una lista por comprensión:

In [None]:
squares = []
for n in range(10):
    squares.append(n**2)
squares

También podemos agregar una condición `if`:

In [None]:
short_planets = [planet for planet in planets if len(planet) < 6]
short_planets

(Si está familiarizado con SQL, podría pensar en esto como una cláusula "WHERE")

A continuación, se muestra un ejemplo de filtrado con una condición "if" y aplicación de alguna transformación a la variable de bucle:

In [None]:
# str.upper() returns an all-caps version of a string
loud_short_planets = [planet.upper() + '!' for planet in planets if len(planet) < 6]
loud_short_planets

La gente suele escribirlos en una sola línea, pero es posible que la estructura sea más clara cuando se divide en 3 líneas:

In [None]:
[
    planet.upper() + '!' 
    for planet in planets 
    if len(planet) < 6
]

(Continuing the SQL analogy, you could think of these three lines as `SELECT`, `FROM`, and `WHERE`)

The expression on the left doesn't technically have to involve the loop variable (though it'd be pretty unusual for it not to). 

What do you think the expression below will evaluate to? Press the 'output' button to check.

In [None]:
[32 for planet in planets]

List comprehensions combined with functions like `min`, `max`, and `sum` can lead to impressive one-line solutions for problems that would otherwise require several lines of code.

For example, compare the following two cells of code that do the same thing.

In [None]:
def count_negatives(nums):
    """Return the number of negative numbers in the given list.
    
    >>> count_negatives([5, -1, -2, 0, 3])
    2
    """
    n_negative = 0
    for num in nums:
        if num < 0:
            n_negative = n_negative + 1
    return n_negative

Aquí hay una solución usando una lista de comprensión:

In [None]:
def count_negatives(nums):
    return len([num for num in nums if num < 0])

Mucho mejor, ¿verdad?

Bueno, si todo lo que nos importa es minimizar la longitud de nuestro código, ¡esta tercera solución es aún mejor!

In [None]:
def count_negatives(nums):
    # Reminder: in the "booleans and conditionals" exercises, we learned about a quirk of 
    # Python where it calculates something like True + True + False + True to be equal to 3.
    return sum([num < 0 for num in nums])

Which of these solutions is the "best" is entirely subjective. 

Solving a problem with less code is always nice, but it's worth keeping in mind the following lines from The Zen of Python:

Readability counts.

Explicit is better than implicit.

So, use these tools to make compact readable programs. 

But when you have to choose, favor code that is easy for others to understand.

## Tu turno

Ya sabes lo que sigue: ¡tenemos algunos [desafíos divertidos de codificación](https://www.kaggle.com/marcocanas/exercise-loops-and-list-comprehensions/edit) para ti! El siguiente conjunto de problemas de codificación es más breve, así que pruébelo ahora.

# Exercise: Loops and List Comprehensions

With all you've learned, you can start writing much more interesting programs. 

See if you can solve the problems below.

As always, run the setup code below before working on the questions.

In [None]:
# from learntools.core import binder; binder.bind(globals())
# from learntools.python.ex5 import *
# print('Setup complete.')

## 1.

¿Alguna vez has sentido que la depuración implicaba un poco de suerte?

El siguiente programa tiene un error.

Intente identificar el error y solucionarlo.

In [16]:
def has_lucky_number(nums):
    """Return whether the given list of numbers is lucky. A lucky list contains
    at least one number divisible by 7.
    """
    lucky = False
    for num in nums:
        if num % 7 == 0:
            lucky = True
    return lucky 

In [17]:
nums = [4,2,3,7,1,0,13,5]

In [18]:
has_lucky_number(nums) 

True

Try to identify the bug and fix it in the cell below:

Intente identificar el error y solucionarlo en la celda siguiente:

# Día 6 [String and Dictionaries](https://www.kaggle.com/colinmorris/strings-and-dictionaries?utm_medium=email&utm_source=gamma&utm_campaign=thirty-days-of-ml&utm_content=day-6)

Esta lección cubrirá dos tipos esenciales de Python: cadenas y diccionarios.

## Strings

Un lugar donde el lenguaje Python realmente brilla es en la manipulación de cadenas.

Esta sección cubrirá algunos de los métodos de cadena incorporados y las operaciones de formato de Python.

Estos patrones de manipulación de cadenas surgen a menudo en el contexto del trabajo de ciencia de datos.

## String syntax

Ya ha visto muchas cadenas en ejemplos durante las lecciones anteriores, pero solo para recapitular, las cadenas en Python se pueden definir usando comillas simples o dobles.

Son funcionalmente equivalentes.

In [None]:
x = 'Pluto is a planet'
y = "Pluto is a planet"
x == y

Las comillas dobles son convenientes si su cadena contiene un carácter de comilla simple (por ejemplo, que representa un apóstrofe).

Del mismo modo, es fácil crear una cadena que contenga comillas dobles si la envuelve entre comillas simples:

In [None]:
print("Pluto's a planet!")
print('My dog is named "Pluto"')

Si intentamos poner un carácter de comilla simple dentro de una cadena de comillas simples, Python se confunde:

In [None]:
'Pluto's a planet!'

Podemos solucionar esto "escapando" de la comilla simple con una barra invertida.

In [None]:
'Pluto\'s a planet!'

La siguiente tabla resume algunos usos importantes del carácter de barra invertida.

|What you type...|What you get  |example	             | print(example)        |  
|----------------|--------------|------------------------|-----------------------|  
|\'              |'             |'What\'s up?'           |	What's up?           |
|\"	             |"             |"That's \"cool\""       |	That's "cool"        |
|\\\	         | \            |"Look, a mountain: /\\" |	Look, a mountain: /\ |
|\n	             |              |"1\n2 3"                |   "1\n2 3"            |

La última secuencia, `\n`, representa el carácter de nueva línea.

Hace que Python comience una nueva línea.

In [None]:
hello = "hello\nworld"
print(hello)

Además, la sintaxis de comillas triples de Python para cadenas nos permite incluir líneas nuevas literalmente (es decir, simplemente presionando 'Enter' en nuestro teclado, en lugar de usar la secuencia especial '\ n').

Ya hemos visto esto en las cadenas de documentos que usamos para documentar nuestras funciones, pero podemos usarlas en cualquier lugar que queramos definir una cadena.

In [None]:
triplequoted_hello = """hello
world"""
print(triplequoted_hello)
triplequoted_hello == hello

La función `print()` agrega automáticamente un carácter de nueva línea a menos que especifiquemos un valor para el argumento de la palabra clave `end` que no sea el valor predeterminado de `'\n'`:

In [None]:
print("hello")
print("world")
print("hello", end='')
print("pluto", end='')

## Strings are sequences

## Las cadenas son secuencias

Las cadenas se pueden considerar como secuencias de caracteres.

Casi todo lo que hemos visto que podemos hacer con una lista, también podemos hacerlo con una cadena.

In [None]:
# Indexing
planet = 'Pluto'
planet[0]

In [None]:
# Slicing
planet[-3:]

In [None]:
# How long is this string?
len(planet)

Sí, incluso podemos pasarlos por alto

In [None]:
[caracter + '! ' for caracter in planet]

Pero una de las principales formas en que se diferencian de las listas es que son inmutables.

No podemos modificarlos.

In [None]:
planet[0] = 'B'
# planet.append doesn't work either

## Métodos de cadena

Como `list`, el tipo `str` tiene muchos métodos muy útiles. 

Mostraré solo algunos ejemplos aquí.

In [None]:
# ALL CAPS
claim = "Pluto is a planet!"
claim.upper()

In [None]:
# all lowercase
claim.lower()

In [None]:
# Searching for the first index of a substring
claim.index('plan')

In [None]:
claim.startswith(planet)

In [None]:
claim.endswith('dwarf planet')

### Going between strings and lists: .split() and .join()

`str.split()` turns a string into a list of smaller strings, breaking on whitespace by default. 

Esto es muy útil para llevarlo de una cadena grande a una lista de palabras.

In [None]:
words = claim.split()
words

Ocasionalmente, querrá dividir en algo que no sea un espacio en blanco:

In [None]:
datestr = '1956-01-31'
year, month, day = datestr.split('-')

`str.join()` nos lleva en la otra dirección, cosiendo una lista de cadenas en una cadena larga, utilizando la cadena a la que se llamó como separador.

In [None]:
'/'.join([month, day, year])

In [None]:
# Yes, we can put unicode characters right in our string literals :)
' 👏 '.join([word.upper() for word in words])

### Building strings with `.format()`

Python lets us concatenate strings with the `+` operator.

In [None]:
planet + ', we miss you.'

Si queremos lanzar cualquier objeto que no sea una cadena, debemos tener cuidado de llamar a `str()` en ellos primero

In [None]:
position = 9
planet + ", you'll always be the " + position + "th planet to me."

In [None]:
planet + ", you'll always be the " + str(position) + "th planet to me."

Esto se está volviendo difícil de leer y molesto de escribir.

`str.format()` al rescate.

In [None]:
"{}, you'll always be the {}th planet to me.".format(planet, position)

¡Mucho más limpio! Llamamos a `.format ()` en una "cadena de formato", donde los valores de Python que queremos insertar se representan con marcadores de posición `{}`.

Observe cómo ni siquiera tuvimos que llamar a `str()` para convertir la posición de un `int`.

`format()` se encarga de eso por nosotros.

Si eso fuera todo lo que hizo `format()`, aún sería increíblemente útil.

Pero resulta que puede hacer mucho más.

Aquí hay solo una muestra:

In [None]:
pluto_mass = 1.303 * 10**22
earth_mass = 5.9722 * 10**24
population = 52910390
#         2 decimal points   3 decimal points, format as percent     separate with commas
"{} weighs about {:.2} kilograms ({:.3%} of Earth's mass). It is home to {:,} Plutonians.".format(
    planet, pluto_mass, pluto_mass / earth_mass, population,
)

In [None]:
# Referring to format() arguments by index, starting from 0
s = """Pluto's a {0}.
No, it's a {1}.
{0}!
{1}!""".format('planet', 'dwarf planet')
print(s)

Probablemente podrías escribir un libro corto solo en `str.format`, así que me detendré aquí y te señalaré [`pyformat.info`](https://pyformat.info/) y los [documentos oficiales](https://docs.python.org/3/library/string.html#formatstrings) para leer más.

## Dictionaries

Los diccionarios son una estructura de datos integrada de Python para asignar claves a valores.

In [None]:
numbers = {'one':1, 'two':2, 'three':3}

En este caso, `one`, `two` y `three` son las claves, y `1`, `2` y `3` son sus valores correspondientes.

Se accede a los valores mediante una sintaxis de corchetes similar a la indexación en listas y cadenas.

In [None]:
numbers['one'] 

Podemos usar la misma sintaxis para agregar otra clave, par de valores

In [None]:
numbers['eleven'] = 11
numbers

O para cambiar el valor asociado con una clave existente

In [None]:
numbers['one'] = 'Pluto'
numbers

Python tiene comprensiones de diccionario con una sintaxis similar a la lista de comprensiones que vimos en el tutorial anterior.

In [None]:
planets = ['Mercury', 'Venus', 'Earth', 'Mars', 'Jupiter', 'Saturn', 'Uranus', 'Neptune']
planet_to_initial = {planet: planet[0] for planet in planets}
planet_to_initial

El operador `in` nos dice si algo es una clave en el diccionario.

In [None]:
'Saturn' in planet_to_initial

In [None]:
'Betelgeuse' in planet_to_initial

Un bucle for sobre un diccionario recorrerá sus claves

In [None]:
for k in numbers:
    print("{} = {}".format(k, numbers[k]))

Podemos acceder a una colección de todas las claves o todos los valores con `dict.keys()` y `dict.values()`, respectivamente.

In [None]:
# Get all the initials, sort them alphabetically, and put them in a space-separated string.
' '.join(sorted(planet_to_initial.values()))

El muy útil método `dict.items()` nos permite iterar sobre las claves y valores de un diccionario simultáneamente.

(En la jerga de Python, un item (elemento) se refiere a un par clave, valor)

In [None]:
for planet, initial in planet_to_initial.items():
    print("{} begins with \"{}\"".format(planet.rjust(10), initial))

Para leer un inventario completo de los métodos de los diccionarios, haga clic en el botón "Salida" a continuación para leer la página de ayuda completa, o consulte la [documentación oficial en línea](https://docs.python.org/3/library/stdtypes.html#dict).

In [None]:
help(dict)

## Tu turno

Has aprendido mucho Python ... [demuestra tus nuevas habilidades](https://www.kaggle.com/marcocanas/exercise-strings-and-dictionaries/edit) con algunas aplicaciones de programación realistas.

Casi has terminado con el curso. ¡Buen trabajo!

Tenemos un par de problemas más interesantes para ti antes de que te vayas.

Como siempre, ejecute el código de configuración a continuación antes de trabajar con las preguntas.

In [None]:
#from learntools.core import binder; binder.bind(globals())
#from learntools.python.ex6 import *
#print('Setup complete.')

Comencemos con una ronda de relámpagos de cuerda para calentar.

¿Cuáles son las longitudes de las `strings` a continuación?

For each of the five strings below, predict what `len()` would return when passed that string. 

Use the variable length to record your answer, then run the cell to check whether you were right.

## 0a.

In [None]:
a = ""
length = ____
q0.a.check()

Correct:

The empty string has length zero. 

Note that the empty string is also the only string that Python considers as `False` when converting to boolean.

## 0b.

In [None]:
b = "it's ok"
length = len(b)
# q0.b.check()

Correct:

Keep in mind Python includes spaces (and punctuation) when counting string length.

## 0c.

In [None]:
c = 'it\'s ok'
length = len(c) 
# q0.c.check()
print(c,length)  

Correct:

Even though we use different syntax to create it, the string c is identical to b. 

In particular, note that the backslash is not part of the string, so it doesn't contribute to its length.

## 0d.

In [None]:
d = """hey"""
length = len(d) 
# q0.d.check()

Correct:

The fact that this string was created using triple-quote syntax doesn't make any difference in terms of its content or length. This string is exactly the same as 'hey'.

## 0e.

In [None]:
e = '\n'
length = len(e)
print(e,length)
# q0.e.check()

1
Correct:

The newline character is just a single character! (Even though we represent it to Python using a combination of two characters.)

## 1.

Hay un dicho que dice que "los científicos de datos pasan el 80% de su tiempo limpiando datos y el 20% de su tiempo quejándose de la limpieza de datos".

"Veamos si puede escribir una función para ayudar a limpiar los datos del código postal de EE. UU.

Dada una cadena, debería devolver si esa cadena representa o no un código postal válido.

Para nuestros propósitos, un código postal válido es cualquier cadena que consta de exactamente 5 dígitos.

### SUGERENCIA: 
`str` tiene un método que será útil aquí. 

Utilice `help(str)` para revisar una lista de métodos de cadena.

In [None]:
def is_valid_zip(zip_code):
    """Returns whether the input string is a valid (5 digit) zip code
    """
    return zip_code.isdigit() and (len(zip_code) == 5) 

# Check your answer
# q1.check()

In [None]:
help(str) 

Hint: Try looking up help(str.isdigit)

Solution:

def is_valid_zip(zip_str):
    return len(zip_str) == 5 and zip_str.isdigit()

## 2.

Un investigador ha reunido miles de artículos de noticias.

Pero quiere centrar su atención en artículos que incluyan una palabra específica.

Complete la siguiente función para ayudarla a filtrar su lista de artículos.

Su función debe cumplir con los siguientes criterios:

* No incluya documentos en los que la cadena de palabras clave aparezca solo como parte de una palabra más grande.

Por ejemplo, si estuviera buscando la palabra clave closed ("cerrado"), no incluiría la cadena enclosed ("encerrado").

* Ella no quiere que distingas mayúsculas de minúsculas.

Entonces, la frase 'Closed the case' ("Cerró el caso") se incluiría cuando la palabra clave sea closed ("cerrada"). 

* No permita que los puntos o las comas afecten a las coincidencias.

'It is closed' ("Está cerrado.") se incluiría cuando la palabra clave sea closed ("cerrada").

Pero puede asumir que no hay otros tipos de puntuación.

In [None]:
def word_search(doc_list, keyword):
    """
    Takes a list of documents (each document is a string) and a keyword. 
    Returns list of the index values into the original list for all documents 
    containing the keyword.

    Example:
    doc_list = ["The Learn Python Challenge Casino.", "They bought a car", "Casinoville"]
    >>> word_search(doc_list, 'casino')
    >>> [0]
    """
    list_index = []
    for i, doc in enumerate(doc_list):
        doc = doc.lower().strip('.').split()
        if 'casino' in doc:
            list_index.append(i)  
        
    return list_index 

# Check your answer
# q2.check()

In [None]:
 doc_list = ["The Learn Python Challenge Casino.", "They bought a car", "Casinoville"]

In [None]:
word_search(doc_list, 'casino')

Toma una lista de documentos (cada documento es una cadena) y una palabra clave.  

Devuelve la lista de los valores del índice en la lista original para todos los documentos que contienen la palabra clave.

## Solución dada por Kaggle

In [None]:
Hint: Some methods that may be useful here: str.split(), str.strip(), str.lower().

In [None]:
def word_search(documents, keyword):
    # list to hold the indices of matching documents
    indices = [] 
    # Iterate through the indices (i) and elements (doc) of documents
    for i, doc in enumerate(documents):
        # Split the string doc into a list of words (according to whitespace)
        tokens = doc.split()
        # Make a transformed list where we 'normalize' each word to facilitate matching.
        # Periods and commas are removed from the end of each word, and it's set to all lowercase.
        normalized = [token.rstrip('.,').lower() for token in tokens]
        # Is there a match? If so, update the list of matching indices.
        if keyword.lower() in normalized:
            indices.append(i)
    return indices

## 3.

Ahora, el investigador desea proporcionar varias palabras clave para buscar.

Complete la siguiente función para ayudarla.

(Se recomienda utilizar la función `word_search` que acaba de escribir al implementar esta función.

Reutilizar el código de esta manera hace que sus programas sean más robustos y legibles, ¡y le ahorra escribir!)

In [None]:
def multi_word_search(doc_list, keywords):
    """
    Takes list of documents (each document is a string) and a list of keywords.  
    Returns a dictionary where each key is a keyword, and the value is a list of indices
    (from doc_list) of the documents containing that keyword

    >>> doc_list = ["The Learn Python Challenge Casino.", "They bought a car and a casino", "Casinoville"]
    >>> keywords = ['casino', 'they']
    >>> multi_word_search(doc_list, keywords)
    {'casino': [0, 1], 'they': [1]}
    """
    pass

# Check your answer
# q3.check()