- **ID:** NB-03
- **Autor/a:** Gabriela Rojas Martínez
- **Curso/Grupo:** Procesamiento de Datos
- **Fecha:** 2025-08-11
- **Descripción:** Métodos, manipulación, y operaciones avanzadas con listas en Python.
- **Cómo ejecutar:** Activar entorno, instalar dependencias (`pip install -r requirements.txt`), abrir en Jupyter y ejecutar celdas en orden.


<h1>Procesamiento de Datos a Gran Escala</h1>

<h2>Listas en Python</h2>

<p><strong>¡Bienvenido!</strong> En este cuaderno aprenderás sobre las listas en el Lenguaje de Programación Python. Al final de este laboratorio, conocerás lo básico sobre las operaciones sobre listas en Python, esto incluye la indexación, el copiado y clonación de listas.</p>

<h2>Tabla de Contenido</h2>
<div class="alert alert-block alert-info" style="margin-top: 20px">
    <ul>
        <li>
            <a href="#dataset">Acerca de los conjuntos de datos (Dataset)</a>
        </li>
        <li>
            <a href="#list">Listas</a>
            <ul>
                <li><a href="index">Indexación</a></li>
                <li><a href="content">Contenido de la Lista</a></li>
                <li><a href="op">Operaciones con Listas</a></li>
                <li><a href="co">Copiado y Clonación de Listas</a></li>
            </ul>
        </li>
        <li>
            <a href="#quiz">Exámen sobre Listas</a>
        </li>
    </ul>
    <p>
        Tiempo Estimado: <strong>15 min</strong>
    </p>
</div>

<hr>

<h2 id="#dataset">Acerca de los conjuntos de datos (Dataset)</h2>

Imagina que obtienes de tus amigos algunas recomendaciones sobre discos de música y las compilas en una tabla con información específica de cada disco.

La tabla tiene una fila para cada disco y algunas columnas:

- **artist** - Nombre del artista
- **album** - Nombre del disco
- **released_year** - Año de estreno
- **length_min_sec** - Duración del disco (horas, minutos,segundos)
- **genre** - Género del disco
- **music_recording_sales_millions** - Ventas registradas (en millones de USD) on [SONG://DATABASE](https://cocl.us/hZvV8)
- **claimed_sales_millions** - Ventas reportadas (en millones de USD) on [SONG://DATABASE](https://cocl.us/hZvV8)
- **date_released** - Fecha del estreno
- **soundtrack** - Indica si el disco pertenece a la banda sonoro de alguna película (Y) o (N)
- **rating_of_friends** - Indica la calificación de tus amigos del 1 al 10
<br>
<br>

El conjunto de datos se muestra a continuación:

<font size="1">
<table font-size:xx-small style="width:25%">
  <tr>
    <th>Artist</th>
    <th>Album</th>
    <th>Released</th>
    <th>Length</th>
    <th>Genre</th>
    <th>Music recording sales (millions)</th>
    <th>Claimed sales (millions)</th>
    <th>Released</th>
    <th>Soundtrack</th>
    <th>Rating (friends)</th>
  </tr>
  <tr>
    <td>Michael Jackson</td>
    <td>Thriller</td>
    <td>1982</td>
    <td>00:42:19</td>
    <td>Pop, rock, R&B</td>
    <td>46</td>
    <td>65</td>
    <td>30-Nov-82</td>
    <td></td>
    <td>10.0</td>
  </tr>
  <tr>
    <td>AC/DC</td>
    <td>Back in Black</td>
    <td>1980</td>
    <td>00:42:11</td>
    <td>Hard rock</td>
    <td>26.1</td>
    <td>50</td>
    <td>25-Jul-80</td>
    <td></td>
    <td>8.5</td>
  </tr>
    <tr>
    <td>Pink Floyd</td>
    <td>The Dark Side of the Moon</td>
    <td>1973</td>
    <td>00:42:49</td>
    <td>Progressive rock</td>
    <td>24.2</td>
    <td>45</td>
    <td>01-Mar-73</td>
    <td></td>
    <td>9.5</td>
  </tr>
    <tr>
    <td>Whitney Houston</td>
    <td>The Bodyguard</td>
    <td>1992</td>
    <td>00:57:44</td>
    <td>Soundtrack/R&B, soul, pop</td>
    <td>26.1</td>
    <td>50</td>
    <td>25-Jul-80</td>
    <td>Y</td>
    <td>7.0</td>
  </tr>
    <tr>
    <td>Meat Loaf</td>
    <td>Bat Out of Hell</td>
    <td>1977</td>
    <td>00:46:33</td>
    <td>Hard rock, progressive rock</td>
    <td>20.6</td>
    <td>43</td>
    <td>21-Oct-77</td>
    <td></td>
    <td>7.0</td>
  </tr>
    <tr>
    <td>Eagles</td>
    <td>Their Greatest Hits (1971-1975)</td>
    <td>1976</td>
    <td>00:43:08</td>
    <td>Rock, soft rock, folk rock</td>
    <td>32.2</td>
    <td>42</td>
    <td>17-Feb-76</td>
    <td></td>
    <td>9.5</td>
  </tr>
    <tr>
    <td>Bee Gees</td>
    <td>Saturday Night Fever</td>
    <td>1977</td>
    <td>1:15:54</td>
    <td>Disco</td>
    <td>20.6</td>
    <td>40</td>
    <td>15-Nov-77</td>
    <td>Y</td>
    <td>9.0</td>
  </tr>
    <tr>
    <td>Fleetwood Mac</td>
    <td>Rumours</td>
    <td>1977</td>
    <td>00:40:01</td>
    <td>Soft rock</td>
    <td>27.9</td>
    <td>40</td>
    <td>04-Feb-77</td>
    <td></td>
    <td>9.5</td>
  </tr>
</table></font>

<h2 id="list">Listas</h2>

<h3 id="index">Indexación</h3>

Vamos a ver un poco mas sobre las listas en Python. Una lista es una colección ordenada de distintos objetos tales como enteros, cadenas e incluso otras listas. La dirección de cada elemento dentro de una lista se llama <b>índice</b>. El índice se usa para acceder o referirse a un objeto dentro de la lista.

<img src="https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/PY0101EN/Chapter%202/Images/ListsIndex.png" width="1000" />

Para crear una lista, se escribe cada elemento dentro de <b>[ ]</b>, separado cada uno por comas. ¡Vamos a probar!

In [None]:
# Crear una lista

L = ["Michael Jackson", 10.1, 1982]
L

Podemos usar en una lista la indexación regular o negativa:

<img src="https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/PY0101EN/Chapter%202/Images/ListsNeg.png" width="1000" />

In [None]:
# Imprime los elementos de cada índice

print('the same element using negative and positive indexing:\n Postive:',L[0],
'\n Negative:' , L[-3]  )
print('the same element using negative and positive indexing:\n Postive:',L[1],
'\n Negative:' , L[-2]  )
print('the same element using negative and positive indexing:\n Postive:',L[2],
'\n Negative:' , L[-1]  )

<h3 id="content">Contenido de la Lista</h3>

Las listas pueden contener cadenas, números enteros y en punto flotante. Podemos anidar otras listas y además tuplas u otros tipos de estructuras de datos. Para el anidado se siguen las mismas reglas:

In [None]:
# Lista de ejemplo

["Michael Jackson", 10.1, 1982, [1, 2], ("A", 1)]

<h3 id="op">Operaciones con Listas</h3>

También podemos aplicar el slicing en las listas. Por ejemplo, si queremos obtener los últimos dos elementos, usamos el siguiente comando:

In [None]:
# Lista de ejemplo

L = ["Michael Jackson", 10.1,1982,"MJ",1]
L

<img src="https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/PY0101EN/Chapter%202/Images/ListsSlice.png" width="1000">

In [None]:
# Slicing en una lista

L[3:5]

Podemos usar el método <code>extend</code> para añadir elementos a la lista:

In [None]:
# Aplica el método extend para añadir elementos

L = [ "Michael Jackson", 10.2]
L.extend(['pop', 10])
L

Otro método similar es <code>append</code>. Si usamos <code>append</code> en vez de <code>extend</code>, añadimos un elemento a a la lista:

In [None]:
# Aplica el método append para añadir elementos

L = [ "Michael Jackson", 10.2]
L.append(['pop', 10])
L

Cada vez que un método es aplicado, la lista cambia. Al usar <code>extend</code> estamos añadiendo dos nuevos elementos. La lista <code>L</code> es entonces modificada con dos nuevos elementos.

In [None]:
# Aplica el método extend para añadir elementos

L = [ "Michael Jackson", 10.2]
L.extend(['pop', 10])
L

Si añadimos a la lista <code>['a','b']</code> tendremos un nuevo elemento conformado por una lista anidada:

In [None]:
# Aplica el método append para añadir elementos

L.append(['a','b'])
L

Las listas son estructuras que pueden cambiar con el tiempo. Por ejemplo, cambiemos el primer elemento de una lista de la siguiente manera:

In [None]:
# Cambia el elemento usando el índice

A = ["disco", 10, 1.2]
print('Before change:', A)
A[0] = 'hard rock'
print('After change:', A)

Para borrar un elemento de la lista, usamos el comando <code>del</code>:

In [None]:
# Borra el elemento usando el índice

print('Before change:', A)
del(A[0])
print('After change:', A)

Podemos transformar una cadena en una lista con <code>split</code>. Por ejemplo, el método <code>split</code> convierte cada grupo de caracteres separados por un espacio en blanco, en un elemento de la lista:

In [None]:
# Divide la cadena

'hard rock'.split()

Podemos utilizar la función split para separar distintas cadenas usando algún carácter especifico. Pasamos en el argumento el carácter que queremos usar como separador, en este caso será una coma. El resultado es una lista, y cada elemento corresponderá a un grupo de caracteres separados por una coma:

In [None]:
# Separa la cadena usando comas

'A,B,C,D'.split(',')

<h3 id="co">Copiado y Clonación de Listas</h3>

Cuando asignamos el valor de la variable <b>B</b> igual a <b>A</b>; ambas están haciendo referencia a la misma lista guardada en memoria:

In [None]:
# Copiar (por referencia) la lista A

A = ["hard rock", 10, 1.2]
B = A
print('A:', A)
print('B:', B)

<img src="https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/PY0101EN/Chapter%202/Images/ListsRef.png" width="1000" align="center">

En un principio, el valor del primer elemento en <b>B</b> es asignado como hard rock. Si modificamos el primer elemento en <b>A</b> por <b>banana</b>, obtendremos un efecto inesperado. Debido a que <b>A</b> y <b>B</b> hacen referencia a la mima lista, si cambiamos <b>A</b>, entonces cambiamos también a <b>B</b>. Al revisar el primer elemento de <b>B</b> veremos banana en vez de hard rock:

In [None]:
# Examinar la copia hecha por referencia

print('B[0]:', B[0])
A[0] = "banana"
print('B[0]:', B[0])

Se muestra esto en la siguiente imagen:

<img src = "https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/PY0101EN/Chapter%202/Images/ListsRefGif.gif" width="1000" />

Se puede clonar la lista **A** haciendo uso de la siguiente sintaxis:

In [None]:
# Clonar la lista A

B = A[:]
B

La variable **B** es una copia o clon por valor de la lista original; esto se puede demostrar en la siguiente imagen:

<img src="https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/PY0101EN/Chapter%202/Images/ListsVal.gif" width="1000" />

Ahora cualquier cambio en <b>A<b/>, no será aplicado a <b>B</b>:

In [None]:
print('B[0]:', B[0])
A[0] = "hard rock"
print('B[0]:', B[0])

<h2 id="quiz">Exámen sobre Listas</h2>

Crea una lista <code>a_lit</code> con los siguientes elementos <code>1</code>, <code>hello</code>, <code>[1,2,3]</code> y <code>True</code>.

In [None]:
# Escribe abajo tu código y presiona Shift+Enter para ejecutarlo

Haz doble click <b>aquí</b> para ver la solución.

<!-- Your answer is below:
a_list = [1, 'hello', [1, 2, 3] , True]
a_list
-->

Encuentra el valor almacenado en el índice 1 de <code>a_list</code>.

In [None]:
# Escribe abajo tu código y presiona Shift+Enter para ejecutarlo

Haz doble click <b>aquí</b> para ver la solución.

<!-- Your answer is below:
a_list[1]
-->

Obtén el elemento almacenado en el índice 1, 2 y 3 de <code>a_list</code>.

In [None]:
# Escribe abajo tu código y presiona Shift+Enter para ejecutarlo

Haz doble click <b>aquí</b> para ver la solución.

<!-- Your answer is below:
a_list[1:4]
-->

Concatena las siguientes listas <code>A = [1, 'a']</code> y <code>B = [2, 1, 'd']</code>:

In [None]:
# Escribe abajo tu código y presiona Shift+Enter para ejecutarlo

Haz doble click <b>aquí</b> para ver la solución.

<!-- Your answer is below:
A = [1, 'a']
B = [2, 1, 'd']
A + B
-->