# Introducción a Listas, Arrays y Diccionarios en Python

---



## ¿Por qué aprender sobre listas y arreglos?

En procesamiento de lenguaje natural y análisis de datos lingüísticos, es común trabajar con colecciones de palabras, frases o números. Las *listas* y los *arrays* son herramientas fundamentales para organizar y manipular estos datos en Python.

## 1. ¿Qué es una lista en Python?

Una **lista** es una colección ordenada de elementos, que pueden ser palabras, números, frases, etc.

In [None]:
lista_vacia = [2,3,4,5]

In [None]:
print(lista_vacia)

In [None]:
palabras = ["lingüística", "análisis", "corpus", "palabra", "texto"]
print(palabras)

Puedes mezclar diferentes tipos de datos en una lista (aunque no es lo más recomendado):

In [None]:
mezcla = ["palabra", 123, True, 4.5]
print(mezcla)

## 2. Acceder a los elementos de una lista

Se puede acceder a cada elemento de la lista por su posición (empezando desde 0):

In [None]:
n = len(palabras)
print(n)

In [None]:
indice = 0 # indice inicia 0 y termina en N - 1

In [None]:
palabras

In [None]:
print("Primer elemento:", palabras[indice])
print("Segundo elemento:", palabras[1])
print("ultima elemento:", palabras[4])
# print("fuera del rango:", palabras[5])
print("ultimo elemento:", palabras[-1])
print("ultimo elemento:", palabras[-2])
print("rango elementos:", palabras[0:2]) # izq cerrado y a la derecha abierta [0,2> -> 0 y 1
print("rango 2do elemento al ultimo:", palabras[1:4]) # [1, 4>
print("rango 2do elemento al ultimo:", palabras[1:]) #[1, 4]
print("prueba:", palabras[-3: -1])

## 3. Modificar, agregar y eliminar elementos en una lista

In [None]:
palabras

In [None]:
# Modificar un elemento
palabras[2] = "lexema"
print(palabras)

In [None]:

# Agregar un nuevo elemento
palabras.append("morfema")
print(palabras)

In [None]:
len(palabras)

In [None]:
# Eliminar un elemento
del palabras[1]
print(palabras)

In [None]:
len(palabras)

In [None]:
len(palabras) #llamar a una funcion externa

In [None]:
palabras.append("wordnet") #llamando a un método interno
print(palabras)

In [None]:
del palabras[0]
print(palabras)

## 4. Recorrer (iterar) una lista

In [None]:
len(palabras), palabras

In [None]:
for palabra in palabras:
  print("La palabra es: ", palabra)
  print("La palabra en mayuscula es: ", palabra.capitalize())
print("Hola")

## 5. ¿Qué es un array (arreglo) en Python?

Python tiene varias maneras de trabajar con arreglos, pero la más común en procesamiento de datos es usando la biblioteca `numpy`.

Un **array** es similar a una lista, pero se utiliza principalmente para cálculos numéricos y es más eficiente para datos de gran tamaño.

In [None]:
# Ejecuta esto sólo si numpy no está instalado
# !pip install numpy
import numpy as np

In [None]:
lista_numeros = [1, 2, 3, 4, 5]

In [None]:
numeros = np.array(lista_numeros)
print(numeros)

## 6. Diferencias entre lista y array

- Una **lista** puede contener cualquier tipo de datos (palabras, números, etc.).
- Un **array** de numpy es más eficiente y suele contener sólo un tipo de dato (por ejemplo, solo números).

In [None]:
lista = [1, "hola", [1,2,3]]
array = np.array([1, 2, 3])

print("Lista:", lista)
print("Array:", array)

## 7. Imprimir listas y arrays

Puedes usar `print()` para mostrar el contenido:

In [None]:
print("Mi lista:", palabras)
print("Mi array:", numeros)

In [None]:
numeros[0]

In [None]:
palabras[0]

## 8. Ejercicios prácticos

### Ejercicio 1
Crea una lista con las siguientes palabras: `"verbo", "sustantivo", "adjetivo"`, imprime la lista y cambia `"adjetivo"` por `"adverbio"`.

### Ejercicio 2
Crea un array de numpy con los números de 10 a 50 (de 10 en 10), e imprímelo.

In [None]:
# Ejercicio 1:
palabras = ["verbo", "sustantivo", "adjetivo"]
print(palabras)
palabras[2] = "adverbio"
print(palabras)

In [None]:
# Ejercicio 2:
numeros = np.arange(10, 51, 10)
print(numeros)

## 9. ¿Qué es un diccionario en Python?

Un **diccionario** es una estructura de datos que permite almacenar pares de información, donde cada elemento se compone de una *clave* (key) y un *valor* (value).

En lingüística, un diccionario puede servir para relacionar una palabra con su significado, su frecuencia, o su categoría gramatical.


### Ejemplo 1: Crear un diccionario de frecuencias

In [None]:
frecuencias = {
    "sustantivo": 5,
    "verbo": 3,
    "adjetivo": 2
}
print(frecuencias)

### Ejemplo 2: Acceder a los valores de un diccionario


In [None]:
print("Frecuencia de 'verbo':", frecuencias["verbo"])

### Ejemplo 3: Agregar o modificar valores


In [None]:
# Agregar una nueva categoría
frecuencias["adverbio"] = 1
print(frecuencias)

In [None]:

# Modificar el valor de una clave existente
frecuencias["sustantivo"] = 6
print(frecuencias)

In [None]:
frecuencias["palabras"] = ["hola", "me", "llamo", "erasmo"]


In [None]:
frecuencias["palabras"]

### Ejemplo 4: Recorrer los elementos del diccionario


In [None]:
frecuencias.items()

In [None]:
for key, value in frecuencias.items():
    print("Categoría:", key, "| Frecuencia:", value)


## 10. Procesamiento de textos con listas, arrays y diccionarios
En lingüística computacional es muy común trabajar con listas de palabras obtenidas a partir de textos. A continuación, se muestran ejemplos básicos de procesamiento.

### Ejemplo 1: Dividir una oración en palabras (tokenización básica)
Supongamos que tenemos una oración y queremos separar cada palabra en una lista:




In [None]:
oracion = "La lingüística estudia el lenguaje humano."
palabras = oracion.split()
print(palabras)

### Ejemplo 2: Contar la frecuencia de cada palabra
Podemos usar un diccionario para contar cuántas veces aparece cada palabra en un texto:

In [None]:
texto = "la casa azul es grande y la casa azul es bonita"
palabras = texto.split()
frecuencias = {} # diccionario de frecuencias
for palabra in palabras:
    # print(frecuencias)
    if palabra in frecuencias:
        frecuencias[palabra] += 1
    else:
        frecuencias[palabra] = 1
print(frecuencias)

### Ejemplo 3: Crear un array con la longitud de cada palabra
Si queremos analizar la longitud de las palabras en un texto:

In [None]:
import numpy as np
palabras = ['morfema', 'fonema', 'sílaba', 'palabra', 'texto']
lista_longitudes = []
for palabra in palabras:
    longitud = len(palabra)
    lista_longitudes.append(longitud)
print(lista_longitudes)

In [None]:
longitudes = np.array(lista_longitudes)
print('Longitud de cada palabra:', longitudes)

In [None]:
[len(p) for p in palabras]

In [None]:
[p.upper() for p in palabras]

In [None]:
longitudes_np = np.array([len(p) for p in palabras])
print(longitudes_np)

### Ejemplo 4: Crea un diccionario donde cada clave sea una palabra y el valor sea su traducción al inglés. Por ejemplo:
{"casa": "house", "árbol": "tree", "libro": "book"}
Imprime el diccionario y muestra la traducción de "libro".

In [None]:
# Crear el diccionario
traducciones = {
    "casa": "house",
    "árbol": "tree",
    "libro": "book"
}

# Imprimir el diccionario completo
print(traducciones)

# Mostrar la traducción de "libro"
print("La traducción de 'libro' es:", traducciones["libro"])


## 11. Resumen

- **Las listas** son útiles para trabajar con secuencias de elementos diversos.
- **Los arrays** (arreglos) con numpy son ideales para trabajar con grandes cantidades de datos numéricos.
- Ambos permiten acceder, modificar y recorrer los elementos de manera sencilla.
- **Los diccionarios** permiten almacenar pares clave-valor y son ideales para asociar información, como la frecuencia de palabras, traducciones o cualquier relación entre dos tipos de datos.
