# Colecciones.

Scala ofrece una biblioteca de colecciones rica y potente que es fundamental para la manipulación de datos y la implementación de algoritmos. Las colecciones en Scala están diseñadas para ser fáciles de usar, versátiles y eficientes, lo que las convierte en una herramienta indispensable para los desarrolladores.

https://docs.scala-lang.org/overviews/collections-2.13/overview.html

## Características Fundamentales

La biblioteca de colecciones de Scala se distingue por su diseño uniforme y principios consistentes. Una característica clave es la distinción clara entre colecciones mutables e inmutables, lo que permite a los desarrolladores elegir la más adecuada según las necesidades de su aplicación, fomentando patrones de programación seguros y funcionales. Las colecciones inmutables, por defecto, promueven la inmutabilidad de datos, lo que facilita el razonamiento sobre el código y ayuda a evitar efectos secundarios no deseados. Por otro lado, las colecciones mutables están disponibles para casos de uso donde se requieren modificaciones frecuentes de los datos.

## Tipos de Colecciones

Scala organiza sus colecciones en varias categorías principales, incluyendo secuencias (`Seq`), conjuntos (`Set`) y mapas (`Map`), cada uno con variantes mutables e inmutables. Dentro de estas categorías, existen múltiples implementaciones específicas optimizadas para diferentes casos de uso:

- **Listas**: Son secuencias inmutables que representan una lista enlazada de elementos. Son ideales para colecciones donde el acceso secuencial es común, pero pueden ser menos eficientes para el acceso aleatorio debido a su naturaleza enlazada.
- **Vectores**: Ofrecen un compromiso entre la eficiencia del acceso aleatorio y la inserción/eliminación de elementos. Son una excelente opción para colecciones grandes donde se necesita un acceso rápido a cualquier elemento.
- **Buffers**: Son colecciones mutables que permiten añadir, actualizar y eliminar elementos de manera eficiente. `ArrayBuffer`, por ejemplo, es útil cuando se necesita una colección indexada con cambios de tamaño dinámico.
- **Conjuntos y Mapas**: Scala proporciona varias implementaciones de conjuntos y mapas, cada uno optimizado para diferentes casos de uso, como `HashSet` para búsquedas rápidas o `TreeMap` para mantener un orden específico.

| Tipo de Colección | Mutabilidad        | Descripción | Ejemplos de Uso |
|-------------------|--------------------|-------------|-----------------|
| **List**          | Inmutable          | Una secuencia de elementos ordenados que pueden contener duplicados. Acceso eficiente al primer elemento, pero el acceso a elementos arbitrarios puede ser lento. | Utilizada para mantener una secuencia de elementos cuando el orden importa y las modificaciones son principalmente adiciones o eliminaciones al principio. |
| **Vector**        | Inmutable          | Una secuencia indexada que proporciona acceso eficiente tanto al principio como al final. Buena para colecciones de gran tamaño donde se requiere acceso aleatorio frecuente. | Ideal para almacenar grandes colecciones de datos donde se necesitan operaciones de acceso aleatorio y actualizaciones. |
| **ArrayBuffer**   | Mutable            | Un búfer de tamaño ajustable que almacena elementos en un array. Proporciona un acceso rápido a los elementos y es eficiente para agregar elementos al final. | Adecuado para situaciones donde el tamaño de la colección varía dinámicamente y se requiere acceso rápido a los elementos por índice. |
| **ListBuffer**    | Mutable            | Similar a `ArrayBuffer`, pero optimizado para agregar elementos al principio. | Útil cuando se necesita construir una lista de manera eficiente mediante la adición frecuente de elementos al principio. |
| **Set**           | Inmutable/Mutable  | Una colección de elementos únicos sin un orden específico. Proporciona operaciones eficientes de búsqueda, adición y eliminación. | Utilizada para mantener un conjunto de elementos únicos, como un conjunto de identificadores únicos o valores sin duplicados. |
| **Map**           | Inmutable/Mutable  | Una colección de pares clave-valor. Las claves son únicas, y cada clave se mapea a exactamente un valor. | Adecuada para representar asociaciones clave-valor, como diccionarios, cachés o tablas de búsqueda. |
| **Seq**           | Inmutable/Mutable  | Una base trait para secuencias que especifica una secuencia ordenada de elementos. `List`, `Vector`, y `ArrayBuffer` son implementaciones concretas de `Seq`. | Se usa como un tipo genérico cuando se quiere trabajar con secuencias sin especificar una implementación concreta. |
| **Queue**         | Inmutable/Mutable  | Una colección de elementos que sigue el principio de primero en entrar, primero en salir (FIFO). | Útil en situaciones de procesamiento de tareas, simulaciones, y algoritmos que requieren una estructura de datos de cola. |
| **Stack**         | Mutable            | Una colección que sigue el principio de último en entrar, primero en salir (LIFO). | Utilizada en algoritmos que necesitan una estructura de datos de pila, como navegadores de historial, evaluación de expresiones y algoritmos de backtracking. |
| **Iterable**      | Inmutable/Mutable  | Un trait base para todas las colecciones Scala que pueden ser iteradas. | Se utiliza cuando se desea acceder a los elementos de una colección uno por uno, sin importar el tipo específico de colección. |


## Colecciones `List`.

Las colecciones `List` son una de las estructuras de datos más fundamentales en la programación funcional y corresponden a una colección ordenada de elementos del mismo tipo.

Las colecciones `List`, ofrecen una amplia gama de funcionalidades que facilitan el manejo de colecciones de datos de manera eficiente y expresiva. Una `List` en Scala es inmutable, lo que significa que una vez creada, no puede ser modificada. Esta característica promueve un estilo de programación funcional y ayuda a evitar errores comunes relacionados con el estado mutable.

### Creación y Manipulación Básica

La creación de listas es directa y se puede realizar de varias maneras. La forma más común es utilizando paréntesis.

```
List(<elemento 1>, <elemento 2>, ..., <elemento n>)
```

Para listas vacías, se puede usar `Nil`.

**Ejemplo:**

In [None]:
val numeros = List(1, 2, 3, 4, 5)

In [None]:
val cadenas: List[String] = List("hola")

In [None]:
val cadenas: List[String] = List(true)

In [None]:
val lista_variada = List(1, true, "Hola")

In [None]:
val listaVacia = Nil

### Acceso a los  elementos de las colecciones `List`.
Para acceder a los elementos de una lista en Scala, se pueden utilizar varios métodos, dependiendo de tus necesidades específicas. A continuación, se describen algunas de las formas más comunes de acceder a elementos en una lista en Scala:

### Acceso Directo

Para acceder a un elemento específico por su índice, puedes utilizar el método `apply()` directamente o simplemente los paréntesis. **Nota:** los índices en Scala comienzan desde 0.

**Ejemplo:**

In [None]:
val numeros = List(1, 2, 3, 4, 5)

* Acceder al primer elemento (índice 0)

In [None]:
numeros(0)

* Acceder al tercer elemento (índice 2)

In [None]:
numeros.apply(2)

### Métodos `head`, `tail`, `last`, `init`

- `head` devuelve el primer elemento de la lista.
- `tail` devuelve una lista con todos los elementos excepto el primero.
- `last` devuelve el último elemento de la lista.
- `init` devuelve una lista con todos los elementos excepto el último.

**Ejemplos:**

In [None]:
val elementos = List('a', 'b', 'c', 'd')

* La siguiente celda regresa el primer elemento de `elementos`.

In [None]:
elementos.head

* La siguiente celda regresa el último elemento de `elementos`.

In [None]:
elementos.last

In [None]:
* La siguiente celda regresa todos, excepto el primer elemento de `elementos`.

In [None]:
elementos.tail

* La siguiente celda regresa todos, excepto el último elemento de `elementos`.

In [None]:
elementos.init

In [None]:
elementos

### Uso de `slice`

El método `slice` permite obtener una sublista especificando los índices inicial y final.

```
slice(<n>, <m>)
```

Donde:

* `<n>` es el índice inicial del rango.
* `<m>` es   el índice previo al final del rango.

**Ejemplo:**

In [None]:
val numeros = List(1, 2, 3, 4, 5)

* La siguiente celda regresa una sublista desde el índice 1 al 3 (el índice final no se incluye).

In [None]:
numeros.slice(1, 4)

In [None]:
numeros.slice(1, 9)

In [None]:
numeros.slice(11, 4)

In [None]:
numeros.slice(3, 2)

### Iteración y Búsqueda

Para acceder a elementos específicos basados en ciertas condiciones, puedes utilizar métodos de alto orden como `filter`, `find`, o iterar sobre la lista con `foreach`, `for` o métodos similares.

**Ejemplos:**

* La siguiente celda regresará el primer número par.

In [None]:
numeros.find(_ % 2 == 0)

* La siguiente celda regresará una lista de todos los números pares.

In [None]:
numeros.filter(_ % 2 == 0)

In [None]:
for (numero <- numeros){
println(numero)
}

In [None]:
numeros.foreach(numero => println(numero * 2))

In [None]:
numeros.foreach(numero => numero * 2)

In [None]:
numeros ++ List(5)

In [None]:
numeros

In [None]:
val nuevos_numeros = numeros ++ List(5)

### Consideraciones de Rendimiento

Es importante tener en cuenta que el acceso a elementos por índice en una lista (`List(índice)`) no es tan eficiente como en estructuras de datos basadas en arrays, como `ArrayBuffer` o `Vector`, ya que las listas en Scala son implementadas como listas enlazadas. Acceder a un elemento por su índice implica recorrer la lista desde el comienzo hasta llegar al índice deseado, lo que puede llevar a un rendimiento O(n) en el peor caso. Para colecciones donde se requiere un acceso frecuente y eficiente a elementos por índice, considera utilizar `Vector` u otras estructuras de datos más adecuadas.

## Colecciones `Map`.

Las colecciones `Map` en Scala representan una estructura de datos que asocia claves únicas con valores. A diferencia de las listas, que son colecciones de elementos individuales, un `Map` mantiene pares clave-valor, donde cada clave se asocia a lo más con un valor. Los `Map` en Scala son tanto inmutables como mutables, proporcionando flexibilidad en su uso según los requerimientos específicos del programa.

### Creación de un Map

Para crear un `Map` inmutable, simplemente puedes usar `Map` con pares clave-valor:

```
Map(<clave 1>  -> <valor 1>, <clave 2>  -> <valor 2>, ... <clave n>  -> <valor n>) 
```

**Ejemplo:**

In [None]:
val capitales = Map("Francia" -> "París", "España" -> "Madrid", "Japón" -> "Tokio")

### Acceso a valores.
Para acceder al valor asociado a una clave específica se usan los parántesis.

```
<mapa>(<clave>)
```

**Ejemplo:**

In [None]:
capitales("Francia")

## Mapas mutables.
Los mapas mutables permiten realizar operaciones que modifican a la colección.

 En un `Map` mutable, se pueden añadir elementos usando `+=` o eliminar elementos usando `-=`.

In [None]:
import collection.mutable.Map

In [None]:
val numeros = Map(1 ->"Uno", 2 -> "Dos")

In [None]:
numeros += (4 -> "Cuatro")

In [None]:
numeros -= 2

In [None]:
for (par <- numeros){
    println(par)
}

## Las colecciones `Set`.

Una colección Set es una estructura de datos que representa una colección de elementos únicos y no ordenados. Esto significa que, a diferencia de las listas o arrays, un elemento puede aparecer como máximo una vez en un conjunto. Esta característica hace que los conjuntos sean ideales para tareas en las que se requiera garantizar que no haya duplicados en los datos.

Para crear un conjunto en Scala, podemos utilizar la palabra clave `Set` seguida de valores entre paréntesis o corchetes.

```
Set(<elemento 1>, <elemento 2>, ..., <elemento n>) 
```

También se puede utilizar la función `Set.empty` para crear un conjunto vacío.

```
Set.empty[<tipo>]
```

**Ejemplo:**

In [None]:
val conjuntoNumeros = Set(1, 2, 3, 4, 5, 5, 5)

### Agregar Elementos.

Para agregar elementos a un conjunto existente, podemos usar el método `+` o `++`. Estos métodos generan un nuevo conjunto con los elementos agregados.

In [None]:
conjuntoNumeros + 11

### Eliminar Elementos

Para eliminar elementos de un conjunto, utilizamos el método `-`. Esto también genera un nuevo conjunto sin los elementos eliminados.

In [None]:
conjuntoNumeros - 3

### Comprobación de Pertenencia

Podemos verificar si un elemento está presente en un conjunto utilizando el método `contains`.

**Ejemplos:**

In [None]:
conjuntoNumeros.contains(2)

In [None]:
conjuntoNumeros.contains(25)

### Operaciones de Conjuntos

Las colecciones Set también admiten operaciones de conjuntos como unión, intersección y diferencia. Estas operaciones son útiles para combinar o comparar conjuntos.

**Ejemplos:**

In [None]:
val conjuntoA = Set(1, 2, 3)
val conjuntoB = Set(3, 4, 5)

In [None]:
conjuntoA.union(conjuntoB) // Unión de conjuntos

In [None]:
conjuntoA | conjuntoB

In [None]:
conjuntoA.intersect(conjuntoB) // Intersección de conjuntos

In [None]:
conjuntoA.diff(conjuntoB) // Diferencia de conjuntos

In [None]:
conjuntoA.subsetOf(conjuntoB) //  Valida si es subconjunto

## Inmutabilidad.

La inmutabilidad, un concepto fundamental en la programación funcional, se refiere a la característica de los objetos que no pueden ser modificados una vez creados. Este principio, lejos de ser una restricción, se erige como un pilar fundamental en el diseño y la implementación de sistemas de procesamiento de big data en memoria, especialmente en entornos como Apache Spark.

### Inmutabilidad en Apache Spark

La inmutabilidad, un concepto fundamental en la programación funcional, se refiere a la característica de los objetos que no pueden ser modificados una vez creados. Este principio, lejos de ser una restricción, se erige como un pilar fundamental en el diseño y la implementación de sistemas de procesamiento de big data en memoria, especialmente en entornos como Apache Spark. Este ensayo explora la importancia de la inmutabilidad en el contexto del procesamiento de big data, destacando su impacto en la eficiencia, la confiabilidad, la facilidad de uso y la concurrencia.

#### Eficiencia en el Manejo de Datos
En sistemas diseñados para manejar grandes volúmenes de datos, como Apache Spark, la inmutabilidad juega un rol crucial en la optimización del uso de recursos y el rendimiento. Al evitar la modificación de los objetos de datos, se reduce la necesidad de copiar y guardar estados, lo que a su vez minimiza el uso de la memoria y el tiempo de procesamiento.to. Spark utiliza el concepto de RDD (Resilient Distributed Dataset), un conjunto de datos inmutable y distribuido, para realizar operaciones de procesamiento en paralelo de manera eficiente. La inmutabilidad asegura que cada transformación en un RDD genere un nuevo RDD, manteniendo el original sin cambios, lo cual facilita la ejecución de operaciones complejas en grandes conjuntos de datos con menor sobrecarga.

#### Confiabilidad y Tolerancia a Fallos
La inmutabilidad incrementa la confiabilidad de los sistemasstemas de procesamiento de bi al simplificar la gestión de errores y la recuperación de fallos.allos. En Apache Spark inmutabilidadilidad de los RDD permite reconstruir cualquier parte del dataset en caso de pérdida o fallo, ya que el linaje de cadae cada RDsecuencia de operaciones aplicadas para construirlo) se conserva. Esto significa que, en lugar de replicar los datos para prevenir pérdidas, Spark puede reconstruir los datos faltantes a partir de su origen, lo cual resulta en una estrategia de tolerancia a fallos más eficiente y menos costosa en términos de recursos.

#### Facilidad de Uso y Abstracción
La inmutabilidad proporciona una abstracción clara y predecible del estado de los datos, lo que simplifica el desarrollo y el mantenimiento de aplicaciones de big data. Los desarrolladores pueden enfocarse en las transformaciones y operaciones que necesitan realizar, sin preocuparse por los efectos secundarios o el estado mutable de los datos. Esta claridad conceptual reduce la complejidad del código y disminuye la probabilidad de errores, facilitando la implementación de lógicas de procesamiento de datos complejas y mejorando la legibilidad y mantenibilidad del código.

#### Concurrencia y Paralelismo
Uno de los mayores desafíos en el procesamiento de big data es la gestión de la concurrencia y el paralelismo. La inmutabilidad aborda este desafío al eliminar las condiciones de carrera y los problemas de sincronización asociados con el acceso y la modificación concurrente de datos. En un entorno distribuido como Spark, donde múltiples nodos trabajan en paralelo, la inmutabilidad garantiza que las operaciones en un nodo no afecten los datos en otro, permitiendo un paralelismo masivo sin bloqueos ni conflictos de datos.

## Compatibilidad de Scala con las Colecciones de Java: Un Puente hacia la Interoperabilidad
dad

La interoperabilidad entre lenguajes es crucial en el desarrollo de software moderno, ya que permite a los equipos de desarrollo aprovechar las bibliotecas y sistemas existentes en otros lenguajes de programación. En este contexto, Scala se destaca por su estrecha integración con Java, uno de los lenguajes más utilizados en el mundo empresarial.

## La Integración de Scala con las Colecciones de Java

Scala logra su interoperabilidad con Java en gran parte gracias a su diseño y su sistema de tipos. Scala está diseñado para ser compatible con la plataforma Java, lo que significa que puede utilizar las bibliotecas y API de Java de manera nativa. Esto incluye la capacidad de trabajar con las colecciones de Java de manera transparente.

Scala ofrece tres tipos de colecciones principales que son compatibles con las colecciones de Java:

### 1. Colecciones Mutables
Scala proporciona colecciones mutables que son directamente interoperables con las colecciones mutables de Java. Por ejemplo, puedes utilizar `scala.collection.mutable.HashMap` de manera similar a `java.util.HashMap`. Esto permite una fácil migración de código Java a Scala o la colaboración en proyectos que utilizan ambos lenguajes.

```scala
import scala.collection.mutable

val scalaMap = mutable.HashMap("a" -> 1, "b" -> 2)
val javaMap = new java.util.HashMap[String, Int]()
javaMap.put("c", 3)
```

### 2. Colecciones Inmutables
Las colecciones inmutables en Scala ofrecen una forma segura y funcional de trabajar con datos. Aunque son diferentes de las colecciones mutables de Java, Scala proporciona conversiones y métodos para facilitar la interoperabilidad. Por ejemplo, puedes convertir una lista inmutable de Scala en una lista de Java y viceversa.

```scala
import scala.collection.JavaConverters._

val scalaList = List(1, 2, 3)
val javaList = scalaList.asJava
val scalaListAgain = javaList.asScala
```

### 3. Colecciones Paralelas
Scala también ofrece colecciones paralelas que pueden aprovechar la concurrencia de hardware para mejorar el rendimiento. Estas colecciones pueden interoperar con las colecciones concurrentes de Java, lo que permite crear aplicaciones eficientes y concurrentes.

```scala
import scala.collection.parallel.immutable.ParVector

val scalaParallelVector = ParVector(1, 2, 3)
val javaConcurrentVector = scalaParallelVector.toVector.asJava
```

## Beneficios de la Compatibilidad

La compatibilidad de Scala con las colecciones de Java presenta varios beneficios:

1. **Reutilización de Código**: Los desarrolladores pueden aprovechar las bibliotecas de Java existentes sin problemas, lo que ahorra tiempo y recursos.

2. **Transición Gradual**: La migración de código Java a Scala puede ser gradual, permitiendo a los equipos adoptar Scala de manera incremental en proyectos existentes.

3. **Combinación de Habilidades**: Equipos de desarrollo que ya tienen experiencia en Java pueden aplicar sus conocimientos en Scala sin dificultad.

4. **Mejora del Rendimiento**: Scala ofrece colecciones paralelas que pueden mejorar significativamente el reilidad es un activo valioso para la comunidad de desarrollo.