# Introducción a Scala para Ciencia de Datos

## ¿Qué es Scala?
Scala es un lenguaje de programación de propósito general que combina características de programación orientada a objetos y funcional en un solo lenguaje. Fue creado por Martin Odersky y lanzado en 2003. Se ha convertido en una herramienta popular en el campo de la Ciencia de Datos debido a su interoperabilidad con Java, su capacidad para manejar grandes volúmenes de datos y su integración con Apache Spark, una de las plataformas de procesamiento de datos más utilizadas.

## Ventajas de Scala sobre Java

**1. Programación Funcional:**

- Scala adopta un paradigma de programación funcional, lo que permite escribir código más conciso, expresivo y fácil de mantener.
- Las funciones de primera clase, las funciones anónimas (lambdas) y las funciones de orden superior son características fundamentales de Scala que    facilitan la escritura de código funcional.
- La inmutabilidad de los datos es un principio central en Scala, lo que ayuda a prevenir efectos secundarios y facilita la programación concurrente.

**2. Concisión y Expresividad:**

- Scala tiende a requerir menos código que Java para realizar las mismas tareas, lo que mejora la legibilidad y reduce la posibilidad de errores.
- Características como la inferencia de tipos, las clases de caso y el pattern matching permiten escribir código más elegante y conciso.

**3. Concurrencia:**

- Scala, con su enfoque en la inmutabilidad y la programación funcional, facilita la escritura de código concurrente y paralelo.
- La biblioteca Akka, escrita en Scala, proporciona un modelo de actores para la concurrencia que es muy potente y eficiente.

**4. Interoperabilidad con Java:**

- Scala se ejecuta en la Máquina Virtual de Java (JVM), lo que le permite interoperar perfectamente con el código Java existente.
- Puedes utilizar bibliotecas Java en Scala y viceversa, lo que facilita la migración y la integración con sistemas existentes.

**5. Ecosistema:**

- Scala tiene un ecosistema rico y en crecimiento, con bibliotecas y frameworks potentes como Spark, Akka y Play Framework.
- Spark, en particular, está escrito en Scala y aprovecha al máximo sus características para el procesamiento distribuido de datos.

## Características de Scala 

### 1. Orientación a Objetos y Funcional

Combina programación orientada a objetos y programación funcional de manera fluida. En Scala, todo es un objeto, incluso los números y las funciones.

### 2. Tipado Estático y Tipado Fuerte

- Tipado estático:
     - Los tipos de datos se verifican en tiempo de compilación, antes de que el programa se ejecute.
     - Esto ayuda a detectar errores de tipo temprano, mejorando la seguridad y el rendimiento.
- Tipado fuerte:
     - Los tipos de datos se imponen estrictamente, impidiendo operaciones entre tipos incompatibles.
     - Esto evita errores inesperados y garantiza la integridad de los datos.

## Inferencia de Tipos:

- La inferencia de tipos es la capacidad del compilador para deducir automáticamente el tipo de una variable o expresión sin que el programador tenga que declararlo explícitamente.
- Por ejemplo, si escribes var x = 10;, el compilador puede inferir que x es un entero.

- La inferencia de tipos es más común en lenguajes con tipado estático y fuerte.
- Esto se debe a que el compilador necesita tener información precisa sobre los tipos de datos para realizar la inferencia de forma segura.
- En un lenguaje con tipado fuerte, el compilador puede estar seguro de que los tipos inferidos son consistentes y no conducirán a errores en tiempo de ejecución.
- La inferencia de tipos puede hacer que el código sea más conciso y legible, ya que reduce la necesidad de declaraciones de tipo explícitas.

## En resumen: 
- el tipado fuerte crea el entorno seguro que la inferencia de datos necesita para funcionar correctamente.
- el tipado fuerte establece las reglas, y la inferencia de tipos es una herramienta que aprovecha esas reglas para simplificar el código.

### 3. Concurrencia y Paralelismo

**Concurrencia**: Manejo de múltiples tareas, pero no necesariamente ejecutadas al mismo tiempo. A veces se puede hacer en un solo procesador con la multitarea (intercalando el tiempo de ejecución).

**Paralelismo**: Ejecución de múltiples tareas al mismo tiempo, usando varios procesadores o núcleos de CPU.
La concurrencia puede generar problemas si no se gestionan correctamente los accesos concurrentes a recursos compartidos, lo que puede llevar a resultados erróneos o inesperados.

La **concurrencia** puede generar problemas si no se gestionan correctamente los accesos concurrentes a recursos compartidos, lo que puede llevar a resultados erróneos o inesperados.


## Scala como lenguaje de programacion funcional.

**1. Inmutabilidad y Referencial Transparencia:**

Uno de los pilares fundamentales de la programación funcional es la inmutabilidad de los datos. En Scala, las colecciones y objetos inmutables son la norma, lo que significa que una vez que se crea un objeto, no se puede cambiar. Esta característica garantiza la referencial transparencia, lo que significa que una función siempre producirá el mismo resultado dado el mismo conjunto de entradas, sin efectos secundarios. Esto hace que el código sea más predecible, fácil de razonar y menos propenso a errores.

**Ejemplo:**

In [1]:
val listaOriginal = List(1, 2, 3)
val listaNueva = listaOriginal :+ 4  // Creación de una nueva lista en lugar de modificar la original

[36mlistaOriginal[39m: [32mList[39m[[32mInt[39m] = [33mList[39m([32m1[39m, [32m2[39m, [32m3[39m)
[36mlistaNueva[39m: [32mList[39m[[32mInt[39m] = [33mList[39m([32m1[39m, [32m2[39m, [32m3[39m, [32m4[39m)

**2. Funciones de Primera Clase:**

Scala trata las funciones como ciudadanos de primera clase, lo que significa que puedes pasar funciones como argumentos, devolver funciones desde otras funciones y asignar funciones a variables. Esto permite un alto nivel de abstracción y expresividad en la escritura de código.

**Ejemplo:**

In [2]:
val suma = (a: Int, b: Int) => a + b
val resultado = suma(3, 4)

[36msuma[39m: ([32mInt[39m, [32mInt[39m) => [32mInt[39m = ammonite.$sess.cmd2$Helper$$Lambda$2976/0x0000000840d63840@49effd02
[36mresultado[39m: [32mInt[39m = [32m7[39m

**3. Funciones de Orden Superior:**

Scala admite funciones de orden superior, que son funciones que toman una o más funciones como argumentos o devuelven una función como resultado. Esto permite patrones de diseño funcionales como el mapeo, el filtrado y la reducción de colecciones de manera concisa y legible.

**Ejemplo:**

In [3]:
val numeros = List(1, 2, 3, 4, 5)
val cuadrados = numeros.map(numero => numero * numero)

[36mnumeros[39m: [32mList[39m[[32mInt[39m] = [33mList[39m([32m1[39m, [32m2[39m, [32m3[39m, [32m4[39m, [32m5[39m)
[36mcuadrados[39m: [32mList[39m[[32mInt[39m] = [33mList[39m([32m1[39m, [32m4[39m, [32m9[39m, [32m16[39m, [32m25[39m)

**4. Composición de Funciones:**

La composición de funciones es una técnica común en la programación funcional. Scala proporciona operadores y métodos que facilitan la composición de funciones de manera eficiente.

**Ejemplo:**

In [4]:
val duplicar = (x: Int) => x * 2
val sumarUno = (x: Int) => x + 1

val duplicarYSumarUno = duplicar andThen sumarUno
val resultado = duplicarYSumarUno(3)  // Resultado: 7

[36mduplicar[39m: [32mInt[39m => [32mInt[39m = ammonite.$sess.cmd4$Helper$$Lambda$3138/0x0000000840dde040@5d180da1
[36msumarUno[39m: [32mInt[39m => [32mInt[39m = ammonite.$sess.cmd4$Helper$$Lambda$3139/0x0000000840ddd840@67c0af4b
[36mduplicarYSumarUno[39m: [32mInt[39m => [32mInt[39m = scala.Function1$$Lambda$3140/0x0000000840ddc840@16503e7a
[36mresultado[39m: [32mInt[39m = [32m7[39m

**5. Tipos de Datos Inmutables y Patrones de Coincidencia:**

Scala permite la definición de tipos de datos inmutables, lo que facilita la creación de estructuras de datos complejas y seguras. Además, Scala ofrece un poderoso mecanismo de patrones de coincidencia que simplifica el manejo de datos enriquecidos y estructuras complejas.

**Ejemplo:**

In [5]:
sealed trait Forma
case class Circulo(radio: Double) extends Forma
case class Rectangulo(ancho: Double, alto: Double) extends Forma

def area(forma: Forma): Double = forma match {
  case Circulo(radio) => 3.1416 * radio * radio
  case Rectangulo(ancho, alto) => ancho * alto
}

defined [32mtrait[39m [36mForma[39m
defined [32mclass[39m [36mCirculo[39m
defined [32mclass[39m [36mRectangulo[39m
defined [32mfunction[39m [36marea[39m

In [6]:
val una_rueda = Circulo(12)
area(una_rueda)

[36muna_rueda[39m: [32mCirculo[39m = [33mCirculo[39m(radio = [32m12.0[39m)
[36mres6_1[39m: [32mDouble[39m = [32m452.3904[39m

In [7]:
val un_cuadro: Rectangulo = Rectangulo(2, 2)
area(un_cuadro)

[36mun_cuadro[39m: [32mRectangulo[39m = [33mRectangulo[39m(ancho = [32m2.0[39m, alto = [32m2.0[39m)
[36mres7_1[39m: [32mDouble[39m = [32m4.0[39m