[![img/pythonista.png](img/pythonista.png)](https://www.pythonista.io)

# Aplicaciones en *PySpark*.

Una aplicación de *PySpark* consiste en una instancia de la clase ```SparkSession```, la cual es capaz de realizar trabajos (*jobs*) distribuidos en el clúster asignado.

## La clase ```pyspark.sql.SparkSession```.

El paquete ```pypasrk.sql``` contiene varios módulos con diversas funcionalidades básicas de ingeniería y analítica de datos, pero además contiene a la clase [```SparkSession```](https://spark.apache.org/docs/latest/api/python/reference/pyspark.sql/api/pyspark.sql.SparkSession.html), la cual permite crear y ejecutar aplicaciones de *Apache Spark*.

El atributo ```pyspark.sql.SparkSession.builder``` permite crear una aplicación de *Spark* y asignarla a un objeto instanciado de ```pyspark.sql.SparkSession```, al que por convención se le asigna el nombre de ```spark```. 

```
spark = SparkSession.builder.master(<cluster>).appName(<nombre>).config(<conf>).getOrCreate()
```



https://spark.apache.org/docs/latest/api/python/reference/pyspark.sql/api/pyspark.sql.SparkSession.html

**Ejemplo:**

* A continuación se iniciará una aplicación de *Spark*  con el nombre ```'Mi primera sesión'```.

In [1]:
from pyspark.sql import SparkSession

In [2]:
spark = SparkSession.builder.appName('Mi primera sesión').getOrCreate()

In [3]:
spark

In [4]:
print(spark.sparkContext)

<SparkContext master=local[*] appName=Mi primera sesión>


* La siguiente celda creará un *RDD* dentro del cluster.

In [5]:
rdd = spark.sparkContext.parallelize([1, 2, 3, 4, 5])

In [6]:
rdd.count()

5

In [7]:
rdd.mean()

3.0

* Los pasos anteriores levantaron un contexto que puede ser consultado en http://localhost:4040.

* La siguiente celda detendrá a la aplicación.

In [None]:
spark.stop()

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2023.</p>