In [63]:
%load_ext autoreload

import warnings
warnings.filterwarnings("ignore") # disable warnings

from os import listdir
from os.path import join
import csv, sys
import dateutil.parser
import pyspark as ps
from pyspark.sql import functions as SF
from pyspark import SparkContext
from pyspark.sql import SparkSession, SQLContext
from pyspark.sql.types import (StringType, DoubleType, TimestampType, NullType, IntegerType, StructType, StructField)

from random import choice
import names
from hdfs import InsecureClient
from functools import reduce
from IPython.core.interactiveshell import InteractiveShell

The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload


Config settings

In [18]:
# For IPython

InteractiveShell.ast_node_interactivity = "all" # To show all output after each cell execution (instead of the last output)

# For HDFS
HDFS_PORT = 9870
HDFS_IP = "10.4.41.81"
HDFS_HOSTNAME = "alakazam.fib.upc.es"
HDFS_DEFAULT = "hdfs://alakazam.fib.upc.es:27000"
HDFS_ADDRESS = "http://{}:{}".format(HDFS_IP, HDFS_PORT)
HDFS_USER = "bdm"
HDFS_HOME = "/user/{}".format(HDFS_USER)

# For HDFS Path

hdfs_home = "{}{}".format(HDFS_DEFAULT, HDFS_HOME)

# For users
users_dir = join("formatted_data", "users")
hdfs_location = "{}/{}".format(hdfs_home, users_dir)

# For events
activities_dir = "{}/{}".format(hdfs_home, join("formatted_data", "activities"))
culture_dir = "{}/{}".format(hdfs_home, join("formatted_data", "cultural_events"))
tourist_points_dir = "{}/{}".format(hdfs_home, join("formatted_data", "touristic_points"))

In [19]:
activities_dir
culture_dir
tourist_points_dir
hdfs_location

'hdfs://alakazam.fib.upc.es:27000/user/bdm/formatted_data/activities'

'hdfs://alakazam.fib.upc.es:27000/user/bdm/formatted_data/cultural_events'

'hdfs://alakazam.fib.upc.es:27000/user/bdm/formatted_data/touristic_points'

'hdfs://alakazam.fib.upc.es:27000/user/bdm/formatted_data/users'

In [9]:
def get_hdfs_address():
    return HDFS_ADDRESS

def get_hdfs_user():
    return HDFS_USER

def get_hdfs_user_home():
    return HDFS_HOME

def get_hdfs_client():
    return InsecureClient(url=get_hdfs_address(), user=get_hdfs_user())


In [24]:
def concat_dataframes(dfs):
    """
    Concat multiple pyspark dataframe(s)

    https://www.geeksforgeeks.org/concatenate-two-pyspark-dataframes/
    """
    return reduce(lambda df1, df2: df1.union( df2.select( df1.columns ) ), dfs)

In [10]:
spark = SparkSession.builder.appName("bdm5").master('local').getOrCreate()
sc = spark.sparkContext
sqlContext = SQLContext(sc)

Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties
Setting default log level to "WARN".
To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).
22/06/13 06:32:47 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
22/06/13 06:32:52 WARN Utils: Service 'SparkUI' could not bind on port 4040. Attempting port 4041.
22/06/13 06:32:52 WARN Utils: Service 'SparkUI' could not bind on port 4041. Attempting port 4042.
22/06/13 06:32:52 WARN Utils: Service 'SparkUI' could not bind on port 4042. Attempting port 4043.


In [11]:
client = get_hdfs_client()
client

<InsecureClient(url='http://10.4.41.81:9870')>

In [12]:
def get_random_name():
    """
    Generate her names
    """
    return names.get_full_name()

In [14]:
get_random_name()

'Leola Odom'

In [16]:
files = client.list(users_dir)
if not len(files):
    # no files
    print("No users")
else:
    df = sqlContext.read.parquet(hdfs_location)
    df.show(10)

No users


In [40]:
df_activities = sqlContext.read.parquet(activities_dir)
df_culture = sqlContext.read.parquet(culture_dir)
df_tourist_points = sqlContext.read.parquet(tourist_points_dir)

In [39]:
activities_type = SF.udf(lambda : "activities", StringType())
culture_type = SF.udf(lambda : "cultural events", StringType())
tourist_points_type = SF.udf(lambda : "tourist points", StringType())

In [None]:
df_activities = df_activities.withColumn("type", activities_type())
df_culture = df_culture.withColumn("type", culture_type())
df_tourist_points = df_tourist_points.withColumn("type", tourist_points_type())

In [91]:
df = concat_dataframes([df_activities, df_culture, df_tourist_points])

In [45]:
df.show(4)

                                                                                

+------------+--------------------+------------------+-----------------+-------------------------+---------------------------+---------------------+-----------------------+-------------------+-----------------+--------------------+----------+
| register_id|                name|   geo_epgs_4326_x|  geo_epgs_4326_y|addresses_neighborhood_id|addresses_neighborhood_name|addresses_district_id|addresses_district_name|addresses_road_name|addresses_road_id|           timestamp|      type|
+------------+--------------------+------------------+-----------------+-------------------------+---------------------------+---------------------+-----------------------+-------------------+-----------------+--------------------+----------+
|﻿99400169638|Visites guiades '...| 41.38666133472934|2.171438214409541|                        2|             el Barri Gòtic|                    1|           Ciutat Vella| Plaça de Catalunya|            74404|2022-06-11 13:26:...|activities|
|﻿99400683221|'American Spac

In [47]:
df_activities.count()
df_culture.count()
df_tourist_points.count()
df.count()

                                                                                

3156

                                                                                

2364

                                                                                

855

                                                                                

6375

In [61]:
users = [get_random_name() for i in range(0, 10)]

In [62]:
users

['David Smith',
 'Donald Roberts',
 'Betty Mannino',
 'Mildred Chong',
 'Edith Tibbles',
 'Tony Barlow',
 'Antonia Jernigan',
 'Mickey Broadnax',
 'Francisco Wyatt',
 'Junior Fulton']

In [92]:
generate_random = SF.udf(lambda : choice(users), StringType())

In [93]:
df = df.withColumn("user", generate_random())

In [None]:
df.show(10)

In [48]:
df_rdd = df.rdd.sample(False, 0.1, 0)

In [53]:
df_rdd.count()

                                                                                

641

In [54]:
    generate_random = SF.udf(lambda : get_random_name(), StringType())

In [55]:
df = df.withColumn("user", generate_random())

In [94]:
df.printSchema()

root
 |-- register_id: string (nullable = true)
 |-- name: string (nullable = true)
 |-- geo_epgs_4326_x: string (nullable = true)
 |-- geo_epgs_4326_y: string (nullable = true)
 |-- addresses_neighborhood_id: string (nullable = true)
 |-- addresses_neighborhood_name: string (nullable = true)
 |-- addresses_district_id: string (nullable = true)
 |-- addresses_district_name: string (nullable = true)
 |-- addresses_road_name: string (nullable = true)
 |-- addresses_road_id: string (nullable = true)
 |-- timestamp: timestamp (nullable = true)
 |-- type: string (nullable = true)
 |-- user: string (nullable = true)



In [68]:
df = df.select(["user", "type", "name"])

In [69]:
df = df.sample(withReplacement=True, fraction=0.5, seed=3)

In [85]:
from pyspark.ml.fpm import FPGrowth


In [82]:
d = df.groupBy("user").agg(SF.collect_list("name").alias("items"))

In [86]:
d = d.select("items")

In [87]:
fp = FPGrowth(minSupport=0.2, minConfidence=0.7)

In [88]:
fpm = fp.fit(d)

22/06/13 08:13:47 ERROR Executor: Exception in task 0.0 in stage 78.0 (TID 715) 
org.apache.spark.SparkException: Items in a transaction must be unique but got WrappedArray(Torneig de videojocs: Clash Royale, Campus Olímpia Específic de bàsquet 'Game Time' per a adolescents de 11 a 17 anys a la Pistes Poliesportives Municipals Parc de la Maquinista, 'Assaig en companyia', amb la Companyia Juvenil de Ballet clàssic de Catalunya, Dinar casalero, Dinar casalero, Visites exprés gratuïtes: '11 de setembre, memòria d’una desfeta', Espectacle “Orpheus”, a càrrec d’”Insectotròpics”, Fira d'Entitats i Comercial, Fira d'Entitats i Comercial, Casal d'estiu 'Mitjans' per a infants de 7 a 10 anys a l'Escola Pia Sant Antoni, Congrés "Global Public Transport Summit", Taller híbrid 'Ioga en família. Infants de 4 a 9 anys', 'Contes orientals', 'Contes a la mà', a càrrec de Marta Catalán, Mapping al Palau Güell 'Parabòlic Gaudí', Mapping al Palau Güell 'Parabòlic Gaudí', Espectacle "A los 30 lo petamos"

Py4JJavaError: An error occurred while calling o527.fit.
: org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 78.0 failed 1 times, most recent failure: Lost task 0.0 in stage 78.0 (TID 715) (alakazam.fib.upc.es executor driver): org.apache.spark.SparkException: Items in a transaction must be unique but got WrappedArray(Torneig de videojocs: Clash Royale, Campus Olímpia Específic de bàsquet 'Game Time' per a adolescents de 11 a 17 anys a la Pistes Poliesportives Municipals Parc de la Maquinista, 'Assaig en companyia', amb la Companyia Juvenil de Ballet clàssic de Catalunya, Dinar casalero, Dinar casalero, Visites exprés gratuïtes: '11 de setembre, memòria d’una desfeta', Espectacle “Orpheus”, a càrrec d’”Insectotròpics”, Fira d'Entitats i Comercial, Fira d'Entitats i Comercial, Casal d'estiu 'Mitjans' per a infants de 7 a 10 anys a l'Escola Pia Sant Antoni, Congrés "Global Public Transport Summit", Taller híbrid 'Ioga en família. Infants de 4 a 9 anys', 'Contes orientals', 'Contes a la mà', a càrrec de Marta Catalán, Mapping al Palau Güell 'Parabòlic Gaudí', Mapping al Palau Güell 'Parabòlic Gaudí', Espectacle "A los 30 lo petamos", Activitats dia 14 de juny, Concert "Uriah Heep", Concert "Uriah Heep", Concert "A Nou Barris donem la nota", a càrrec de la Banda Simfònica de Roquetes - Nou Barris, Exposició "Igualtat de gènere i objectius de desenvolupament sostenible" Empoderament de la dona, Taller 'Ceràmica: Fes el teu animal imaginari', Exposició 'Turner. La llum és color', Exposició 'Turner. La llum és color', Exposició 'La grandesa del que és senzill: mobles del Monestir de Pedralbes', Casal d'estiu 'Els 7 misteris perduts de l'Arenal' per a infants i adolescents de 6 a 14 anys a l'Escola L'Arenal de Llevant, Calendari d'obertura de comerços en diumenges i dies festius 2022, Concert "Milton Nascimento", Concert "Milton Nascimento", Espectacle "Calladitas estáis más guapas", Espectacle "Calladitas estáis más guapas", Exposició 'Unsafe', Exposició 'Més que abelles. Pol·linitzadors i flors, la vida en joc', Concert "Sinatra & Jobim Project", Concert "Sinatra & Jobim Project", Concert "Andrés Calamaro", I si no estimem els nostres cossos? Parlem dels Trastorns de la Conducta Alimentària, Precampus Olímpia per a infants de 3 a 5 anys al CEM Cotxeres Borbó, Precampus Olímpia per a infants de 3 a 5 anys al CEM Cotxeres Borbó, Contes a cau d'orella, Exposició 'Lab Math' *Suspès, Patis escolars oberts al barri - Escola Bressol Municipal La Mar, Taller 'Sevillanes', Taller 'Sevillanes', Espectacle "La pell Rosetta", Arribada de l' "Ultra Clean Marathon", Casal d'estiu 'Grans' per a infants i adolescents de 10 a 14 anys a l'Escola Pia Sant Antoni, Casal d'estiu 'Grans' per a infants i adolescents de 10 a 14 anys a l'Escola Pia Sant Antoni, Taller temàtic combinat 'COA Besòs' per a adolescents de 12 a 16  anys a l'Institut Besòs, Campus Olímpia Poliesportiu per a infants de 6 a 8 anys al CEM Can Ricart, Fira del Col·leccionisme de la Zona Nord, Casal d'estiu per a infants i adolescents de 3 a 14 anys a l'Escola Parc de la Ciutadella, Casal d'estiu per a infants i adolescents de 3 a 14 anys a l'Escola Immaculada Concepció d'Horta, Espectacle "Riot Comedy", Espectacle "Riot Comedy", Jornada "Déjate ser y carnaval trans", 'Alegria', a càrrec d'Olga Rodríguez, Precampus Olímpia per a infants 3 a 5 anys al CEM Olímpics de la Vall d'Hebron, Casal d'estiu per a infants i adolescents de 5 a 12 anys al Casal Parroquial del Crist Rei, Concert 'Festival Simfònic', Concert 'Festival Simfònic', Campus Olímpia Específic 'Pàdel' per a infants i adolescents de 9 a 16 anys al CEM  Bon Pastor, Festival "The authentic italian table", Festival "The authentic italian table", Visites guiades sobre la història arquitectònica del Pavelló de la República, Exposició 'Objectiu Dona: Maternar' de Lisi Andrés Palacios, Bressol d'estiu per a infants d'1 a 3 anys a l'EBM La Fassina, Campus Olímpia de natura per a infants i adolescents de 11 a 16 anys a l'Ins Doctor Puigvert, Patis escolars oberts al barri - Escola Mercè Rodoreda, Patis escolars oberts al barri - Escola Mercè Rodoreda, Espectacle "Replecs", a càrrec de la Cia. Isabel Vinardell, 'Activa't als parcs' als Jardins de la Maternitat, 'Activa't als parcs' als Jardins de la Maternitat, 'Sarrià i els sarrianencs de fa 100 anys', Bressol d'estiu per a infants de 1 a 3 anys a l'EBM Ralet, Bressol d'estiu per a infants de 1 a 3 anys a l'EBM Ralet, Patis escolars oberts al barri  - Escola Reina Violant, Exposició 'Interrogar Barcelona. De la industrialització al segle XXI', Exposició "Entourage", d'Enric Tormo, Taller familiar 'Kangeroo (mares amb nadó i embarassades)', Campus Olímpia Específic 'Summer dance' per a infants i adolescents de 7 a 16 anys a l'Escola Els Llorers, Campus Olímpia Específic 'Summer dance' per a infants i adolescents de 7 a 16 anys a l'Escola Els Llorers, Acte de districte pel Dia Internacional contra l'Lgtbifòbia', Complex Esportiu Municipal Pau Negre - Parc Migdia, Fira Espai d'Art a l'avinguda Diagonal, Casal d'Estiu 'Un estiu de pel·lícula' per a infants de 3 a 5 anys a a l'Escola Can Fabra, Espectacle "Cobalto. Laila Tafur i Alba Rihe", 'Còmics', 'Còmics', Patis escolars oberts al barri - Escola Vila Olímpica, Patis escolars oberts al barri - Escola Pau Romeva, Patis escolars oberts al barri - Escola Pau Romeva, Concert "Companyia Elèctrica Dharma", Activitats familiars, Bressol d'estiu per a infants de 1 a 3 anys a l'EBM Puigmal, Casal d'estiu 'Enriquezarte' per a infants i adolescents de 3 a 12 anys a Centre Cultural EnriquezArte, Taller 'Percussió corporal', a càrrec de Sol Re Percussió, Campaments d’estiu 'Tria' per a adolescents de 12 a 17 anys, Campus Olímpia Específic 'Futbol' per a infants i adolescents de 7 a 16 anys al CEM Fort Pienc, Taller 'Posa’t a prova amb l’STEAM (9 a 12 anys)', Espectacle "¿Estamos programados?", a càrrec de Magno El Mentalista, Precampus Olímpia per a infants de 4 a 6 anys al Poliesportiu La Marina, Concert "The Beach Boys", Concert "The Beach Boys", Projecció del documental "La maleta de Mauthausen", Concert de l’Orquestra Simfònica de Barcelona i Nacional de Catalunya (OBC) i Alba G. Corral, Concert "Coque Malla", Taller 'Relats de viatge: mirades a través de la literatura' *NOU*, Campanya solidària per becar colònies i casals d'infants sense recursos, Casal d'estiu 'Juguem amb l'art' per a infants i adolescents de 3 a 12 anys de L'Escola Mediterrània, Joc virtual 'La natura en històries', XVII Obrador d'Estiu de la Sala Beckett, Club de lectura de literatura asiàtica “La historia interminable" de Michael Ende, Casal d'estiu per a infants i adolescents de 3 a 12 anys a l'Escola Ferran Sunyer, Concert "August Tharrats Trio", Concert "August Tharrats Trio", Concert "August Tharrats Trio", Visites a l'arxiu Joan Maragall, Casal d'estiu per a infants i adolescents de 3 a 12 anys de l'Escola Sant Martí, Fira del Llibre Vell a la Plaça de Sarrià, Fira Artesanal de l'Associació Sabors Catalans a la Rambla Guipúscoa, Taller 'Còmic (8-12 anys)', Xerrada 'L’evidència genòmica de l’evolució humana', Arribada de la Flama del Canigó a La Marina, Visites a l'Ajuntament de Barcelona, Visites a l'Ajuntament de Barcelona, Casal d'estiu 'Les històries de la senyora Antonieta i el senyor Pepituu' per a infants i adolescents de 3 a 12 anys a l'Escola l'Estel, Casal d'estiu per a infants i adolescents de 3 a 12 anys a l'Escola Vila Olímpica, Casal d'estiu per a infants i adolescents de 3 a 12 anys a l'Escola Vila Olímpica, Cinefòrum. Projecció del documental "Seaspiracy: La Pesca Insostenible", Caminada 'Parc de La Ciutadella', Patis escolars oberts al barri - Institut Barcelona Congrés, Exposició 'Casa Àfrica: Migrar, habitar i resistir', Campus Olímpia Poliesportiu per a infants i adolescents de 6 a 17 anys al CEM Maresme, Espai d'interpretació 'Sirenes en TRANSsit', Taller: El Pas a l'adolescència, Taller: El Pas a l'adolescència, Taller 'Iniciació al teatre' *NOU*, Correfoc, Exposició 'Mika Vainio. Sondear', Itinerari 'Més enllà del Quadrat d'Or: l'Eixample més desconegut', Escalem al Pou, Matí d'esports, Cosmètica natural, Joc de pistes 'Tauromaníacs', Cicle de concerts 'Dijous Jazz a les Corts', "Taller 'Processos alternatius. Cianotípia, Concerts i audicions del carilló del Palau de la Generalitat, Taller 'Teatre per adults', Taller híbrid 'Orquestra d'Ukeleles', Taller híbrid 'Orquestra d'Ukeleles', Taller híbrid 'Orquestra d'Ukeleles', "Mostra de la Biennal d’art ""El Venadito"". 4a Edició Primats", "Mostra de la Biennal d’art ""El Venadito"". 4a Edició Primats", Taller 'Viatge als orígens', "Concert ""Andrés Calamaro""", Conferència 'La relació de parella amb l'arribada dels fills i filles', Conferència 'La relació de parella amb l'arribada dels fills i filles', Taller temàtic imatge 'Captura el moviment' per a adolescents de 14 a 17 anys a la Fundació Mans a les Mans, Taller temàtic imatge 'Captura el moviment' per a adolescents de 14 a 17 anys a la Fundació Mans a les Mans, Taller 'Amanides per al bon temps' *Nou*, Seminari 'Gestionar l'estrès amb l'alimentació', Seminari 'Gestionar l'estrès amb l'alimentació', "Concert ""Sopa de Cabra. 30 Anys Ben Endins""", "Espectacle ""The Musical Box. Performing Genesis 'The Lamb Lies Down On Broadway'""", Taller 'Ioguilates', Taller 'Laca jaonesa', Taller 'Guitarra - Rumba i buleria', Taller 'Guitarra - Rumba i buleria', "Concert ""ZA! & la TransMegaCobla"", Taller 'Retrats per a persones adultes', Taller cultural 'El cinema i les arts: influències de la pintura a la gran pantalla' *NOU*, """Barna'n'Roll"" a Razzmatazz (Warm Up Party)", Taller 'Gimnàstica GAC', Taller 'Revelat digital'  *NOU*, Taller cultural ' Història d´Europa a través de les seves obres d'art', Taller 'Biodansa', Taller 'Biodansa', Taller 'Iniciació al dibuix', Taller 'Iniciació al dibuix', Taller 'Fitnes Dance', Taller 'Fitnes Dance', Taller 'Fitnes Dance', Taller 'Sevillanes', Seminari 'Iniciació a la màquina de cosir. Nivell II', Taller 'Costura bàsica i patronatge', Taller 'Costura bàsica i patronatge', Taller 'Tècniques de dibuix', Taller 'Zumba', Taller 'Zumba', "Concert ""Diana Krall""", Taller 'Mètode pilates', Taller 'Ioga per a Gent Gran', Dates, Taller per a la gent gran 'Informàtica des de zero', Taller per a dones “El cos escriptor”. Laboratori anual de creació escènica, Taller 'Cuina street food vegana matí' (sense ingredients d’origen animal), Taller 'Cuina street food vegana matí' (sense ingredients d’origen animal), "Concert ""Manolo García""", "Projecció de pel•lícula + col•loqui ""Las hijas del fuego""", "Concert ""Jorge Drexler""", "Concert ""Jorge Drexler""", "Concert ""Madness""", "Concert ""Madness""", Exposició 'Mare Natura', "Òpera ""Die Zauberflöte (La Flauta Màgica)"", Catifa floral a la Parròquia de Santa Maria del Remei, Taller 'Art crític', "Concert ""VV""", Taller 'Llengua de signes en família', Taller 'Llengua de signes en família', Xerrada 'L'accés a l'invisible', Taller 'Anglès des de zero', Taller 'Dibuix', "Concert ""The Txandals""", Taller 'Photoshop (iniciació)', Taller 'Percussió corporal' *NOU*, Taller 'Percussió corporal' *NOU*, Exposició 'Subirachs. Retorn al Poblenou', Taller 'Restauració de mobles', Taller 'Cuina fresca de temporada', Taller 'Club de lectura', Taller 'Club de lectura', "Exposició 'Firma', Concert 'Brutal', Taller 'Ballet barre', "Concert ""Steve Vai""", Taller 'Ioga', Xerrades de teleassistència, Xerrades de teleassistència, "Concert solidari ""Ladilla Rusa + Pirat's Sound Sistema + Chalart58 & Matah +Elane i més""", "Taller 'Circ, Taller 'Pilates', "Exposició 'Casa Àfrica: Migrar, Taller 'Urban sketching', Taller cultural 'L'art gòtic: l´Europa de le catedrals', Taller cultural 'L'art gòtic: l´Europa de le catedrals', Taller 'Balls de saló avançat', Taller en línia 'Hatha ioga per a dones', Taller 'Cuina fresca i acolorida' *Nou*, "Taller ""Body-balance""", "Taller ""Body-balance""", Taller voluntari 'Pintura sobre roba', "Concert ""Arnau Griso""", Taller 'Escriptura creativa', Cicle líric 'Les veus del monestir', Taller 'Dansa polinèsia', Taller 'Aprèn a parlar en públic', Taller 'Clàssics indiscutibles de la història del cinema'' *NOU*, Taller 'Processos fotogràfics de creació artística' *NOU*', Taller 'Processos fotogràfics de creació artística' *NOU*', Taller 'Iniciació a la guitarra acústica', "Concert a benefici de Xamfrà ""Manu Guix i Amics""", Taller 'Sòl pelvià i abdominals hipopressives' *NOU*, Taller per gent gran 'Hama', creArte: Coneixem les emocions a partir de la fotografia i el collage, "Concert Jazztrònica XS ""Pol Omedes - Pura Vida""", Festival Hipnotik 2022, Festival Hipnotik 2022, "Exposició '25 anys de la Universitat de Vic – UCC: Persones, "Concert ""Mac DeMarco""", Exposició 'Tàpies. Malenconia', "Concert ""Jacky Terrasson Trio""", Cicle de concerts al Hortet de la Farga, "Concert ""Echo & Bunnymen""", Taller 'Gimnàstica dolça per a persones més grans de 60 anys', Sessions obertes de Dansa Lliure, Taller híbrid: 'Ioga hatha integral' *NOU*, Gran Festa Verdaguer 2022, "Concert ""Jessie J""", "Correllengua, Casa Martí Trias i Domènech, Casa Claudi Alsina, La Muralla Romana, Parc de la Font Florida, Funicular Tibidabo - Cuca de Llum, Fundació Barcelona Media - Centre d'Innovació, Plaça del Nen de la Rutlla, Plaça del Nen de la Rutlla, Casa Serra, Casa Serra, Col·legi Oficial de Metges de Barcelona, Col·legi Oficial de Metges de Barcelona, Consell Municipal del Districte de Sant Andreu, Consell Municipal del Districte de Sant Andreu, Consell Municipal del Districte de Sant Andreu, Torre d'Aigües de Carrasco i Formiguera, Carrer Aiguafreda, Casa Vidal, El Congrés i els Indians, Casa Pomar, Turó Park - Parc del Poeta Eduard Marquina, Casa Eudald Obradors, Casa Eudald Obradors, La plaça de Ramon M. Roca i Sastre, Club Natació Atlètic - Barceloneta, Casa Rubinat, Casa Rubinat, L'Estació dels FGC de Sarrià, La Vila Olímpica, Parc Carmel, Parc Carmel, La plaça de Comas, Placa Fotovoltaica, Cementiri d'Horta, Cementiri d'Horta, Parròquia de la Mare de Déu del Coll, Parròquia de la Mare de Déu del Coll, Parròquia de Sant Ramon Nonat, Castell de Torre Baró, Castell de Torre Baró, Parc del Mirador del Poble-sec, Parc del Mirador del Poble-sec, El Raval, La Casa de l'Aigua).
	at org.apache.spark.mllib.fpm.FPGrowth.$anonfun$genFreqItems$1(FPGrowth.scala:249)
	at scala.collection.Iterator$$anon$11.nextCur(Iterator.scala:486)
	at scala.collection.Iterator$$anon$11.hasNext(Iterator.scala:492)
	at scala.collection.Iterator$$anon$10.hasNext(Iterator.scala:460)
	at org.apache.spark.util.collection.ExternalSorter.insertAll(ExternalSorter.scala:197)
	at org.apache.spark.shuffle.sort.SortShuffleWriter.write(SortShuffleWriter.scala:63)
	at org.apache.spark.shuffle.ShuffleWriteProcessor.write(ShuffleWriteProcessor.scala:59)
	at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:99)
	at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:52)
	at org.apache.spark.scheduler.Task.run(Task.scala:131)
	at org.apache.spark.executor.Executor$TaskRunner.$anonfun$run$3(Executor.scala:506)
	at org.apache.spark.util.Utils$.tryWithSafeFinally(Utils.scala:1462)
	at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:509)
	at java.base/java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1128)
	at java.base/java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:628)
	at java.base/java.lang.Thread.run(Thread.java:829)

Driver stacktrace:
	at org.apache.spark.scheduler.DAGScheduler.failJobAndIndependentStages(DAGScheduler.scala:2454)
	at org.apache.spark.scheduler.DAGScheduler.$anonfun$abortStage$2(DAGScheduler.scala:2403)
	at org.apache.spark.scheduler.DAGScheduler.$anonfun$abortStage$2$adapted(DAGScheduler.scala:2402)
	at scala.collection.mutable.ResizableArray.foreach(ResizableArray.scala:62)
	at scala.collection.mutable.ResizableArray.foreach$(ResizableArray.scala:55)
	at scala.collection.mutable.ArrayBuffer.foreach(ArrayBuffer.scala:49)
	at org.apache.spark.scheduler.DAGScheduler.abortStage(DAGScheduler.scala:2402)
	at org.apache.spark.scheduler.DAGScheduler.$anonfun$handleTaskSetFailed$1(DAGScheduler.scala:1160)
	at org.apache.spark.scheduler.DAGScheduler.$anonfun$handleTaskSetFailed$1$adapted(DAGScheduler.scala:1160)
	at scala.Option.foreach(Option.scala:407)
	at org.apache.spark.scheduler.DAGScheduler.handleTaskSetFailed(DAGScheduler.scala:1160)
	at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.doOnReceive(DAGScheduler.scala:2642)
	at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.onReceive(DAGScheduler.scala:2584)
	at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.onReceive(DAGScheduler.scala:2573)
	at org.apache.spark.util.EventLoop$$anon$1.run(EventLoop.scala:49)
	at org.apache.spark.scheduler.DAGScheduler.runJob(DAGScheduler.scala:938)
	at org.apache.spark.SparkContext.runJob(SparkContext.scala:2214)
	at org.apache.spark.SparkContext.runJob(SparkContext.scala:2235)
	at org.apache.spark.SparkContext.runJob(SparkContext.scala:2254)
	at org.apache.spark.SparkContext.runJob(SparkContext.scala:2279)
	at org.apache.spark.rdd.RDD.$anonfun$collect$1(RDD.scala:1030)
	at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:151)
	at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:112)
	at org.apache.spark.rdd.RDD.withScope(RDD.scala:414)
	at org.apache.spark.rdd.RDD.collect(RDD.scala:1029)
	at org.apache.spark.mllib.fpm.FPGrowth.genFreqItems(FPGrowth.scala:254)
	at org.apache.spark.mllib.fpm.FPGrowth.run(FPGrowth.scala:219)
	at org.apache.spark.ml.fpm.FPGrowth.$anonfun$genericFit$1(FPGrowth.scala:180)
	at org.apache.spark.ml.util.Instrumentation$.$anonfun$instrumented$1(Instrumentation.scala:191)
	at scala.util.Try$.apply(Try.scala:213)
	at org.apache.spark.ml.util.Instrumentation$.instrumented(Instrumentation.scala:191)
	at org.apache.spark.ml.fpm.FPGrowth.genericFit(FPGrowth.scala:162)
	at org.apache.spark.ml.fpm.FPGrowth.fit(FPGrowth.scala:159)
	at java.base/jdk.internal.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
	at java.base/jdk.internal.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
	at java.base/jdk.internal.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
	at java.base/java.lang.reflect.Method.invoke(Method.java:566)
	at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:244)
	at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:357)
	at py4j.Gateway.invoke(Gateway.java:282)
	at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132)
	at py4j.commands.CallCommand.execute(CallCommand.java:79)
	at py4j.ClientServerConnection.waitForCommands(ClientServerConnection.java:182)
	at py4j.ClientServerConnection.run(ClientServerConnection.java:106)
	at java.base/java.lang.Thread.run(Thread.java:829)
Caused by: org.apache.spark.SparkException: Items in a transaction must be unique but got WrappedArray(Torneig de videojocs: Clash Royale, Campus Olímpia Específic de bàsquet 'Game Time' per a adolescents de 11 a 17 anys a la Pistes Poliesportives Municipals Parc de la Maquinista, 'Assaig en companyia', amb la Companyia Juvenil de Ballet clàssic de Catalunya, Dinar casalero, Dinar casalero, Visites exprés gratuïtes: '11 de setembre, memòria d’una desfeta', Espectacle “Orpheus”, a càrrec d’”Insectotròpics”, Fira d'Entitats i Comercial, Fira d'Entitats i Comercial, Casal d'estiu 'Mitjans' per a infants de 7 a 10 anys a l'Escola Pia Sant Antoni, Congrés "Global Public Transport Summit", Taller híbrid 'Ioga en família. Infants de 4 a 9 anys', 'Contes orientals', 'Contes a la mà', a càrrec de Marta Catalán, Mapping al Palau Güell 'Parabòlic Gaudí', Mapping al Palau Güell 'Parabòlic Gaudí', Espectacle "A los 30 lo petamos", Activitats dia 14 de juny, Concert "Uriah Heep", Concert "Uriah Heep", Concert "A Nou Barris donem la nota", a càrrec de la Banda Simfònica de Roquetes - Nou Barris, Exposició "Igualtat de gènere i objectius de desenvolupament sostenible" Empoderament de la dona, Taller 'Ceràmica: Fes el teu animal imaginari', Exposició 'Turner. La llum és color', Exposició 'Turner. La llum és color', Exposició 'La grandesa del que és senzill: mobles del Monestir de Pedralbes', Casal d'estiu 'Els 7 misteris perduts de l'Arenal' per a infants i adolescents de 6 a 14 anys a l'Escola L'Arenal de Llevant, Calendari d'obertura de comerços en diumenges i dies festius 2022, Concert "Milton Nascimento", Concert "Milton Nascimento", Espectacle "Calladitas estáis más guapas", Espectacle "Calladitas estáis más guapas", Exposició 'Unsafe', Exposició 'Més que abelles. Pol·linitzadors i flors, la vida en joc', Concert "Sinatra & Jobim Project", Concert "Sinatra & Jobim Project", Concert "Andrés Calamaro", I si no estimem els nostres cossos? Parlem dels Trastorns de la Conducta Alimentària, Precampus Olímpia per a infants de 3 a 5 anys al CEM Cotxeres Borbó, Precampus Olímpia per a infants de 3 a 5 anys al CEM Cotxeres Borbó, Contes a cau d'orella, Exposició 'Lab Math' *Suspès, Patis escolars oberts al barri - Escola Bressol Municipal La Mar, Taller 'Sevillanes', Taller 'Sevillanes', Espectacle "La pell Rosetta", Arribada de l' "Ultra Clean Marathon", Casal d'estiu 'Grans' per a infants i adolescents de 10 a 14 anys a l'Escola Pia Sant Antoni, Casal d'estiu 'Grans' per a infants i adolescents de 10 a 14 anys a l'Escola Pia Sant Antoni, Taller temàtic combinat 'COA Besòs' per a adolescents de 12 a 16  anys a l'Institut Besòs, Campus Olímpia Poliesportiu per a infants de 6 a 8 anys al CEM Can Ricart, Fira del Col·leccionisme de la Zona Nord, Casal d'estiu per a infants i adolescents de 3 a 14 anys a l'Escola Parc de la Ciutadella, Casal d'estiu per a infants i adolescents de 3 a 14 anys a l'Escola Immaculada Concepció d'Horta, Espectacle "Riot Comedy", Espectacle "Riot Comedy", Jornada "Déjate ser y carnaval trans", 'Alegria', a càrrec d'Olga Rodríguez, Precampus Olímpia per a infants 3 a 5 anys al CEM Olímpics de la Vall d'Hebron, Casal d'estiu per a infants i adolescents de 5 a 12 anys al Casal Parroquial del Crist Rei, Concert 'Festival Simfònic', Concert 'Festival Simfònic', Campus Olímpia Específic 'Pàdel' per a infants i adolescents de 9 a 16 anys al CEM  Bon Pastor, Festival "The authentic italian table", Festival "The authentic italian table", Visites guiades sobre la història arquitectònica del Pavelló de la República, Exposició 'Objectiu Dona: Maternar' de Lisi Andrés Palacios, Bressol d'estiu per a infants d'1 a 3 anys a l'EBM La Fassina, Campus Olímpia de natura per a infants i adolescents de 11 a 16 anys a l'Ins Doctor Puigvert, Patis escolars oberts al barri - Escola Mercè Rodoreda, Patis escolars oberts al barri - Escola Mercè Rodoreda, Espectacle "Replecs", a càrrec de la Cia. Isabel Vinardell, 'Activa't als parcs' als Jardins de la Maternitat, 'Activa't als parcs' als Jardins de la Maternitat, 'Sarrià i els sarrianencs de fa 100 anys', Bressol d'estiu per a infants de 1 a 3 anys a l'EBM Ralet, Bressol d'estiu per a infants de 1 a 3 anys a l'EBM Ralet, Patis escolars oberts al barri  - Escola Reina Violant, Exposició 'Interrogar Barcelona. De la industrialització al segle XXI', Exposició "Entourage", d'Enric Tormo, Taller familiar 'Kangeroo (mares amb nadó i embarassades)', Campus Olímpia Específic 'Summer dance' per a infants i adolescents de 7 a 16 anys a l'Escola Els Llorers, Campus Olímpia Específic 'Summer dance' per a infants i adolescents de 7 a 16 anys a l'Escola Els Llorers, Acte de districte pel Dia Internacional contra l'Lgtbifòbia', Complex Esportiu Municipal Pau Negre - Parc Migdia, Fira Espai d'Art a l'avinguda Diagonal, Casal d'Estiu 'Un estiu de pel·lícula' per a infants de 3 a 5 anys a a l'Escola Can Fabra, Espectacle "Cobalto. Laila Tafur i Alba Rihe", 'Còmics', 'Còmics', Patis escolars oberts al barri - Escola Vila Olímpica, Patis escolars oberts al barri - Escola Pau Romeva, Patis escolars oberts al barri - Escola Pau Romeva, Concert "Companyia Elèctrica Dharma", Activitats familiars, Bressol d'estiu per a infants de 1 a 3 anys a l'EBM Puigmal, Casal d'estiu 'Enriquezarte' per a infants i adolescents de 3 a 12 anys a Centre Cultural EnriquezArte, Taller 'Percussió corporal', a càrrec de Sol Re Percussió, Campaments d’estiu 'Tria' per a adolescents de 12 a 17 anys, Campus Olímpia Específic 'Futbol' per a infants i adolescents de 7 a 16 anys al CEM Fort Pienc, Taller 'Posa’t a prova amb l’STEAM (9 a 12 anys)', Espectacle "¿Estamos programados?", a càrrec de Magno El Mentalista, Precampus Olímpia per a infants de 4 a 6 anys al Poliesportiu La Marina, Concert "The Beach Boys", Concert "The Beach Boys", Projecció del documental "La maleta de Mauthausen", Concert de l’Orquestra Simfònica de Barcelona i Nacional de Catalunya (OBC) i Alba G. Corral, Concert "Coque Malla", Taller 'Relats de viatge: mirades a través de la literatura' *NOU*, Campanya solidària per becar colònies i casals d'infants sense recursos, Casal d'estiu 'Juguem amb l'art' per a infants i adolescents de 3 a 12 anys de L'Escola Mediterrània, Joc virtual 'La natura en històries', XVII Obrador d'Estiu de la Sala Beckett, Club de lectura de literatura asiàtica “La historia interminable" de Michael Ende, Casal d'estiu per a infants i adolescents de 3 a 12 anys a l'Escola Ferran Sunyer, Concert "August Tharrats Trio", Concert "August Tharrats Trio", Concert "August Tharrats Trio", Visites a l'arxiu Joan Maragall, Casal d'estiu per a infants i adolescents de 3 a 12 anys de l'Escola Sant Martí, Fira del Llibre Vell a la Plaça de Sarrià, Fira Artesanal de l'Associació Sabors Catalans a la Rambla Guipúscoa, Taller 'Còmic (8-12 anys)', Xerrada 'L’evidència genòmica de l’evolució humana', Arribada de la Flama del Canigó a La Marina, Visites a l'Ajuntament de Barcelona, Visites a l'Ajuntament de Barcelona, Casal d'estiu 'Les històries de la senyora Antonieta i el senyor Pepituu' per a infants i adolescents de 3 a 12 anys a l'Escola l'Estel, Casal d'estiu per a infants i adolescents de 3 a 12 anys a l'Escola Vila Olímpica, Casal d'estiu per a infants i adolescents de 3 a 12 anys a l'Escola Vila Olímpica, Cinefòrum. Projecció del documental "Seaspiracy: La Pesca Insostenible", Caminada 'Parc de La Ciutadella', Patis escolars oberts al barri - Institut Barcelona Congrés, Exposició 'Casa Àfrica: Migrar, habitar i resistir', Campus Olímpia Poliesportiu per a infants i adolescents de 6 a 17 anys al CEM Maresme, Espai d'interpretació 'Sirenes en TRANSsit', Taller: El Pas a l'adolescència, Taller: El Pas a l'adolescència, Taller 'Iniciació al teatre' *NOU*, Correfoc, Exposició 'Mika Vainio. Sondear', Itinerari 'Més enllà del Quadrat d'Or: l'Eixample més desconegut', Escalem al Pou, Matí d'esports, Cosmètica natural, Joc de pistes 'Tauromaníacs', Cicle de concerts 'Dijous Jazz a les Corts', "Taller 'Processos alternatius. Cianotípia, Concerts i audicions del carilló del Palau de la Generalitat, Taller 'Teatre per adults', Taller híbrid 'Orquestra d'Ukeleles', Taller híbrid 'Orquestra d'Ukeleles', Taller híbrid 'Orquestra d'Ukeleles', "Mostra de la Biennal d’art ""El Venadito"". 4a Edició Primats", "Mostra de la Biennal d’art ""El Venadito"". 4a Edició Primats", Taller 'Viatge als orígens', "Concert ""Andrés Calamaro""", Conferència 'La relació de parella amb l'arribada dels fills i filles', Conferència 'La relació de parella amb l'arribada dels fills i filles', Taller temàtic imatge 'Captura el moviment' per a adolescents de 14 a 17 anys a la Fundació Mans a les Mans, Taller temàtic imatge 'Captura el moviment' per a adolescents de 14 a 17 anys a la Fundació Mans a les Mans, Taller 'Amanides per al bon temps' *Nou*, Seminari 'Gestionar l'estrès amb l'alimentació', Seminari 'Gestionar l'estrès amb l'alimentació', "Concert ""Sopa de Cabra. 30 Anys Ben Endins""", "Espectacle ""The Musical Box. Performing Genesis 'The Lamb Lies Down On Broadway'""", Taller 'Ioguilates', Taller 'Laca jaonesa', Taller 'Guitarra - Rumba i buleria', Taller 'Guitarra - Rumba i buleria', "Concert ""ZA! & la TransMegaCobla"", Taller 'Retrats per a persones adultes', Taller cultural 'El cinema i les arts: influències de la pintura a la gran pantalla' *NOU*, """Barna'n'Roll"" a Razzmatazz (Warm Up Party)", Taller 'Gimnàstica GAC', Taller 'Revelat digital'  *NOU*, Taller cultural ' Història d´Europa a través de les seves obres d'art', Taller 'Biodansa', Taller 'Biodansa', Taller 'Iniciació al dibuix', Taller 'Iniciació al dibuix', Taller 'Fitnes Dance', Taller 'Fitnes Dance', Taller 'Fitnes Dance', Taller 'Sevillanes', Seminari 'Iniciació a la màquina de cosir. Nivell II', Taller 'Costura bàsica i patronatge', Taller 'Costura bàsica i patronatge', Taller 'Tècniques de dibuix', Taller 'Zumba', Taller 'Zumba', "Concert ""Diana Krall""", Taller 'Mètode pilates', Taller 'Ioga per a Gent Gran', Dates, Taller per a la gent gran 'Informàtica des de zero', Taller per a dones “El cos escriptor”. Laboratori anual de creació escènica, Taller 'Cuina street food vegana matí' (sense ingredients d’origen animal), Taller 'Cuina street food vegana matí' (sense ingredients d’origen animal), "Concert ""Manolo García""", "Projecció de pel•lícula + col•loqui ""Las hijas del fuego""", "Concert ""Jorge Drexler""", "Concert ""Jorge Drexler""", "Concert ""Madness""", "Concert ""Madness""", Exposició 'Mare Natura', "Òpera ""Die Zauberflöte (La Flauta Màgica)"", Catifa floral a la Parròquia de Santa Maria del Remei, Taller 'Art crític', "Concert ""VV""", Taller 'Llengua de signes en família', Taller 'Llengua de signes en família', Xerrada 'L'accés a l'invisible', Taller 'Anglès des de zero', Taller 'Dibuix', "Concert ""The Txandals""", Taller 'Photoshop (iniciació)', Taller 'Percussió corporal' *NOU*, Taller 'Percussió corporal' *NOU*, Exposició 'Subirachs. Retorn al Poblenou', Taller 'Restauració de mobles', Taller 'Cuina fresca de temporada', Taller 'Club de lectura', Taller 'Club de lectura', "Exposició 'Firma', Concert 'Brutal', Taller 'Ballet barre', "Concert ""Steve Vai""", Taller 'Ioga', Xerrades de teleassistència, Xerrades de teleassistència, "Concert solidari ""Ladilla Rusa + Pirat's Sound Sistema + Chalart58 & Matah +Elane i més""", "Taller 'Circ, Taller 'Pilates', "Exposició 'Casa Àfrica: Migrar, Taller 'Urban sketching', Taller cultural 'L'art gòtic: l´Europa de le catedrals', Taller cultural 'L'art gòtic: l´Europa de le catedrals', Taller 'Balls de saló avançat', Taller en línia 'Hatha ioga per a dones', Taller 'Cuina fresca i acolorida' *Nou*, "Taller ""Body-balance""", "Taller ""Body-balance""", Taller voluntari 'Pintura sobre roba', "Concert ""Arnau Griso""", Taller 'Escriptura creativa', Cicle líric 'Les veus del monestir', Taller 'Dansa polinèsia', Taller 'Aprèn a parlar en públic', Taller 'Clàssics indiscutibles de la història del cinema'' *NOU*, Taller 'Processos fotogràfics de creació artística' *NOU*', Taller 'Processos fotogràfics de creació artística' *NOU*', Taller 'Iniciació a la guitarra acústica', "Concert a benefici de Xamfrà ""Manu Guix i Amics""", Taller 'Sòl pelvià i abdominals hipopressives' *NOU*, Taller per gent gran 'Hama', creArte: Coneixem les emocions a partir de la fotografia i el collage, "Concert Jazztrònica XS ""Pol Omedes - Pura Vida""", Festival Hipnotik 2022, Festival Hipnotik 2022, "Exposició '25 anys de la Universitat de Vic – UCC: Persones, "Concert ""Mac DeMarco""", Exposició 'Tàpies. Malenconia', "Concert ""Jacky Terrasson Trio""", Cicle de concerts al Hortet de la Farga, "Concert ""Echo & Bunnymen""", Taller 'Gimnàstica dolça per a persones més grans de 60 anys', Sessions obertes de Dansa Lliure, Taller híbrid: 'Ioga hatha integral' *NOU*, Gran Festa Verdaguer 2022, "Concert ""Jessie J""", "Correllengua, Casa Martí Trias i Domènech, Casa Claudi Alsina, La Muralla Romana, Parc de la Font Florida, Funicular Tibidabo - Cuca de Llum, Fundació Barcelona Media - Centre d'Innovació, Plaça del Nen de la Rutlla, Plaça del Nen de la Rutlla, Casa Serra, Casa Serra, Col·legi Oficial de Metges de Barcelona, Col·legi Oficial de Metges de Barcelona, Consell Municipal del Districte de Sant Andreu, Consell Municipal del Districte de Sant Andreu, Consell Municipal del Districte de Sant Andreu, Torre d'Aigües de Carrasco i Formiguera, Carrer Aiguafreda, Casa Vidal, El Congrés i els Indians, Casa Pomar, Turó Park - Parc del Poeta Eduard Marquina, Casa Eudald Obradors, Casa Eudald Obradors, La plaça de Ramon M. Roca i Sastre, Club Natació Atlètic - Barceloneta, Casa Rubinat, Casa Rubinat, L'Estació dels FGC de Sarrià, La Vila Olímpica, Parc Carmel, Parc Carmel, La plaça de Comas, Placa Fotovoltaica, Cementiri d'Horta, Cementiri d'Horta, Parròquia de la Mare de Déu del Coll, Parròquia de la Mare de Déu del Coll, Parròquia de Sant Ramon Nonat, Castell de Torre Baró, Castell de Torre Baró, Parc del Mirador del Poble-sec, Parc del Mirador del Poble-sec, El Raval, La Casa de l'Aigua).
	at org.apache.spark.mllib.fpm.FPGrowth.$anonfun$genFreqItems$1(FPGrowth.scala:249)
	at scala.collection.Iterator$$anon$11.nextCur(Iterator.scala:486)
	at scala.collection.Iterator$$anon$11.hasNext(Iterator.scala:492)
	at scala.collection.Iterator$$anon$10.hasNext(Iterator.scala:460)
	at org.apache.spark.util.collection.ExternalSorter.insertAll(ExternalSorter.scala:197)
	at org.apache.spark.shuffle.sort.SortShuffleWriter.write(SortShuffleWriter.scala:63)
	at org.apache.spark.shuffle.ShuffleWriteProcessor.write(ShuffleWriteProcessor.scala:59)
	at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:99)
	at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:52)
	at org.apache.spark.scheduler.Task.run(Task.scala:131)
	at org.apache.spark.executor.Executor$TaskRunner.$anonfun$run$3(Executor.scala:506)
	at org.apache.spark.util.Utils$.tryWithSafeFinally(Utils.scala:1462)
	at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:509)
	at java.base/java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1128)
	at java.base/java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:628)
	... 1 more


In [79]:
#df.select(SF.collect_set("name").alias("name")).first()["name"]

df1 = df.groupBy('type', 'name').agg(SF.count('name').alias('trip_count'))
df2 = df1.sort(df1.trip_count.desc()).show()



+---------------+--------------------+----------+
|           type|                name|trip_count|
+---------------+--------------------+----------+
|cultural events|    Taller 'Pilates'|        16|
|cultural events|       Taller 'Ioga'|         9|
|cultural events|     Taller 'Teatre'|         6|
|cultural events|Taller 'Marxa nòr...|         5|
|cultural events|Taller 'Estiraments'|         5|
|     activities|     Cinema solidari|         4|
|     activities|Visita guiada 'El...|         4|
|     activities|Dates de Festa Major|         4|
|     activities|Taller 'Gipsy ori...|         4|
|cultural events|Taller híbrid 'Fe...|         4|
|cultural events|Taller 'Iniciació...|         4|
|cultural events|      Taller 'Zumba'|         4|
|cultural events|Taller 'Escriptur...|         4|
|cultural events|Taller 'Dansa con...|         4|
|cultural events|Presentació del p...|         4|
|cultural events|Taller 'Dibuix i ...|         4|
|cultural events|Taller 'Iniciació...|         4|


                                                                                

In [75]:
#df.select(SF.count('name').alias("total")).show()
df.select("name").distinct().show()



+--------------------+
|                name|
+--------------------+
|Torneig de videoj...|
|Monòleg amb Marc ...|
|Casal esportiu i ...|
|Tertúlia literari...|
|Espectacle famili...|
|Xerrada 'Una obra...|
|Casal d'estiu 'Mi...|
|Taller 'Hipopress...|
|Intervenció artís...|
| Festival Ubeat Live|
|Espectacle “Bros”...|
|Exposició 'Memòri...|
|'Com s'inventen e...|
|   Teatre "Ximpanzé"|
|Taller 'Creació d...|
|Espectacle "L'oll...|
|Visita dinamitzad...|
|Concert "Jimi Som...|
|Lliure al sofà - ...|
|Visites guiades -...|
+--------------------+
only showing top 20 rows



                                                                                