In [291]:
try:
    spark.stop()
except Exception:
    pass

from pyspark.sql import SparkSession

spark = (
    SparkSession.builder.appName("Iceberg via REST")
    .config("spark.sql.extensions", "org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions")
    .config("spark.sql.catalog.local", "org.apache.iceberg.spark.SparkCatalog")
    .config("spark.sql.catalog.local.type", "rest")
    .config("spark.sql.catalog.local.uri", "http://iceberg-rest:8181")
    .config("spark.sql.catalog.local.warehouse", "s3://lake/warehouse")
    .config("spark.sql.catalog.local.io-impl", "org.apache.iceberg.aws.s3.S3FileIO")
    .config("spark.sql.catalog.local.s3.endpoint", "http://minio:9000")
    .config("spark.sql.catalog.local.s3.path-style-access", "true")
    .config("spark.sql.catalog.local.s3.access-key-id", "admin")
    .config("spark.sql.catalog.local.s3.secret-access-key", "admin123")
    .config("spark.sql.catalog.local.s3.region", "us-east-1")
    .getOrCreate()
)

spark

In [292]:
spark.sql("SHOW NAMESPACES IN local").show(truncate=False)

+---------+
|namespace|
+---------+
|raw      |
+---------+



In [293]:
spark.sql("SHOW TABLES IN local.raw").show(truncate=False)

+---------+---------+-----------+
|namespace|tableName|isTemporary|
+---------+---------+-----------+
|raw      |avito    |false      |
+---------+---------+-----------+



In [334]:
tbl = "local.raw.avito"
spark.sql(f"SELECT COUNT(*) AS rows FROM {tbl}").show()


+----+
|rows|
+----+
|   0|
+----+



In [295]:
spark.sql("SELECT * FROM local.raw.avito LIMIT 1").show(truncate=False)

+--------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+-----------------------+
|id      |payload                                                                                                                                                                                                                                 |ingest_ts              |
+--------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+-----------------------+
|57022402|{"id": "57022402", "url": "https://www.avito.ma/fr/centre_ville/autre_immobilier/OPPORTUNIT√â_PROJET_APPART_HOTEL_57022402.htm", "error": "('Connection aborted.', RemoteDisconnected('Rem

In [296]:
# Load RAW table
raw_df = spark.table("local.raw.avito")   # or local.raw.sarouty

In [297]:
# Cr√©er un DataFrame "Silver" minimal
silver_df = raw_df.select("id").distinct()

# Afficher quelques lignes
silver_df.show(5, truncate=False)

print("‚úÖ Silver dataset initialized with only 'id' column.")
print("Total IDs:", silver_df.count())

+--------+
|id      |
+--------+
|55853042|
|57140846|
|57153055|
|55105755|
|56566494|
+--------+
only showing top 5 rows

‚úÖ Silver dataset initialized with only 'id' column.
Total IDs: 331


In [298]:
from pyspark.sql import functions as F
raw_df.select("payload").first()["payload"]

'{"id": "57133328", "url": "https://www.avito.ma/fr/maarif/appartements/Studio_Meubl√©_de_luxe__Maarif_57133328.htm", "error": null, "title": "Studio Meubl√© de luxe -Maarif", "price_text": "6 500 DH", "breadcrumbs": "Home Icon Accueil > Tout le Maroc > Casablanca > Maarif > Avito Immobilier > Locations Immobili√®res > Appartements > Studio Meubl√© de luxe -Maarif", "category": "Appartements, √† louer", "description": "üì¢ √Ä Louer : Studio Meubl√© de Luxe ‚Äì Socrate, Yacoub El Mansour ‚ú® Studio haut standing enti√®rement meubl√© üè† Compos√© de : Salon moderne Chambre spacieuse Cuisine am√©ricaine √©quip√©e üè¢ R√©sidence s√©curis√©e avec 2 ascenseurs üöó Garage inclus üí∞ Loyer : 6 500 DH / mois üíº Commission d‚Äôagence : 1 mois üìç Emplacement privil√©gi√© √† Yacoub El Mansour ‚Äì Socrate, proche de toutes commodit√©s.", "attributes": "{\\"Chambres\\": \\"1\\", \\"Salle de bain\\": \\"1\\", \\"Salons\\": \\"1\\", \\"Surface habitable\\": \\"47\\", \\"√âtage\\": \\"4\\"}", 

In [299]:
from pyspark.sql import functions as F, types as T

# 1) D√©finir le sch√©ma du JSON dans "payload"
payload_schema = T.StructType([
    T.StructField("id", T.StringType()),
    T.StructField("url", T.StringType()),
    T.StructField("error", T.StringType()),
    T.StructField("title", T.StringType()),
    T.StructField("price_text", T.StringType()),
    T.StructField("breadcrumbs", T.StringType()),
    T.StructField("category", T.StringType()),
    T.StructField("description", T.StringType()),
    T.StructField("attributes", T.StringType()),  # JSON imbriqu√© sous forme de string
    T.StructField("equipments", T.StringType()),
    T.StructField("seller_name", T.StringType()),
    T.StructField("seller_type", T.StringType()),
    T.StructField("published_date", T.StringType()),
    T.StructField("image_urls", T.StringType()),
])

# 2) Parser le JSON depuis la colonne string "payload"
parsed = (raw_df
    .select(
        *[c for c in raw_df.columns if c != "payload"],  # ex: garder ingest_ts s'il existe
        F.from_json(F.col("payload"), payload_schema).alias("p")
    )
    .filter(F.col("p").isNotNull())  # ignorer les lignes avec JSON invalide
)

# 3) Parser le JSON imbriqu√© "attributes" -> Map<String,String>
attrs_map = F.from_json(F.col("p.attributes"), T.MapType(T.StringType(), T.StringType()))

# 4) Nettoyages utiles:
# - price_value (MAD) √† partir de "price_text" (ex: "6 000 DH" -> 6000.0)
price_value = F.regexp_replace(F.col("p.price_text"), r"[^0-9]", "").cast("double")

# - image_urls -> array<string> en splittant sur " | " et trim de chaque url
image_urls_arr = F.transform(
    F.split(F.col("p.image_urls"), r"\s*\|\s*"),
    lambda x: F.trim(x)
)

# - equipments -> array<string> en splittant sur ";"
equipments_arr = F.transform(
    F.split(F.col("p.equipments"), r"\s*;\s*"),
    lambda x: F.trim(x)
)

# 5) Construire le DataFrame silver (colonnes √† plat)
silver_df = parsed.select(
    F.col("p.id").alias("id"),
    F.col("p.url").alias("url"),
    F.col("p.title").alias("title"),
    F.col("p.price_text").alias("price_text"),
    price_value.alias("price_value_mad"),
    F.col("p.category").alias("category"),
    F.col("p.breadcrumbs").alias("breadcrumbs"),
    F.col("p.description").alias("description"),
    F.col("p.seller_name").alias("seller_name"),
    F.col("p.seller_type").alias("seller_type"),
    F.col("p.published_date").alias("published_date_text"),
    image_urls_arr.alias("image_urls"),
    equipments_arr.alias("equipments"),
    attrs_map.alias("attributes_map"),
    # garder le timestamp d'ingestion s'il est pr√©sent dans ton raw_df
    *([F.col("ingest_ts")] if "ingest_ts" in raw_df.columns else [])
)

In [300]:
import pandas as pd
from IPython.display import display

# Keep things compact
pd.set_option("display.max_columns", 20)   # don't try to show hundreds
pd.set_option("display.max_colwidth", 80)  # clamp long cells to ~80 chars

# pick a small sample and flatten newlines so rows stay short
pdf = (silver_df.limit(10)
       .toPandas()
       .replace({r'[\r\n\t]+': ' '}, regex=True))

# simple, compact table with ellipsis in long cells
display(
    pdf.style
      .set_table_styles([
          {'selector': 'table', 'props': [('table-layout','fixed'), ('width','100%')]},
          {'selector': 'th, td', 'props': [
              ('max-width','280px'),
              ('white-space','nowrap'),
              ('overflow','hidden'),
              ('text-overflow','ellipsis')
          ]}
      ])
      .hide(axis='index')  # remove row numbers
)
# show all distinct price_text values
silver_df.select("price_text").distinct().show(truncate=False)


id,url,title,price_text,price_value_mad,category,breadcrumbs,description,seller_name,seller_type,published_date_text,image_urls,equipments,attributes_map,ingest_ts
57153308,https://www.avito.ma/fr/bel_air___val_fleuri/appartements/Val_Fleuri_57153308.htm,Val Fleuri,5 500 DH,5500.0,"Appartements, √† louer",Home Icon Accueil > Tout le Maroc > Tanger > Bel Air - Val fleuri > Avito Immobilier > Locations Immobili√®res > Appartements > Val Fleuri,"Appartement meubl√© √† louer, 2 chambres, salon, salle de bain, cuisine √©quip√©e, situ√© √† Val Fleuri",Mohammed,Particulier,il y a 5 minutes,"['https://content.avito.ma/classifieds/images/10141385622?t=images', 'https://content.avito.ma/classifieds/images/10141385613?t=images', 'https://content.avito.ma/classifieds/images/10141385610?t=images', 'https://content.avito.ma/classifieds/images/10141385623?t=images', 'https://content.avito.ma/classifieds/images/10141385612?t=images', 'https://content.avito.ma/classifieds/images/10141385624?t=images', 'https://content.avito.ma/classifieds/images/10141385625?t=images', 'https://content.avito.ma/classifieds/images/10141385626?t=images']","['2', '1', '70', '1 mois', '1', '70', 'Ascenseur', 'Balcon', 'Climatisation', 'Concierge', 'Cuisine √©quip√©e', 'Meubl√©']","{'Salle de bain': '1', 'Surface habitable': '70', 'Chambres': '2', 'Caution': '1 mois', 'Salons': '1', 'Surface totale': '70'}",2025-11-02 20:50:30.004000
57153307,https://www.avito.ma/fr/al_irfane_2/appartements/Appartement_meubl√©_1er_√©tage_57153307.htm,Appartement meubl√© 1er √©tage,3 300 DH,3300.0,"Appartements, √† louer",Home Icon Accueil > Tout le Maroc > Tanger > Al Irfane 2 > Avito Immobilier > Locations Immobili√®res > Appartements > Appartement meubl√© 1er √©tage,"üåü Appartement meubl√© √† louer - 1er √©tage üåü Emplacement : Al Irfane 2, route d'Achakkar, en face du district de s√©curit√© n¬∞12 Caract√©ristiques : 2 chambres, salon spacieux. Cuisine enti√®rement √©quip√©e et salle de bain. Enti√®rement meubl√© avec des meubles modernes et neufs. 1er √©tage - Immeuble calme et s√©curis√©. Proche de toutes commodit√©s et services. Prix : 3300 DH Conditions : C√©libataires",noureddine,Particulier,il y a 5 minutes,"['https://content.avito.ma/classifieds/images/10141385619?t=images', 'https://content.avito.ma/classifieds/images/10141385614?t=images', 'https://content.avito.ma/classifieds/images/10141385615?t=images', 'https://content.avito.ma/classifieds/images/10141385617?t=images', 'https://content.avito.ma/classifieds/images/10141385616?t=images', 'https://content.avito.ma/classifieds/images/10141385621?t=images', 'https://content.avito.ma/classifieds/images/10141385620?t=images', 'https://content.avito.ma/classifieds/images/10141385618?t=images']","['2', '1', '60', '2 mois', '50', '1', 'Balcon', 'Cuisine √©quip√©e', 'Meubl√©', 'Parking', 'S√©curit√©']","{'Salle de bain': '1', 'Frais de syndic / mois': '50', 'Chambres': '2', 'Caution': '2 mois', 'Salons': '1', 'Surface totale': '60'}",2025-11-02 20:50:30.004000
56952828,https://www.avito.ma/fr/quartier_du_parc/villas_et_riads/√†_Mohammedia_villa_√†_louer_de_160_m¬≤_56952828.htm,√† Mohammedia villa √† louer de 160 m¬≤,10 000 DH,10000.0,"Villas et Riads, √† louer",Home Icon Accueil > Tout le Maroc > Mohammedia > Quartier du Parc > Avito Immobilier > Locations Immobili√®res > Villas et Riads > √† Mohammedia villa √† louer de 160 m¬≤,"Serraj-Immobilier vous propose une petite villa situ√©e √† c√¥t√© du parc, comprenant : 3 chambres Salon S√©jour 2 salles de bain Petit jardin Superficie totale : 160 m¬≤ Superficie habitable : 100 m¬≤ Loyer : 10 000 DH/mois",Serraj immobilier,Particulier,il y a 10 minutes,"['https://content.avito.ma/classifieds/images/10140569901?t=images', 'https://content.avito.ma/classifieds/images/10140569917?t=images', 'https://content.avito.ma/classifieds/images/10140569980?t=images', 'https://content.avito.ma/classifieds/images/10140570000?t=images', 'https://content.avito.ma/classifieds/images/10140570012?t=images', 'https://content.avito.ma/classifieds/images/10140570023?t=images', 'https://content.avito.ma/classifieds/images/10140570031?t=images', 'https://content.avito.ma/classifieds/images/10140570057?t=images', 'https://content.avito.ma/classifieds/images/10140570074?t=images', 'https://content.avito.ma/classifieds/images/10140570087?t=images']","['3', '2', '1', '160']","{'Salle de bain': '2', 'Surface habitable': '160', 'Chambres': '3', 'Salons': '1'}",2025-11-02 20:50:30.004000
57153301,https://www.avito.ma/fr/la√¢youne/appartements/Appartement_√†_louer_130_m¬≤_√†_La√¢youne_57153301.htm,Appartement √† louer 130 m¬≤ √† La√¢youne,7 000 DH,7000.0,"Appartements, √† louer",Home Icon Accueil > Tout le Maroc > La√¢youne > Toute la ville > Avito Immobilier > Locations Immobili√®res > Appartements > Appartement √† louer 130 m¬≤ √† La√¢youne,Bel Appartement spacieux et lumineux √† La√¢youne,cherqaoui,Particulier,il y a 7 minutes,"['https://content.avito.ma/classifieds/images/10141385494?t=images', 'https://content.avito.ma/classifieds/images/10141385495?t=images', 'https://content.avito.ma/classifieds/images/10141385496?t=images', 'https://content.avito.ma/classifieds/images/10141385497?t=images', 'https://content.avito.ma/classifieds/images/10141385501?t=images', 'https://content.avito.ma/classifieds/images/10141385524?t=images', 'https://content.avito.ma/classifieds/images/10141385541?t=images', 'https://content.avito.ma/classifieds/images/10141385547?t=images']","['3', '2', '130', '1 mois', '2', '130', 'Concierge', 'Cuisine √©quip√©e', 'Meubl√©', 'Parking', 'S√©curit√©']","{'Salle de bain': '2', 'Surface habitable': '130', 'Chambres': '3', 'Caution': '1 mois', 'Salons': '2', 'Surface totale': '130'}",2025-11-02 20:50:30.004000
57077728,https://www.avito.ma/fr/agdal/appartements/Appartement_√†_louer_200_m¬≤_√†_Rabat_57077728.htm,Appartement √† louer 200 m¬≤ √† Rabat,14 000 DH,14000.0,"Appartements, √† louer",Home Icon Accueil > Tout le Maroc > Rabat > Agdal > Avito Immobilier > Locations Immobili√®res > Appartements > Appartement √† louer 200 m¬≤ √† Rabat,"ANOUAR IMMO vous propose √† d√©couvrir ce magnifique appartement de 200 m¬≤ , id√©alement situ√© dans le quartier tr√®s recherch√© d'Agdal √† Rabat. Nich√© au 3√®me √©tage d'un immeuble moderne et s√©curis√©, ce bien offre un cadre de vie exceptionnel pour une famille. Caract√©ristiques principales : ‚Ä¢ Superficie : 100 m¬≤ ‚Ä¢ √âtages : 3√®me √©tage ‚Ä¢ Ascenseur : Oui, pour un acc√®s facile et pratique ‚Ä¢ Composition : ‚Ä¢ 4 Chambres spacieuses, offrant confort et intimit√© pour tous les membres de la famille. ‚Ä¢ Un Grand Salon lumineux, parfait pour les moments de d√©tente et pour recevoir. ‚Ä¢ Cuisine am√©nag√©e et fonctionnelle. ‚Ä¢ Deux Salles de bains et une salle d'eau suppl√©mentaire pour les invit√©s. ‚Ä¢ Place de Garage privative, un atout majeur dans ce quartier central. ‚Ä¢ G√©n√©ralement, l'appartement b√©n√©ficie d'une bonne exposition pour un ensoleillement optimal. ‚Ä¢ Proximit√© imm√©diate des commodit√©s (√©coles, commerces, transports, restaurants). Pour plus d‚Äôinformations n‚Äôh√©sitez pas √† nous contacter ,",ANOUAR IMMO,Particulier,il y a 7 minutes,"['https://content.avito.ma/classifieds/images/10140582669?t=images', 'https://content.avito.ma/classifieds/images/10140582676?t=images', 'https://content.avito.ma/classifieds/images/10140582671?t=images', 'https://content.avito.ma/classifieds/images/10140582717?t=images', 'https://content.avito.ma/classifieds/images/10140582718?t=images', 'https://content.avito.ma/classifieds/images/10140582722?t=images', 'https://content.avito.ma/classifieds/images/10140582770?t=images', 'https://content.avito.ma/classifieds/images/10140582771?t=images', 'https://content.avito.ma/classifieds/images/10140582773?t=images', 'https://content.avito.ma/classifieds/images/10140582831?t=images', 'https://content.avito.ma/classifieds/images/10140582833?t=images', 'https://content.avito.ma/classifieds/images/10140582836?t=images', 'https://content.avito.ma/classifieds/images/10140582939?t=images', 'https://content.avito.ma/classifieds/images/10140582941?t=images', 'https://content.avito.ma/classifieds/images/10140582940?t=images', 'https://content.avito.ma/classifieds/images/10140583080?t=images', 'https://content.avito.ma/classifieds/images/10140583082?t=images', 'https://content.avito.ma/classifieds/images/10140583083?t=images']","['4', '3', '1', '200', '3', 'Ascenseur', 'Balcon', 'Concierge', 'S√©curit√©']","{'Salle de bain': '3', '√âtage': '3', 'Surface habitable': '200', 'Chambres': '4', 'Salons': '1'}",2025-11-02 18:05:15.019000
55853042,https://www.avito.ma/fr/quartier_des_h√¥pitaux/appartements/Location_studio_vide_√†_Quartier_des_h√¥pitaux_55853042.htm,Location studio vide √† Quartier des h√¥pitaux,5 500 DH,5500.0,"Appartements, √† louer",Home Icon Accueil > Tout le Maroc > Casablanca > Quartier des H√¥pitaux > Avito Immobilier > Locations Immobili√®res > Appartements > Location studio vide √† Quartier des h√¥pitaux,Location studio vide √† Quartier des h√¥pitaux 1etage avec un chambre et salon avec cuisine et salle de bain et balcon avec garage et ascenseur,Mahdi immo,Particulier,il y a 8 minutes,"['https://content.avito.ma/classifieds/images/10141346081?t=images', 'https://content.avito.ma/classifieds/images/10141346075?t=images', 'https://content.avito.ma/classifieds/images/10141346076?t=images', 'https://content.avito.ma/classifieds/images/10141346077?t=images', 'https://content.avito.ma/classifieds/images/10141346082?t=images', 'https://content.avito.ma/classifieds/images/10141346074?t=images', 'https://content.avito.ma/classifieds/images/10141346079?t=images', 'https://content.avito.ma/classifieds/images/10141346073?t=images', 'https://content.avito.ma/classifieds/images/10141346078?t=images', 'https://content.avito.ma/classifieds/images/10141346080?t=images']","['1', '1', '1 mois', '1', '5500', '1', 'Ascenseur', 'Balcon', 'Chauffage', 'Climatisation', 'Concierge', 'Cuisine √©quip√©e']","{'Salle de bain': '1', '√âtage': '1', 'Surface habitable': '5500', 'Chambres': '1', 'Caution': '1 mois', 'Salons': '1'}",2025-11-02 18:05:15.019000
57130151,https://www.avito.ma/fr/abdelmoumen/appartements/Studio_√†_louer_√†_abdelmoumen_57130151.htm,Studio √† louer √† abdelmoumen,7 500 DH,7500.0,"Appartements, √† louer",Home Icon Accueil > Tout le Maroc > Casablanca > Abdelmoumen > Avito Immobilier > Locations Immobili√®res > Appartements > Studio √† louer √† abdelmoumen,"D√©couvrez ce magnifique studio enti√®rement meubl√© et d√©cor√© avec √©l√©gance, id√©al pour une location longue dur√©e. Situ√© dans un immeuble r√©cent avec ascenseur, il offre tout le confort et le charme d‚Äôun logement moderne pr√™t √† vivre. Caract√©ristiques : ‚Ä¢ Superficie : 43 m¬≤ habitables ‚Ä¢ √âtage : 3·µâ avec ascenseur ‚Ä¢ Double fa√ßade lumineuse ‚Ä¢ Salon confortable avec canap√© d‚Äôangle et coin repas ‚Ä¢ Cuisine moderne enti√®rement √©quip√©e (plaques, four, lave-linge, micro-ondes, vaisselle, etc.) ‚Ä¢ Chambre cosy avec literie haut de gamme et rangements ‚Ä¢ Salle de bain contemporaine avec douche italienne ‚Ä¢ Climatisation ‚Ä¢ Place de parking de 13 m¬≤ incluse Emplacement : Id√©alement situ√© en face de la station de tramway Abdelmoumen, proche de tous les commerces, caf√©s et restaurants. Acc√®s rapide au centre-ville et aux principaux quartiers d‚Äôaffaires.",ELITE 24,Particulier,il y a 8 minutes,"['https://content.avito.ma/classifieds/images/10141144435?t=images', 'https://content.avito.ma/classifieds/images/10141144433?t=images', 'https://content.avito.ma/classifieds/images/10141144434?t=images', 'https://content.avito.ma/classifieds/images/10141144445?t=images', 'https://content.avito.ma/classifieds/images/10141144446?t=images', 'https://content.avito.ma/classifieds/images/10141144447?t=images']","['1', '1', '1 mois', '1', '43', 'Studio', 'Ascenseur', 'Chauffage', 'Climatisation', 'Concierge', 'Cuisine √©quip√©e', 'Meubl√©']","{""Type d'appartement"": 'Studio', 'Salle de bain': '1', 'Surface habitable': '43', 'Chambres': '1', 'Caution': '1 mois', 'Salons': '1'}",2025-11-02 18:05:15.019000
57109045,https://www.avito.ma/fr/abdelmoumen/appartements/Studio_√†_louer_47_m¬≤_√†_Casablanca_57109045.htm,Studio √† louer 47 m¬≤ √† Casablanca,8 500 DH,8500.0,"Appartements, √† louer",Home Icon Accueil > Tout le Maroc > Casablanca > Abdelmoumen > Avito Immobilier > Locations Immobili√®res > Appartements > Studio √† louer 47 m¬≤ √† Casablanca,"√Ä Louer ‚Äì Studio Meubl√© Neuf ‚Äì Quartier Les H√¥pitaux üìç Tr√®s bien situ√©, dans une r√©sidence r√©cente et s√©curis√©e, proche du tram, caf√©s, restaurants, banques, cliniques et toutes commodit√©s. Ce studio moderne enti√®rement meubl√© se trouve au √©tage (√† pr√©ciser) et b√©n√©ficie d‚Äôune belle terrasse id√©ale pour se d√©tendre. Caract√©ristiques : Espace de vie lumineux avec acc√®s terrasse Cuisine am√©ricaine √©quip√©e (frigo, plaques, hotte, micro-ondes, etc.) Salle de bain moderne avec douche italienne Climatisation / chauffage Mobilier neuf et d√©coration soign√©e R√©sidence s√©curis√©e 24/24 Ascenseur Place de parking (optionnelle / incluse √† pr√©ciser) Points forts : Studio neuf et jamais habit√© ou en excellent √©tat Quartier central et recherch√© Terrasse exploitable (calme) PRIX : 8500 DH 2 MOIS DE CAUTION 1 MOIS FRAIS D'AGENCE",SAKAN LIK GROUPE,Particulier,il y a 8 minutes,"['https://content.avito.ma/classifieds/images/10141368941?t=images', 'https://content.avito.ma/classifieds/images/10141368933?t=images', 'https://content.avito.ma/classifieds/images/10141368937?t=images', 'https://content.avito.ma/classifieds/images/10141368940?t=images', 'https://content.avito.ma/classifieds/images/10141368932?t=images', 'https://content.avito.ma/classifieds/images/10141368935?t=images', 'https://content.avito.ma/classifieds/images/10141368936?t=images', 'https://content.avito.ma/classifieds/images/10141368939?t=images', 'https://content.avito.ma/classifieds/images/10141368942?t=images']","['1', '1', '46', '2 mois', '1', '50', 'Ascenseur', 'Chauffage', 'Climatisation', 'Concierge', 'Cuisine √©quip√©e', 'Meubl√©']","{'Salle de bain': '1', 'Surface habitable': '50', 'Chambres': '1', 'Caution': '2 mois', 'Salons': '1', 'Surface totale': '46'}",2025-11-02 18:05:15.019000
55105755,https://www.avito.ma/fr/targa/villas_et_riads/Location_belle_Maison_55105755.htm,Location belle Maison,2 500 DH,2500.0,"Villas et Riads, √† louer",Home Icon Accueil > Tout le Maroc > Marrakech > Targa > Avito Immobilier > Locations Immobili√®res > Villas et Riads > Location belle Maison,"Je met en location une belle Maison sous forme d'une ferme situ√© a 16 Km de Marrakech Route de Targa Douar Aarich, dans un environnement calme, Ensoleill√©, et s√©curis√©. Elle se compose de : - Entr√©e spacieuse - 1 salon - 5 chambres - 2 salles de bains - grande terrasse - piscine - jardin NB: 2500 dhs la nuit√©e pour 3 chambres, minimum deux (2) nuit√©e 4000 dhs la nuit√©e pour 5 chambres, minimum deux (2) nuit√©e Location juste pour les familles.",Halim,Particulier,il y a 5 heures,"['https://content.avito.ma/classifieds/images/10121034468?t=images', 'https://content.avito.ma/classifieds/images/10121034472?t=images', 'https://content.avito.ma/classifieds/images/10121034469?t=images', 'https://content.avito.ma/classifieds/images/10121034471?t=images', 'https://content.avito.ma/classifieds/images/10121034466?t=images', 'https://content.avito.ma/classifieds/images/10121034467?t=images', 'https://content.avito.ma/classifieds/images/10121034470?t=images']","['3', '2', '1', '1', '2000', 'Balcon', 'Climatisation', 'Cuisine √©quip√©e', 'Jardin', 'Parking', 'Piscine']","{""Nombre d'√©tage"": '1', 'Salle de bain': '2', 'Surface habitable': '2000', 'Chambres': '3', 'Salons': '1'}",2025-11-02 19:40:15.005000
57020720,https://www.avito.ma/fr/lissasfa/bureaux/Bureau_√†_louer_d_une_superficie_29_m¬≤_57020720.htm,Bureau √† louer d'une superficie 29 m¬≤,2 755 DH,2755.0,"Bureaux, √† louer",Home Icon Accueil > Tout le Maroc > Casablanca > Lissasfa > Avito Immobilier > Bureaux > Bureau √† louer d'une superficie 29 m¬≤,"FBC met √† votre disposition un plateau bureau 306 B √† louer de 29 m¬≤ , situ√© d'un espace professionnel, s√©curis√©, calme et propre.sis au 2 √®me √©tage bien √©quip√©: climatisation, 2 ascenseurs, cloisons, chauffage, parking et internet haut d√©bit ( fibre optique) , kitchenette, acc√®s direct √† deux autoroute celle de rond point Azbane et la Rocade sud-ouest. Pour plus d'information n'h√©sitez pas √† nous contacter.",FACILITIES BUSINESS CENTER,Particulier,il y a 9 heures,"['https://content.avito.ma/classifieds/images/10139960360?t=images', 'https://content.avito.ma/classifieds/images/10139960362?t=images', 'https://content.avito.ma/classifieds/images/10139960361?t=images']","['1', '29', '2', '3', 'Ascenseur', 'Chauffage', 'Climatisation', 'C√¢blage t√©l√©phonique', 'Parking', 'S√©curit√©']","{'Nombre de pi√®ces': '2', 'Salle de bain': '1', '√âtage': '3', 'Surface totale': '29'}",2025-11-02 19:40:15.005000


+------------+
|price_text  |
+------------+
|7 000 DH    |
|1 080 000 DH|
|2 011 500 DH|
|3 300 DH    |
|8 500 DH    |
|10 000 DH   |
|1 450 000 DH|
|7 500 DH    |
|5 000 DH    |
|594 000 DH  |
|14 000 DH   |
|5 500 DH    |
|6 500 DH    |
|1 850 000 DH|
|320 000 DH  |
|16 500 DH   |
|3 600 DH    |
|1 099 DH    |
|6 650 000 DH|
|9 500 DH    |
+------------+
only showing top 20 rows



In [301]:
from pyspark.sql import functions as F

ID_COL = "id"  # change if your column is named differently
df = silver_df.withColumn("id_norm", F.trim(F.col(ID_COL).cast("string")))

In [302]:
total_rows    = df.count()
distinct_ids  = df.select("id_norm").distinct().count()
dup_row_count = total_rows - distinct_ids
print(f"Total rows = {total_rows} | Distinct IDs = {distinct_ids} | Duplicate rows (extra) = {dup_row_count}")

Total rows = 417 | Distinct IDs = 331 | Duplicate rows (extra) = 86


In [303]:
from pyspark.sql import functions as F

# (optionnel) filtrer les id vides
silver_df = silver_df.filter(F.col("id").isNotNull() & (F.trim(F.col("id")) != ""))

silver_df = (
    silver_df
      .withColumn("id_norm",
                  F.regexp_replace(F.trim(F.col("id").cast("string")), r"\s+", ""))
      .dropDuplicates(["id_norm"])
      .drop("id_norm")
)

In [304]:
total_rows    = df.count()
distinct_ids  = df.select("id_norm").distinct().count()
dup_row_count = total_rows - distinct_ids
print(f"Total rows = {total_rows} | Distinct IDs = {distinct_ids} | Duplicate rows (extra) = {dup_row_count}")

Total rows = 417 | Distinct IDs = 331 | Duplicate rows (extra) = 86


In [305]:
from pyspark.sql import functions as F

silver_df.select(
    F.when(F.col("price_text").isNull(), F.lit("NULL"))
     .otherwise(F.col("price_text"))
     .alias("price_text")
).show(10, truncate=False)


+----------+
|price_text|
+----------+
|594 000 DH|
|195 000 DH|
|7 200 DH  |
|12 000 DH |
|4 600 DH  |
|NULL      |
|NULL      |
|4 536 DH  |
|NULL      |
|NULL      |
+----------+
only showing top 10 rows



In [306]:
silver_df = (
    silver_df
      # Rename 'price_value_mad' to 'price_value'
      .withColumnRenamed("price_value_mad", "price_value")
      # Drop 'price_text' column
      .drop("price_text")
)

In [307]:
import pandas as pd
from IPython.display import display

# Keep things compact
pd.set_option("display.max_columns", 20)   # don't try to show hundreds
pd.set_option("display.max_colwidth", 80)  # clamp long cells to ~80 chars

# pick a small sample and flatten newlines so rows stay short
pdf = (silver_df.limit(10)
       .toPandas()
       .replace({r'[\r\n\t]+': ' '}, regex=True))

# simple, compact table with ellipsis in long cells
display(
    pdf.style
      .set_table_styles([
          {'selector': 'table', 'props': [('table-layout','fixed'), ('width','100%')]},
          {'selector': 'th, td', 'props': [
              ('max-width','280px'),
              ('white-space','nowrap'),
              ('overflow','hidden'),
              ('text-overflow','ellipsis')
          ]}
      ])
      .hide(axis='index')  # remove row numbers
)
# show all distinct price_text values


id,url,title,price_value,category,breadcrumbs,description,seller_name,seller_type,published_date_text,image_urls,equipments,attributes_map,ingest_ts
31752899,https://www.avito.ma/fr/centre_ville/appartements/Appartement_√†_vendre_de_68_√†_157m¬≤_√†_Mohammedia_31752899.htm,Appartement √† vendre de 68 √† 157m¬≤ √† Mohammedia,594000.0,"Appartements, √† vendre",Home Icon Accueil > Tout le Maroc > Mohammedia > Centre Ville > Avito Immobilier > Ventes Immobili√®res > Appartements > Appartement √† vendre de 68 √† 157m¬≤ √† Mohammedia,"La r√©sidence de Tulipes est situ√©e √† l'entr√©e sud de Mohammedia, en direction du grand parc, √† quelques minutes des plages, de l‚Äôautoroute et de la gare ferroviaire et √† 15min seulement de la m√©tropole Casablanca. Le projet se d√©marque par sa conception architecturale et ses mat√©riaux alliant modernit√© et raffinement, con√ßu en R5 avec ascenseurs et places de parking privatives en sous-sol. Appartements avec installations soign√©es, de 68 √† 157m¬≤, comprenant un salon, 2 √† 3 chambres spacieuses avec balcon et une cuisine √©quip√©e.",CHAABI LIL ISKANE,Particulier,il y a 8 minutes,"['https://content.avito.ma/classifieds/images/10045572961?t=images', 'https://content.avito.ma/classifieds/images/10045572874?t=images', 'https://content.avito.ma/classifieds/images/10138692631?t=images', 'https://content.avito.ma/classifieds/images/10045573108?t=images', 'https://content.avito.ma/classifieds/images/10045573122?t=images', 'https://content.avito.ma/classifieds/images/10045573009?t=images', 'https://content.avito.ma/classifieds/images/10045572986?t=images', 'https://content.avito.ma/classifieds/images/10138692700?t=images']","['2', '2', 'Neuf', 'Imm√©diate', '1', 'Economique', 'Ascenseur', 'Balcon', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']","{'Condition': 'Neuf', 'Disponibilit√©': 'Imm√©diate', 'Salle de bain': '2', 'Standing': 'Economique', 'Chambres': '2', 'Salons': '1'}",2025-11-02 21:20:30.004000
37619566,https://www.avito.ma/fr/autre_secteur/appartements/Appartement_Riad_Essalam_Beni_Yekhlef__Mohammedia_37619566.htm,Appartement Riad Essalam Beni Yekhlef- Mohammedia,195000.0,"Appartements, √† vendre",Home Icon Accueil > Tout le Maroc > Mohammedia > Autre secteur > Avito Immobilier > Ventes Immobili√®res > Appartements > Appartement Riad Essalam Beni Yekhlef- Mohammedia,R√©sidences √©conomiques avec ascenseurs. Une Chambre/ salon/ cuisine/salle de bain. Prix : 195 000DH Livraison imm√©diate.,Groupe Ikamati,Particulier,il y a 2 heures,"['https://content.avito.ma/classifieds/images/2533557603?t=images', 'https://content.avito.ma/classifieds/images/2539801094?t=images', 'https://content.avito.ma/classifieds/images/2516510965?t=images', 'https://content.avito.ma/classifieds/images/2504023983?t=images', 'https://content.avito.ma/classifieds/images/2582417689?t=images', 'https://content.avito.ma/classifieds/images/2572806528?t=images']","['1', '1', 'Neuf', 'Imm√©diate', '0', 'Economique', 'Ascenseur']","{'Condition': 'Neuf', 'Disponibilit√©': 'Imm√©diate', 'Salle de bain': '1', 'Standing': 'Economique', 'Chambres': '1', 'Salons': '0'}",2025-11-02 21:20:15.004000
37621281,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartement_Sidi_Bernoussi_R√©sidences_Al_Badr_37621281.htm,Appartement Sidi Bernoussi R√©sidences Al Badr,7200.0,"Appartements, √† vendre",Home Icon Accueil > Tout le Maroc > Casablanca > Sidi Bernoussi > Avito Immobilier > Ventes Immobili√®res > Appartements > Appartement Sidi Bernoussi R√©sidences Al Badr,"Complexe r√©sidentiel Al Badr est un projet moyen standing du Groupe Ikamati situ√© au meilleur quartier √† Sidi Bernoussi proche de toutes les commodit√©s n√©cessaires : √âcoles priv√©es et publiques, commerces de proximit√©, boulangeries, p√¢tisseries, caf√©s, pharmacies, hammam, plateaux de bureau,‚Ä¶ Avec un acc√®s direct √† l‚Äôautoroute Casablanca ‚ÄìRabat. Des appartements livrables dans l‚Äôimm√©diat avec des superficies qui varient entre 74m¬≤ et 96m¬≤. Dot√©s d‚Äôune finition irr√©prochable : cuisines √©quip√©es, carrelage de qualit√© premium, volets roulants motoris√©s, l‚Äôutilisation du bois de ch√™ne,‚Ä¶ Les r√©sidences sont s√©curis√©es 24h/24 et 7j/7j. A l‚Äôoccasion de la saison d'√©t√© on vous offre une offre exclusive : le tout √† 7200 dh m¬≤ au lieu de 8200dh/m¬≤. offre limit√©e et valable jusqu'au 31/08/2023. Pour plus d‚Äôinformations, appelez nous ou visitez nos bureaux de vente ouverts toute la semaine et m√™me les week-ends de 9h √† 19h.",Groupe Ikamati,Particulier,il y a 8 minutes,"['https://content.avito.ma/classifieds/images/9761138868?t=images', 'https://content.avito.ma/classifieds/images/9751423563?t=images', 'https://content.avito.ma/classifieds/images/9792952316?t=images', 'https://content.avito.ma/classifieds/images/9771942015?t=images', 'https://content.avito.ma/classifieds/images/9712278782?t=images']","['3', '100', 'Neuf', '49', 'Moins de 1 an', '0', 'Ascenseur', 'Balcon', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']","{'Condition': 'Neuf', '√âtage': '0', 'Surface habitable': '49', 'Chambres': '3', 'Surface totale': '100', '√Çge du bien': 'Moins de 1 an'}",2025-11-02 21:40:30.003000
40564118,https://www.avito.ma/fr/hay_el_fath/bureaux/Bureau_de_74_√†_114_m¬≤_√†_Hay_Al_Fath_40564118.htm,Bureau de 74 √† 114 m¬≤ √† Hay Al Fath,12000.0,"Bureaux, √† louer",Home Icon Accueil > Tout le Maroc > Rabat > Hay el Fath > Avito Immobilier > Bureaux > Bureau de 74 √† 114 m¬≤ √† Hay Al Fath,"Pour un investissement rentable, Riad Al Fath Offices vous propose des bureaux enti√®rement modulables et un large choix de superficie open space pour r√©pondre aux diff√©rentes attentes de nos clients professionnels. ‚Ä¢ Livraison : Imm√©diate ‚Ä¢ Superficie : de 74 √† 114 m¬≤ ‚Ä¢ Prix du m¬≤ : 12 000 Dhs/m¬≤ ‚Ä¢ Adresse : Avenue Al Majd, Hay Al Fath ‚Ä¢ Equipements : Des places de parking sous-sol, les transports publics, centre commercial.",CHAABI LIL ISKANE,Particulier,il y a 4 minutes,['https://content.avito.ma/classifieds/images/2118180349?t=images'],"['1', '1', '1', 'Ascenseur', 'C√¢blage t√©l√©phonique', 'Parking', 'S√©curit√©', 'Terrasse']","{'Nombre de pi√®ces': '1', 'Salle de bain': '1', '√âtage': '1'}",2025-11-02 19:00:15.003000
42098023,https://www.avito.ma/fr/autre_secteur/villas_et_riads/LOTS_DE_VILLAS_DE_294_√Ä_555_M¬≤_√Ä_SALA_AL_JADIDA_42098023.htm,LOTS DE VILLAS DE 294 √Ä 555 M¬≤ √Ä SALA AL JADIDA,4600.0,"Villas et Riads, √† louer",Home Icon Accueil > Tout le Maroc > Rabat > Autre secteur > Avito Immobilier > Locations Immobili√®res > Villas et Riads > LOTS DE VILLAS DE 294 √Ä 555 M¬≤ √Ä SALA AL JADIDA,"D√©sirez-vous devenir propri√©taire d‚Äôune villa et d√©velopper votre patrimoine ? Le lotissement AL MAAMORA vous propose des lots de villas exceptionnels, en bande ou isol√©es, dans un site calme et prosp√®re. Des lots viabilis√©s et √©quip√©s, de 294 √† 555m¬≤, √† am√©nager en R1 avec sous-sol. Alors, il ne vous reste plus qu‚Äô√† choisir votre morceau de bonheur. Type de logement : Lot de villa Type Immeuble : R1 Consistance : S-s/RDC & 1 √©tage Adresse du projet : Av Lalla Meryem, (Zone villas) en face mosqu√©e Mohammed VI - Sala Al Jadida Equipements du projet : -Centre commercial -Commerces -Ecoles, universit√© -Espace de jeux -Espaces verts -Mosqu√©e -Piscine couverte",CHAABI LIL ISKANE,Particulier,il y a 2 minutes,['https://content.avito.ma/classifieds/images/10000902595?t=images'],"['4', '551', 'Balcon', 'Garage', 'Jardin', 'Parking', 'Piscine', 'S√©curit√©']","{'Chambres': '4', 'Surface habitable': '551'}",2025-11-02 18:25:15.008000
49592977,https://www.avito.ma/fr/autre_secteur/appartements/Appartements_en_location_√†_Ifrane_49592977.htm,Appartements en location √† Ifrane,,"Appartements, √† louer",Home Icon Accueil > Tout le Maroc > Ifrane > Autre secteur > Avito Immobilier > Locations Immobili√®res > Appartements > Appartements en location √† Ifrane,"Appartements meubl√©s en location √† Ifrane centre ville prix raisonnable seulement pour les familles ,",location de vacances √† ifrane et Agadir,Particulier,il y a 10 minutes,"['https://content.avito.ma/classifieds/images/10060556983?t=images', 'https://content.avito.ma/classifieds/images/10060556994?t=images', 'https://content.avito.ma/classifieds/images/10060556993?t=images', 'https://content.avito.ma/classifieds/images/10060556990?t=images', 'https://content.avito.ma/classifieds/images/10060556989?t=images', 'https://content.avito.ma/classifieds/images/10060556987?t=images']","['2', '2', '111', '1', '92', 'Duplex', 'Ascenseur', 'Balcon', 'Chauffage', 'Concierge', 'Cuisine √©quip√©e', 'Meubl√©']","{""Type d'appartement"": 'Duplex', 'Salle de bain': '2', 'Surface habitable': '92', 'Chambres': '2', 'Salons': '1', 'Surface totale': '111'}",2025-11-02 19:50:30.005000
51617155,https://www.avito.ma/fr/hay_riad/villas_et_riads/Villa_4_fa√ßades_ensoleill√©e_3_niveaux_51617155.htm,Villa 4 fa√ßades ensoleill√©e 3 niveaux,,"Villas et Riads, √† vendre",Home Icon Accueil > Tout le Maroc > Rabat > Hay Riad > Avito Immobilier > Ventes Immobili√®res > Villas et Riads > Villa 4 fa√ßades ensoleill√©e 3 niveaux,"Villa √† vendre de 432m¬≤ avec emplacement id√©al sur Rabat Hay Riad. Sur 3 niveaux, ensoleill√©e toute la journ√©e. Pour plus d'informations, veuillez contacter Mr Rachid.",High immo,Particulier,il y a 9 minutes,"['https://content.avito.ma/classifieds/images/10083192685?t=images', 'https://content.avito.ma/classifieds/images/10083192718?t=images', 'https://content.avito.ma/classifieds/images/10083192817?t=images', 'https://content.avito.ma/classifieds/images/10083192763?t=images', 'https://content.avito.ma/classifieds/images/10083192802?t=images']","['5', '4', '432', '3', '3', '360']","{""Nombre d'√©tage"": '3', 'Salle de bain': '4', 'Surface habitable': '360', 'Chambres': '5', 'Salons': '3', 'Surface totale': '432'}",2025-11-02 22:00:30.004000
53020607,https://www.avito.ma/fr/lissasfa/bureaux/Bureaux_√†_louer_PL_N_201_D_53020607.htm,Bureaux √† louer PL N 201 D,4536.0,"Bureaux, √† louer",Home Icon Accueil > Tout le Maroc > Casablanca > Lissasfa > Avito Immobilier > Bureaux > Bureaux √† louer PL N 201 D,Location de plateau bureau d'une superficie de 36 m¬≤ √† lissasfa dans un immeuble professionnel s√©curis√© propre et calme sis au 2√®me √©tage bien √©quip√© Climatisation Internet fibre optique haut d√©bit 2 ascenseurs cloisons chauffage parking (places limit√©s) Acc√®s direct √† deux autoroutes celle de rond point Azbane et la Rocade sud-Ouest Trajet direct vers l'a√©roport √† environ de 30 min.,FACILITIES BUSINESS CENTER,Particulier,il y a 3 heures,"['https://content.avito.ma/classifieds/images/10098185495?t=images', 'https://content.avito.ma/classifieds/images/10123168302?t=images', 'https://content.avito.ma/classifieds/images/10123168303?t=images', 'https://content.avito.ma/classifieds/images/10123168341?t=images', 'https://content.avito.ma/classifieds/images/10123168342?t=images', 'https://content.avito.ma/classifieds/images/10123168383?t=images']","['1', '36', '1', '1', '1', 'Ascenseur', 'Chauffage', 'Climatisation', 'C√¢blage t√©l√©phonique', 'Parking', 'S√©curit√©']","{'Nombre de pi√®ces': '1', 'Salle de bain': '1', 'Frais de syndic / mois': '1', '√âtage': '1', 'Surface totale': '36'}",2025-11-02 18:35:15.010000
53079995,https://www.avito.ma/fr/hay_mohammadi/bureaux/Bureaux_√†_louer_√†_Casablanca_53079995.htm,Bureaux √† louer √† Casablanca,,"Bureaux, √† louer",Home Icon Accueil > Tout le Maroc > Casablanca > Hay Mohammadi > Avito Immobilier > Bureaux > Bureaux √† louer √† Casablanca,Plateau bureau Neuf √† louer pour usage professionnel sur Boulevard de la grande ceinture Emplacement - √† 1 minute de la sortie de l‚Äôautoroute express - √† 5 minutes d'A√Øn Seba√¢ et en face √† pr√©fecture mowahidin sur le boulevard principal - Bureaux lumineux et spacieux - Un immeuble imposant de trois √©tages dot√© d'une fa√ßade moderne Equipement - Pr√©-installation de la climatisation - C√¢blage informatique install√© - √âquipement t√©l√©phonique - Cam√©ras - Ascenseurs - l‚Äôimmeuble se compose d‚Äôune cour arri√®re qui aura acc√®s √† partir des bureaux arri√®re Contactez-nous pour une visite sur place,Plateaux bureaux Al-hizam,Particulier,il y a 6 heures,"['https://content.avito.ma/classifieds/images/10140667343?t=images', 'https://content.avito.ma/classifieds/images/10140668229?t=images', 'https://content.avito.ma/classifieds/images/10098872001?t=images', 'https://content.avito.ma/classifieds/images/10098872000?t=images', 'https://content.avito.ma/classifieds/images/10098871991?t=images', 'https://content.avito.ma/classifieds/images/10098872075?t=images', 'https://content.avito.ma/classifieds/images/10136234190?t=images', 'https://content.avito.ma/classifieds/images/10098872990?t=images', 'https://content.avito.ma/classifieds/images/10098871993?t=images', 'https://content.avito.ma/classifieds/images/10098872004?t=images', 'https://content.avito.ma/classifieds/images/10098871995?t=images']","['1', '1', 'Ascenseur', 'Climatisation', 'C√¢blage t√©l√©phonique', 'S√©curit√©', 'Terrasse']","{'Nombre de pi√®ces': '1', '√âtage': '1'}",2025-11-02 19:50:15.005000
53080322,https://www.avito.ma/fr/hay_mohammadi/bureaux/Plateau_bureau_Neuf_√†_louer_BD_grande_ceinture_53080322.htm,Plateau bureau Neuf √† louer BD grande ceinture,,"Bureaux, √† louer",Home Icon Accueil > Tout le Maroc > Casablanca > Hay Mohammadi > Avito Immobilier > Bureaux > Plateau bureau Neuf √† louer BD grande ceinture,Plateau bureau Neuf √† louer pour usage professionnel sur Boulevard de la grande ceinture Emplacement - √† 1 minute de la sortie de l‚Äôautoroute express - √† 5 minutes d'A√Øn Seba√¢ et en face √† pr√©fecture mowahidin sur le boulevard principal - Bureaux lumineux et spacieux - Un immeuble imposant de trois √©tages dot√© d'une fa√ßade moderne Equipement - Pr√©-installation de la climatisation - C√¢blage informatique install√© - √âquipement t√©l√©phonique - Cam√©ras - Ascenseurs - l‚Äôimmeuble se compose d‚Äôune cour arri√®re qui aura acc√®s √† partir des bureaux arri√®re Contactez-nous pour une visite sur place.,Plateaux bureaux Al-hizam,Particulier,il y a 4 heures,"['https://content.avito.ma/classifieds/images/10139622581?t=images', 'https://content.avito.ma/classifieds/images/10110560368?t=images', 'https://content.avito.ma/classifieds/images/10118120028?t=images', 'https://content.avito.ma/classifieds/images/10098875906?t=images', 'https://content.avito.ma/classifieds/images/10098875908?t=images', 'https://content.avito.ma/classifieds/images/10098875882?t=images', 'https://content.avito.ma/classifieds/images/10098875880?t=images', 'https://content.avito.ma/classifieds/images/10098875881?t=images', 'https://content.avito.ma/classifieds/images/10098875883?t=images', 'https://content.avito.ma/classifieds/images/10098876030?t=images', 'https://content.avito.ma/classifieds/images/10098876043?t=images', 'https://content.avito.ma/classifieds/images/10098875905?t=images', 'https://content.avito.ma/classifieds/images/10098875878?t=images']","['1', '1', '2', 'Ascenseur', 'Climatisation', 'C√¢blage t√©l√©phonique', 'S√©curit√©', 'Terrasse']","{'Nombre de pi√®ces': '1', 'Salle de bain': '1', '√âtage': '2'}",2025-11-02 18:55:15.005000


In [308]:
silver_df.select("category").distinct().show(truncate=False)

+----------------------------+
|category                    |
+----------------------------+
|Maisons, √† louer            |
|Autre Immobilier, √† vendre  |
|Bureaux, √† louer            |
|Local, √† louer              |
|Appartements, √† louer       |
|Local, √† vendre             |
|Villas et Riads, √† louer    |
|Bureaux, √† vendre           |
|Maisons, √† vendre           |
|Terrains et fermes, √† vendre|
|Autre Immobilier, √† louer   |
|Appartements, √† vendre      |
|Villas et Riads, √† vendre   |
|NULL                        |
+----------------------------+



In [309]:
from pyspark.sql import functions as F

silver_df = (
    silver_df
      # Create 'type' column for '√† louer' or '√† vendre'
      .withColumn(
          "type",
          F.when(F.col("category").contains("√† louer"), "√† louer")
           .when(F.col("category").contains("√† vendre"), "√† vendre")
           .otherwise(None)
      )
      # Create 'category_type' column with only the property type (e.g., Maisons, Appartements)
      .withColumn(
          "category_type",
          F.when(F.col("category").contains("√† louer") | F.col("category").contains("√† vendre"), 
                 F.split(F.col("category"), ",")[0])
           .otherwise(None)
      )
      # Drop the original 'category' column
      .drop("category")
)

# Check the result
silver_df.select("type", "category_type").show(30, truncate=False)


+--------+------------------+
|type    |category_type     |
+--------+------------------+
|√† vendre|Appartements      |
|√† vendre|Appartements      |
|√† vendre|Appartements      |
|√† louer |Bureaux           |
|√† louer |Villas et Riads   |
|√† louer |Appartements      |
|√† vendre|Villas et Riads   |
|√† louer |Bureaux           |
|√† louer |Bureaux           |
|√† louer |Bureaux           |
|√† vendre|Appartements      |
|√† louer |Bureaux           |
|√† louer |Appartements      |
|√† louer |Appartements      |
|√† vendre|Maisons           |
|√† louer |Appartements      |
|√† louer |Bureaux           |
|√† vendre|Appartements      |
|√† vendre|Appartements      |
|√† vendre|Maisons           |
|√† louer |Bureaux           |
|√† vendre|Terrains et fermes|
|√† vendre|Local             |
|√† vendre|Local             |
|√† vendre|Appartements      |
|√† louer |Villas et Riads   |
|√† louer |Appartements      |
|√† louer |Appartements      |
|√† louer |Bureaux           |
|√† louer |

In [310]:
import pandas as pd
from IPython.display import display

# Keep things compact
pd.set_option("display.max_columns", 20)   # don't try to show hundreds
pd.set_option("display.max_colwidth", 80)  # clamp long cells to ~80 chars

# pick a small sample and flatten newlines so rows stay short
pdf = (silver_df.limit(10)
       .toPandas()
       .replace({r'[\r\n\t]+': ' '}, regex=True))

# simple, compact table with ellipsis in long cells
display(
    pdf.style
      .set_table_styles([
          {'selector': 'table', 'props': [('table-layout','fixed'), ('width','100%')]},
          {'selector': 'th, td', 'props': [
              ('max-width','280px'),
              ('white-space','nowrap'),
              ('overflow','hidden'),
              ('text-overflow','ellipsis')
          ]}
      ])
      .hide(axis='index')  # remove row numbers
)

id,url,title,price_value,breadcrumbs,description,seller_name,seller_type,published_date_text,image_urls,equipments,attributes_map,ingest_ts,type,category_type
31752899,https://www.avito.ma/fr/centre_ville/appartements/Appartement_√†_vendre_de_68_√†_157m¬≤_√†_Mohammedia_31752899.htm,Appartement √† vendre de 68 √† 157m¬≤ √† Mohammedia,594000.0,Home Icon Accueil > Tout le Maroc > Mohammedia > Centre Ville > Avito Immobilier > Ventes Immobili√®res > Appartements > Appartement √† vendre de 68 √† 157m¬≤ √† Mohammedia,"La r√©sidence de Tulipes est situ√©e √† l'entr√©e sud de Mohammedia, en direction du grand parc, √† quelques minutes des plages, de l‚Äôautoroute et de la gare ferroviaire et √† 15min seulement de la m√©tropole Casablanca. Le projet se d√©marque par sa conception architecturale et ses mat√©riaux alliant modernit√© et raffinement, con√ßu en R5 avec ascenseurs et places de parking privatives en sous-sol. Appartements avec installations soign√©es, de 68 √† 157m¬≤, comprenant un salon, 2 √† 3 chambres spacieuses avec balcon et une cuisine √©quip√©e.",CHAABI LIL ISKANE,Particulier,il y a 8 minutes,"['https://content.avito.ma/classifieds/images/10045572961?t=images', 'https://content.avito.ma/classifieds/images/10045572874?t=images', 'https://content.avito.ma/classifieds/images/10138692631?t=images', 'https://content.avito.ma/classifieds/images/10045573108?t=images', 'https://content.avito.ma/classifieds/images/10045573122?t=images', 'https://content.avito.ma/classifieds/images/10045573009?t=images', 'https://content.avito.ma/classifieds/images/10045572986?t=images', 'https://content.avito.ma/classifieds/images/10138692700?t=images']","['2', '2', 'Neuf', 'Imm√©diate', '1', 'Economique', 'Ascenseur', 'Balcon', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']","{'Condition': 'Neuf', 'Disponibilit√©': 'Imm√©diate', 'Salle de bain': '2', 'Standing': 'Economique', 'Chambres': '2', 'Salons': '1'}",2025-11-02 21:20:30.004000,√† vendre,Appartements
37619566,https://www.avito.ma/fr/autre_secteur/appartements/Appartement_Riad_Essalam_Beni_Yekhlef__Mohammedia_37619566.htm,Appartement Riad Essalam Beni Yekhlef- Mohammedia,195000.0,Home Icon Accueil > Tout le Maroc > Mohammedia > Autre secteur > Avito Immobilier > Ventes Immobili√®res > Appartements > Appartement Riad Essalam Beni Yekhlef- Mohammedia,R√©sidences √©conomiques avec ascenseurs. Une Chambre/ salon/ cuisine/salle de bain. Prix : 195 000DH Livraison imm√©diate.,Groupe Ikamati,Particulier,il y a 2 heures,"['https://content.avito.ma/classifieds/images/2533557603?t=images', 'https://content.avito.ma/classifieds/images/2539801094?t=images', 'https://content.avito.ma/classifieds/images/2516510965?t=images', 'https://content.avito.ma/classifieds/images/2504023983?t=images', 'https://content.avito.ma/classifieds/images/2582417689?t=images', 'https://content.avito.ma/classifieds/images/2572806528?t=images']","['1', '1', 'Neuf', 'Imm√©diate', '0', 'Economique', 'Ascenseur']","{'Condition': 'Neuf', 'Disponibilit√©': 'Imm√©diate', 'Salle de bain': '1', 'Standing': 'Economique', 'Chambres': '1', 'Salons': '0'}",2025-11-02 21:20:15.004000,√† vendre,Appartements
37621281,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartement_Sidi_Bernoussi_R√©sidences_Al_Badr_37621281.htm,Appartement Sidi Bernoussi R√©sidences Al Badr,7200.0,Home Icon Accueil > Tout le Maroc > Casablanca > Sidi Bernoussi > Avito Immobilier > Ventes Immobili√®res > Appartements > Appartement Sidi Bernoussi R√©sidences Al Badr,"Complexe r√©sidentiel Al Badr est un projet moyen standing du Groupe Ikamati situ√© au meilleur quartier √† Sidi Bernoussi proche de toutes les commodit√©s n√©cessaires : √âcoles priv√©es et publiques, commerces de proximit√©, boulangeries, p√¢tisseries, caf√©s, pharmacies, hammam, plateaux de bureau,‚Ä¶ Avec un acc√®s direct √† l‚Äôautoroute Casablanca ‚ÄìRabat. Des appartements livrables dans l‚Äôimm√©diat avec des superficies qui varient entre 74m¬≤ et 96m¬≤. Dot√©s d‚Äôune finition irr√©prochable : cuisines √©quip√©es, carrelage de qualit√© premium, volets roulants motoris√©s, l‚Äôutilisation du bois de ch√™ne,‚Ä¶ Les r√©sidences sont s√©curis√©es 24h/24 et 7j/7j. A l‚Äôoccasion de la saison d'√©t√© on vous offre une offre exclusive : le tout √† 7200 dh m¬≤ au lieu de 8200dh/m¬≤. offre limit√©e et valable jusqu'au 31/08/2023. Pour plus d‚Äôinformations, appelez nous ou visitez nos bureaux de vente ouverts toute la semaine et m√™me les week-ends de 9h √† 19h.",Groupe Ikamati,Particulier,il y a 8 minutes,"['https://content.avito.ma/classifieds/images/9761138868?t=images', 'https://content.avito.ma/classifieds/images/9751423563?t=images', 'https://content.avito.ma/classifieds/images/9792952316?t=images', 'https://content.avito.ma/classifieds/images/9771942015?t=images', 'https://content.avito.ma/classifieds/images/9712278782?t=images']","['3', '100', 'Neuf', '49', 'Moins de 1 an', '0', 'Ascenseur', 'Balcon', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']","{'Condition': 'Neuf', '√âtage': '0', 'Surface habitable': '49', 'Chambres': '3', 'Surface totale': '100', '√Çge du bien': 'Moins de 1 an'}",2025-11-02 21:40:30.003000,√† vendre,Appartements
40564118,https://www.avito.ma/fr/hay_el_fath/bureaux/Bureau_de_74_√†_114_m¬≤_√†_Hay_Al_Fath_40564118.htm,Bureau de 74 √† 114 m¬≤ √† Hay Al Fath,12000.0,Home Icon Accueil > Tout le Maroc > Rabat > Hay el Fath > Avito Immobilier > Bureaux > Bureau de 74 √† 114 m¬≤ √† Hay Al Fath,"Pour un investissement rentable, Riad Al Fath Offices vous propose des bureaux enti√®rement modulables et un large choix de superficie open space pour r√©pondre aux diff√©rentes attentes de nos clients professionnels. ‚Ä¢ Livraison : Imm√©diate ‚Ä¢ Superficie : de 74 √† 114 m¬≤ ‚Ä¢ Prix du m¬≤ : 12 000 Dhs/m¬≤ ‚Ä¢ Adresse : Avenue Al Majd, Hay Al Fath ‚Ä¢ Equipements : Des places de parking sous-sol, les transports publics, centre commercial.",CHAABI LIL ISKANE,Particulier,il y a 4 minutes,['https://content.avito.ma/classifieds/images/2118180349?t=images'],"['1', '1', '1', 'Ascenseur', 'C√¢blage t√©l√©phonique', 'Parking', 'S√©curit√©', 'Terrasse']","{'Nombre de pi√®ces': '1', 'Salle de bain': '1', '√âtage': '1'}",2025-11-02 19:00:15.003000,√† louer,Bureaux
42098023,https://www.avito.ma/fr/autre_secteur/villas_et_riads/LOTS_DE_VILLAS_DE_294_√Ä_555_M¬≤_√Ä_SALA_AL_JADIDA_42098023.htm,LOTS DE VILLAS DE 294 √Ä 555 M¬≤ √Ä SALA AL JADIDA,4600.0,Home Icon Accueil > Tout le Maroc > Rabat > Autre secteur > Avito Immobilier > Locations Immobili√®res > Villas et Riads > LOTS DE VILLAS DE 294 √Ä 555 M¬≤ √Ä SALA AL JADIDA,"D√©sirez-vous devenir propri√©taire d‚Äôune villa et d√©velopper votre patrimoine ? Le lotissement AL MAAMORA vous propose des lots de villas exceptionnels, en bande ou isol√©es, dans un site calme et prosp√®re. Des lots viabilis√©s et √©quip√©s, de 294 √† 555m¬≤, √† am√©nager en R1 avec sous-sol. Alors, il ne vous reste plus qu‚Äô√† choisir votre morceau de bonheur. Type de logement : Lot de villa Type Immeuble : R1 Consistance : S-s/RDC & 1 √©tage Adresse du projet : Av Lalla Meryem, (Zone villas) en face mosqu√©e Mohammed VI - Sala Al Jadida Equipements du projet : -Centre commercial -Commerces -Ecoles, universit√© -Espace de jeux -Espaces verts -Mosqu√©e -Piscine couverte",CHAABI LIL ISKANE,Particulier,il y a 2 minutes,['https://content.avito.ma/classifieds/images/10000902595?t=images'],"['4', '551', 'Balcon', 'Garage', 'Jardin', 'Parking', 'Piscine', 'S√©curit√©']","{'Chambres': '4', 'Surface habitable': '551'}",2025-11-02 18:25:15.008000,√† louer,Villas et Riads
49592977,https://www.avito.ma/fr/autre_secteur/appartements/Appartements_en_location_√†_Ifrane_49592977.htm,Appartements en location √† Ifrane,,Home Icon Accueil > Tout le Maroc > Ifrane > Autre secteur > Avito Immobilier > Locations Immobili√®res > Appartements > Appartements en location √† Ifrane,"Appartements meubl√©s en location √† Ifrane centre ville prix raisonnable seulement pour les familles ,",location de vacances √† ifrane et Agadir,Particulier,il y a 10 minutes,"['https://content.avito.ma/classifieds/images/10060556983?t=images', 'https://content.avito.ma/classifieds/images/10060556994?t=images', 'https://content.avito.ma/classifieds/images/10060556993?t=images', 'https://content.avito.ma/classifieds/images/10060556990?t=images', 'https://content.avito.ma/classifieds/images/10060556989?t=images', 'https://content.avito.ma/classifieds/images/10060556987?t=images']","['2', '2', '111', '1', '92', 'Duplex', 'Ascenseur', 'Balcon', 'Chauffage', 'Concierge', 'Cuisine √©quip√©e', 'Meubl√©']","{""Type d'appartement"": 'Duplex', 'Salle de bain': '2', 'Surface habitable': '92', 'Chambres': '2', 'Salons': '1', 'Surface totale': '111'}",2025-11-02 19:50:30.005000,√† louer,Appartements
51617155,https://www.avito.ma/fr/hay_riad/villas_et_riads/Villa_4_fa√ßades_ensoleill√©e_3_niveaux_51617155.htm,Villa 4 fa√ßades ensoleill√©e 3 niveaux,,Home Icon Accueil > Tout le Maroc > Rabat > Hay Riad > Avito Immobilier > Ventes Immobili√®res > Villas et Riads > Villa 4 fa√ßades ensoleill√©e 3 niveaux,"Villa √† vendre de 432m¬≤ avec emplacement id√©al sur Rabat Hay Riad. Sur 3 niveaux, ensoleill√©e toute la journ√©e. Pour plus d'informations, veuillez contacter Mr Rachid.",High immo,Particulier,il y a 9 minutes,"['https://content.avito.ma/classifieds/images/10083192685?t=images', 'https://content.avito.ma/classifieds/images/10083192718?t=images', 'https://content.avito.ma/classifieds/images/10083192817?t=images', 'https://content.avito.ma/classifieds/images/10083192763?t=images', 'https://content.avito.ma/classifieds/images/10083192802?t=images']","['5', '4', '432', '3', '3', '360']","{""Nombre d'√©tage"": '3', 'Salle de bain': '4', 'Surface habitable': '360', 'Chambres': '5', 'Salons': '3', 'Surface totale': '432'}",2025-11-02 22:00:30.004000,√† vendre,Villas et Riads
53020607,https://www.avito.ma/fr/lissasfa/bureaux/Bureaux_√†_louer_PL_N_201_D_53020607.htm,Bureaux √† louer PL N 201 D,4536.0,Home Icon Accueil > Tout le Maroc > Casablanca > Lissasfa > Avito Immobilier > Bureaux > Bureaux √† louer PL N 201 D,Location de plateau bureau d'une superficie de 36 m¬≤ √† lissasfa dans un immeuble professionnel s√©curis√© propre et calme sis au 2√®me √©tage bien √©quip√© Climatisation Internet fibre optique haut d√©bit 2 ascenseurs cloisons chauffage parking (places limit√©s) Acc√®s direct √† deux autoroutes celle de rond point Azbane et la Rocade sud-Ouest Trajet direct vers l'a√©roport √† environ de 30 min.,FACILITIES BUSINESS CENTER,Particulier,il y a 3 heures,"['https://content.avito.ma/classifieds/images/10098185495?t=images', 'https://content.avito.ma/classifieds/images/10123168302?t=images', 'https://content.avito.ma/classifieds/images/10123168303?t=images', 'https://content.avito.ma/classifieds/images/10123168341?t=images', 'https://content.avito.ma/classifieds/images/10123168342?t=images', 'https://content.avito.ma/classifieds/images/10123168383?t=images']","['1', '36', '1', '1', '1', 'Ascenseur', 'Chauffage', 'Climatisation', 'C√¢blage t√©l√©phonique', 'Parking', 'S√©curit√©']","{'Nombre de pi√®ces': '1', 'Salle de bain': '1', 'Frais de syndic / mois': '1', '√âtage': '1', 'Surface totale': '36'}",2025-11-02 18:35:15.010000,√† louer,Bureaux
53079995,https://www.avito.ma/fr/hay_mohammadi/bureaux/Bureaux_√†_louer_√†_Casablanca_53079995.htm,Bureaux √† louer √† Casablanca,,Home Icon Accueil > Tout le Maroc > Casablanca > Hay Mohammadi > Avito Immobilier > Bureaux > Bureaux √† louer √† Casablanca,Plateau bureau Neuf √† louer pour usage professionnel sur Boulevard de la grande ceinture Emplacement - √† 1 minute de la sortie de l‚Äôautoroute express - √† 5 minutes d'A√Øn Seba√¢ et en face √† pr√©fecture mowahidin sur le boulevard principal - Bureaux lumineux et spacieux - Un immeuble imposant de trois √©tages dot√© d'une fa√ßade moderne Equipement - Pr√©-installation de la climatisation - C√¢blage informatique install√© - √âquipement t√©l√©phonique - Cam√©ras - Ascenseurs - l‚Äôimmeuble se compose d‚Äôune cour arri√®re qui aura acc√®s √† partir des bureaux arri√®re Contactez-nous pour une visite sur place,Plateaux bureaux Al-hizam,Particulier,il y a 6 heures,"['https://content.avito.ma/classifieds/images/10140667343?t=images', 'https://content.avito.ma/classifieds/images/10140668229?t=images', 'https://content.avito.ma/classifieds/images/10098872001?t=images', 'https://content.avito.ma/classifieds/images/10098872000?t=images', 'https://content.avito.ma/classifieds/images/10098871991?t=images', 'https://content.avito.ma/classifieds/images/10098872075?t=images', 'https://content.avito.ma/classifieds/images/10136234190?t=images', 'https://content.avito.ma/classifieds/images/10098872990?t=images', 'https://content.avito.ma/classifieds/images/10098871993?t=images', 'https://content.avito.ma/classifieds/images/10098872004?t=images', 'https://content.avito.ma/classifieds/images/10098871995?t=images']","['1', '1', 'Ascenseur', 'Climatisation', 'C√¢blage t√©l√©phonique', 'S√©curit√©', 'Terrasse']","{'Nombre de pi√®ces': '1', '√âtage': '1'}",2025-11-02 19:50:15.005000,√† louer,Bureaux
53080322,https://www.avito.ma/fr/hay_mohammadi/bureaux/Plateau_bureau_Neuf_√†_louer_BD_grande_ceinture_53080322.htm,Plateau bureau Neuf √† louer BD grande ceinture,,Home Icon Accueil > Tout le Maroc > Casablanca > Hay Mohammadi > Avito Immobilier > Bureaux > Plateau bureau Neuf √† louer BD grande ceinture,Plateau bureau Neuf √† louer pour usage professionnel sur Boulevard de la grande ceinture Emplacement - √† 1 minute de la sortie de l‚Äôautoroute express - √† 5 minutes d'A√Øn Seba√¢ et en face √† pr√©fecture mowahidin sur le boulevard principal - Bureaux lumineux et spacieux - Un immeuble imposant de trois √©tages dot√© d'une fa√ßade moderne Equipement - Pr√©-installation de la climatisation - C√¢blage informatique install√© - √âquipement t√©l√©phonique - Cam√©ras - Ascenseurs - l‚Äôimmeuble se compose d‚Äôune cour arri√®re qui aura acc√®s √† partir des bureaux arri√®re Contactez-nous pour une visite sur place.,Plateaux bureaux Al-hizam,Particulier,il y a 4 heures,"['https://content.avito.ma/classifieds/images/10139622581?t=images', 'https://content.avito.ma/classifieds/images/10110560368?t=images', 'https://content.avito.ma/classifieds/images/10118120028?t=images', 'https://content.avito.ma/classifieds/images/10098875906?t=images', 'https://content.avito.ma/classifieds/images/10098875908?t=images', 'https://content.avito.ma/classifieds/images/10098875882?t=images', 'https://content.avito.ma/classifieds/images/10098875880?t=images', 'https://content.avito.ma/classifieds/images/10098875881?t=images', 'https://content.avito.ma/classifieds/images/10098875883?t=images', 'https://content.avito.ma/classifieds/images/10098876030?t=images', 'https://content.avito.ma/classifieds/images/10098876043?t=images', 'https://content.avito.ma/classifieds/images/10098875905?t=images', 'https://content.avito.ma/classifieds/images/10098875878?t=images']","['1', '1', '2', 'Ascenseur', 'Climatisation', 'C√¢blage t√©l√©phonique', 'S√©curit√©', 'Terrasse']","{'Nombre de pi√®ces': '1', 'Salle de bain': '1', '√âtage': '2'}",2025-11-02 18:55:15.005000,√† louer,Bureaux


In [311]:
silver_df.select("breadcrumbs").distinct().show(5 ,truncate=False)

+---------------------------------------------------------------------------------------------------------------------------------------------------------+
|breadcrumbs                                                                                                                                              |
+---------------------------------------------------------------------------------------------------------------------------------------------------------+
|Home Icon Accueil > Tout le Maroc > Rabat > Hassan > Avito Immobilier > Autre Immobilier > Investissement Locatif Immeuble √† Vendre Hassan               |
|Home Icon Accueil > Tout le Maroc > Tit Mellil > Toute la ville > Avito Immobilier > Autre Immobilier > Terrain √† louer ZI tit Mellil pour les conteneurs|
|Home Icon Accueil > Tout le Maroc > Sal√© > Said Hajji > Avito Immobilier > Ventes Immobili√®res > Appartements > Appartement √† Vendre Said Hajji Sal√©     |
|Home Icon Accueil > Tout le Maroc > Rabat > Hay Riad > Av

In [312]:
from pyspark.sql import functions as F

# Split 'breadcrumbs' based on '>'
split_breadcrumbs = F.split(F.col("breadcrumbs"), " > ")

# Create new columns for each segment
silver_df = (
    silver_df
    .withColumn("city", split_breadcrumbs.getItem(2))  # e.g., "Casablanca"
    .withColumn("neighborhood", split_breadcrumbs.getItem(3))  # e.g., "Maarif"
    .withColumn("site", split_breadcrumbs.getItem(4))  # e.g., "Avito Immobilier"
    .drop("breadcrumbs")  # Drop the original column if not needed
)

# Check the result
silver_df.select(
     "city", "neighborhood", "site", 
).show(30, truncate=False)


+--------------+--------------+----------------+
|city          |neighborhood  |site            |
+--------------+--------------+----------------+
|Mohammedia    |Centre Ville  |Avito Immobilier|
|Mohammedia    |Autre secteur |Avito Immobilier|
|Casablanca    |Sidi Bernoussi|Avito Immobilier|
|Rabat         |Hay el Fath   |Avito Immobilier|
|Rabat         |Autre secteur |Avito Immobilier|
|Ifrane        |Autre secteur |Avito Immobilier|
|Rabat         |Hay Riad      |Avito Immobilier|
|Casablanca    |Lissasfa      |Avito Immobilier|
|Casablanca    |Hay Mohammadi |Avito Immobilier|
|Casablanca    |Hay Mohammadi |Avito Immobilier|
|Sidi Kacem    |Toute la ville|Avito Immobilier|
|Casablanca    |Hay Mohammadi |Avito Immobilier|
|Rabat         |Hay Riad      |Avito Immobilier|
|Rabat         |Hay Riad      |Avito Immobilier|
|Tanger        |Aouama Gharbia|Avito Immobilier|
|Marrakech     |Av Mohammed VI|Avito Immobilier|
|F√®s           |Centre        |Avito Immobilier|
|Marrakech     |M'H

In [313]:
from IPython.display import display

# Assuming 'silver_df' is already created as per the earlier transformation
display(
    silver_df.select(
        "city", "neighborhood", "site"
    ).toPandas()
)

Unnamed: 0,city,neighborhood,site
0,Mohammedia,Centre Ville,Avito Immobilier
1,Mohammedia,Autre secteur,Avito Immobilier
2,Casablanca,Sidi Bernoussi,Avito Immobilier
3,Rabat,Hay el Fath,Avito Immobilier
4,Rabat,Autre secteur,Avito Immobilier
...,...,...,...
326,Tanger,Marjane,Avito Immobilier
327,Casablanca,Oulfa,Avito Immobilier
328,Skhirat,Autre secteur,Avito Immobilier
329,Ventes Immobili√®res,Appartement,


In [314]:
import pandas as pd
from IPython.display import display

# Keep things compact
pd.set_option("display.max_columns", 20)   # don't try to show hundreds
pd.set_option("display.max_colwidth", 80)  # clamp long cells to ~80 chars

# pick a small sample and flatten newlines so rows stay short
pdf = (silver_df.limit(10)
       .toPandas()
       .replace({r'[\r\n\t]+': ' '}, regex=True))

# simple, compact table with ellipsis in long cells
display(
    pdf.style
      .set_table_styles([
          {'selector': 'table', 'props': [('table-layout','fixed'), ('width','100%')]},
          {'selector': 'th, td', 'props': [
              ('max-width','280px'),
              ('white-space','nowrap'),
              ('overflow','hidden'),
              ('text-overflow','ellipsis')
          ]}
      ])
      .hide(axis='index')  # remove row numbers
)

id,url,title,price_value,description,seller_name,seller_type,published_date_text,image_urls,equipments,attributes_map,ingest_ts,type,category_type,city,neighborhood,site
31752899,https://www.avito.ma/fr/centre_ville/appartements/Appartement_√†_vendre_de_68_√†_157m¬≤_√†_Mohammedia_31752899.htm,Appartement √† vendre de 68 √† 157m¬≤ √† Mohammedia,594000.0,"La r√©sidence de Tulipes est situ√©e √† l'entr√©e sud de Mohammedia, en direction du grand parc, √† quelques minutes des plages, de l‚Äôautoroute et de la gare ferroviaire et √† 15min seulement de la m√©tropole Casablanca. Le projet se d√©marque par sa conception architecturale et ses mat√©riaux alliant modernit√© et raffinement, con√ßu en R5 avec ascenseurs et places de parking privatives en sous-sol. Appartements avec installations soign√©es, de 68 √† 157m¬≤, comprenant un salon, 2 √† 3 chambres spacieuses avec balcon et une cuisine √©quip√©e.",CHAABI LIL ISKANE,Particulier,il y a 8 minutes,"['https://content.avito.ma/classifieds/images/10045572961?t=images', 'https://content.avito.ma/classifieds/images/10045572874?t=images', 'https://content.avito.ma/classifieds/images/10138692631?t=images', 'https://content.avito.ma/classifieds/images/10045573108?t=images', 'https://content.avito.ma/classifieds/images/10045573122?t=images', 'https://content.avito.ma/classifieds/images/10045573009?t=images', 'https://content.avito.ma/classifieds/images/10045572986?t=images', 'https://content.avito.ma/classifieds/images/10138692700?t=images']","['2', '2', 'Neuf', 'Imm√©diate', '1', 'Economique', 'Ascenseur', 'Balcon', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']","{'Condition': 'Neuf', 'Disponibilit√©': 'Imm√©diate', 'Salle de bain': '2', 'Standing': 'Economique', 'Chambres': '2', 'Salons': '1'}",2025-11-02 21:20:30.004000,√† vendre,Appartements,Mohammedia,Centre Ville,Avito Immobilier
37619566,https://www.avito.ma/fr/autre_secteur/appartements/Appartement_Riad_Essalam_Beni_Yekhlef__Mohammedia_37619566.htm,Appartement Riad Essalam Beni Yekhlef- Mohammedia,195000.0,R√©sidences √©conomiques avec ascenseurs. Une Chambre/ salon/ cuisine/salle de bain. Prix : 195 000DH Livraison imm√©diate.,Groupe Ikamati,Particulier,il y a 2 heures,"['https://content.avito.ma/classifieds/images/2533557603?t=images', 'https://content.avito.ma/classifieds/images/2539801094?t=images', 'https://content.avito.ma/classifieds/images/2516510965?t=images', 'https://content.avito.ma/classifieds/images/2504023983?t=images', 'https://content.avito.ma/classifieds/images/2582417689?t=images', 'https://content.avito.ma/classifieds/images/2572806528?t=images']","['1', '1', 'Neuf', 'Imm√©diate', '0', 'Economique', 'Ascenseur']","{'Condition': 'Neuf', 'Disponibilit√©': 'Imm√©diate', 'Salle de bain': '1', 'Standing': 'Economique', 'Chambres': '1', 'Salons': '0'}",2025-11-02 21:20:15.004000,√† vendre,Appartements,Mohammedia,Autre secteur,Avito Immobilier
37621281,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartement_Sidi_Bernoussi_R√©sidences_Al_Badr_37621281.htm,Appartement Sidi Bernoussi R√©sidences Al Badr,7200.0,"Complexe r√©sidentiel Al Badr est un projet moyen standing du Groupe Ikamati situ√© au meilleur quartier √† Sidi Bernoussi proche de toutes les commodit√©s n√©cessaires : √âcoles priv√©es et publiques, commerces de proximit√©, boulangeries, p√¢tisseries, caf√©s, pharmacies, hammam, plateaux de bureau,‚Ä¶ Avec un acc√®s direct √† l‚Äôautoroute Casablanca ‚ÄìRabat. Des appartements livrables dans l‚Äôimm√©diat avec des superficies qui varient entre 74m¬≤ et 96m¬≤. Dot√©s d‚Äôune finition irr√©prochable : cuisines √©quip√©es, carrelage de qualit√© premium, volets roulants motoris√©s, l‚Äôutilisation du bois de ch√™ne,‚Ä¶ Les r√©sidences sont s√©curis√©es 24h/24 et 7j/7j. A l‚Äôoccasion de la saison d'√©t√© on vous offre une offre exclusive : le tout √† 7200 dh m¬≤ au lieu de 8200dh/m¬≤. offre limit√©e et valable jusqu'au 31/08/2023. Pour plus d‚Äôinformations, appelez nous ou visitez nos bureaux de vente ouverts toute la semaine et m√™me les week-ends de 9h √† 19h.",Groupe Ikamati,Particulier,il y a 8 minutes,"['https://content.avito.ma/classifieds/images/9761138868?t=images', 'https://content.avito.ma/classifieds/images/9751423563?t=images', 'https://content.avito.ma/classifieds/images/9792952316?t=images', 'https://content.avito.ma/classifieds/images/9771942015?t=images', 'https://content.avito.ma/classifieds/images/9712278782?t=images']","['3', '100', 'Neuf', '49', 'Moins de 1 an', '0', 'Ascenseur', 'Balcon', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']","{'Condition': 'Neuf', '√âtage': '0', 'Surface habitable': '49', 'Chambres': '3', 'Surface totale': '100', '√Çge du bien': 'Moins de 1 an'}",2025-11-02 21:40:30.003000,√† vendre,Appartements,Casablanca,Sidi Bernoussi,Avito Immobilier
40564118,https://www.avito.ma/fr/hay_el_fath/bureaux/Bureau_de_74_√†_114_m¬≤_√†_Hay_Al_Fath_40564118.htm,Bureau de 74 √† 114 m¬≤ √† Hay Al Fath,12000.0,"Pour un investissement rentable, Riad Al Fath Offices vous propose des bureaux enti√®rement modulables et un large choix de superficie open space pour r√©pondre aux diff√©rentes attentes de nos clients professionnels. ‚Ä¢ Livraison : Imm√©diate ‚Ä¢ Superficie : de 74 √† 114 m¬≤ ‚Ä¢ Prix du m¬≤ : 12 000 Dhs/m¬≤ ‚Ä¢ Adresse : Avenue Al Majd, Hay Al Fath ‚Ä¢ Equipements : Des places de parking sous-sol, les transports publics, centre commercial.",CHAABI LIL ISKANE,Particulier,il y a 4 minutes,['https://content.avito.ma/classifieds/images/2118180349?t=images'],"['1', '1', '1', 'Ascenseur', 'C√¢blage t√©l√©phonique', 'Parking', 'S√©curit√©', 'Terrasse']","{'Nombre de pi√®ces': '1', 'Salle de bain': '1', '√âtage': '1'}",2025-11-02 19:00:15.003000,√† louer,Bureaux,Rabat,Hay el Fath,Avito Immobilier
42098023,https://www.avito.ma/fr/autre_secteur/villas_et_riads/LOTS_DE_VILLAS_DE_294_√Ä_555_M¬≤_√Ä_SALA_AL_JADIDA_42098023.htm,LOTS DE VILLAS DE 294 √Ä 555 M¬≤ √Ä SALA AL JADIDA,4600.0,"D√©sirez-vous devenir propri√©taire d‚Äôune villa et d√©velopper votre patrimoine ? Le lotissement AL MAAMORA vous propose des lots de villas exceptionnels, en bande ou isol√©es, dans un site calme et prosp√®re. Des lots viabilis√©s et √©quip√©s, de 294 √† 555m¬≤, √† am√©nager en R1 avec sous-sol. Alors, il ne vous reste plus qu‚Äô√† choisir votre morceau de bonheur. Type de logement : Lot de villa Type Immeuble : R1 Consistance : S-s/RDC & 1 √©tage Adresse du projet : Av Lalla Meryem, (Zone villas) en face mosqu√©e Mohammed VI - Sala Al Jadida Equipements du projet : -Centre commercial -Commerces -Ecoles, universit√© -Espace de jeux -Espaces verts -Mosqu√©e -Piscine couverte",CHAABI LIL ISKANE,Particulier,il y a 2 minutes,['https://content.avito.ma/classifieds/images/10000902595?t=images'],"['4', '551', 'Balcon', 'Garage', 'Jardin', 'Parking', 'Piscine', 'S√©curit√©']","{'Chambres': '4', 'Surface habitable': '551'}",2025-11-02 18:25:15.008000,√† louer,Villas et Riads,Rabat,Autre secteur,Avito Immobilier
49592977,https://www.avito.ma/fr/autre_secteur/appartements/Appartements_en_location_√†_Ifrane_49592977.htm,Appartements en location √† Ifrane,,"Appartements meubl√©s en location √† Ifrane centre ville prix raisonnable seulement pour les familles ,",location de vacances √† ifrane et Agadir,Particulier,il y a 10 minutes,"['https://content.avito.ma/classifieds/images/10060556983?t=images', 'https://content.avito.ma/classifieds/images/10060556994?t=images', 'https://content.avito.ma/classifieds/images/10060556993?t=images', 'https://content.avito.ma/classifieds/images/10060556990?t=images', 'https://content.avito.ma/classifieds/images/10060556989?t=images', 'https://content.avito.ma/classifieds/images/10060556987?t=images']","['2', '2', '111', '1', '92', 'Duplex', 'Ascenseur', 'Balcon', 'Chauffage', 'Concierge', 'Cuisine √©quip√©e', 'Meubl√©']","{""Type d'appartement"": 'Duplex', 'Salle de bain': '2', 'Surface habitable': '92', 'Chambres': '2', 'Salons': '1', 'Surface totale': '111'}",2025-11-02 19:50:30.005000,√† louer,Appartements,Ifrane,Autre secteur,Avito Immobilier
51617155,https://www.avito.ma/fr/hay_riad/villas_et_riads/Villa_4_fa√ßades_ensoleill√©e_3_niveaux_51617155.htm,Villa 4 fa√ßades ensoleill√©e 3 niveaux,,"Villa √† vendre de 432m¬≤ avec emplacement id√©al sur Rabat Hay Riad. Sur 3 niveaux, ensoleill√©e toute la journ√©e. Pour plus d'informations, veuillez contacter Mr Rachid.",High immo,Particulier,il y a 9 minutes,"['https://content.avito.ma/classifieds/images/10083192685?t=images', 'https://content.avito.ma/classifieds/images/10083192718?t=images', 'https://content.avito.ma/classifieds/images/10083192817?t=images', 'https://content.avito.ma/classifieds/images/10083192763?t=images', 'https://content.avito.ma/classifieds/images/10083192802?t=images']","['5', '4', '432', '3', '3', '360']","{""Nombre d'√©tage"": '3', 'Salle de bain': '4', 'Surface habitable': '360', 'Chambres': '5', 'Salons': '3', 'Surface totale': '432'}",2025-11-02 22:00:30.004000,√† vendre,Villas et Riads,Rabat,Hay Riad,Avito Immobilier
53020607,https://www.avito.ma/fr/lissasfa/bureaux/Bureaux_√†_louer_PL_N_201_D_53020607.htm,Bureaux √† louer PL N 201 D,4536.0,Location de plateau bureau d'une superficie de 36 m¬≤ √† lissasfa dans un immeuble professionnel s√©curis√© propre et calme sis au 2√®me √©tage bien √©quip√© Climatisation Internet fibre optique haut d√©bit 2 ascenseurs cloisons chauffage parking (places limit√©s) Acc√®s direct √† deux autoroutes celle de rond point Azbane et la Rocade sud-Ouest Trajet direct vers l'a√©roport √† environ de 30 min.,FACILITIES BUSINESS CENTER,Particulier,il y a 3 heures,"['https://content.avito.ma/classifieds/images/10098185495?t=images', 'https://content.avito.ma/classifieds/images/10123168302?t=images', 'https://content.avito.ma/classifieds/images/10123168303?t=images', 'https://content.avito.ma/classifieds/images/10123168341?t=images', 'https://content.avito.ma/classifieds/images/10123168342?t=images', 'https://content.avito.ma/classifieds/images/10123168383?t=images']","['1', '36', '1', '1', '1', 'Ascenseur', 'Chauffage', 'Climatisation', 'C√¢blage t√©l√©phonique', 'Parking', 'S√©curit√©']","{'Nombre de pi√®ces': '1', 'Salle de bain': '1', 'Frais de syndic / mois': '1', '√âtage': '1', 'Surface totale': '36'}",2025-11-02 18:35:15.010000,√† louer,Bureaux,Casablanca,Lissasfa,Avito Immobilier
53079995,https://www.avito.ma/fr/hay_mohammadi/bureaux/Bureaux_√†_louer_√†_Casablanca_53079995.htm,Bureaux √† louer √† Casablanca,,Plateau bureau Neuf √† louer pour usage professionnel sur Boulevard de la grande ceinture Emplacement - √† 1 minute de la sortie de l‚Äôautoroute express - √† 5 minutes d'A√Øn Seba√¢ et en face √† pr√©fecture mowahidin sur le boulevard principal - Bureaux lumineux et spacieux - Un immeuble imposant de trois √©tages dot√© d'une fa√ßade moderne Equipement - Pr√©-installation de la climatisation - C√¢blage informatique install√© - √âquipement t√©l√©phonique - Cam√©ras - Ascenseurs - l‚Äôimmeuble se compose d‚Äôune cour arri√®re qui aura acc√®s √† partir des bureaux arri√®re Contactez-nous pour une visite sur place,Plateaux bureaux Al-hizam,Particulier,il y a 6 heures,"['https://content.avito.ma/classifieds/images/10140667343?t=images', 'https://content.avito.ma/classifieds/images/10140668229?t=images', 'https://content.avito.ma/classifieds/images/10098872001?t=images', 'https://content.avito.ma/classifieds/images/10098872000?t=images', 'https://content.avito.ma/classifieds/images/10098871991?t=images', 'https://content.avito.ma/classifieds/images/10098872075?t=images', 'https://content.avito.ma/classifieds/images/10136234190?t=images', 'https://content.avito.ma/classifieds/images/10098872990?t=images', 'https://content.avito.ma/classifieds/images/10098871993?t=images', 'https://content.avito.ma/classifieds/images/10098872004?t=images', 'https://content.avito.ma/classifieds/images/10098871995?t=images']","['1', '1', 'Ascenseur', 'Climatisation', 'C√¢blage t√©l√©phonique', 'S√©curit√©', 'Terrasse']","{'Nombre de pi√®ces': '1', '√âtage': '1'}",2025-11-02 19:50:15.005000,√† louer,Bureaux,Casablanca,Hay Mohammadi,Avito Immobilier
53080322,https://www.avito.ma/fr/hay_mohammadi/bureaux/Plateau_bureau_Neuf_√†_louer_BD_grande_ceinture_53080322.htm,Plateau bureau Neuf √† louer BD grande ceinture,,Plateau bureau Neuf √† louer pour usage professionnel sur Boulevard de la grande ceinture Emplacement - √† 1 minute de la sortie de l‚Äôautoroute express - √† 5 minutes d'A√Øn Seba√¢ et en face √† pr√©fecture mowahidin sur le boulevard principal - Bureaux lumineux et spacieux - Un immeuble imposant de trois √©tages dot√© d'une fa√ßade moderne Equipement - Pr√©-installation de la climatisation - C√¢blage informatique install√© - √âquipement t√©l√©phonique - Cam√©ras - Ascenseurs - l‚Äôimmeuble se compose d‚Äôune cour arri√®re qui aura acc√®s √† partir des bureaux arri√®re Contactez-nous pour une visite sur place.,Plateaux bureaux Al-hizam,Particulier,il y a 4 heures,"['https://content.avito.ma/classifieds/images/10139622581?t=images', 'https://content.avito.ma/classifieds/images/10110560368?t=images', 'https://content.avito.ma/classifieds/images/10118120028?t=images', 'https://content.avito.ma/classifieds/images/10098875906?t=images', 'https://content.avito.ma/classifieds/images/10098875908?t=images', 'https://content.avito.ma/classifieds/images/10098875882?t=images', 'https://content.avito.ma/classifieds/images/10098875880?t=images', 'https://content.avito.ma/classifieds/images/10098875881?t=images', 'https://content.avito.ma/classifieds/images/10098875883?t=images', 'https://content.avito.ma/classifieds/images/10098876030?t=images', 'https://content.avito.ma/classifieds/images/10098876043?t=images', 'https://content.avito.ma/classifieds/images/10098875905?t=images', 'https://content.avito.ma/classifieds/images/10098875878?t=images']","['1', '1', '2', 'Ascenseur', 'Climatisation', 'C√¢blage t√©l√©phonique', 'S√©curit√©', 'Terrasse']","{'Nombre de pi√®ces': '1', 'Salle de bain': '1', '√âtage': '2'}",2025-11-02 18:55:15.005000,√† louer,Bureaux,Casablanca,Hay Mohammadi,Avito Immobilier


In [315]:
silver_df.select("equipments").distinct().show(5 , truncate=False)

+-------------------------------------------------------------------------------------------------------------+
|equipments                                                                                                   |
+-------------------------------------------------------------------------------------------------------------+
|[2, 2, 1, 110, 3]                                                                                            |
|[2, 1, 100, 1 mois, 1, 100, Ascenseur, Balcon, Concierge, Cuisine √©quip√©e, Meubl√©, S√©curit√©]                 |
|[0, 37, Neuf, Imm√©diate, 1, Moins de 1 an, Ascenseur, Climatisation, C√¢blage t√©l√©phonique, Parking, S√©curit√©]|
|[3, 2, 1, 120, 0, Ascenseur, Chauffage, Climatisation, Concierge, Cuisine √©quip√©e, Parking]                  |
|[1, 136, 1, 1, Ascenseur, Chauffage, Climatisation, C√¢blage t√©l√©phonique, Parking, S√©curit√©]                 |
+-------------------------------------------------------------------------------------

In [316]:
from pyspark.sql.functions import col, udf
from pyspark.sql.types import ArrayType, StringType
import re

# Define a UDF to clean the 'equipments' list, handling NoneType
def clean_equipments(equipments):
    # Handle NoneType case
    if equipments is None:
        return []
    
    # Filter out unwanted entries (numbers and time-related strings)
    cleaned = [item for item in equipments if not re.match(r'^\d+$', str(item)) and not re.match(r'.*(mois|an).*', str(item))]
    return cleaned

# Register the UDF
clean_equipments_udf = udf(clean_equipments, ArrayType(StringType()))

# Apply the UDF to clean 'equipments' directly (in place)
silver_df = silver_df.withColumn("equipments", clean_equipments_udf(col("equipments")))

# Show the cleaned 'equipments' column
silver_df.select("equipments").show(5, truncate=False)

+----------------------------------------------------------------------------------------------+
|equipments                                                                                    |
+----------------------------------------------------------------------------------------------+
|[Neuf, Imm√©diate, Economique, Ascenseur, Balcon, Cuisine √©quip√©e, Parking, S√©curit√©, Terrasse]|
|[Neuf, Imm√©diate, Economique, Ascenseur]                                                      |
|[Neuf, Ascenseur, Balcon, Cuisine √©quip√©e, Parking, S√©curit√©, Terrasse]                       |
|[Ascenseur, C√¢blage t√©l√©phonique, Parking, S√©curit√©, Terrasse]                                |
|[Balcon, Garage, Jardin, Parking, Piscine, S√©curit√©]                                          |
+----------------------------------------------------------------------------------------------+
only showing top 5 rows



In [318]:
from pyspark.sql import functions as F

# Extract the keys and values from the attributes_map
keys = silver_df.select(F.explode(F.map_keys(F.col("attributes_map"))).alias("attribute")).distinct().rdd.flatMap(lambda x: x).collect()

# For each key, create a new column with its corresponding value
for key in keys:
    silver_df = silver_df.withColumn(
        key, 
        F.when(F.col("attributes_map").getItem(key).isNotNull(), 
               F.col("attributes_map").getItem(key)).otherwise(None)
    )

# Show the result with new columns for each attribute
silver_df.select("id", *keys).show(5, truncate=False)

+--------+-----------------+-------+------+------------------+----------+--------------+-----+-------------+--------+-------------+----------------+----------------------+---------+--------------+-------------+------+
|id      |Surface habitable|Caution|Zoning|Type d'appartement|Standing  |Surface totale|√âtage|√Çge du bien  |Chambres|Salle de bain|Nombre de pi√®ces|Frais de syndic / mois|Condition|Nombre d'√©tage|Disponibilit√©|Salons|
+--------+-----------------+-------+------+------------------+----------+--------------+-----+-------------+--------+-------------+----------------+----------------------+---------+--------------+-------------+------+
|31752899|NULL             |NULL   |NULL  |NULL              |Economique|NULL          |NULL |NULL         |2       |2            |NULL            |NULL                  |Neuf     |NULL          |Imm√©diate    |1     |
|37619566|NULL             |NULL   |NULL  |NULL              |Economique|NULL          |NULL |NULL         |1       |1    

In [319]:
import pandas as pd
from IPython.display import display

# Keep things compact
pd.set_option("display.max_columns", 20)   # don't try to show hundreds
pd.set_option("display.max_colwidth", 80)  # clamp long cells to ~80 chars

# pick a small sample and flatten newlines so rows stay short
pdf = (silver_df.limit(10)
       .toPandas()
       .replace({r'[\r\n\t]+': ' '}, regex=True))

# simple, compact table with ellipsis in long cells
display(
    pdf.style
      .set_table_styles([
          {'selector': 'table', 'props': [('table-layout','fixed'), ('width','100%')]},
          {'selector': 'th, td', 'props': [
              ('max-width','280px'),
              ('white-space','nowrap'),
              ('overflow','hidden'),
              ('text-overflow','ellipsis')
          ]}
      ])
      .hide(axis='index')  # remove row numbers
)

id,url,title,price_value,description,seller_name,seller_type,published_date_text,image_urls,equipments,attributes_map,ingest_ts,type,category_type,city,neighborhood,site,Surface habitable,Caution,Zoning,Type d'appartement,Standing,Surface totale,√âtage,√Çge du bien,Chambres,Salle de bain,Nombre de pi√®ces,Frais de syndic / mois,Condition,Nombre d'√©tage,Disponibilit√©,Salons
31752899,https://www.avito.ma/fr/centre_ville/appartements/Appartement_√†_vendre_de_68_√†_157m¬≤_√†_Mohammedia_31752899.htm,Appartement √† vendre de 68 √† 157m¬≤ √† Mohammedia,594000.0,"La r√©sidence de Tulipes est situ√©e √† l'entr√©e sud de Mohammedia, en direction du grand parc, √† quelques minutes des plages, de l‚Äôautoroute et de la gare ferroviaire et √† 15min seulement de la m√©tropole Casablanca. Le projet se d√©marque par sa conception architecturale et ses mat√©riaux alliant modernit√© et raffinement, con√ßu en R5 avec ascenseurs et places de parking privatives en sous-sol. Appartements avec installations soign√©es, de 68 √† 157m¬≤, comprenant un salon, 2 √† 3 chambres spacieuses avec balcon et une cuisine √©quip√©e.",CHAABI LIL ISKANE,Particulier,il y a 8 minutes,"['https://content.avito.ma/classifieds/images/10045572961?t=images', 'https://content.avito.ma/classifieds/images/10045572874?t=images', 'https://content.avito.ma/classifieds/images/10138692631?t=images', 'https://content.avito.ma/classifieds/images/10045573108?t=images', 'https://content.avito.ma/classifieds/images/10045573122?t=images', 'https://content.avito.ma/classifieds/images/10045573009?t=images', 'https://content.avito.ma/classifieds/images/10045572986?t=images', 'https://content.avito.ma/classifieds/images/10138692700?t=images']","['Neuf', 'Imm√©diate', 'Economique', 'Ascenseur', 'Balcon', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']","{'Condition': 'Neuf', 'Disponibilit√©': 'Imm√©diate', 'Salle de bain': '2', 'Standing': 'Economique', 'Chambres': '2', 'Salons': '1'}",2025-11-02 21:20:30.004000,√† vendre,Appartements,Mohammedia,Centre Ville,Avito Immobilier,,,,,Economique,,,,2.0,2.0,,,Neuf,,Imm√©diate,1.0
37619566,https://www.avito.ma/fr/autre_secteur/appartements/Appartement_Riad_Essalam_Beni_Yekhlef__Mohammedia_37619566.htm,Appartement Riad Essalam Beni Yekhlef- Mohammedia,195000.0,R√©sidences √©conomiques avec ascenseurs. Une Chambre/ salon/ cuisine/salle de bain. Prix : 195 000DH Livraison imm√©diate.,Groupe Ikamati,Particulier,il y a 2 heures,"['https://content.avito.ma/classifieds/images/2533557603?t=images', 'https://content.avito.ma/classifieds/images/2539801094?t=images', 'https://content.avito.ma/classifieds/images/2516510965?t=images', 'https://content.avito.ma/classifieds/images/2504023983?t=images', 'https://content.avito.ma/classifieds/images/2582417689?t=images', 'https://content.avito.ma/classifieds/images/2572806528?t=images']","['Neuf', 'Imm√©diate', 'Economique', 'Ascenseur']","{'Condition': 'Neuf', 'Disponibilit√©': 'Imm√©diate', 'Salle de bain': '1', 'Standing': 'Economique', 'Chambres': '1', 'Salons': '0'}",2025-11-02 21:20:15.004000,√† vendre,Appartements,Mohammedia,Autre secteur,Avito Immobilier,,,,,Economique,,,,1.0,1.0,,,Neuf,,Imm√©diate,0.0
37621281,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartement_Sidi_Bernoussi_R√©sidences_Al_Badr_37621281.htm,Appartement Sidi Bernoussi R√©sidences Al Badr,7200.0,"Complexe r√©sidentiel Al Badr est un projet moyen standing du Groupe Ikamati situ√© au meilleur quartier √† Sidi Bernoussi proche de toutes les commodit√©s n√©cessaires : √âcoles priv√©es et publiques, commerces de proximit√©, boulangeries, p√¢tisseries, caf√©s, pharmacies, hammam, plateaux de bureau,‚Ä¶ Avec un acc√®s direct √† l‚Äôautoroute Casablanca ‚ÄìRabat. Des appartements livrables dans l‚Äôimm√©diat avec des superficies qui varient entre 74m¬≤ et 96m¬≤. Dot√©s d‚Äôune finition irr√©prochable : cuisines √©quip√©es, carrelage de qualit√© premium, volets roulants motoris√©s, l‚Äôutilisation du bois de ch√™ne,‚Ä¶ Les r√©sidences sont s√©curis√©es 24h/24 et 7j/7j. A l‚Äôoccasion de la saison d'√©t√© on vous offre une offre exclusive : le tout √† 7200 dh m¬≤ au lieu de 8200dh/m¬≤. offre limit√©e et valable jusqu'au 31/08/2023. Pour plus d‚Äôinformations, appelez nous ou visitez nos bureaux de vente ouverts toute la semaine et m√™me les week-ends de 9h √† 19h.",Groupe Ikamati,Particulier,il y a 8 minutes,"['https://content.avito.ma/classifieds/images/9761138868?t=images', 'https://content.avito.ma/classifieds/images/9751423563?t=images', 'https://content.avito.ma/classifieds/images/9792952316?t=images', 'https://content.avito.ma/classifieds/images/9771942015?t=images', 'https://content.avito.ma/classifieds/images/9712278782?t=images']","['Neuf', 'Ascenseur', 'Balcon', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']","{'Condition': 'Neuf', '√âtage': '0', 'Surface habitable': '49', 'Chambres': '3', 'Surface totale': '100', '√Çge du bien': 'Moins de 1 an'}",2025-11-02 21:40:30.003000,√† vendre,Appartements,Casablanca,Sidi Bernoussi,Avito Immobilier,49.0,,,,,100.0,0.0,Moins de 1 an,3.0,,,,Neuf,,,
40564118,https://www.avito.ma/fr/hay_el_fath/bureaux/Bureau_de_74_√†_114_m¬≤_√†_Hay_Al_Fath_40564118.htm,Bureau de 74 √† 114 m¬≤ √† Hay Al Fath,12000.0,"Pour un investissement rentable, Riad Al Fath Offices vous propose des bureaux enti√®rement modulables et un large choix de superficie open space pour r√©pondre aux diff√©rentes attentes de nos clients professionnels. ‚Ä¢ Livraison : Imm√©diate ‚Ä¢ Superficie : de 74 √† 114 m¬≤ ‚Ä¢ Prix du m¬≤ : 12 000 Dhs/m¬≤ ‚Ä¢ Adresse : Avenue Al Majd, Hay Al Fath ‚Ä¢ Equipements : Des places de parking sous-sol, les transports publics, centre commercial.",CHAABI LIL ISKANE,Particulier,il y a 4 minutes,['https://content.avito.ma/classifieds/images/2118180349?t=images'],"['Ascenseur', 'C√¢blage t√©l√©phonique', 'Parking', 'S√©curit√©', 'Terrasse']","{'Nombre de pi√®ces': '1', 'Salle de bain': '1', '√âtage': '1'}",2025-11-02 19:00:15.003000,√† louer,Bureaux,Rabat,Hay el Fath,Avito Immobilier,,,,,,,1.0,,,1.0,1.0,,,,,
42098023,https://www.avito.ma/fr/autre_secteur/villas_et_riads/LOTS_DE_VILLAS_DE_294_√Ä_555_M¬≤_√Ä_SALA_AL_JADIDA_42098023.htm,LOTS DE VILLAS DE 294 √Ä 555 M¬≤ √Ä SALA AL JADIDA,4600.0,"D√©sirez-vous devenir propri√©taire d‚Äôune villa et d√©velopper votre patrimoine ? Le lotissement AL MAAMORA vous propose des lots de villas exceptionnels, en bande ou isol√©es, dans un site calme et prosp√®re. Des lots viabilis√©s et √©quip√©s, de 294 √† 555m¬≤, √† am√©nager en R1 avec sous-sol. Alors, il ne vous reste plus qu‚Äô√† choisir votre morceau de bonheur. Type de logement : Lot de villa Type Immeuble : R1 Consistance : S-s/RDC & 1 √©tage Adresse du projet : Av Lalla Meryem, (Zone villas) en face mosqu√©e Mohammed VI - Sala Al Jadida Equipements du projet : -Centre commercial -Commerces -Ecoles, universit√© -Espace de jeux -Espaces verts -Mosqu√©e -Piscine couverte",CHAABI LIL ISKANE,Particulier,il y a 2 minutes,['https://content.avito.ma/classifieds/images/10000902595?t=images'],"['Balcon', 'Garage', 'Jardin', 'Parking', 'Piscine', 'S√©curit√©']","{'Chambres': '4', 'Surface habitable': '551'}",2025-11-02 18:25:15.008000,√† louer,Villas et Riads,Rabat,Autre secteur,Avito Immobilier,551.0,,,,,,,,4.0,,,,,,,
49592977,https://www.avito.ma/fr/autre_secteur/appartements/Appartements_en_location_√†_Ifrane_49592977.htm,Appartements en location √† Ifrane,,"Appartements meubl√©s en location √† Ifrane centre ville prix raisonnable seulement pour les familles ,",location de vacances √† ifrane et Agadir,Particulier,il y a 5 minutes,"['https://content.avito.ma/classifieds/images/10060556983?t=images', 'https://content.avito.ma/classifieds/images/10060556994?t=images', 'https://content.avito.ma/classifieds/images/10060556993?t=images', 'https://content.avito.ma/classifieds/images/10060556990?t=images', 'https://content.avito.ma/classifieds/images/10060556989?t=images', 'https://content.avito.ma/classifieds/images/10060556987?t=images']","['Duplex', 'Ascenseur', 'Balcon', 'Chauffage', 'Concierge', 'Cuisine √©quip√©e', 'Meubl√©']","{""Type d'appartement"": 'Duplex', 'Salle de bain': '2', 'Surface habitable': '92', 'Chambres': '2', 'Salons': '1', 'Surface totale': '111'}",2025-11-02 19:45:15.003000,√† louer,Appartements,Ifrane,Autre secteur,Avito Immobilier,92.0,,,Duplex,,111.0,,,2.0,2.0,,,,,,1.0
51617155,https://www.avito.ma/fr/hay_riad/villas_et_riads/Villa_4_fa√ßades_ensoleill√©e_3_niveaux_51617155.htm,Villa 4 fa√ßades ensoleill√©e 3 niveaux,,"Villa √† vendre de 432m¬≤ avec emplacement id√©al sur Rabat Hay Riad. Sur 3 niveaux, ensoleill√©e toute la journ√©e. Pour plus d'informations, veuillez contacter Mr Rachid.",High immo,Particulier,il y a 9 minutes,"['https://content.avito.ma/classifieds/images/10083192685?t=images', 'https://content.avito.ma/classifieds/images/10083192718?t=images', 'https://content.avito.ma/classifieds/images/10083192817?t=images', 'https://content.avito.ma/classifieds/images/10083192763?t=images', 'https://content.avito.ma/classifieds/images/10083192802?t=images']",[],"{""Nombre d'√©tage"": '3', 'Salle de bain': '4', 'Surface habitable': '360', 'Chambres': '5', 'Salons': '3', 'Surface totale': '432'}",2025-11-02 22:00:30.004000,√† vendre,Villas et Riads,Rabat,Hay Riad,Avito Immobilier,360.0,,,,,432.0,,,5.0,4.0,,,,3.0,,3.0
53020607,https://www.avito.ma/fr/lissasfa/bureaux/Bureaux_√†_louer_PL_N_201_D_53020607.htm,Bureaux √† louer PL N 201 D,4536.0,Location de plateau bureau d'une superficie de 36 m¬≤ √† lissasfa dans un immeuble professionnel s√©curis√© propre et calme sis au 2√®me √©tage bien √©quip√© Climatisation Internet fibre optique haut d√©bit 2 ascenseurs cloisons chauffage parking (places limit√©s) Acc√®s direct √† deux autoroutes celle de rond point Azbane et la Rocade sud-Ouest Trajet direct vers l'a√©roport √† environ de 30 min.,FACILITIES BUSINESS CENTER,Particulier,il y a 3 heures,"['https://content.avito.ma/classifieds/images/10098185495?t=images', 'https://content.avito.ma/classifieds/images/10123168302?t=images', 'https://content.avito.ma/classifieds/images/10123168303?t=images', 'https://content.avito.ma/classifieds/images/10123168341?t=images', 'https://content.avito.ma/classifieds/images/10123168342?t=images', 'https://content.avito.ma/classifieds/images/10123168383?t=images']","['Ascenseur', 'Chauffage', 'Climatisation', 'C√¢blage t√©l√©phonique', 'Parking', 'S√©curit√©']","{'Nombre de pi√®ces': '1', 'Salle de bain': '1', 'Frais de syndic / mois': '1', '√âtage': '1', 'Surface totale': '36'}",2025-11-02 18:35:15.010000,√† louer,Bureaux,Casablanca,Lissasfa,Avito Immobilier,,,,,,36.0,1.0,,,1.0,1.0,1.0,,,,
53079995,https://www.avito.ma/fr/hay_mohammadi/bureaux/Bureaux_√†_louer_√†_Casablanca_53079995.htm,Bureaux √† louer √† Casablanca,,Plateau bureau Neuf √† louer pour usage professionnel sur Boulevard de la grande ceinture Emplacement - √† 1 minute de la sortie de l‚Äôautoroute express - √† 5 minutes d'A√Øn Seba√¢ et en face √† pr√©fecture mowahidin sur le boulevard principal - Bureaux lumineux et spacieux - Un immeuble imposant de trois √©tages dot√© d'une fa√ßade moderne Equipement - Pr√©-installation de la climatisation - C√¢blage informatique install√© - √âquipement t√©l√©phonique - Cam√©ras - Ascenseurs - l‚Äôimmeuble se compose d‚Äôune cour arri√®re qui aura acc√®s √† partir des bureaux arri√®re Contactez-nous pour une visite sur place,Plateaux bureaux Al-hizam,Particulier,il y a 6 heures,"['https://content.avito.ma/classifieds/images/10140667343?t=images', 'https://content.avito.ma/classifieds/images/10140668229?t=images', 'https://content.avito.ma/classifieds/images/10098872001?t=images', 'https://content.avito.ma/classifieds/images/10098872000?t=images', 'https://content.avito.ma/classifieds/images/10098871991?t=images', 'https://content.avito.ma/classifieds/images/10098872075?t=images', 'https://content.avito.ma/classifieds/images/10136234190?t=images', 'https://content.avito.ma/classifieds/images/10098872990?t=images', 'https://content.avito.ma/classifieds/images/10098871993?t=images', 'https://content.avito.ma/classifieds/images/10098872004?t=images', 'https://content.avito.ma/classifieds/images/10098871995?t=images']","['Ascenseur', 'Climatisation', 'C√¢blage t√©l√©phonique', 'S√©curit√©', 'Terrasse']","{'Nombre de pi√®ces': '1', '√âtage': '1'}",2025-11-02 19:50:15.005000,√† louer,Bureaux,Casablanca,Hay Mohammadi,Avito Immobilier,,,,,,,1.0,,,,1.0,,,,,
53080322,https://www.avito.ma/fr/hay_mohammadi/bureaux/Plateau_bureau_Neuf_√†_louer_BD_grande_ceinture_53080322.htm,Plateau bureau Neuf √† louer BD grande ceinture,,Plateau bureau Neuf √† louer pour usage professionnel sur Boulevard de la grande ceinture Emplacement - √† 1 minute de la sortie de l‚Äôautoroute express - √† 5 minutes d'A√Øn Seba√¢ et en face √† pr√©fecture mowahidin sur le boulevard principal - Bureaux lumineux et spacieux - Un immeuble imposant de trois √©tages dot√© d'une fa√ßade moderne Equipement - Pr√©-installation de la climatisation - C√¢blage informatique install√© - √âquipement t√©l√©phonique - Cam√©ras - Ascenseurs - l‚Äôimmeuble se compose d‚Äôune cour arri√®re qui aura acc√®s √† partir des bureaux arri√®re Contactez-nous pour une visite sur place.,Plateaux bureaux Al-hizam,Particulier,il y a 4 heures,"['https://content.avito.ma/classifieds/images/10139622581?t=images', 'https://content.avito.ma/classifieds/images/10110560368?t=images', 'https://content.avito.ma/classifieds/images/10118120028?t=images', 'https://content.avito.ma/classifieds/images/10098875906?t=images', 'https://content.avito.ma/classifieds/images/10098875908?t=images', 'https://content.avito.ma/classifieds/images/10098875882?t=images', 'https://content.avito.ma/classifieds/images/10098875880?t=images', 'https://content.avito.ma/classifieds/images/10098875881?t=images', 'https://content.avito.ma/classifieds/images/10098875883?t=images', 'https://content.avito.ma/classifieds/images/10098876030?t=images', 'https://content.avito.ma/classifieds/images/10098876043?t=images', 'https://content.avito.ma/classifieds/images/10098875905?t=images', 'https://content.avito.ma/classifieds/images/10098875878?t=images']","['Ascenseur', 'Climatisation', 'C√¢blage t√©l√©phonique', 'S√©curit√©', 'Terrasse']","{'Nombre de pi√®ces': '1', 'Salle de bain': '1', '√âtage': '2'}",2025-11-02 18:55:15.005000,√† louer,Bureaux,Casablanca,Hay Mohammadi,Avito Immobilier,,,,,,,2.0,,,1.0,1.0,,,,,


In [320]:
# Get the number of columns
num_columns = len(silver_df.columns)

# Display the result
print(f"Number of columns in the dataframe: {num_columns}")

Number of columns in the dataframe: 33


In [324]:
from pyspark.sql import functions as F

# Replace all values in the 'site' column with "avito"
silver_df = silver_df.withColumn("site", F.lit("avito"))

# Show the updated DataFrame (distinct 'site' values)
silver_df.select("site").distinct().show(5, truncate=False)

+-----+
|site |
+-----+
|avito|
+-----+



In [327]:
from pyspark.sql import functions as F

# Update the 'type' column to have English values
silver_df = silver_df.withColumn(
    "type", 
    F.when(F.col("type") == "√† louer", "rent")
     .when(F.col("type") == "√† vendre", "sale")
     .otherwise(F.col("type"))
)

# Show the result with counts for the updated 'type' column
type_counts_english = silver_df.groupBy("type").count()
type_counts_english.show(truncate=False)

+----+-----+
|type|count|
+----+-----+
|NULL|9    |
|sale|86   |
|rent|236  |
+----+-----+



In [330]:
# Group by 'seller_type' and count the occurrences
seller_type_counts = silver_df.groupBy("seller_type").count()

# Show the result
seller_type_counts.show(truncate=False)

+-----------+-----+
|seller_type|count|
+-----------+-----+
|NULL       |1    |
|Boutique   |8    |
|Particulier|322  |
+-----------+-----+

