In [291]:
try:
    spark.stop()
except Exception:
    pass

from pyspark.sql import SparkSession

spark = (
    SparkSession.builder.appName("Iceberg via REST")
    .config("spark.sql.extensions", "org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions")
    .config("spark.sql.catalog.local", "org.apache.iceberg.spark.SparkCatalog")
    .config("spark.sql.catalog.local.type", "rest")
    .config("spark.sql.catalog.local.uri", "http://iceberg-rest:8181")
    .config("spark.sql.catalog.local.warehouse", "s3://lake/warehouse")
    .config("spark.sql.catalog.local.io-impl", "org.apache.iceberg.aws.s3.S3FileIO")
    .config("spark.sql.catalog.local.s3.endpoint", "http://minio:9000")
    .config("spark.sql.catalog.local.s3.path-style-access", "true")
    .config("spark.sql.catalog.local.s3.access-key-id", "admin")
    .config("spark.sql.catalog.local.s3.secret-access-key", "admin123")
    .config("spark.sql.catalog.local.s3.region", "us-east-1")
    .getOrCreate()
)

spark

In [336]:
spark.sql("SHOW NAMESPACES IN local").show(truncate=False)

+---------+
|namespace|
+---------+
|raw      |
+---------+



In [337]:
spark.sql("SHOW TABLES IN local.raw").show(truncate=False)

+---------+---------+-----------+
|namespace|tableName|isTemporary|
+---------+---------+-----------+
|raw      |avito    |false      |
+---------+---------+-----------+



In [338]:
tbl = "local.raw.avito"
spark.sql(f"SELECT COUNT(*) AS rows FROM {tbl}").show()


+----+
|rows|
+----+
| 130|
+----+



In [339]:
spark.sql("SELECT * FROM local.raw.avito LIMIT 1").show(truncate=False)

+--------+------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

In [340]:
# Load RAW table
raw_df = spark.table("local.raw.avito")   # or local.raw.sarouty

In [341]:
# Cr√©er un DataFrame "Silver" minimal
silver_df = raw_df.select("id").distinct()

# Afficher quelques lignes
silver_df.show(5, truncate=False)

print("‚úÖ Silver dataset initialized with only 'id' column.")
print("Total IDs:", silver_df.count())

+--------+
|id      |
+--------+
|56926340|
|57020711|
|56045169|
|56920617|
|57153823|
+--------+
only showing top 5 rows

‚úÖ Silver dataset initialized with only 'id' column.
Total IDs: 104


In [342]:
from pyspark.sql import functions as F
raw_df.select("payload").first()["payload"]

'{"id": "56530450", "url": "https://www.avito.ma/fr/autre_secteur/bureaux/plateaux_Bureaux_100m¬≤_AV_le_Caire_Temara_56530450.htm", "error": null, "title": "plateaux Bureaux 100m¬≤ AV le Caire Temara", "price_text": "8 500 DH", "breadcrumbs": "Home Icon Accueil > Tout le Maroc > Temara > Autre secteur > Avito Immobilier > Bureaux > plateaux Bureaux 100m¬≤ AV le Caire Temara", "category": "Bureaux, √† louer", "description": "- AGENCE MOSTAGIMMO Met en location 2 Plateaux Bureaux 2 Fa√ßade ou 3em √©tage sans Ascenseur Superficie du 100m Sur Avenue le Caire. - Bureaux pour : M√©decin, Architecte, param√©dical, Comptable, Notaire. Pour plus d\'informations ou faire une Visite Contacter Votre Agence immobili√®re MOSTAGIMMO.", "attributes": "{\\"Salle de bain\\": \\"1\\", \\"Surface totale\\": \\"100\\", \\"Nombre de pi√®ces\\": \\"1\\", \\"√âtage\\": \\"3\\"}", "equipments": "1; 100; 1; 3; C√¢blage t√©l√©phonique", "seller_name": "AGENCE IMMOBILIER MOSTAGIMMO", "seller_type": "Particulier",

In [343]:
from pyspark.sql import functions as F, types as T

# 1) D√©finir le sch√©ma du JSON dans "payload"
payload_schema = T.StructType([
    T.StructField("id", T.StringType()),
    T.StructField("url", T.StringType()),
    T.StructField("error", T.StringType()),
    T.StructField("title", T.StringType()),
    T.StructField("price_text", T.StringType()),
    T.StructField("breadcrumbs", T.StringType()),
    T.StructField("category", T.StringType()),
    T.StructField("description", T.StringType()),
    T.StructField("attributes", T.StringType()),  # JSON imbriqu√© sous forme de string
    T.StructField("equipments", T.StringType()),
    T.StructField("seller_name", T.StringType()),
    T.StructField("seller_type", T.StringType()),
    T.StructField("published_date", T.StringType()),
    T.StructField("image_urls", T.StringType()),
])

# 2) Parser le JSON depuis la colonne string "payload"
parsed = (raw_df
    .select(
        *[c for c in raw_df.columns if c != "payload"],  # ex: garder ingest_ts s'il existe
        F.from_json(F.col("payload"), payload_schema).alias("p")
    )
    .filter(F.col("p").isNotNull())  # ignorer les lignes avec JSON invalide
)

# 3) Parser le JSON imbriqu√© "attributes" -> Map<String,String>
attrs_map = F.from_json(F.col("p.attributes"), T.MapType(T.StringType(), T.StringType()))

# 4) Nettoyages utiles:
# - price_value (MAD) √† partir de "price_text" (ex: "6 000 DH" -> 6000.0)
price_value = F.regexp_replace(F.col("p.price_text"), r"[^0-9]", "").cast("double")

# - image_urls -> array<string> en splittant sur " | " et trim de chaque url
image_urls_arr = F.transform(
    F.split(F.col("p.image_urls"), r"\s*\|\s*"),
    lambda x: F.trim(x)
)

# - equipments -> array<string> en splittant sur ";"
equipments_arr = F.transform(
    F.split(F.col("p.equipments"), r"\s*;\s*"),
    lambda x: F.trim(x)
)

# 5) Construire le DataFrame silver (colonnes √† plat)
silver_df = parsed.select(
    F.col("p.id").alias("id"),
    F.col("p.url").alias("url"),
    F.col("p.title").alias("title"),
    F.col("p.price_text").alias("price_text"),
    price_value.alias("price_value_mad"),
    F.col("p.category").alias("category"),
    F.col("p.breadcrumbs").alias("breadcrumbs"),
    F.col("p.description").alias("description"),
    F.col("p.seller_name").alias("seller_name"),
    F.col("p.seller_type").alias("seller_type"),
    F.col("p.published_date").alias("published_date_text"),
    image_urls_arr.alias("image_urls"),
    equipments_arr.alias("equipments"),
    attrs_map.alias("attributes_map"),
    # garder le timestamp d'ingestion s'il est pr√©sent dans ton raw_df
    *([F.col("ingest_ts")] if "ingest_ts" in raw_df.columns else [])
)

In [344]:
import pandas as pd
from IPython.display import display

# Keep things compact
pd.set_option("display.max_columns", 20)   # don't try to show hundreds
pd.set_option("display.max_colwidth", 80)  # clamp long cells to ~80 chars

# pick a small sample and flatten newlines so rows stay short
pdf = (silver_df.limit(10)
       .toPandas()
       .replace({r'[\r\n\t]+': ' '}, regex=True))

# simple, compact table with ellipsis in long cells
display(
    pdf.style
      .set_table_styles([
          {'selector': 'table', 'props': [('table-layout','fixed'), ('width','100%')]},
          {'selector': 'th, td', 'props': [
              ('max-width','280px'),
              ('white-space','nowrap'),
              ('overflow','hidden'),
              ('text-overflow','ellipsis')
          ]}
      ])
      .hide(axis='index')  # remove row numbers
)
# show all distinct price_text values
silver_df.select("price_text").distinct().show(truncate=False)


id,url,title,price_text,price_value_mad,category,breadcrumbs,description,seller_name,seller_type,published_date_text,image_urls,equipments,attributes_map,ingest_ts
57020711,https://www.avito.ma/fr/lissasfa/bureaux/Bureau_√†_louer_d_une_superficie_141_m¬≤_57020711.htm,Bureau √† louer d'une superficie 141 m¬≤,12 690 DH,12690.0,"Bureaux, √† louer",Home Icon Accueil > Tout le Maroc > Casablanca > Lissasfa > Avito Immobilier > Bureaux > Bureau √† louer d'une superficie 141 m¬≤,"FBC met √† votre disposition un plateau bureau 311 √† louer de 141 m¬≤, situ√© dans un espace professionnel, s√©curis√©, calme et propre. Situ√© au 3√®me √©tage, bien √©quip√© : climatisation, 2 ascenseurs, cloisons, chauffage, parking et internet haut d√©bit (fibre optique), kitchenette, acc√®s direct √† deux autoroutes, celle de rond-point Azbane et la Rocade sud-ouest. Pour plus d'information, n'h√©sitez pas √† nous contacter.",FACILITIES BUSINESS CENTER,Particulier,2025-11-02 11:17:06,"['https://content.avito.ma/classifieds/images/10139961083?t=images', 'https://content.avito.ma/classifieds/images/10139961084?t=images', 'https://content.avito.ma/classifieds/images/10139961070?t=images', 'https://content.avito.ma/classifieds/images/10139961074?t=images', 'https://content.avito.ma/classifieds/images/10139961073?t=images', 'https://content.avito.ma/classifieds/images/10139961069?t=images', 'https://content.avito.ma/classifieds/images/10139961068?t=images', 'https://content.avito.ma/classifieds/images/10139961072?t=images', 'https://content.avito.ma/classifieds/images/10139961076?t=images', 'https://content.avito.ma/classifieds/images/10139961077?t=images', 'https://content.avito.ma/classifieds/images/10139961078?t=images', 'https://content.avito.ma/classifieds/images/10139961082?t=images']","['0', '141', '3', '3', 'Ascenseur', 'Chauffage', 'Climatisation', 'C√¢blage t√©l√©phonique', 'Parking', 'S√©curit√©']","{'Nombre de pi√®ces': '3', 'Salle de bain': '0', '√âtage': '3', 'Surface totale': '141'}",2025-11-03 00:17:15.003000
57055336,https://www.avito.ma/fr/hay_riad/appartements/Appartement_en_location_√†_Hay_Riad_Rabat_57055336.htm,Appartement en location √† Hay Riad Rabat,,,"Appartements, √† louer",Home Icon Accueil > Tout le Maroc > Rabat > Hay Riad > Avito Immobilier > Locations Immobili√®res > Appartements > Appartement en location √† Hay Riad Rabat,"Bel appartement de 195 m¬≤ en location au 1 er √©tage situ√© √† Hay Riad Rabat Compos√© de deux salons avec chemin√©e s√©jour cuisine salle d'inviter deux chambres avec salle de bain suite parental avec salle de bain et drissing prix de location 16000dhs / mois pour plus d'informations veuillez contacter nous ,",Immosaadaoui,Particulier,2025-11-02 18:17:08,"['https://content.avito.ma/classifieds/images/10140311388?t=images', 'https://content.avito.ma/classifieds/images/10140311398?t=images', 'https://content.avito.ma/classifieds/images/10140311399?t=images', 'https://content.avito.ma/classifieds/images/10140311404?t=images', 'https://content.avito.ma/classifieds/images/10140311389?t=images', 'https://content.avito.ma/classifieds/images/10140311393?t=images', 'https://content.avito.ma/classifieds/images/10140311387?t=images']","['4', '195', '1']","{'Chambres': '4', '√âtage': '1', 'Surface habitable': '195'}",2025-11-03 00:17:15.003000
57140550,https://www.avito.ma/fr/targa/bureaux/Bureaux_priv√©s_Domiciliation_√†_Targa__Marrakech_57140550.htm,"Bureaux priv√©s-Domiciliation √† Targa, Marrakech",1 200 DH,1200.0,"Bureaux, √† louer","Home Icon Accueil > Tout le Maroc > Marrakech > Targa > Avito Immobilier > Bureaux > Bureaux priv√©s-Domiciliation √† Targa, Marrakech",üè¢ Bureaux priv√©s & domiciliation √† Marrakech Besoin d‚Äôun espace professionnel cl√© en main √† Marrakech ? Excellentia Business Center vous propose : ‚úÖ Bureaux priv√©s √©quip√©s et climatis√©s ‚Äì pr√™ts √† l‚Äôemploi ‚úÖ Internet fibre optique haut d√©bit inclus ‚úÖ Service de domiciliation 100 % en ligne ‚Äì obtenez votre adresse professionnelle sans vous d√©placer ‚úÖ R√©ception et gestion de votre courrier Offrez √† votre entreprise une image professionnelle et un environnement de travail moderne au c≈ìur de Marrakech. üìû Contactez-nous d√®s aujourd‚Äôhui et profitez d‚Äôune solution compl√®te pour votre bureau et domiciliation.,Excellentia Business Center,Particulier,2025-11-02 13:17:10,"['https://content.avito.ma/classifieds/images/10141255291?t=images', 'https://content.avito.ma/classifieds/images/10141255293?t=images', 'https://content.avito.ma/classifieds/images/10141255292?t=images', 'https://content.avito.ma/classifieds/images/10141255294?t=images', 'https://content.avito.ma/classifieds/images/10141255301?t=images', 'https://content.avito.ma/classifieds/images/10141255302?t=images']","['1', '7', '5', '0', 'Ascenseur', 'Climatisation', 'C√¢blage t√©l√©phonique', 'Parking']","{'Nombre de pi√®ces': '5', 'Salle de bain': '1', '√âtage': '0', 'Surface totale': '7'}",2025-11-03 00:17:15.003000
56620071,https://www.avito.ma/fr/val_fleuri/appartements/Studio_meubl√©_Val_Fleuri_TRAMWAY_56620071.htm,Studio meubl√© Val Fleuri TRAMWAY,6 300 DH,6300.0,"Appartements, √† louer",Home Icon Accueil > Tout le Maroc > Casablanca > Val Fleuri > Avito Immobilier > Locations Immobili√®res > Appartements > Studio meubl√© Val Fleuri TRAMWAY,"Studio bien meubl√© √† louer, √† Val Fleuri, 45m¬≤, ETG1, 1 Salon balcon, 1 Cuisine √©quip√©e, 1 Chambre √† coucher,1 SDB douche, ascenseur parking concierge Loyer 6300 Dh par mois",ABAMNY Immobilier,Particulier,2025-11-03 00:58:12,"['https://content.avito.ma/classifieds/images/10141320194?t=images', 'https://content.avito.ma/classifieds/images/10141320200?t=images', 'https://content.avito.ma/classifieds/images/10141320202?t=images', 'https://content.avito.ma/classifieds/images/10141320211?t=images', 'https://content.avito.ma/classifieds/images/10141320220?t=images', 'https://content.avito.ma/classifieds/images/10141320224?t=images', 'https://content.avito.ma/classifieds/images/10141320228?t=images', 'https://content.avito.ma/classifieds/images/10141320229?t=images', 'https://content.avito.ma/classifieds/images/10141320230?t=images']","['1', '1', '45', '1 mois', '1', '45', 'Ascenseur', 'Balcon', 'Climatisation', 'Concierge', 'Cuisine √©quip√©e', 'Meubl√©']","{'Salle de bain': '1', 'Surface habitable': '45', 'Chambres': '1', 'Caution': '1 mois', 'Salons': '1', 'Surface totale': '45'}",2025-11-03 00:17:15.003000
56920617,https://www.avito.ma/fr/bourgogne/local/Magasin_√†_louer_plein_centre_ville_56920617.htm,Magasin √† louer plein centre ville,10 000 DH,10000.0,"Local, √† louer",Home Icon Accueil > Tout le Maroc > Casablanca > Bourgogne > Avito Immobilier > Local > Magasin √† louer plein centre ville,Local √† louer totalement am√©nag√© disponible en place centre-ville. Si vous √™tes vraiment int√©ress√©. Appelle-moi sur le num√©ro Cafe sur l‚Äôannonce. Merci,New Adresse SARL,Particulier,2025-11-03 00:59:14,"['https://content.avito.ma/classifieds/images/10141252952?t=images', 'https://content.avito.ma/classifieds/images/10141252967?t=images', 'https://content.avito.ma/classifieds/images/10141252968?t=images', 'https://content.avito.ma/classifieds/images/10141252971?t=images']","['1', '100']","{'Salle de bain': '1', 'Surface totale': '100'}",2025-11-03 00:17:15.003000
56045169,https://www.avito.ma/fr/hay_al_farah/villas_et_riads/Villa_Semi_Fini_Tarik_Lkheir_56045169.htm,Villa Semi-Fini Tarik Lkheir,,,"Villas et Riads, √† vendre",Home Icon Accueil > Tout le Maroc > Agadir > Hay Al Farah > Avito Immobilier > Ventes Immobili√®res > Villas et Riads > Villa Semi-Fini Tarik Lkheir,Villa Semi finie de 190 m√®tres carr√©s avec deux fa√ßades oppos√©es,SAFIN Immobilier,Particulier,2025-11-03 00:54:15,"['https://content.avito.ma/classifieds/images/10131150418?t=images', 'https://content.avito.ma/classifieds/images/10130913434?t=images', 'https://content.avito.ma/classifieds/images/10130913435?t=images', 'https://content.avito.ma/classifieds/images/10131150420?t=images']","['5', '4', '190', 'Neuf', 'Imm√©diate', '2', 'Balcon', 'Garage', 'Jardin', 'Parking', 'S√©curit√©', 'Terrasse']","{'Condition': 'Neuf', 'Disponibilit√©': 'Imm√©diate', 'Salle de bain': '4', 'Chambres': '5', 'Salons': '2', 'Surface totale': '190'}",2025-11-03 00:10:30.004000
57153823,https://www.avito.ma/fr/marjane_2/appartements/Appartements_√†_vendre_Mekn√®s_Marjane_lotissement_Al_Kawthar_Atakaddo_57153823.htm,Appartements √† vendre Mekn√®s Marjane lotissement Al Kawthar Atakaddo,560 000 DH,560000.0,"Appartements, √† vendre",Home Icon Accueil > Tout le Maroc > Mekn√®s > Marjane 2 > Avito Immobilier > Ventes Immobili√®res > Appartements > Appartements √† vendre Mekn√®s Marjane lotissement Al Kawthar Atakaddo,Appartements √† vendre Marjane Atakaddo lotissement Al Kawthar,ecomerce,Particulier,2025-11-03 00:55:17,"['https://content.avito.ma/classifieds/images/10141390237?t=images', 'https://content.avito.ma/classifieds/images/10141390240?t=images', 'https://content.avito.ma/classifieds/images/10141390238?t=images', 'https://content.avito.ma/classifieds/images/10141390239?t=images']","['3', '2', '110', 'Neuf', 'Imm√©diate', '100', 'Balcon', 'Chauffage', 'Concierge', 'Cuisine √©quip√©e', 'Meubl√©', 'Parking']","{'Condition': 'Neuf', 'Disponibilit√©': 'Imm√©diate', 'Salle de bain': '2', 'Frais de syndic / mois': '100', 'Chambres': '3', 'Surface totale': '110'}",2025-11-03 00:10:30.004000
57153822,https://www.avito.ma/fr/berkane/maisons/Maison_√†_r√©nover_Tahtaha_57153822.htm,Maison √† r√©nover Tahtaha,,,"Maisons, √† vendre",Home Icon Accueil > Tout le Maroc > Berkane > Toute la ville > Avito Immobilier > Ventes Immobili√®res > Maisons > Maison √† r√©nover Tahtaha,Maison √† r√©nover ou √† acheter pour terrain rue tr√®s commerciale en plein milieu de Tahtaha pas de titre.,Sarah Candy,Particulier,2025-11-03 00:55:19,['https://content.avito.ma/classifieds/images/10141390241?t=images'],"['3', '1', '√† r√©nover', 'Imm√©diate', '0']","{'Condition': '√† r√©nover', 'Disponibilit√©': 'Imm√©diate', 'Salle de bain': '1', 'Chambres': '3', 'Salons': '0'}",2025-11-03 00:10:30.004000
56717508,https://www.avito.ma/fr/autre_secteur/maisons/Maison_de_180M2_avec_6_lot_et_piscine_√†_Sidi_Taibi_56717508.htm,Maison de 180M2 avec 6 lot et piscine √† Sidi Taibi,,,"Maisons, √† vendre",Home Icon Accueil > Tout le Maroc > K√©nitra > Autre secteur > Avito Immobilier > Ventes Immobili√®res > Maisons > Maison de 180M2 avec 6 lot et piscine √† Sidi Taibi,"Belle maison calme avec piscine √† Sidi Taibi b√©n√©ficie d'un acc√©s rapide √† mehdia (12 min), Kenitra ( 15min), proche de toutes commodit√©s (march√©, mosqu√©e, pharmacie...) et √©quip√©e (cam√©ra, d√©tecteur...). Les personnes int√©r√©ss√©es peuvent me contacter pour plus d'infos ou visite Interm√©diare s'abstenir SVP.",Hajj,Particulier,2025-11-03 00:54:22,"['https://content.avito.ma/classifieds/images/10137166502?t=images', 'https://content.avito.ma/classifieds/images/10137166511?t=images', 'https://content.avito.ma/classifieds/images/10137166520?t=images', 'https://content.avito.ma/classifieds/images/10137166525?t=images', 'https://content.avito.ma/classifieds/images/10137166532?t=images', 'https://content.avito.ma/classifieds/images/10137166538?t=images', 'https://content.avito.ma/classifieds/images/10137166557?t=images', 'https://content.avito.ma/classifieds/images/10137166578?t=images']","['2', '0', '731', 'Bon √©tat', 'Imm√©diate', '1', 'Balcon', 'Climatisation', 'Garage', 'Jardin', 'Parking', 'Piscine']","{'Condition': 'Bon √©tat', 'Disponibilit√©': 'Imm√©diate', ""Nombre d'√©tage"": '1', 'Salle de bain': '0', 'Chambres': '2', 'Surface totale': '731'}",2025-11-03 00:10:30.004000
56941776,https://www.avito.ma/fr/florida/maisons/Maison_triplex_spacieuse_avec_jardin_et_terrasse_56941776.htm,Maison triplex spacieuse avec jardin et terrasse,3 250 000 DH,3250000.0,"Maisons, √† vendre",Home Icon Accueil > Tout le Maroc > Casablanca > Florida > Avito Immobilier > Ventes Immobili√®res > Maisons > Maison triplex spacieuse avec jardin et terrasse,"BOUANANI IMMOBILIER VOUS PROPOSE CET MAGNIFIQUE TRIPLEX AVEC JARDIN √Ä VENDRE D√©couvrez cette magnifique maison triplex alliant modernit√©, confort et √©l√©gance, situ√©e dans un cadre calme et agr√©able. SOUS-SOL : grand salon, grande cuisine, salle √† manger, salle de bain, d√©barr√¢t RDC : salon, grande chambre, grande salle de bain, garage 1er √©tage : 2 grandes chambres avec placards, grand salon, vasque, salle de bain 2√®me √©tage: chambre, petite cuisine, salle de bains et terrasse Fait l‚Äôangle 2 Fa√ßades Ensoleill√© toute la journ√©e orientation est- sud Grand jardin qui tourne de la maison POUR PLUS D‚ÄôINFORMATIONS VEUILLEZ CONTACTER AGENCE BOUANANI IMMOBILIER",BOUANANI IMMOBILIER,Particulier,2025-11-03 00:20:15,"['https://content.avito.ma/classifieds/images/10139168399?t=images', 'https://content.avito.ma/classifieds/images/10139168374?t=images', 'https://content.avito.ma/classifieds/images/10139168548?t=images', 'https://content.avito.ma/classifieds/images/10139168547?t=images', 'https://content.avito.ma/classifieds/images/10139168354?t=images', 'https://content.avito.ma/classifieds/images/10139168375?t=images', 'https://content.avito.ma/classifieds/images/10139168267?t=images', 'https://content.avito.ma/classifieds/images/10139168400?t=images', 'https://content.avito.ma/classifieds/images/10139168427?t=images', 'https://content.avito.ma/classifieds/images/10139168265?t=images', 'https://content.avito.ma/classifieds/images/10139168426?t=images', 'https://content.avito.ma/classifieds/images/10139168356?t=images', 'https://content.avito.ma/classifieds/images/10139168401?t=images', 'https://content.avito.ma/classifieds/images/10139168319?t=images', 'https://content.avito.ma/classifieds/images/10139168373?t=images', 'https://content.avito.ma/classifieds/images/10139168372?t=images', 'https://content.avito.ma/classifieds/images/10139168268?t=images', 'https://content.avito.ma/classifieds/images/10139168355?t=images', 'https://content.avito.ma/classifieds/images/10139168595?t=images', 'https://content.avito.ma/classifieds/images/10139168596?t=images']","['4', '4', '290', 'Bon √©tat', 'Imm√©diate', '4', 'Chauffage', 'Climatisation', 'Cuisine √©quip√©e', 'Garage', 'Jardin', 'Terrasse']","{'Condition': 'Bon √©tat', 'Disponibilit√©': 'Imm√©diate', ""Nombre d'√©tage"": '4', 'Salle de bain': '4', 'Chambres': '4', 'Surface totale': '290'}",2025-11-02 23:30:30.003000


+------------+
|price_text  |
+------------+
|35 000 DH   |
|1 200 DH    |
|6 500 DH    |
|560 000 DH  |
|25 000 DH   |
|6 300 DH    |
|9 880 DH    |
|10 000 DH   |
|3 200 000 DH|
|12 690 DH   |
|14 000 DH   |
|500 000 DH  |
|2 200 DH    |
|3 100 000 DH|
|5 250 DH    |
|2 500 DH    |
|3 700 DH    |
|7 900 DH    |
|2 500 000 DH|
|490 000 DH  |
+------------+
only showing top 20 rows



In [345]:
from pyspark.sql import functions as F

ID_COL = "id"  # change if your column is named differently
df = silver_df.withColumn("id_norm", F.trim(F.col(ID_COL).cast("string")))

In [346]:
total_rows    = df.count()
distinct_ids  = df.select("id_norm").distinct().count()
dup_row_count = total_rows - distinct_ids
print(f"Total rows = {total_rows} | Distinct IDs = {distinct_ids} | Duplicate rows (extra) = {dup_row_count}")

Total rows = 130 | Distinct IDs = 104 | Duplicate rows (extra) = 26


In [347]:
from pyspark.sql import functions as F

# (optionnel) filtrer les id vides
silver_df = silver_df.filter(F.col("id").isNotNull() & (F.trim(F.col("id")) != ""))

silver_df = (
    silver_df
      .withColumn("id_norm",
                  F.regexp_replace(F.trim(F.col("id").cast("string")), r"\s+", ""))
      .dropDuplicates(["id_norm"])
      .drop("id_norm")
)

In [348]:
total_rows    = df.count()
distinct_ids  = df.select("id_norm").distinct().count()
dup_row_count = total_rows - distinct_ids
print(f"Total rows = {total_rows} | Distinct IDs = {distinct_ids} | Duplicate rows (extra) = {dup_row_count}")

Total rows = 130 | Distinct IDs = 104 | Duplicate rows (extra) = 26


In [349]:
from pyspark.sql import functions as F

silver_df.select(
    F.when(F.col("price_text").isNull(), F.lit("NULL"))
     .otherwise(F.col("price_text"))
     .alias("price_text")
).show(10, truncate=False)


+----------+
|price_text|
+----------+
|195 000 DH|
|7 200 DH  |
|8 500 DH  |
|6 300 DH  |
|NULL      |
|260 000 DH|
|9 880 DH  |
|260 000 DH|
|7 000 DH  |
|11 000 DH |
+----------+
only showing top 10 rows



In [350]:
silver_df = (
    silver_df
      # Rename 'price_value_mad' to 'price_value'
      .withColumnRenamed("price_value_mad", "price_value")
      # Drop 'price_text' column
      .drop("price_text")
)

In [351]:
import pandas as pd
from IPython.display import display

# Keep things compact
pd.set_option("display.max_columns", 20)   # don't try to show hundreds
pd.set_option("display.max_colwidth", 80)  # clamp long cells to ~80 chars

# pick a small sample and flatten newlines so rows stay short
pdf = (silver_df.limit(10)
       .toPandas()
       .replace({r'[\r\n\t]+': ' '}, regex=True))

# simple, compact table with ellipsis in long cells
display(
    pdf.style
      .set_table_styles([
          {'selector': 'table', 'props': [('table-layout','fixed'), ('width','100%')]},
          {'selector': 'th, td', 'props': [
              ('max-width','280px'),
              ('white-space','nowrap'),
              ('overflow','hidden'),
              ('text-overflow','ellipsis')
          ]}
      ])
      .hide(axis='index')  # remove row numbers
)
# show all distinct price_text values


id,url,title,price_value,category,breadcrumbs,description,seller_name,seller_type,published_date_text,image_urls,equipments,attributes_map,ingest_ts
37619566,https://www.avito.ma/fr/autre_secteur/appartements/Appartement_Riad_Essalam_Beni_Yekhlef__Mohammedia_37619566.htm,Appartement Riad Essalam Beni Yekhlef- Mohammedia,195000.0,"Appartements, √† vendre",Home Icon Accueil > Tout le Maroc > Mohammedia > Autre secteur > Avito Immobilier > Ventes Immobili√®res > Appartements > Appartement Riad Essalam Beni Yekhlef- Mohammedia,R√©sidences √©conomiques avec ascenseurs. Une Chambre/ salon/ cuisine/salle de bain. Prix : 195 000DH Livraison imm√©diate.,Groupe Ikamati,Particulier,2025-11-03 00:17:19,"['https://content.avito.ma/classifieds/images/2533557603?t=images', 'https://content.avito.ma/classifieds/images/2539801094?t=images', 'https://content.avito.ma/classifieds/images/2516510965?t=images', 'https://content.avito.ma/classifieds/images/2504023983?t=images', 'https://content.avito.ma/classifieds/images/2582417689?t=images', 'https://content.avito.ma/classifieds/images/2572806528?t=images']","['1', '1', 'Neuf', 'Imm√©diate', '0', 'Economique', 'Ascenseur']","{'Condition': 'Neuf', 'Disponibilit√©': 'Imm√©diate', 'Salle de bain': '1', 'Standing': 'Economique', 'Chambres': '1', 'Salons': '0'}",2025-11-02 23:30:30.003000
37621281,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartement_Sidi_Bernoussi_R√©sidences_Al_Badr_37621281.htm,Appartement Sidi Bernoussi R√©sidences Al Badr,7200.0,"Appartements, √† vendre",Home Icon Accueil > Tout le Maroc > Casablanca > Sidi Bernoussi > Avito Immobilier > Ventes Immobili√®res > Appartements > Appartement Sidi Bernoussi R√©sidences Al Badr,"Complexe r√©sidentiel Al Badr est un projet moyen standing du Groupe Ikamati situ√© au meilleur quartier √† Sidi Bernoussi proche de toutes les commodit√©s n√©cessaires : √âcoles priv√©es et publiques, commerces de proximit√©, boulangeries, p√¢tisseries, caf√©s, pharmacies, hammam, plateaux de bureau,‚Ä¶ Avec un acc√®s direct √† l‚Äôautoroute Casablanca ‚ÄìRabat. Des appartements livrables dans l‚Äôimm√©diat avec des superficies qui varient entre 74m¬≤ et 96m¬≤. Dot√©s d‚Äôune finition irr√©prochable : cuisines √©quip√©es, carrelage de qualit√© premium, volets roulants motoris√©s, l‚Äôutilisation du bois de ch√™ne,‚Ä¶ Les r√©sidences sont s√©curis√©es 24h/24 et 7j/7j. A l‚Äôoccasion de la saison d'√©t√© on vous offre une offre exclusive : le tout √† 7200 dh m¬≤ au lieu de 8200dh/m¬≤. offre limit√©e et valable jusqu'au 31/08/2023. Pour plus d‚Äôinformations, appelez nous ou visitez nos bureaux de vente ouverts toute la semaine et m√™me les week-ends de 9h √† 19h.",Groupe Ikamati,Particulier,2025-11-03 00:32:17,"['https://content.avito.ma/classifieds/images/9761138868?t=images', 'https://content.avito.ma/classifieds/images/9751423563?t=images', 'https://content.avito.ma/classifieds/images/9792952316?t=images', 'https://content.avito.ma/classifieds/images/9771942015?t=images', 'https://content.avito.ma/classifieds/images/9712278782?t=images']","['3', '100', 'Neuf', '49', 'Moins de 1 an', '0', 'Ascenseur', 'Balcon', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']","{'Condition': 'Neuf', '√âtage': '0', 'Surface habitable': '49', 'Chambres': '3', 'Surface totale': '100', '√Çge du bien': 'Moins de 1 an'}",2025-11-02 23:40:30.004000
37621456,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartement_√†_vendre_64_m¬≤_√†_Casablanca_37621456.htm,Appartement √† vendre 64 m¬≤ √† Casablanca,8500.0,"Appartements, √† vendre",Home Icon Accueil > Tout le Maroc > Casablanca > Sidi Bernoussi > Avito Immobilier > Ventes Immobili√®res > Appartements > Appartement √† vendre 64 m¬≤ √† Casablanca,"R√©sidence s√©curis√©e avec cam√©ras de surveillance, ascenseur, parking sous-sol, parabole collective, piscine et climatisation pr√©-install√©e. Avec une finition de bon standing, les appartements de r√©sidences El Yassamine disposent de cuisines √©quip√©es, Bois de ch√™ne naturel, Volets roulants motoris√©s, Douche italienne, Sanitaire haut de gamme, ‚Ä¶ La r√©sidence est √† proximit√© de : √âcoles priv√©e et publique, commerces de proximit√©, boulangeries, p√¢tisseries, caf√©s, pharmacies, hammam, plateaux de bureau. R√©servez votre appartement et b√©n√©ficier de remises exceptionnelles sur le prix de vente.",Groupe Ikamati,Particulier,2025-11-03 00:21:11,"['https://content.avito.ma/classifieds/images/9757591781?t=images', 'https://content.avito.ma/classifieds/images/7742218029?t=images', 'https://content.avito.ma/classifieds/images/9790388927?t=images', 'https://content.avito.ma/classifieds/images/9777514240?t=images', 'https://content.avito.ma/classifieds/images/9768290784?t=images', 'https://content.avito.ma/classifieds/images/9785829271?t=images']","['2', '1', '1', '64', '4']","{'Salle de bain': '1', '√âtage': '4', 'Surface habitable': '64', 'Chambres': '2', 'Salons': '1'}",2025-11-02 23:30:15.003000
52151097,https://www.avito.ma/fr/riviera/appartements/Studio_meubl√©_Riviera_52151097.htm,Studio meubl√© Riviera,6300.0,"Appartements, √† louer",Home Icon Accueil > Tout le Maroc > Casablanca > Riviera > Avito Immobilier > Locations Immobili√®res > Appartements > Studio meubl√© Riviera,"Studio meubl√© en location √† Riviera ,proche arr√™t TRAM, dans une R√©sidence s√©curis√©e avec ascenseur place au parking, superficie 44m¬≤, au 2 √©me √©tage, 1 Salon , 1 Cuisine √©quip√©e 1 Chambre √† coucher , 1 SDB douche, balcon , climatisation Loyer 6300 Dh par mois",ABAMNY Immobilier,Particulier,2025-11-03 00:41:10,"['https://content.avito.ma/classifieds/images/10141320311?t=images', 'https://content.avito.ma/classifieds/images/10141320312?t=images', 'https://content.avito.ma/classifieds/images/10141320313?t=images', 'https://content.avito.ma/classifieds/images/10141320314?t=images', 'https://content.avito.ma/classifieds/images/10141320315?t=images', 'https://content.avito.ma/classifieds/images/10141320317?t=images']","['1', '1', '44', '1 mois', '1', '44', 'Ascenseur', 'Balcon', 'Climatisation', 'Concierge', 'Cuisine √©quip√©e', 'Meubl√©']","{'Salle de bain': '1', 'Surface habitable': '44', 'Chambres': '1', 'Caution': '1 mois', 'Salons': '1', 'Surface totale': '44'}",2025-11-02 23:45:15.002000
53988201,https://www.avito.ma/fr/tamraght/villas_et_riads/Villa_Taghazout_Bay_vue_mer_53988201.htm,Villa Taghazout Bay vue mer,,"Villas et Riads, √† vendre",Home Icon Accueil > Tout le Maroc > Agadir > Tamraght > Avito Immobilier > Ventes Immobili√®res > Villas et Riads > Villa Taghazout Bay vue mer,Villa de 3 chambres compl√®tement r√©nov√©e avec du mat√©riel de luxe,Holiday Resorts Taghazout,Particulier,2025-11-02 18:20:10,"['https://content.avito.ma/classifieds/images/10109625457?t=images', 'https://content.avito.ma/classifieds/images/10141228594?t=images', 'https://content.avito.ma/classifieds/images/10141228593?t=images']","['3', '2', '650', '2', '2', '250', 'Balcon', 'Chauffage', 'Climatisation', 'Cuisine √©quip√©e', 'Garage', 'Meubl√©']","{""Nombre d'√©tage"": '2', 'Salle de bain': '2', 'Surface habitable': '250', 'Chambres': '3', 'Salons': '2', 'Surface totale': '650'}",2025-11-03 00:20:15.003000
54036040,https://www.avito.ma/fr/autre_secteur/terrains_et_fermes/Cinq_hectares_et_quatre_ouvriers__tous_en_oliviers_54036040.htm,"Cinq hectares et quatre ouvriers, tous en oliviers",260000.0,"Terrains et fermes, √† vendre","Home Icon Accueil > Tout le Maroc > K√©nitra > Autre secteur > Avito Immobilier > Terrains et fermes > Cinq hectares et quatre ouvriers, tous en oliviers","Excellente terre agricole de cinq hectares, enti√®rement plant√©e d'oliviers √† A√Øn Johra. Excellente terre, excellente nappe phr√©atique. Tiflet, prix de 26 millions par hectare, proche d'El Kamouni √† 18 km.",Immo continental,Particulier,2025-11-03 00:34:19,"['https://content.avito.ma/classifieds/images/10110154187?t=images', 'https://content.avito.ma/classifieds/images/10110154188?t=images']","['54000', 'Agricole']","{'Surface totale': '54000', 'Zoning': 'Agricole'}",2025-11-02 23:40:30.004000
54393790,https://www.avito.ma/fr/roches_noires/bureaux/Plateaux_bureaux_de_haut_standing_de_76_√†_6000_m¬≤_54393790.htm,Plateaux bureaux de haut standing de 76 √† 6000 m¬≤,9880.0,"Bureaux, √† louer",Home Icon Accueil > Tout le Maroc > Casablanca > Roches Noires > Avito Immobilier > Bureaux > Plateaux bureaux de haut standing de 76 √† 6000 m¬≤,"CENTRE D‚ÄôAFFAIRES Moulay ISMAIL PLATEAUX BUREAUX de HAUT STANDING Votre Espace Professionnel Assur√© en des Plateaux bureaux de HAUT STANDING FUSIONNABLES. Mat√©riaux Haut de Gamme, une Belle Conception & Prestations, avec une variante de 76 m¬≤ √† 6000 m¬≤. Tout y est Optimis√© pour votre Confort Professionnel. - Climatisation Centrale - Kitchenette - Fibre optique - Cam√©ras de surveillance internes & externes, - D√©tecteur de fum√©e - alarme d‚Äôincendie - Domotique - Isolation acoustique & thermique luminosit√© - Parfaites a√©ration & distribution - 2 sous sols en parking SECURIS√© 24/24",GOLF BUILDING,Particulier,2025-11-02 16:25:08,"['https://content.avito.ma/classifieds/images/10113651400?t=images', 'https://content.avito.ma/classifieds/images/10113651409?t=images', 'https://content.avito.ma/classifieds/images/10113651461?t=images', 'https://content.avito.ma/classifieds/images/10113652890?t=images', 'https://content.avito.ma/classifieds/images/10113652899?t=images', 'https://content.avito.ma/classifieds/images/10113652930?t=images', 'https://content.avito.ma/classifieds/images/10113652934?t=images', 'https://content.avito.ma/classifieds/images/10113652937?t=images', 'https://content.avito.ma/classifieds/images/10113652938?t=images', 'https://content.avito.ma/classifieds/images/10113652939?t=images', 'https://content.avito.ma/classifieds/images/10113652940?t=images', 'https://content.avito.ma/classifieds/images/10113652944?t=images', 'https://content.avito.ma/classifieds/images/10113652951?t=images', 'https://content.avito.ma/classifieds/images/10113652954?t=images', 'https://content.avito.ma/classifieds/images/10113652958?t=images']","['1', '76', '1', '2', 'Ascenseur', 'Chauffage', 'Climatisation', 'C√¢blage t√©l√©phonique', 'Parking', 'S√©curit√©']","{'Nombre de pi√®ces': '1', 'Salle de bain': '1', '√âtage': '2', 'Surface totale': '76'}",2025-11-02 23:25:15.003000
54679330,https://www.avito.ma/fr/sidi_allal_el_bahraoui/terrains_et_fermes/Cinq_hectares_d_oliviers_√†_prix_tr√®s_bas_54679330.htm,Cinq hectares d'oliviers √† prix tr√®s bas,260000.0,"Terrains et fermes, √† vendre",Home Icon Accueil > Tout le Maroc > Sidi Allal El Bahraoui > Toute la ville > Avito Immobilier > Terrains et fermes > Cinq hectares d'oliviers √† prix tr√®s bas,"Cinq hectares et demi, excellents, enti√®rement plant√©s d'oliviers, tr√®s bon march√©. Prix : 26 millions l'hectare. Eau disponible en abondance. Situ√©s √† A√Øn Johra.",Immo continental,Particulier,2025-11-03 00:42:15,['https://content.avito.ma/classifieds/images/10116283222?t=images'],"['54000', 'Agricole']","{'Surface totale': '54000', 'Zoning': 'Agricole'}",2025-11-02 23:52:30.003000
55174614,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartements_√†_vendre_√†_Casablanca_55174614.htm,Appartements √† vendre √† Casablanca,7000.0,"Appartements, √† vendre",Home Icon Accueil > Tout le Maroc > Casablanca > Sidi Bernoussi > Avito Immobilier > Ventes Immobili√®res > Appartements > Appartements √† vendre √† Casablanca,"R√©sidence Jnan Sbil 2 (moyen standing) entre la nouvelle ville Zenata et Sidi Bernoussi pr√®s de la route nationale 1 casa-rabat. 3 chambres / 2 chambres Ascenseur Les √©quipements du projet : Espaces verts, Hammam, salle de sport, mosqu√©e, commerces.... Livraison imm√©diate",Groupe Ikamati,Particulier,2025-11-03 00:05:04,"['https://content.avito.ma/classifieds/images/10121657711?t=images', 'https://content.avito.ma/classifieds/images/10121657714?t=images', 'https://content.avito.ma/classifieds/images/10121657715?t=images', 'https://content.avito.ma/classifieds/images/10121657716?t=images', 'https://content.avito.ma/classifieds/images/10121657717?t=images', 'https://content.avito.ma/classifieds/images/10121657718?t=images', 'https://content.avito.ma/classifieds/images/10121657719?t=images', 'https://content.avito.ma/classifieds/images/10121657713?t=images', 'https://content.avito.ma/classifieds/images/10121657720?t=images', 'https://content.avito.ma/classifieds/images/10121657721?t=images', 'https://content.avito.ma/classifieds/images/10121657722?t=images', 'https://content.avito.ma/classifieds/images/10121657723?t=images', 'https://content.avito.ma/classifieds/images/10121657724?t=images', 'https://content.avito.ma/classifieds/images/10121657725?t=images']","['3', '2', 'Neuf', '1', '105', 'Moins de 1 an', 'Ascenseur', 'Balcon']","{'Condition': 'Neuf', 'Salle de bain': '2', 'Surface habitable': '105', 'Chambres': '3', 'Salons': '1', '√Çge du bien': 'Moins de 1 an'}",2025-11-02 23:22:15.003000
55344055,https://www.avito.ma/fr/aviation___mabella/appartements/Appartement_R√©nov√©_√†_louer_Quartier_Administratif_55344055.htm,Appartement R√©nov√© √† louer Quartier Administratif,11000.0,"Appartements, √† louer",Home Icon Accueil > Tout le Maroc > Rabat > Aviation - Mabella > Avito Immobilier > Locations Immobili√®res > Appartements > Appartement R√©nov√© √† louer Quartier Administratif,REF 2A610 Le Cabinet Sa√Ød BENNIS IMMOBILIER met en Location un bel appartement avec vue sur la vall√©e √† Youssoufia. L‚Äôappartement est situ√© au 2e √©tage d‚Äôun immeuble s√©curis√© et sans vis-√†-vis. Descriptif : ‚Ä¢ 1 Suite parentale avec Salle de bain et Dressing ‚Ä¢ 2 Chambres √† coucher ‚Ä¢ 1 Salle de bain ‚Ä¢ 1 Double Salon avec chemin√©e ‚Ä¢ 1 Terrasse avec vue sur la vall√©e ‚Ä¢ 1 Salle d‚Äôeau invit√©s ‚Ä¢ 1 Cuisine √©quip√©e avec buanderie ‚Ä¢ 2 Places au garage ‚Ä¢ Climatisation ‚Ä¢ Cam√©ra de surveillance Superficie : 170 m2 Prix : 11 000 DH/mois Disponibilit√© imm√©diate N‚Äôh√©sitez pas √† nous contacter pour plus d‚Äôinformations.,Cabinet Immobilier Sa√Ød BENNIS,Particulier,2025-11-02 23:35:06,"['https://content.avito.ma/classifieds/images/10134065982?t=images', 'https://content.avito.ma/classifieds/images/10134065983?t=images', 'https://content.avito.ma/classifieds/images/10134065984?t=images', 'https://content.avito.ma/classifieds/images/10134065992?t=images', 'https://content.avito.ma/classifieds/images/10134066015?t=images', 'https://content.avito.ma/classifieds/images/10134066016?t=images', 'https://content.avito.ma/classifieds/images/10134066017?t=images', 'https://content.avito.ma/classifieds/images/10134065993?t=images']","['3', '2', '1 mois', '2', '170', '2', 'Climatisation', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']","{'Salle de bain': '2', '√âtage': '2', 'Surface habitable': '170', 'Chambres': '3', 'Caution': '1 mois', 'Salons': '2'}",2025-11-02 23:35:15.003000


In [352]:
silver_df.select("category").distinct().show(truncate=False)

+----------------------------+
|category                    |
+----------------------------+
|Autre Immobilier, √† vendre  |
|Bureaux, √† louer            |
|Local, √† louer              |
|Appartements, √† louer       |
|Local, √† vendre             |
|Villas et Riads, √† louer    |
|Bureaux, √† vendre           |
|Terrains et fermes, √† vendre|
|Maisons, √† vendre           |
|Appartements, √† vendre      |
|Villas et Riads, √† vendre   |
|NULL                        |
+----------------------------+



In [353]:
from pyspark.sql import functions as F

silver_df = (
    silver_df
      # Create 'type' column for '√† louer' or '√† vendre'
      .withColumn(
          "type",
          F.when(F.col("category").contains("√† louer"), "√† louer")
           .when(F.col("category").contains("√† vendre"), "√† vendre")
           .otherwise(None)
      )
      # Create 'category_type' column with only the property type (e.g., Maisons, Appartements)
      .withColumn(
          "category_type",
          F.when(F.col("category").contains("√† louer") | F.col("category").contains("√† vendre"), 
                 F.split(F.col("category"), ",")[0])
           .otherwise(None)
      )
      # Drop the original 'category' column
      .drop("category")
)

# Check the result
silver_df.select("type", "category_type").show(30, truncate=False)


+--------+------------------+
|type    |category_type     |
+--------+------------------+
|√† vendre|Appartements      |
|√† vendre|Appartements      |
|√† vendre|Appartements      |
|√† louer |Appartements      |
|√† vendre|Villas et Riads   |
|√† vendre|Terrains et fermes|
|√† louer |Bureaux           |
|√† vendre|Terrains et fermes|
|√† vendre|Appartements      |
|√† louer |Appartements      |
|√† vendre|Appartements      |
|√† louer |Appartements      |
|√† louer |Bureaux           |
|√† vendre|Appartements      |
|√† vendre|Maisons           |
|√† vendre|Maisons           |
|√† vendre|Villas et Riads   |
|√† vendre|Bureaux           |
|√† vendre|Appartements      |
|√† vendre|Terrains et fermes|
|√† louer |Bureaux           |
|√† vendre|Autre Immobilier  |
|√† vendre|Terrains et fermes|
|√† louer |Appartements      |
|√† vendre|Appartements      |
|√† vendre|Appartements      |
|√† vendre|Appartements      |
|√† vendre|Maisons           |
|√† vendre|Villas et Riads   |
|√† louer |

In [354]:
import pandas as pd
from IPython.display import display

# Keep things compact
pd.set_option("display.max_columns", 20)   # don't try to show hundreds
pd.set_option("display.max_colwidth", 80)  # clamp long cells to ~80 chars

# pick a small sample and flatten newlines so rows stay short
pdf = (silver_df.limit(10)
       .toPandas()
       .replace({r'[\r\n\t]+': ' '}, regex=True))

# simple, compact table with ellipsis in long cells
display(
    pdf.style
      .set_table_styles([
          {'selector': 'table', 'props': [('table-layout','fixed'), ('width','100%')]},
          {'selector': 'th, td', 'props': [
              ('max-width','280px'),
              ('white-space','nowrap'),
              ('overflow','hidden'),
              ('text-overflow','ellipsis')
          ]}
      ])
      .hide(axis='index')  # remove row numbers
)

id,url,title,price_value,breadcrumbs,description,seller_name,seller_type,published_date_text,image_urls,equipments,attributes_map,ingest_ts,type,category_type
37619566,https://www.avito.ma/fr/autre_secteur/appartements/Appartement_Riad_Essalam_Beni_Yekhlef__Mohammedia_37619566.htm,Appartement Riad Essalam Beni Yekhlef- Mohammedia,195000.0,Home Icon Accueil > Tout le Maroc > Mohammedia > Autre secteur > Avito Immobilier > Ventes Immobili√®res > Appartements > Appartement Riad Essalam Beni Yekhlef- Mohammedia,R√©sidences √©conomiques avec ascenseurs. Une Chambre/ salon/ cuisine/salle de bain. Prix : 195 000DH Livraison imm√©diate.,Groupe Ikamati,Particulier,2025-11-03 00:17:19,"['https://content.avito.ma/classifieds/images/2533557603?t=images', 'https://content.avito.ma/classifieds/images/2539801094?t=images', 'https://content.avito.ma/classifieds/images/2516510965?t=images', 'https://content.avito.ma/classifieds/images/2504023983?t=images', 'https://content.avito.ma/classifieds/images/2582417689?t=images', 'https://content.avito.ma/classifieds/images/2572806528?t=images']","['1', '1', 'Neuf', 'Imm√©diate', '0', 'Economique', 'Ascenseur']","{'Condition': 'Neuf', 'Disponibilit√©': 'Imm√©diate', 'Salle de bain': '1', 'Standing': 'Economique', 'Chambres': '1', 'Salons': '0'}",2025-11-02 23:30:30.003000,√† vendre,Appartements
37621281,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartement_Sidi_Bernoussi_R√©sidences_Al_Badr_37621281.htm,Appartement Sidi Bernoussi R√©sidences Al Badr,7200.0,Home Icon Accueil > Tout le Maroc > Casablanca > Sidi Bernoussi > Avito Immobilier > Ventes Immobili√®res > Appartements > Appartement Sidi Bernoussi R√©sidences Al Badr,"Complexe r√©sidentiel Al Badr est un projet moyen standing du Groupe Ikamati situ√© au meilleur quartier √† Sidi Bernoussi proche de toutes les commodit√©s n√©cessaires : √âcoles priv√©es et publiques, commerces de proximit√©, boulangeries, p√¢tisseries, caf√©s, pharmacies, hammam, plateaux de bureau,‚Ä¶ Avec un acc√®s direct √† l‚Äôautoroute Casablanca ‚ÄìRabat. Des appartements livrables dans l‚Äôimm√©diat avec des superficies qui varient entre 74m¬≤ et 96m¬≤. Dot√©s d‚Äôune finition irr√©prochable : cuisines √©quip√©es, carrelage de qualit√© premium, volets roulants motoris√©s, l‚Äôutilisation du bois de ch√™ne,‚Ä¶ Les r√©sidences sont s√©curis√©es 24h/24 et 7j/7j. A l‚Äôoccasion de la saison d'√©t√© on vous offre une offre exclusive : le tout √† 7200 dh m¬≤ au lieu de 8200dh/m¬≤. offre limit√©e et valable jusqu'au 31/08/2023. Pour plus d‚Äôinformations, appelez nous ou visitez nos bureaux de vente ouverts toute la semaine et m√™me les week-ends de 9h √† 19h.",Groupe Ikamati,Particulier,2025-11-03 00:32:17,"['https://content.avito.ma/classifieds/images/9761138868?t=images', 'https://content.avito.ma/classifieds/images/9751423563?t=images', 'https://content.avito.ma/classifieds/images/9792952316?t=images', 'https://content.avito.ma/classifieds/images/9771942015?t=images', 'https://content.avito.ma/classifieds/images/9712278782?t=images']","['3', '100', 'Neuf', '49', 'Moins de 1 an', '0', 'Ascenseur', 'Balcon', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']","{'Condition': 'Neuf', '√âtage': '0', 'Surface habitable': '49', 'Chambres': '3', 'Surface totale': '100', '√Çge du bien': 'Moins de 1 an'}",2025-11-02 23:40:30.004000,√† vendre,Appartements
37621456,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartement_√†_vendre_64_m¬≤_√†_Casablanca_37621456.htm,Appartement √† vendre 64 m¬≤ √† Casablanca,8500.0,Home Icon Accueil > Tout le Maroc > Casablanca > Sidi Bernoussi > Avito Immobilier > Ventes Immobili√®res > Appartements > Appartement √† vendre 64 m¬≤ √† Casablanca,"R√©sidence s√©curis√©e avec cam√©ras de surveillance, ascenseur, parking sous-sol, parabole collective, piscine et climatisation pr√©-install√©e. Avec une finition de bon standing, les appartements de r√©sidences El Yassamine disposent de cuisines √©quip√©es, Bois de ch√™ne naturel, Volets roulants motoris√©s, Douche italienne, Sanitaire haut de gamme, ‚Ä¶ La r√©sidence est √† proximit√© de : √âcoles priv√©e et publique, commerces de proximit√©, boulangeries, p√¢tisseries, caf√©s, pharmacies, hammam, plateaux de bureau. R√©servez votre appartement et b√©n√©ficier de remises exceptionnelles sur le prix de vente.",Groupe Ikamati,Particulier,2025-11-03 00:21:11,"['https://content.avito.ma/classifieds/images/9757591781?t=images', 'https://content.avito.ma/classifieds/images/7742218029?t=images', 'https://content.avito.ma/classifieds/images/9790388927?t=images', 'https://content.avito.ma/classifieds/images/9777514240?t=images', 'https://content.avito.ma/classifieds/images/9768290784?t=images', 'https://content.avito.ma/classifieds/images/9785829271?t=images']","['2', '1', '1', '64', '4']","{'Salle de bain': '1', '√âtage': '4', 'Surface habitable': '64', 'Chambres': '2', 'Salons': '1'}",2025-11-02 23:30:15.003000,√† vendre,Appartements
52151097,https://www.avito.ma/fr/riviera/appartements/Studio_meubl√©_Riviera_52151097.htm,Studio meubl√© Riviera,6300.0,Home Icon Accueil > Tout le Maroc > Casablanca > Riviera > Avito Immobilier > Locations Immobili√®res > Appartements > Studio meubl√© Riviera,"Studio meubl√© en location √† Riviera ,proche arr√™t TRAM, dans une R√©sidence s√©curis√©e avec ascenseur place au parking, superficie 44m¬≤, au 2 √©me √©tage, 1 Salon , 1 Cuisine √©quip√©e 1 Chambre √† coucher , 1 SDB douche, balcon , climatisation Loyer 6300 Dh par mois",ABAMNY Immobilier,Particulier,2025-11-03 00:41:10,"['https://content.avito.ma/classifieds/images/10141320311?t=images', 'https://content.avito.ma/classifieds/images/10141320312?t=images', 'https://content.avito.ma/classifieds/images/10141320313?t=images', 'https://content.avito.ma/classifieds/images/10141320314?t=images', 'https://content.avito.ma/classifieds/images/10141320315?t=images', 'https://content.avito.ma/classifieds/images/10141320317?t=images']","['1', '1', '44', '1 mois', '1', '44', 'Ascenseur', 'Balcon', 'Climatisation', 'Concierge', 'Cuisine √©quip√©e', 'Meubl√©']","{'Salle de bain': '1', 'Surface habitable': '44', 'Chambres': '1', 'Caution': '1 mois', 'Salons': '1', 'Surface totale': '44'}",2025-11-02 23:45:15.002000,√† louer,Appartements
53988201,https://www.avito.ma/fr/tamraght/villas_et_riads/Villa_Taghazout_Bay_vue_mer_53988201.htm,Villa Taghazout Bay vue mer,,Home Icon Accueil > Tout le Maroc > Agadir > Tamraght > Avito Immobilier > Ventes Immobili√®res > Villas et Riads > Villa Taghazout Bay vue mer,Villa de 3 chambres compl√®tement r√©nov√©e avec du mat√©riel de luxe,Holiday Resorts Taghazout,Particulier,2025-11-02 18:20:10,"['https://content.avito.ma/classifieds/images/10109625457?t=images', 'https://content.avito.ma/classifieds/images/10141228594?t=images', 'https://content.avito.ma/classifieds/images/10141228593?t=images']","['3', '2', '650', '2', '2', '250', 'Balcon', 'Chauffage', 'Climatisation', 'Cuisine √©quip√©e', 'Garage', 'Meubl√©']","{""Nombre d'√©tage"": '2', 'Salle de bain': '2', 'Surface habitable': '250', 'Chambres': '3', 'Salons': '2', 'Surface totale': '650'}",2025-11-03 00:20:15.003000,√† vendre,Villas et Riads
54036040,https://www.avito.ma/fr/autre_secteur/terrains_et_fermes/Cinq_hectares_et_quatre_ouvriers__tous_en_oliviers_54036040.htm,"Cinq hectares et quatre ouvriers, tous en oliviers",260000.0,"Home Icon Accueil > Tout le Maroc > K√©nitra > Autre secteur > Avito Immobilier > Terrains et fermes > Cinq hectares et quatre ouvriers, tous en oliviers","Excellente terre agricole de cinq hectares, enti√®rement plant√©e d'oliviers √† A√Øn Johra. Excellente terre, excellente nappe phr√©atique. Tiflet, prix de 26 millions par hectare, proche d'El Kamouni √† 18 km.",Immo continental,Particulier,2025-11-03 00:34:19,"['https://content.avito.ma/classifieds/images/10110154187?t=images', 'https://content.avito.ma/classifieds/images/10110154188?t=images']","['54000', 'Agricole']","{'Surface totale': '54000', 'Zoning': 'Agricole'}",2025-11-02 23:40:30.004000,√† vendre,Terrains et fermes
54393790,https://www.avito.ma/fr/roches_noires/bureaux/Plateaux_bureaux_de_haut_standing_de_76_√†_6000_m¬≤_54393790.htm,Plateaux bureaux de haut standing de 76 √† 6000 m¬≤,9880.0,Home Icon Accueil > Tout le Maroc > Casablanca > Roches Noires > Avito Immobilier > Bureaux > Plateaux bureaux de haut standing de 76 √† 6000 m¬≤,"CENTRE D‚ÄôAFFAIRES Moulay ISMAIL PLATEAUX BUREAUX de HAUT STANDING Votre Espace Professionnel Assur√© en des Plateaux bureaux de HAUT STANDING FUSIONNABLES. Mat√©riaux Haut de Gamme, une Belle Conception & Prestations, avec une variante de 76 m¬≤ √† 6000 m¬≤. Tout y est Optimis√© pour votre Confort Professionnel. - Climatisation Centrale - Kitchenette - Fibre optique - Cam√©ras de surveillance internes & externes, - D√©tecteur de fum√©e - alarme d‚Äôincendie - Domotique - Isolation acoustique & thermique luminosit√© - Parfaites a√©ration & distribution - 2 sous sols en parking SECURIS√© 24/24",GOLF BUILDING,Particulier,2025-11-02 16:25:08,"['https://content.avito.ma/classifieds/images/10113651400?t=images', 'https://content.avito.ma/classifieds/images/10113651409?t=images', 'https://content.avito.ma/classifieds/images/10113651461?t=images', 'https://content.avito.ma/classifieds/images/10113652890?t=images', 'https://content.avito.ma/classifieds/images/10113652899?t=images', 'https://content.avito.ma/classifieds/images/10113652930?t=images', 'https://content.avito.ma/classifieds/images/10113652934?t=images', 'https://content.avito.ma/classifieds/images/10113652937?t=images', 'https://content.avito.ma/classifieds/images/10113652938?t=images', 'https://content.avito.ma/classifieds/images/10113652939?t=images', 'https://content.avito.ma/classifieds/images/10113652940?t=images', 'https://content.avito.ma/classifieds/images/10113652944?t=images', 'https://content.avito.ma/classifieds/images/10113652951?t=images', 'https://content.avito.ma/classifieds/images/10113652954?t=images', 'https://content.avito.ma/classifieds/images/10113652958?t=images']","['1', '76', '1', '2', 'Ascenseur', 'Chauffage', 'Climatisation', 'C√¢blage t√©l√©phonique', 'Parking', 'S√©curit√©']","{'Nombre de pi√®ces': '1', 'Salle de bain': '1', '√âtage': '2', 'Surface totale': '76'}",2025-11-02 23:25:15.003000,√† louer,Bureaux
54679330,https://www.avito.ma/fr/sidi_allal_el_bahraoui/terrains_et_fermes/Cinq_hectares_d_oliviers_√†_prix_tr√®s_bas_54679330.htm,Cinq hectares d'oliviers √† prix tr√®s bas,260000.0,Home Icon Accueil > Tout le Maroc > Sidi Allal El Bahraoui > Toute la ville > Avito Immobilier > Terrains et fermes > Cinq hectares d'oliviers √† prix tr√®s bas,"Cinq hectares et demi, excellents, enti√®rement plant√©s d'oliviers, tr√®s bon march√©. Prix : 26 millions l'hectare. Eau disponible en abondance. Situ√©s √† A√Øn Johra.",Immo continental,Particulier,2025-11-03 00:42:15,['https://content.avito.ma/classifieds/images/10116283222?t=images'],"['54000', 'Agricole']","{'Surface totale': '54000', 'Zoning': 'Agricole'}",2025-11-02 23:52:30.003000,√† vendre,Terrains et fermes
55174614,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartements_√†_vendre_√†_Casablanca_55174614.htm,Appartements √† vendre √† Casablanca,7000.0,Home Icon Accueil > Tout le Maroc > Casablanca > Sidi Bernoussi > Avito Immobilier > Ventes Immobili√®res > Appartements > Appartements √† vendre √† Casablanca,"R√©sidence Jnan Sbil 2 (moyen standing) entre la nouvelle ville Zenata et Sidi Bernoussi pr√®s de la route nationale 1 casa-rabat. 3 chambres / 2 chambres Ascenseur Les √©quipements du projet : Espaces verts, Hammam, salle de sport, mosqu√©e, commerces.... Livraison imm√©diate",Groupe Ikamati,Particulier,2025-11-03 00:05:04,"['https://content.avito.ma/classifieds/images/10121657711?t=images', 'https://content.avito.ma/classifieds/images/10121657714?t=images', 'https://content.avito.ma/classifieds/images/10121657715?t=images', 'https://content.avito.ma/classifieds/images/10121657716?t=images', 'https://content.avito.ma/classifieds/images/10121657717?t=images', 'https://content.avito.ma/classifieds/images/10121657718?t=images', 'https://content.avito.ma/classifieds/images/10121657719?t=images', 'https://content.avito.ma/classifieds/images/10121657713?t=images', 'https://content.avito.ma/classifieds/images/10121657720?t=images', 'https://content.avito.ma/classifieds/images/10121657721?t=images', 'https://content.avito.ma/classifieds/images/10121657722?t=images', 'https://content.avito.ma/classifieds/images/10121657723?t=images', 'https://content.avito.ma/classifieds/images/10121657724?t=images', 'https://content.avito.ma/classifieds/images/10121657725?t=images']","['3', '2', 'Neuf', '1', '105', 'Moins de 1 an', 'Ascenseur', 'Balcon']","{'Condition': 'Neuf', 'Salle de bain': '2', 'Surface habitable': '105', 'Chambres': '3', 'Salons': '1', '√Çge du bien': 'Moins de 1 an'}",2025-11-02 23:22:15.003000,√† vendre,Appartements
55344055,https://www.avito.ma/fr/aviation___mabella/appartements/Appartement_R√©nov√©_√†_louer_Quartier_Administratif_55344055.htm,Appartement R√©nov√© √† louer Quartier Administratif,11000.0,Home Icon Accueil > Tout le Maroc > Rabat > Aviation - Mabella > Avito Immobilier > Locations Immobili√®res > Appartements > Appartement R√©nov√© √† louer Quartier Administratif,REF 2A610 Le Cabinet Sa√Ød BENNIS IMMOBILIER met en Location un bel appartement avec vue sur la vall√©e √† Youssoufia. L‚Äôappartement est situ√© au 2e √©tage d‚Äôun immeuble s√©curis√© et sans vis-√†-vis. Descriptif : ‚Ä¢ 1 Suite parentale avec Salle de bain et Dressing ‚Ä¢ 2 Chambres √† coucher ‚Ä¢ 1 Salle de bain ‚Ä¢ 1 Double Salon avec chemin√©e ‚Ä¢ 1 Terrasse avec vue sur la vall√©e ‚Ä¢ 1 Salle d‚Äôeau invit√©s ‚Ä¢ 1 Cuisine √©quip√©e avec buanderie ‚Ä¢ 2 Places au garage ‚Ä¢ Climatisation ‚Ä¢ Cam√©ra de surveillance Superficie : 170 m2 Prix : 11 000 DH/mois Disponibilit√© imm√©diate N‚Äôh√©sitez pas √† nous contacter pour plus d‚Äôinformations.,Cabinet Immobilier Sa√Ød BENNIS,Particulier,2025-11-02 23:35:06,"['https://content.avito.ma/classifieds/images/10134065982?t=images', 'https://content.avito.ma/classifieds/images/10134065983?t=images', 'https://content.avito.ma/classifieds/images/10134065984?t=images', 'https://content.avito.ma/classifieds/images/10134065992?t=images', 'https://content.avito.ma/classifieds/images/10134066015?t=images', 'https://content.avito.ma/classifieds/images/10134066016?t=images', 'https://content.avito.ma/classifieds/images/10134066017?t=images', 'https://content.avito.ma/classifieds/images/10134065993?t=images']","['3', '2', '1 mois', '2', '170', '2', 'Climatisation', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']","{'Salle de bain': '2', '√âtage': '2', 'Surface habitable': '170', 'Chambres': '3', 'Caution': '1 mois', 'Salons': '2'}",2025-11-02 23:35:15.003000,√† louer,Appartements


In [355]:
silver_df.select("breadcrumbs").distinct().show(5 ,truncate=False)

+--------------------------------------------------------------------------------------------------------------------------------------------------------------------+
|breadcrumbs                                                                                                                                                         |
+--------------------------------------------------------------------------------------------------------------------------------------------------------------------+
|Home Icon Accueil > Tout le Maroc > Temara > Autre secteur > Avito Immobilier > Local > Magasin 152m¬≤ Total Stock ou Show Rom Seulement                             |
|Home Icon Accueil > Tout le Maroc > Rabat > Hay Riad > Avito Immobilier > Locations Immobili√®res > Appartements > Appartement en location √† Hay Riad Rabat          |
|Home Icon Accueil > Tout le Maroc > Casablanca > 2 Mars > Avito Immobilier > Local > 93, bd d'Anoual BEAUX LOCAUX Zone Tr√®s ANIM√âE                             

In [356]:
from pyspark.sql import functions as F

# Split 'breadcrumbs' based on '>'
split_breadcrumbs = F.split(F.col("breadcrumbs"), " > ")

# Create new columns for each segment
silver_df = (
    silver_df
    .withColumn("city", split_breadcrumbs.getItem(2))  # e.g., "Casablanca"
    .withColumn("neighborhood", split_breadcrumbs.getItem(3))  # e.g., "Maarif"
    .withColumn("site", split_breadcrumbs.getItem(4))  # e.g., "Avito Immobilier"
    .drop("breadcrumbs")  # Drop the original column if not needed
)

# Check the result
silver_df.select(
     "city", "neighborhood", "site", 
).show(30, truncate=False)


+----------------------+-------------------+----------------+
|city                  |neighborhood       |site            |
+----------------------+-------------------+----------------+
|Mohammedia            |Autre secteur      |Avito Immobilier|
|Casablanca            |Sidi Bernoussi     |Avito Immobilier|
|Casablanca            |Sidi Bernoussi     |Avito Immobilier|
|Casablanca            |Riviera            |Avito Immobilier|
|Agadir                |Tamraght           |Avito Immobilier|
|K√©nitra               |Autre secteur      |Avito Immobilier|
|Casablanca            |Roches Noires      |Avito Immobilier|
|Sidi Allal El Bahraoui|Toute la ville     |Avito Immobilier|
|Casablanca            |Sidi Bernoussi     |Avito Immobilier|
|Rabat                 |Aviation - Mabella |Avito Immobilier|
|F√®s                   |Route de Sefrou    |Avito Immobilier|
|Nouaceur              |Toute la ville     |Avito Immobilier|
|Mohammedia            |Quartier du Parc   |Avito Immobilier|
|Casab

In [357]:
from IPython.display import display

# Assuming 'silver_df' is already created as per the earlier transformation
display(
    silver_df.select(
        "city", "neighborhood", "site"
    ).toPandas()
)

Unnamed: 0,city,neighborhood,site
0,Mohammedia,Autre secteur,Avito Immobilier
1,Casablanca,Sidi Bernoussi,Avito Immobilier
2,Casablanca,Sidi Bernoussi,Avito Immobilier
3,Casablanca,Riviera,Avito Immobilier
4,Agadir,Tamraght,Avito Immobilier
...,...,...,...
99,El Jadida,Autre secteur,Avito Immobilier
100,El Jadida,Saada,Avito Immobilier
101,Sal√©,Sala El Jadida,Avito Immobilier
102,Skhirat,Autre secteur,Avito Immobilier


In [358]:
import pandas as pd
from IPython.display import display

# Keep things compact
pd.set_option("display.max_columns", 20)   # don't try to show hundreds
pd.set_option("display.max_colwidth", 80)  # clamp long cells to ~80 chars

# pick a small sample and flatten newlines so rows stay short
pdf = (silver_df.limit(10)
       .toPandas()
       .replace({r'[\r\n\t]+': ' '}, regex=True))

# simple, compact table with ellipsis in long cells
display(
    pdf.style
      .set_table_styles([
          {'selector': 'table', 'props': [('table-layout','fixed'), ('width','100%')]},
          {'selector': 'th, td', 'props': [
              ('max-width','280px'),
              ('white-space','nowrap'),
              ('overflow','hidden'),
              ('text-overflow','ellipsis')
          ]}
      ])
      .hide(axis='index')  # remove row numbers
)

id,url,title,price_value,description,seller_name,seller_type,published_date_text,image_urls,equipments,attributes_map,ingest_ts,type,category_type,city,neighborhood,site
37619566,https://www.avito.ma/fr/autre_secteur/appartements/Appartement_Riad_Essalam_Beni_Yekhlef__Mohammedia_37619566.htm,Appartement Riad Essalam Beni Yekhlef- Mohammedia,195000.0,R√©sidences √©conomiques avec ascenseurs. Une Chambre/ salon/ cuisine/salle de bain. Prix : 195 000DH Livraison imm√©diate.,Groupe Ikamati,Particulier,2025-11-03 00:17:19,"['https://content.avito.ma/classifieds/images/2533557603?t=images', 'https://content.avito.ma/classifieds/images/2539801094?t=images', 'https://content.avito.ma/classifieds/images/2516510965?t=images', 'https://content.avito.ma/classifieds/images/2504023983?t=images', 'https://content.avito.ma/classifieds/images/2582417689?t=images', 'https://content.avito.ma/classifieds/images/2572806528?t=images']","['1', '1', 'Neuf', 'Imm√©diate', '0', 'Economique', 'Ascenseur']","{'Condition': 'Neuf', 'Disponibilit√©': 'Imm√©diate', 'Salle de bain': '1', 'Standing': 'Economique', 'Chambres': '1', 'Salons': '0'}",2025-11-02 23:30:30.003000,√† vendre,Appartements,Mohammedia,Autre secteur,Avito Immobilier
37621281,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartement_Sidi_Bernoussi_R√©sidences_Al_Badr_37621281.htm,Appartement Sidi Bernoussi R√©sidences Al Badr,7200.0,"Complexe r√©sidentiel Al Badr est un projet moyen standing du Groupe Ikamati situ√© au meilleur quartier √† Sidi Bernoussi proche de toutes les commodit√©s n√©cessaires : √âcoles priv√©es et publiques, commerces de proximit√©, boulangeries, p√¢tisseries, caf√©s, pharmacies, hammam, plateaux de bureau,‚Ä¶ Avec un acc√®s direct √† l‚Äôautoroute Casablanca ‚ÄìRabat. Des appartements livrables dans l‚Äôimm√©diat avec des superficies qui varient entre 74m¬≤ et 96m¬≤. Dot√©s d‚Äôune finition irr√©prochable : cuisines √©quip√©es, carrelage de qualit√© premium, volets roulants motoris√©s, l‚Äôutilisation du bois de ch√™ne,‚Ä¶ Les r√©sidences sont s√©curis√©es 24h/24 et 7j/7j. A l‚Äôoccasion de la saison d'√©t√© on vous offre une offre exclusive : le tout √† 7200 dh m¬≤ au lieu de 8200dh/m¬≤. offre limit√©e et valable jusqu'au 31/08/2023. Pour plus d‚Äôinformations, appelez nous ou visitez nos bureaux de vente ouverts toute la semaine et m√™me les week-ends de 9h √† 19h.",Groupe Ikamati,Particulier,2025-11-03 00:32:17,"['https://content.avito.ma/classifieds/images/9761138868?t=images', 'https://content.avito.ma/classifieds/images/9751423563?t=images', 'https://content.avito.ma/classifieds/images/9792952316?t=images', 'https://content.avito.ma/classifieds/images/9771942015?t=images', 'https://content.avito.ma/classifieds/images/9712278782?t=images']","['3', '100', 'Neuf', '49', 'Moins de 1 an', '0', 'Ascenseur', 'Balcon', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']","{'Condition': 'Neuf', '√âtage': '0', 'Surface habitable': '49', 'Chambres': '3', 'Surface totale': '100', '√Çge du bien': 'Moins de 1 an'}",2025-11-02 23:40:30.004000,√† vendre,Appartements,Casablanca,Sidi Bernoussi,Avito Immobilier
37621456,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartement_√†_vendre_64_m¬≤_√†_Casablanca_37621456.htm,Appartement √† vendre 64 m¬≤ √† Casablanca,8500.0,"R√©sidence s√©curis√©e avec cam√©ras de surveillance, ascenseur, parking sous-sol, parabole collective, piscine et climatisation pr√©-install√©e. Avec une finition de bon standing, les appartements de r√©sidences El Yassamine disposent de cuisines √©quip√©es, Bois de ch√™ne naturel, Volets roulants motoris√©s, Douche italienne, Sanitaire haut de gamme, ‚Ä¶ La r√©sidence est √† proximit√© de : √âcoles priv√©e et publique, commerces de proximit√©, boulangeries, p√¢tisseries, caf√©s, pharmacies, hammam, plateaux de bureau. R√©servez votre appartement et b√©n√©ficier de remises exceptionnelles sur le prix de vente.",Groupe Ikamati,Particulier,2025-11-03 00:21:11,"['https://content.avito.ma/classifieds/images/9757591781?t=images', 'https://content.avito.ma/classifieds/images/7742218029?t=images', 'https://content.avito.ma/classifieds/images/9790388927?t=images', 'https://content.avito.ma/classifieds/images/9777514240?t=images', 'https://content.avito.ma/classifieds/images/9768290784?t=images', 'https://content.avito.ma/classifieds/images/9785829271?t=images']","['2', '1', '1', '64', '4']","{'Salle de bain': '1', '√âtage': '4', 'Surface habitable': '64', 'Chambres': '2', 'Salons': '1'}",2025-11-02 23:30:15.003000,√† vendre,Appartements,Casablanca,Sidi Bernoussi,Avito Immobilier
52151097,https://www.avito.ma/fr/riviera/appartements/Studio_meubl√©_Riviera_52151097.htm,Studio meubl√© Riviera,6300.0,"Studio meubl√© en location √† Riviera ,proche arr√™t TRAM, dans une R√©sidence s√©curis√©e avec ascenseur place au parking, superficie 44m¬≤, au 2 √©me √©tage, 1 Salon , 1 Cuisine √©quip√©e 1 Chambre √† coucher , 1 SDB douche, balcon , climatisation Loyer 6300 Dh par mois",ABAMNY Immobilier,Particulier,2025-11-03 00:41:12,"['https://content.avito.ma/classifieds/images/10141320311?t=images', 'https://content.avito.ma/classifieds/images/10141320312?t=images', 'https://content.avito.ma/classifieds/images/10141320313?t=images', 'https://content.avito.ma/classifieds/images/10141320314?t=images', 'https://content.avito.ma/classifieds/images/10141320315?t=images', 'https://content.avito.ma/classifieds/images/10141320317?t=images']","['1', '1', '44', '1 mois', '1', '44', 'Ascenseur', 'Balcon', 'Climatisation', 'Concierge', 'Cuisine √©quip√©e', 'Meubl√©']","{'Salle de bain': '1', 'Surface habitable': '44', 'Chambres': '1', 'Caution': '1 mois', 'Salons': '1', 'Surface totale': '44'}",2025-11-02 23:55:15.003000,√† louer,Appartements,Casablanca,Riviera,Avito Immobilier
53988201,https://www.avito.ma/fr/tamraght/villas_et_riads/Villa_Taghazout_Bay_vue_mer_53988201.htm,Villa Taghazout Bay vue mer,,Villa de 3 chambres compl√®tement r√©nov√©e avec du mat√©riel de luxe,Holiday Resorts Taghazout,Particulier,2025-11-02 18:20:10,"['https://content.avito.ma/classifieds/images/10109625457?t=images', 'https://content.avito.ma/classifieds/images/10141228594?t=images', 'https://content.avito.ma/classifieds/images/10141228593?t=images']","['3', '2', '650', '2', '2', '250', 'Balcon', 'Chauffage', 'Climatisation', 'Cuisine √©quip√©e', 'Garage', 'Meubl√©']","{""Nombre d'√©tage"": '2', 'Salle de bain': '2', 'Surface habitable': '250', 'Chambres': '3', 'Salons': '2', 'Surface totale': '650'}",2025-11-03 00:20:15.003000,√† vendre,Villas et Riads,Agadir,Tamraght,Avito Immobilier
54036040,https://www.avito.ma/fr/autre_secteur/terrains_et_fermes/Cinq_hectares_et_quatre_ouvriers__tous_en_oliviers_54036040.htm,"Cinq hectares et quatre ouvriers, tous en oliviers",260000.0,"Excellente terre agricole de cinq hectares, enti√®rement plant√©e d'oliviers √† A√Øn Johra. Excellente terre, excellente nappe phr√©atique. Tiflet, prix de 26 millions par hectare, proche d'El Kamouni √† 18 km.",Immo continental,Particulier,2025-11-03 00:34:19,"['https://content.avito.ma/classifieds/images/10110154187?t=images', 'https://content.avito.ma/classifieds/images/10110154188?t=images']","['54000', 'Agricole']","{'Surface totale': '54000', 'Zoning': 'Agricole'}",2025-11-02 23:40:30.004000,√† vendre,Terrains et fermes,K√©nitra,Autre secteur,Avito Immobilier
54393790,https://www.avito.ma/fr/roches_noires/bureaux/Plateaux_bureaux_de_haut_standing_de_76_√†_6000_m¬≤_54393790.htm,Plateaux bureaux de haut standing de 76 √† 6000 m¬≤,9880.0,"CENTRE D‚ÄôAFFAIRES Moulay ISMAIL PLATEAUX BUREAUX de HAUT STANDING Votre Espace Professionnel Assur√© en des Plateaux bureaux de HAUT STANDING FUSIONNABLES. Mat√©riaux Haut de Gamme, une Belle Conception & Prestations, avec une variante de 76 m¬≤ √† 6000 m¬≤. Tout y est Optimis√© pour votre Confort Professionnel. - Climatisation Centrale - Kitchenette - Fibre optique - Cam√©ras de surveillance internes & externes, - D√©tecteur de fum√©e - alarme d‚Äôincendie - Domotique - Isolation acoustique & thermique luminosit√© - Parfaites a√©ration & distribution - 2 sous sols en parking SECURIS√© 24/24",GOLF BUILDING,Particulier,2025-11-02 16:25:08,"['https://content.avito.ma/classifieds/images/10113651400?t=images', 'https://content.avito.ma/classifieds/images/10113651409?t=images', 'https://content.avito.ma/classifieds/images/10113651461?t=images', 'https://content.avito.ma/classifieds/images/10113652890?t=images', 'https://content.avito.ma/classifieds/images/10113652899?t=images', 'https://content.avito.ma/classifieds/images/10113652930?t=images', 'https://content.avito.ma/classifieds/images/10113652934?t=images', 'https://content.avito.ma/classifieds/images/10113652937?t=images', 'https://content.avito.ma/classifieds/images/10113652938?t=images', 'https://content.avito.ma/classifieds/images/10113652939?t=images', 'https://content.avito.ma/classifieds/images/10113652940?t=images', 'https://content.avito.ma/classifieds/images/10113652944?t=images', 'https://content.avito.ma/classifieds/images/10113652951?t=images', 'https://content.avito.ma/classifieds/images/10113652954?t=images', 'https://content.avito.ma/classifieds/images/10113652958?t=images']","['1', '76', '1', '2', 'Ascenseur', 'Chauffage', 'Climatisation', 'C√¢blage t√©l√©phonique', 'Parking', 'S√©curit√©']","{'Nombre de pi√®ces': '1', 'Salle de bain': '1', '√âtage': '2', 'Surface totale': '76'}",2025-11-02 23:25:15.003000,√† louer,Bureaux,Casablanca,Roches Noires,Avito Immobilier
54679330,https://www.avito.ma/fr/sidi_allal_el_bahraoui/terrains_et_fermes/Cinq_hectares_d_oliviers_√†_prix_tr√®s_bas_54679330.htm,Cinq hectares d'oliviers √† prix tr√®s bas,260000.0,"Cinq hectares et demi, excellents, enti√®rement plant√©s d'oliviers, tr√®s bon march√©. Prix : 26 millions l'hectare. Eau disponible en abondance. Situ√©s √† A√Øn Johra.",Immo continental,Particulier,2025-11-03 00:42:15,['https://content.avito.ma/classifieds/images/10116283222?t=images'],"['54000', 'Agricole']","{'Surface totale': '54000', 'Zoning': 'Agricole'}",2025-11-02 23:52:30.003000,√† vendre,Terrains et fermes,Sidi Allal El Bahraoui,Toute la ville,Avito Immobilier
55174614,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartements_√†_vendre_√†_Casablanca_55174614.htm,Appartements √† vendre √† Casablanca,7000.0,"R√©sidence Jnan Sbil 2 (moyen standing) entre la nouvelle ville Zenata et Sidi Bernoussi pr√®s de la route nationale 1 casa-rabat. 3 chambres / 2 chambres Ascenseur Les √©quipements du projet : Espaces verts, Hammam, salle de sport, mosqu√©e, commerces.... Livraison imm√©diate",Groupe Ikamati,Particulier,2025-11-03 00:05:04,"['https://content.avito.ma/classifieds/images/10121657711?t=images', 'https://content.avito.ma/classifieds/images/10121657714?t=images', 'https://content.avito.ma/classifieds/images/10121657715?t=images', 'https://content.avito.ma/classifieds/images/10121657716?t=images', 'https://content.avito.ma/classifieds/images/10121657717?t=images', 'https://content.avito.ma/classifieds/images/10121657718?t=images', 'https://content.avito.ma/classifieds/images/10121657719?t=images', 'https://content.avito.ma/classifieds/images/10121657713?t=images', 'https://content.avito.ma/classifieds/images/10121657720?t=images', 'https://content.avito.ma/classifieds/images/10121657721?t=images', 'https://content.avito.ma/classifieds/images/10121657722?t=images', 'https://content.avito.ma/classifieds/images/10121657723?t=images', 'https://content.avito.ma/classifieds/images/10121657724?t=images', 'https://content.avito.ma/classifieds/images/10121657725?t=images']","['3', '2', 'Neuf', '1', '105', 'Moins de 1 an', 'Ascenseur', 'Balcon']","{'Condition': 'Neuf', 'Salle de bain': '2', 'Surface habitable': '105', 'Chambres': '3', 'Salons': '1', '√Çge du bien': 'Moins de 1 an'}",2025-11-02 23:22:15.003000,√† vendre,Appartements,Casablanca,Sidi Bernoussi,Avito Immobilier
55344055,https://www.avito.ma/fr/aviation___mabella/appartements/Appartement_R√©nov√©_√†_louer_Quartier_Administratif_55344055.htm,Appartement R√©nov√© √† louer Quartier Administratif,11000.0,REF 2A610 Le Cabinet Sa√Ød BENNIS IMMOBILIER met en Location un bel appartement avec vue sur la vall√©e √† Youssoufia. L‚Äôappartement est situ√© au 2e √©tage d‚Äôun immeuble s√©curis√© et sans vis-√†-vis. Descriptif : ‚Ä¢ 1 Suite parentale avec Salle de bain et Dressing ‚Ä¢ 2 Chambres √† coucher ‚Ä¢ 1 Salle de bain ‚Ä¢ 1 Double Salon avec chemin√©e ‚Ä¢ 1 Terrasse avec vue sur la vall√©e ‚Ä¢ 1 Salle d‚Äôeau invit√©s ‚Ä¢ 1 Cuisine √©quip√©e avec buanderie ‚Ä¢ 2 Places au garage ‚Ä¢ Climatisation ‚Ä¢ Cam√©ra de surveillance Superficie : 170 m2 Prix : 11 000 DH/mois Disponibilit√© imm√©diate N‚Äôh√©sitez pas √† nous contacter pour plus d‚Äôinformations.,Cabinet Immobilier Sa√Ød BENNIS,Particulier,2025-11-02 23:35:06,"['https://content.avito.ma/classifieds/images/10134065982?t=images', 'https://content.avito.ma/classifieds/images/10134065983?t=images', 'https://content.avito.ma/classifieds/images/10134065984?t=images', 'https://content.avito.ma/classifieds/images/10134065992?t=images', 'https://content.avito.ma/classifieds/images/10134066015?t=images', 'https://content.avito.ma/classifieds/images/10134066016?t=images', 'https://content.avito.ma/classifieds/images/10134066017?t=images', 'https://content.avito.ma/classifieds/images/10134065993?t=images']","['3', '2', '1 mois', '2', '170', '2', 'Climatisation', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']","{'Salle de bain': '2', '√âtage': '2', 'Surface habitable': '170', 'Chambres': '3', 'Caution': '1 mois', 'Salons': '2'}",2025-11-02 23:35:15.003000,√† louer,Appartements,Rabat,Aviation - Mabella,Avito Immobilier


In [359]:
silver_df.select("equipments").distinct().show(5 , truncate=False)

+-----------------------------------------------------------------------------------------------------+
|equipments                                                                                           |
+-----------------------------------------------------------------------------------------------------+
|[2, 2, 150, 1 mois, 250, 1, Concierge, S√©curit√©]                                                     |
|[2, 2, 86, 1 mois, 200, 1, Ascenseur, Balcon, Concierge, Cuisine √©quip√©e, Parking, S√©curit√©]         |
|[1, 1, 45, 1 mois, 1, 45, Ascenseur, Balcon, Climatisation, Concierge, Cuisine √©quip√©e, Meubl√©]      |
|[3, 100, Neuf, 49, Moins de 1 an, 0, Ascenseur, Balcon, Cuisine √©quip√©e, Parking, S√©curit√©, Terrasse]|
|[1, 100, 1, 3, C√¢blage t√©l√©phonique]                                                                 |
+-----------------------------------------------------------------------------------------------------+
only showing top 5 rows



In [360]:
from pyspark.sql.functions import col, udf
from pyspark.sql.types import ArrayType, StringType
import re

# Define a UDF to clean the 'equipments' list, handling NoneType
def clean_equipments(equipments):
    # Handle NoneType case
    if equipments is None:
        return []
    
    # Filter out unwanted entries (numbers and time-related strings)
    cleaned = [item for item in equipments if not re.match(r'^\d+$', str(item)) and not re.match(r'.*(mois|an).*', str(item))]
    return cleaned

# Register the UDF
clean_equipments_udf = udf(clean_equipments, ArrayType(StringType()))

# Apply the UDF to clean 'equipments' directly (in place)
silver_df = silver_df.withColumn("equipments", clean_equipments_udf(col("equipments")))

# Show the cleaned 'equipments' column
silver_df.select("equipments").show(5, truncate=False)

+-----------------------------------------------------------------------+
|equipments                                                             |
+-----------------------------------------------------------------------+
|[Neuf, Imm√©diate, Economique, Ascenseur]                               |
|[Neuf, Ascenseur, Balcon, Cuisine √©quip√©e, Parking, S√©curit√©, Terrasse]|
|[]                                                                     |
|[Ascenseur, Balcon, Climatisation, Concierge, Cuisine √©quip√©e, Meubl√©] |
|[Balcon, Chauffage, Climatisation, Cuisine √©quip√©e, Garage, Meubl√©]    |
+-----------------------------------------------------------------------+
only showing top 5 rows



In [361]:
from pyspark.sql import functions as F

# Extract the keys and values from the attributes_map
keys = silver_df.select(F.explode(F.map_keys(F.col("attributes_map"))).alias("attribute")).distinct().rdd.flatMap(lambda x: x).collect()

# For each key, create a new column with its corresponding value
for key in keys:
    silver_df = silver_df.withColumn(
        key, 
        F.when(F.col("attributes_map").getItem(key).isNotNull(), 
               F.col("attributes_map").getItem(key)).otherwise(None)
    )

# Show the result with new columns for each attribute
silver_df.select("id", *keys).show(5, truncate=False)

+--------+-----------------+-------+------+------------------+----------+--------------+-----+-------------+--------+-------------+----------------+----------------------+---------+--------------+-------------+------+
|id      |Surface habitable|Caution|Zoning|Type d'appartement|Standing  |Surface totale|√âtage|√Çge du bien  |Chambres|Salle de bain|Nombre de pi√®ces|Frais de syndic / mois|Condition|Nombre d'√©tage|Disponibilit√©|Salons|
+--------+-----------------+-------+------+------------------+----------+--------------+-----+-------------+--------+-------------+----------------+----------------------+---------+--------------+-------------+------+
|37619566|NULL             |NULL   |NULL  |NULL              |Economique|NULL          |NULL |NULL         |1       |1            |NULL            |NULL                  |Neuf     |NULL          |Imm√©diate    |0     |
|37621281|49               |NULL   |NULL  |NULL              |NULL      |100           |0    |Moins de 1 an|3       |NULL 

In [379]:
import pandas as pd
from IPython.display import display

# Keep things compact
pd.set_option("display.max_columns", 20)   # don't try to show hundreds
pd.set_option("display.max_colwidth", 80)  # clamp long cells to ~80 chars

# pick a small sample and flatten newlines so rows stay short
pdf = (silver_df.limit(10)
       .toPandas()
       .replace({r'[\r\n\t]+': ' '}, regex=True))

# simple, compact table with ellipsis in long cells
display(
    pdf.style
      .set_table_styles([
          {'selector': 'table', 'props': [('table-layout','fixed'), ('width','100%')]},
          {'selector': 'th, td', 'props': [
              ('max-width','280px'),
              ('white-space','nowrap'),
              ('overflow','hidden'),
              ('text-overflow','ellipsis')
          ]}
      ])
      .hide(axis='index')  # remove row numbers
)

id,url,title,price_value,description,seller_name,seller_type,published_date_text,image_urls,equipments,ingest_ts,type,category_type,city,neighborhood,site,Surface habitable,Caution,Zoning,Type d'appartement,Standing,Surface totale,√âtage,√Çge du bien,Chambres,Salle de bain,Nombre de pi√®ces,Frais de syndic / mois,Condition,Nombre d'√©tage,Disponibilit√©,Salons
37619566,https://www.avito.ma/fr/autre_secteur/appartements/Appartement_Riad_Essalam_Beni_Yekhlef__Mohammedia_37619566.htm,Appartement Riad Essalam Beni Yekhlef- Mohammedia,195000.0,R√©sidences √©conomiques avec ascenseurs. Une Chambre/ salon/ cuisine/salle de bain. Prix : 195 000DH Livraison imm√©diate.,Groupe Ikamati,Particulier,2025-11-03 00:17:19,"['https://content.avito.ma/classifieds/images/2533557603?t=images', 'https://content.avito.ma/classifieds/images/2539801094?t=images', 'https://content.avito.ma/classifieds/images/2516510965?t=images', 'https://content.avito.ma/classifieds/images/2504023983?t=images', 'https://content.avito.ma/classifieds/images/2582417689?t=images', 'https://content.avito.ma/classifieds/images/2572806528?t=images']","['Neuf', 'Imm√©diate', 'Economique', 'Ascenseur']",2025-11-02 23:30:30.003000,sale,Appartements,Mohammedia,Autre secteur,avito,,,,,Economique,,,,1.0,1.0,,,Neuf,,Imm√©diate,0.0
37621281,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartement_Sidi_Bernoussi_R√©sidences_Al_Badr_37621281.htm,Appartement Sidi Bernoussi R√©sidences Al Badr,7200.0,"Complexe r√©sidentiel Al Badr est un projet moyen standing du Groupe Ikamati situ√© au meilleur quartier √† Sidi Bernoussi proche de toutes les commodit√©s n√©cessaires : √âcoles priv√©es et publiques, commerces de proximit√©, boulangeries, p√¢tisseries, caf√©s, pharmacies, hammam, plateaux de bureau,‚Ä¶ Avec un acc√®s direct √† l‚Äôautoroute Casablanca ‚ÄìRabat. Des appartements livrables dans l‚Äôimm√©diat avec des superficies qui varient entre 74m¬≤ et 96m¬≤. Dot√©s d‚Äôune finition irr√©prochable : cuisines √©quip√©es, carrelage de qualit√© premium, volets roulants motoris√©s, l‚Äôutilisation du bois de ch√™ne,‚Ä¶ Les r√©sidences sont s√©curis√©es 24h/24 et 7j/7j. A l‚Äôoccasion de la saison d'√©t√© on vous offre une offre exclusive : le tout √† 7200 dh m¬≤ au lieu de 8200dh/m¬≤. offre limit√©e et valable jusqu'au 31/08/2023. Pour plus d‚Äôinformations, appelez nous ou visitez nos bureaux de vente ouverts toute la semaine et m√™me les week-ends de 9h √† 19h.",Groupe Ikamati,Particulier,2025-11-03 00:32:17,"['https://content.avito.ma/classifieds/images/9761138868?t=images', 'https://content.avito.ma/classifieds/images/9751423563?t=images', 'https://content.avito.ma/classifieds/images/9792952316?t=images', 'https://content.avito.ma/classifieds/images/9771942015?t=images', 'https://content.avito.ma/classifieds/images/9712278782?t=images']","['Neuf', 'Ascenseur', 'Balcon', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']",2025-11-02 23:40:30.004000,sale,Appartements,Casablanca,Sidi Bernoussi,avito,49.0,,,,,100.0,0.0,Moins de 1 an,3.0,,,,Neuf,,,
37621456,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartement_√†_vendre_64_m¬≤_√†_Casablanca_37621456.htm,Appartement √† vendre 64 m¬≤ √† Casablanca,8500.0,"R√©sidence s√©curis√©e avec cam√©ras de surveillance, ascenseur, parking sous-sol, parabole collective, piscine et climatisation pr√©-install√©e. Avec une finition de bon standing, les appartements de r√©sidences El Yassamine disposent de cuisines √©quip√©es, Bois de ch√™ne naturel, Volets roulants motoris√©s, Douche italienne, Sanitaire haut de gamme, ‚Ä¶ La r√©sidence est √† proximit√© de : √âcoles priv√©e et publique, commerces de proximit√©, boulangeries, p√¢tisseries, caf√©s, pharmacies, hammam, plateaux de bureau. R√©servez votre appartement et b√©n√©ficier de remises exceptionnelles sur le prix de vente.",Groupe Ikamati,Particulier,2025-11-03 00:21:11,"['https://content.avito.ma/classifieds/images/9757591781?t=images', 'https://content.avito.ma/classifieds/images/7742218029?t=images', 'https://content.avito.ma/classifieds/images/9790388927?t=images', 'https://content.avito.ma/classifieds/images/9777514240?t=images', 'https://content.avito.ma/classifieds/images/9768290784?t=images', 'https://content.avito.ma/classifieds/images/9785829271?t=images']",[],2025-11-02 23:30:15.003000,sale,Appartements,Casablanca,Sidi Bernoussi,avito,64.0,,,,,,4.0,,2.0,1.0,,,,,,1.0
52151097,https://www.avito.ma/fr/riviera/appartements/Studio_meubl√©_Riviera_52151097.htm,Studio meubl√© Riviera,6300.0,"Studio meubl√© en location √† Riviera ,proche arr√™t TRAM, dans une R√©sidence s√©curis√©e avec ascenseur place au parking, superficie 44m¬≤, au 2 √©me √©tage, 1 Salon , 1 Cuisine √©quip√©e 1 Chambre √† coucher , 1 SDB douche, balcon , climatisation Loyer 6300 Dh par mois",ABAMNY Immobilier,Particulier,2025-11-03 00:41:10,"['https://content.avito.ma/classifieds/images/10141320311?t=images', 'https://content.avito.ma/classifieds/images/10141320312?t=images', 'https://content.avito.ma/classifieds/images/10141320313?t=images', 'https://content.avito.ma/classifieds/images/10141320314?t=images', 'https://content.avito.ma/classifieds/images/10141320315?t=images', 'https://content.avito.ma/classifieds/images/10141320317?t=images']","['Ascenseur', 'Balcon', 'Climatisation', 'Concierge', 'Cuisine √©quip√©e', 'Meubl√©']",2025-11-02 23:45:15.002000,rent,Appartements,Casablanca,Riviera,avito,44.0,1 mois,,,,44.0,,,1.0,1.0,,,,,,1.0
53988201,https://www.avito.ma/fr/tamraght/villas_et_riads/Villa_Taghazout_Bay_vue_mer_53988201.htm,Villa Taghazout Bay vue mer,0.0,Villa de 3 chambres compl√®tement r√©nov√©e avec du mat√©riel de luxe,Holiday Resorts Taghazout,Particulier,2025-11-02 18:20:10,"['https://content.avito.ma/classifieds/images/10109625457?t=images', 'https://content.avito.ma/classifieds/images/10141228594?t=images', 'https://content.avito.ma/classifieds/images/10141228593?t=images']","['Balcon', 'Chauffage', 'Climatisation', 'Cuisine √©quip√©e', 'Garage', 'Meubl√©']",2025-11-03 00:20:15.003000,sale,Villas et Riads,Agadir,Tamraght,avito,250.0,,,,,650.0,,,3.0,2.0,,,,2.0,,2.0
54036040,https://www.avito.ma/fr/autre_secteur/terrains_et_fermes/Cinq_hectares_et_quatre_ouvriers__tous_en_oliviers_54036040.htm,"Cinq hectares et quatre ouvriers, tous en oliviers",260000.0,"Excellente terre agricole de cinq hectares, enti√®rement plant√©e d'oliviers √† A√Øn Johra. Excellente terre, excellente nappe phr√©atique. Tiflet, prix de 26 millions par hectare, proche d'El Kamouni √† 18 km.",Immo continental,Particulier,2025-11-03 00:34:19,"['https://content.avito.ma/classifieds/images/10110154187?t=images', 'https://content.avito.ma/classifieds/images/10110154188?t=images']",['Agricole'],2025-11-02 23:40:30.004000,sale,Terrains et fermes,K√©nitra,Autre secteur,avito,,,Agricole,,,54000.0,,,,,,,,,,
54393790,https://www.avito.ma/fr/roches_noires/bureaux/Plateaux_bureaux_de_haut_standing_de_76_√†_6000_m¬≤_54393790.htm,Plateaux bureaux de haut standing de 76 √† 6000 m¬≤,9880.0,"CENTRE D‚ÄôAFFAIRES Moulay ISMAIL PLATEAUX BUREAUX de HAUT STANDING Votre Espace Professionnel Assur√© en des Plateaux bureaux de HAUT STANDING FUSIONNABLES. Mat√©riaux Haut de Gamme, une Belle Conception & Prestations, avec une variante de 76 m¬≤ √† 6000 m¬≤. Tout y est Optimis√© pour votre Confort Professionnel. - Climatisation Centrale - Kitchenette - Fibre optique - Cam√©ras de surveillance internes & externes, - D√©tecteur de fum√©e - alarme d‚Äôincendie - Domotique - Isolation acoustique & thermique luminosit√© - Parfaites a√©ration & distribution - 2 sous sols en parking SECURIS√© 24/24",GOLF BUILDING,Particulier,2025-11-02 16:25:08,"['https://content.avito.ma/classifieds/images/10113651400?t=images', 'https://content.avito.ma/classifieds/images/10113651409?t=images', 'https://content.avito.ma/classifieds/images/10113651461?t=images', 'https://content.avito.ma/classifieds/images/10113652890?t=images', 'https://content.avito.ma/classifieds/images/10113652899?t=images', 'https://content.avito.ma/classifieds/images/10113652930?t=images', 'https://content.avito.ma/classifieds/images/10113652934?t=images', 'https://content.avito.ma/classifieds/images/10113652937?t=images', 'https://content.avito.ma/classifieds/images/10113652938?t=images', 'https://content.avito.ma/classifieds/images/10113652939?t=images', 'https://content.avito.ma/classifieds/images/10113652940?t=images', 'https://content.avito.ma/classifieds/images/10113652944?t=images', 'https://content.avito.ma/classifieds/images/10113652951?t=images', 'https://content.avito.ma/classifieds/images/10113652954?t=images', 'https://content.avito.ma/classifieds/images/10113652958?t=images']","['Ascenseur', 'Chauffage', 'Climatisation', 'C√¢blage t√©l√©phonique', 'Parking', 'S√©curit√©']",2025-11-02 23:25:15.003000,rent,Bureaux,Casablanca,Roches Noires,avito,,,,,,76.0,2.0,,,1.0,1.0,,,,,
54679330,https://www.avito.ma/fr/sidi_allal_el_bahraoui/terrains_et_fermes/Cinq_hectares_d_oliviers_√†_prix_tr√®s_bas_54679330.htm,Cinq hectares d'oliviers √† prix tr√®s bas,260000.0,"Cinq hectares et demi, excellents, enti√®rement plant√©s d'oliviers, tr√®s bon march√©. Prix : 26 millions l'hectare. Eau disponible en abondance. Situ√©s √† A√Øn Johra.",Immo continental,Particulier,2025-11-03 00:42:15,['https://content.avito.ma/classifieds/images/10116283222?t=images'],['Agricole'],2025-11-02 23:52:30.003000,sale,Terrains et fermes,Sidi Allal El Bahraoui,Toute la ville,avito,,,Agricole,,,54000.0,,,,,,,,,,
55174614,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartements_√†_vendre_√†_Casablanca_55174614.htm,Appartements √† vendre √† Casablanca,7000.0,"R√©sidence Jnan Sbil 2 (moyen standing) entre la nouvelle ville Zenata et Sidi Bernoussi pr√®s de la route nationale 1 casa-rabat. 3 chambres / 2 chambres Ascenseur Les √©quipements du projet : Espaces verts, Hammam, salle de sport, mosqu√©e, commerces.... Livraison imm√©diate",Groupe Ikamati,Particulier,2025-11-03 00:05:04,"['https://content.avito.ma/classifieds/images/10121657711?t=images', 'https://content.avito.ma/classifieds/images/10121657714?t=images', 'https://content.avito.ma/classifieds/images/10121657715?t=images', 'https://content.avito.ma/classifieds/images/10121657716?t=images', 'https://content.avito.ma/classifieds/images/10121657717?t=images', 'https://content.avito.ma/classifieds/images/10121657718?t=images', 'https://content.avito.ma/classifieds/images/10121657719?t=images', 'https://content.avito.ma/classifieds/images/10121657713?t=images', 'https://content.avito.ma/classifieds/images/10121657720?t=images', 'https://content.avito.ma/classifieds/images/10121657721?t=images', 'https://content.avito.ma/classifieds/images/10121657722?t=images', 'https://content.avito.ma/classifieds/images/10121657723?t=images', 'https://content.avito.ma/classifieds/images/10121657724?t=images', 'https://content.avito.ma/classifieds/images/10121657725?t=images']","['Neuf', 'Ascenseur', 'Balcon']",2025-11-02 23:22:15.003000,sale,Appartements,Casablanca,Sidi Bernoussi,avito,105.0,,,,,,,Moins de 1 an,3.0,2.0,,,Neuf,,,1.0
55344055,https://www.avito.ma/fr/aviation___mabella/appartements/Appartement_R√©nov√©_√†_louer_Quartier_Administratif_55344055.htm,Appartement R√©nov√© √† louer Quartier Administratif,11000.0,REF 2A610 Le Cabinet Sa√Ød BENNIS IMMOBILIER met en Location un bel appartement avec vue sur la vall√©e √† Youssoufia. L‚Äôappartement est situ√© au 2e √©tage d‚Äôun immeuble s√©curis√© et sans vis-√†-vis. Descriptif : ‚Ä¢ 1 Suite parentale avec Salle de bain et Dressing ‚Ä¢ 2 Chambres √† coucher ‚Ä¢ 1 Salle de bain ‚Ä¢ 1 Double Salon avec chemin√©e ‚Ä¢ 1 Terrasse avec vue sur la vall√©e ‚Ä¢ 1 Salle d‚Äôeau invit√©s ‚Ä¢ 1 Cuisine √©quip√©e avec buanderie ‚Ä¢ 2 Places au garage ‚Ä¢ Climatisation ‚Ä¢ Cam√©ra de surveillance Superficie : 170 m2 Prix : 11 000 DH/mois Disponibilit√© imm√©diate N‚Äôh√©sitez pas √† nous contacter pour plus d‚Äôinformations.,Cabinet Immobilier Sa√Ød BENNIS,Particulier,2025-11-02 23:35:06,"['https://content.avito.ma/classifieds/images/10134065982?t=images', 'https://content.avito.ma/classifieds/images/10134065983?t=images', 'https://content.avito.ma/classifieds/images/10134065984?t=images', 'https://content.avito.ma/classifieds/images/10134065992?t=images', 'https://content.avito.ma/classifieds/images/10134066015?t=images', 'https://content.avito.ma/classifieds/images/10134066016?t=images', 'https://content.avito.ma/classifieds/images/10134066017?t=images', 'https://content.avito.ma/classifieds/images/10134065993?t=images']","['Climatisation', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']",2025-11-02 23:35:15.003000,rent,Appartements,Rabat,Aviation - Mabella,avito,170.0,1 mois,,,,,2.0,,3.0,2.0,,,,,,2.0


In [363]:
# Get the number of columns
num_columns = len(silver_df.columns)

# Display the result
print(f"Number of columns in the dataframe: {num_columns}")

Number of columns in the dataframe: 33


In [364]:
from pyspark.sql import functions as F

# Replace all values in the 'site' column with "avito"
silver_df = silver_df.withColumn("site", F.lit("avito"))

# Show the updated DataFrame (distinct 'site' values)
silver_df.select("site").distinct().show(5, truncate=False)

+-----+
|site |
+-----+
|avito|
+-----+



In [365]:
from pyspark.sql import functions as F

# Update the 'type' column to have English values
silver_df = silver_df.withColumn(
    "type", 
    F.when(F.col("type") == "√† louer", "rent")
     .when(F.col("type") == "√† vendre", "sale")
     .otherwise(F.col("type"))
)

# Show the result with counts for the updated 'type' column
type_counts_english = silver_df.groupBy("type").count()
type_counts_english.show(truncate=False)

+----+-----+
|type|count|
+----+-----+
|NULL|2    |
|sale|58   |
|rent|44   |
+----+-----+



In [366]:
# Group by 'seller_type' and count the occurrences
seller_type_counts = silver_df.groupBy("seller_type").count()

# Show the result
seller_type_counts.show(truncate=False)

+-----------+-----+
|seller_type|count|
+-----------+-----+
|NULL       |1    |
|Boutique   |1    |
|Particulier|102  |
+-----------+-----+



In [376]:
import pandas as pd
from IPython.display import display

# Keep things compact
pd.set_option("display.max_columns", 20)   # don't try to show hundreds
pd.set_option("display.max_colwidth", 80)  # clamp long cells to ~80 chars

# pick a small sample and flatten newlines so rows stay short
pdf = (silver_df.limit(10)
       .toPandas()
       .replace({r'[\r\n\t]+': ' '}, regex=True))

# simple, compact table with ellipsis in long cells
display(
    pdf.style
      .set_table_styles([
          {'selector': 'table', 'props': [('table-layout','fixed'), ('width','100%')]},
          {'selector': 'th, td', 'props': [
              ('max-width','280px'),
              ('white-space','nowrap'),
              ('overflow','hidden'),
              ('text-overflow','ellipsis')
          ]}
      ])
      .hide(axis='index')  # remove row numbers
)

id,url,title,price_value,description,seller_name,seller_type,published_date_text,image_urls,equipments,ingest_ts,type,category_type,city,neighborhood,site,Surface habitable,Caution,Zoning,Type d'appartement,Standing,Surface totale,√âtage,√Çge du bien,Chambres,Salle de bain,Nombre de pi√®ces,Frais de syndic / mois,Condition,Nombre d'√©tage,Disponibilit√©,Salons
37619566,https://www.avito.ma/fr/autre_secteur/appartements/Appartement_Riad_Essalam_Beni_Yekhlef__Mohammedia_37619566.htm,Appartement Riad Essalam Beni Yekhlef- Mohammedia,195000.0,R√©sidences √©conomiques avec ascenseurs. Une Chambre/ salon/ cuisine/salle de bain. Prix : 195 000DH Livraison imm√©diate.,Groupe Ikamati,Particulier,2025-11-03 00:17:19,"['https://content.avito.ma/classifieds/images/2533557603?t=images', 'https://content.avito.ma/classifieds/images/2539801094?t=images', 'https://content.avito.ma/classifieds/images/2516510965?t=images', 'https://content.avito.ma/classifieds/images/2504023983?t=images', 'https://content.avito.ma/classifieds/images/2582417689?t=images', 'https://content.avito.ma/classifieds/images/2572806528?t=images']","['Neuf', 'Imm√©diate', 'Economique', 'Ascenseur']",2025-11-02 23:30:30.003000,sale,Appartements,Mohammedia,Autre secteur,avito,,,,,Economique,,,,1.0,1.0,,,Neuf,,Imm√©diate,0.0
37621281,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartement_Sidi_Bernoussi_R√©sidences_Al_Badr_37621281.htm,Appartement Sidi Bernoussi R√©sidences Al Badr,7200.0,"Complexe r√©sidentiel Al Badr est un projet moyen standing du Groupe Ikamati situ√© au meilleur quartier √† Sidi Bernoussi proche de toutes les commodit√©s n√©cessaires : √âcoles priv√©es et publiques, commerces de proximit√©, boulangeries, p√¢tisseries, caf√©s, pharmacies, hammam, plateaux de bureau,‚Ä¶ Avec un acc√®s direct √† l‚Äôautoroute Casablanca ‚ÄìRabat. Des appartements livrables dans l‚Äôimm√©diat avec des superficies qui varient entre 74m¬≤ et 96m¬≤. Dot√©s d‚Äôune finition irr√©prochable : cuisines √©quip√©es, carrelage de qualit√© premium, volets roulants motoris√©s, l‚Äôutilisation du bois de ch√™ne,‚Ä¶ Les r√©sidences sont s√©curis√©es 24h/24 et 7j/7j. A l‚Äôoccasion de la saison d'√©t√© on vous offre une offre exclusive : le tout √† 7200 dh m¬≤ au lieu de 8200dh/m¬≤. offre limit√©e et valable jusqu'au 31/08/2023. Pour plus d‚Äôinformations, appelez nous ou visitez nos bureaux de vente ouverts toute la semaine et m√™me les week-ends de 9h √† 19h.",Groupe Ikamati,Particulier,2025-11-03 00:32:17,"['https://content.avito.ma/classifieds/images/9761138868?t=images', 'https://content.avito.ma/classifieds/images/9751423563?t=images', 'https://content.avito.ma/classifieds/images/9792952316?t=images', 'https://content.avito.ma/classifieds/images/9771942015?t=images', 'https://content.avito.ma/classifieds/images/9712278782?t=images']","['Neuf', 'Ascenseur', 'Balcon', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']",2025-11-02 23:40:30.004000,sale,Appartements,Casablanca,Sidi Bernoussi,avito,49.0,,,,,100.0,0.0,Moins de 1 an,3.0,,,,Neuf,,,
37621456,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartement_√†_vendre_64_m¬≤_√†_Casablanca_37621456.htm,Appartement √† vendre 64 m¬≤ √† Casablanca,8500.0,"R√©sidence s√©curis√©e avec cam√©ras de surveillance, ascenseur, parking sous-sol, parabole collective, piscine et climatisation pr√©-install√©e. Avec une finition de bon standing, les appartements de r√©sidences El Yassamine disposent de cuisines √©quip√©es, Bois de ch√™ne naturel, Volets roulants motoris√©s, Douche italienne, Sanitaire haut de gamme, ‚Ä¶ La r√©sidence est √† proximit√© de : √âcoles priv√©e et publique, commerces de proximit√©, boulangeries, p√¢tisseries, caf√©s, pharmacies, hammam, plateaux de bureau. R√©servez votre appartement et b√©n√©ficier de remises exceptionnelles sur le prix de vente.",Groupe Ikamati,Particulier,2025-11-03 00:21:11,"['https://content.avito.ma/classifieds/images/9757591781?t=images', 'https://content.avito.ma/classifieds/images/7742218029?t=images', 'https://content.avito.ma/classifieds/images/9790388927?t=images', 'https://content.avito.ma/classifieds/images/9777514240?t=images', 'https://content.avito.ma/classifieds/images/9768290784?t=images', 'https://content.avito.ma/classifieds/images/9785829271?t=images']",[],2025-11-02 23:30:15.003000,sale,Appartements,Casablanca,Sidi Bernoussi,avito,64.0,,,,,,4.0,,2.0,1.0,,,,,,1.0
52151097,https://www.avito.ma/fr/riviera/appartements/Studio_meubl√©_Riviera_52151097.htm,Studio meubl√© Riviera,6300.0,"Studio meubl√© en location √† Riviera ,proche arr√™t TRAM, dans une R√©sidence s√©curis√©e avec ascenseur place au parking, superficie 44m¬≤, au 2 √©me √©tage, 1 Salon , 1 Cuisine √©quip√©e 1 Chambre √† coucher , 1 SDB douche, balcon , climatisation Loyer 6300 Dh par mois",ABAMNY Immobilier,Particulier,2025-11-03 00:41:10,"['https://content.avito.ma/classifieds/images/10141320311?t=images', 'https://content.avito.ma/classifieds/images/10141320312?t=images', 'https://content.avito.ma/classifieds/images/10141320313?t=images', 'https://content.avito.ma/classifieds/images/10141320314?t=images', 'https://content.avito.ma/classifieds/images/10141320315?t=images', 'https://content.avito.ma/classifieds/images/10141320317?t=images']","['Ascenseur', 'Balcon', 'Climatisation', 'Concierge', 'Cuisine √©quip√©e', 'Meubl√©']",2025-11-02 23:45:15.002000,rent,Appartements,Casablanca,Riviera,avito,44.0,1 mois,,,,44.0,,,1.0,1.0,,,,,,1.0
53988201,https://www.avito.ma/fr/tamraght/villas_et_riads/Villa_Taghazout_Bay_vue_mer_53988201.htm,Villa Taghazout Bay vue mer,,Villa de 3 chambres compl√®tement r√©nov√©e avec du mat√©riel de luxe,Holiday Resorts Taghazout,Particulier,2025-11-02 18:20:10,"['https://content.avito.ma/classifieds/images/10109625457?t=images', 'https://content.avito.ma/classifieds/images/10141228594?t=images', 'https://content.avito.ma/classifieds/images/10141228593?t=images']","['Balcon', 'Chauffage', 'Climatisation', 'Cuisine √©quip√©e', 'Garage', 'Meubl√©']",2025-11-03 00:20:15.003000,sale,Villas et Riads,Agadir,Tamraght,avito,250.0,,,,,650.0,,,3.0,2.0,,,,2.0,,2.0
54036040,https://www.avito.ma/fr/autre_secteur/terrains_et_fermes/Cinq_hectares_et_quatre_ouvriers__tous_en_oliviers_54036040.htm,"Cinq hectares et quatre ouvriers, tous en oliviers",260000.0,"Excellente terre agricole de cinq hectares, enti√®rement plant√©e d'oliviers √† A√Øn Johra. Excellente terre, excellente nappe phr√©atique. Tiflet, prix de 26 millions par hectare, proche d'El Kamouni √† 18 km.",Immo continental,Particulier,2025-11-03 00:34:19,"['https://content.avito.ma/classifieds/images/10110154187?t=images', 'https://content.avito.ma/classifieds/images/10110154188?t=images']",['Agricole'],2025-11-02 23:40:30.004000,sale,Terrains et fermes,K√©nitra,Autre secteur,avito,,,Agricole,,,54000.0,,,,,,,,,,
54393790,https://www.avito.ma/fr/roches_noires/bureaux/Plateaux_bureaux_de_haut_standing_de_76_√†_6000_m¬≤_54393790.htm,Plateaux bureaux de haut standing de 76 √† 6000 m¬≤,9880.0,"CENTRE D‚ÄôAFFAIRES Moulay ISMAIL PLATEAUX BUREAUX de HAUT STANDING Votre Espace Professionnel Assur√© en des Plateaux bureaux de HAUT STANDING FUSIONNABLES. Mat√©riaux Haut de Gamme, une Belle Conception & Prestations, avec une variante de 76 m¬≤ √† 6000 m¬≤. Tout y est Optimis√© pour votre Confort Professionnel. - Climatisation Centrale - Kitchenette - Fibre optique - Cam√©ras de surveillance internes & externes, - D√©tecteur de fum√©e - alarme d‚Äôincendie - Domotique - Isolation acoustique & thermique luminosit√© - Parfaites a√©ration & distribution - 2 sous sols en parking SECURIS√© 24/24",GOLF BUILDING,Particulier,2025-11-02 16:25:08,"['https://content.avito.ma/classifieds/images/10113651400?t=images', 'https://content.avito.ma/classifieds/images/10113651409?t=images', 'https://content.avito.ma/classifieds/images/10113651461?t=images', 'https://content.avito.ma/classifieds/images/10113652890?t=images', 'https://content.avito.ma/classifieds/images/10113652899?t=images', 'https://content.avito.ma/classifieds/images/10113652930?t=images', 'https://content.avito.ma/classifieds/images/10113652934?t=images', 'https://content.avito.ma/classifieds/images/10113652937?t=images', 'https://content.avito.ma/classifieds/images/10113652938?t=images', 'https://content.avito.ma/classifieds/images/10113652939?t=images', 'https://content.avito.ma/classifieds/images/10113652940?t=images', 'https://content.avito.ma/classifieds/images/10113652944?t=images', 'https://content.avito.ma/classifieds/images/10113652951?t=images', 'https://content.avito.ma/classifieds/images/10113652954?t=images', 'https://content.avito.ma/classifieds/images/10113652958?t=images']","['Ascenseur', 'Chauffage', 'Climatisation', 'C√¢blage t√©l√©phonique', 'Parking', 'S√©curit√©']",2025-11-02 23:25:15.003000,rent,Bureaux,Casablanca,Roches Noires,avito,,,,,,76.0,2.0,,,1.0,1.0,,,,,
54679330,https://www.avito.ma/fr/sidi_allal_el_bahraoui/terrains_et_fermes/Cinq_hectares_d_oliviers_√†_prix_tr√®s_bas_54679330.htm,Cinq hectares d'oliviers √† prix tr√®s bas,260000.0,"Cinq hectares et demi, excellents, enti√®rement plant√©s d'oliviers, tr√®s bon march√©. Prix : 26 millions l'hectare. Eau disponible en abondance. Situ√©s √† A√Øn Johra.",Immo continental,Particulier,2025-11-03 00:42:15,['https://content.avito.ma/classifieds/images/10116283222?t=images'],['Agricole'],2025-11-02 23:52:30.003000,sale,Terrains et fermes,Sidi Allal El Bahraoui,Toute la ville,avito,,,Agricole,,,54000.0,,,,,,,,,,
55174614,https://www.avito.ma/fr/sidi_bernoussi/appartements/Appartements_√†_vendre_√†_Casablanca_55174614.htm,Appartements √† vendre √† Casablanca,7000.0,"R√©sidence Jnan Sbil 2 (moyen standing) entre la nouvelle ville Zenata et Sidi Bernoussi pr√®s de la route nationale 1 casa-rabat. 3 chambres / 2 chambres Ascenseur Les √©quipements du projet : Espaces verts, Hammam, salle de sport, mosqu√©e, commerces.... Livraison imm√©diate",Groupe Ikamati,Particulier,2025-11-03 00:05:04,"['https://content.avito.ma/classifieds/images/10121657711?t=images', 'https://content.avito.ma/classifieds/images/10121657714?t=images', 'https://content.avito.ma/classifieds/images/10121657715?t=images', 'https://content.avito.ma/classifieds/images/10121657716?t=images', 'https://content.avito.ma/classifieds/images/10121657717?t=images', 'https://content.avito.ma/classifieds/images/10121657718?t=images', 'https://content.avito.ma/classifieds/images/10121657719?t=images', 'https://content.avito.ma/classifieds/images/10121657713?t=images', 'https://content.avito.ma/classifieds/images/10121657720?t=images', 'https://content.avito.ma/classifieds/images/10121657721?t=images', 'https://content.avito.ma/classifieds/images/10121657722?t=images', 'https://content.avito.ma/classifieds/images/10121657723?t=images', 'https://content.avito.ma/classifieds/images/10121657724?t=images', 'https://content.avito.ma/classifieds/images/10121657725?t=images']","['Neuf', 'Ascenseur', 'Balcon']",2025-11-02 23:22:15.003000,sale,Appartements,Casablanca,Sidi Bernoussi,avito,105.0,,,,,,,Moins de 1 an,3.0,2.0,,,Neuf,,,1.0
55344055,https://www.avito.ma/fr/aviation___mabella/appartements/Appartement_R√©nov√©_√†_louer_Quartier_Administratif_55344055.htm,Appartement R√©nov√© √† louer Quartier Administratif,11000.0,REF 2A610 Le Cabinet Sa√Ød BENNIS IMMOBILIER met en Location un bel appartement avec vue sur la vall√©e √† Youssoufia. L‚Äôappartement est situ√© au 2e √©tage d‚Äôun immeuble s√©curis√© et sans vis-√†-vis. Descriptif : ‚Ä¢ 1 Suite parentale avec Salle de bain et Dressing ‚Ä¢ 2 Chambres √† coucher ‚Ä¢ 1 Salle de bain ‚Ä¢ 1 Double Salon avec chemin√©e ‚Ä¢ 1 Terrasse avec vue sur la vall√©e ‚Ä¢ 1 Salle d‚Äôeau invit√©s ‚Ä¢ 1 Cuisine √©quip√©e avec buanderie ‚Ä¢ 2 Places au garage ‚Ä¢ Climatisation ‚Ä¢ Cam√©ra de surveillance Superficie : 170 m2 Prix : 11 000 DH/mois Disponibilit√© imm√©diate N‚Äôh√©sitez pas √† nous contacter pour plus d‚Äôinformations.,Cabinet Immobilier Sa√Ød BENNIS,Particulier,2025-11-02 23:35:06,"['https://content.avito.ma/classifieds/images/10134065982?t=images', 'https://content.avito.ma/classifieds/images/10134065983?t=images', 'https://content.avito.ma/classifieds/images/10134065984?t=images', 'https://content.avito.ma/classifieds/images/10134065992?t=images', 'https://content.avito.ma/classifieds/images/10134066015?t=images', 'https://content.avito.ma/classifieds/images/10134066016?t=images', 'https://content.avito.ma/classifieds/images/10134066017?t=images', 'https://content.avito.ma/classifieds/images/10134065993?t=images']","['Climatisation', 'Cuisine √©quip√©e', 'Parking', 'S√©curit√©', 'Terrasse']",2025-11-02 23:35:15.003000,rent,Appartements,Rabat,Aviation - Mabella,avito,170.0,1 mois,,,,,2.0,,3.0,2.0,,,,,,2.0


In [375]:
silver_df = silver_df.drop("attributes_map")

In [377]:
# Print the schema of the silver_df DataFrame
silver_df.printSchema()

root
 |-- id: string (nullable = true)
 |-- url: string (nullable = true)
 |-- title: string (nullable = true)
 |-- price_value: double (nullable = true)
 |-- description: string (nullable = true)
 |-- seller_name: string (nullable = true)
 |-- seller_type: string (nullable = true)
 |-- published_date_text: string (nullable = true)
 |-- image_urls: array (nullable = true)
 |    |-- element: string (containsNull = false)
 |-- equipments: array (nullable = true)
 |    |-- element: string (containsNull = true)
 |-- ingest_ts: timestamp (nullable = true)
 |-- type: string (nullable = true)
 |-- category_type: string (nullable = true)
 |-- city: string (nullable = true)
 |-- neighborhood: string (nullable = true)
 |-- site: string (nullable = false)
 |-- Surface habitable: string (nullable = true)
 |-- Caution: string (nullable = true)
 |-- Zoning: string (nullable = true)
 |-- Type d'appartement: string (nullable = true)
 |-- Standing: string (nullable = true)
 |-- Surface totale: string (

In [388]:
silver_df.select('seller_name').show(10, truncate=False)

+------------------------------+
|seller_name                   |
+------------------------------+
|Groupe Ikamati                |
|Groupe Ikamati                |
|Groupe Ikamati                |
|ABAMNY Immobilier             |
|Holiday Resorts Taghazout     |
|Immo continental              |
|GOLF BUILDING                 |
|Immo continental              |
|Groupe Ikamati                |
|Cabinet Immobilier Sa√Ød BENNIS|
+------------------------------+
only showing top 10 rows



In [395]:
silver_df.groupBy('seller_name').count().orderBy('count', ascending=False).show(5, truncate=False)

+----------------------------+-----+
|seller_name                 |count|
+----------------------------+-----+
|agence immobilier mostagimmo|6    |
|safin immobilier            |4    |
|groupe ikamati              |4    |
|immo continental            |3    |
|chawki                      |2    |
+----------------------------+-----+
only showing top 5 rows



In [396]:
from pyspark.sql.functions import lower

# Convert 'seller_name' to lowercase
silver_df = silver_df.withColumn('seller_name', lower(col('seller_name')))

# Show the updated schema and preview the data
silver_df.groupBy('seller_name').count().orderBy('count', ascending=False).show(5, truncate=False)

+----------------------------+-----+
|seller_name                 |count|
+----------------------------+-----+
|agence immobilier mostagimmo|6    |
|safin immobilier            |4    |
|groupe ikamati              |4    |
|immo continental            |3    |
|chawki                      |2    |
+----------------------------+-----+
only showing top 5 rows

