# Melluso

In [None]:
import requests
from bs4 import BeautifulSoup
import re
import time
import os
import csv

url_melluso = 'https://www.melluso.com/it/'
pagina = requests.get(url_melluso)
analisi = BeautifulSoup(pagina.text, 'html.parser')

# TROVA TUTTE LE CATEGORIE PER UOMO(2) E DONNA(1)
categorie_scraping = analisi.find_all('li', class_=re.compile(r'level1 nav-[1,2]-\w{1,2} category-item'))

In [None]:
# CREA E POPOLA LISTA
categorie_trovate = []
for categoria_scraping in categorie_scraping:
    elemento = categoria_scraping.find('a')
    nome_categorie = elemento.find('span').text.strip()
    link = elemento['href']
    if 'uomo' in link.lower():
        Genere = 'Uomo'
    elif 'donna' in link.lower():
        Genere = 'Donna'
    else:
        Genere = 'NaN'
    # AGGIUNGE DATO ALLA LISTA
    categorie_trovate.append({
        'Genere_Categoria': Genere,
        'Nome_Categoria': nome_categorie,
        'Link_Categoria': link
    })

# SELEZIONO CATEGORIE DA ELIMINARE NON UTILIZZATE
indice = 0
filtro = [True] * len(categorie_scraping)
elimina_categorie = ['accessori', 'new collection', 'saldi', 'estate']
for nome_categoria in categorie_trovate:
    for i in elimina_categorie:
        if i in nome_categoria['Nome_Categoria'].lower():
            filtro[indice] = False
    indice += 1

# ELIMINO LE CATEGORIE
categorie_trovate = [nome_categoria for nome_categoria, tenere in zip(categorie_trovate, filtro) if tenere] # COMPREHENSION FOR
# SI USA UNA COMPREHENSION PER L'INSERIMENTO PARALLELO

In [None]:
# CICLO FOR PER LE CATEGORIE
dati_melluso = []
for categoria in categorie_trovate:
    print(categoria) # INFORMAZIONE PER SAPERE L'ANDAMENTO DELLA ESECUZIONE DEL CODICE
    # PREPARAZIONE PARSING
    url = categoria["Link_Categoria"]
    response = requests.get(url)
    soup = BeautifulSoup(response.text, "html.parser")
    products = soup.select("ol.products.list.items.product-items > li.item.product.product-item")
    
    condizione = True if products else False # COMPREHENSION IF
    
    while condizione:
        for product in products:
            name = product.select_one(".product-item-link").get_text(strip=True)

            # PREZZI 
            special_price_tag = product.select_one(".special-price .price")
            special_price = special_price_tag.get_text(strip=True) if special_price_tag else "" # COMPREHENSION IF

            old_price_tag = product.select_one(".old-price .price")
            old_price = old_price_tag.get_text(strip=True) if old_price_tag else "" # COMPREHENSION IF

            if not special_price and not old_price:
                price_tag = product.select_one(".price")
                special_price = price_tag.get_text(strip=True) if price_tag else "Nan"
            
            # DATI DA FARE SCRAPING
            img = product.select_one("img").get("src")
            link = product.select_one(".product-item-link").get("href")
            
            # SALVATAGGIO DATI
            dati_melluso.append({
                "genere_categoria": categoria["Genere_Categoria"],
                "nome_categoria": categoria["Nome_Categoria"],
                "nome": name,
                "prezzo_originale": old_price if old_price else "Nan",
                "prezzo_scontato": special_price if special_price else "Nan",
                "immagine": img,
                "link": link,
            })

        # PASSAGGIO A PAGINA SUCCESSIVA SE PRESENTE
        url_tag = soup.select_one('li.pages-item-next > a.next')
        url = url_tag.get('href')
        if url == categoria["Link_Categoria"]:
            condizione = False
        else:
            response = requests.get(url)
            soup = BeautifulSoup(response.text, "html.parser")
            products = soup.select("ol.products.list.items.product-items > li.item.product.product-item")
        time.sleep(1)  #PAUSA PER EVITARE SOVRACCARICO

In [None]:
# CREO LA CARTELLA PER SALVARE# SCRITTURA IN CSV
output_folder = "csv"
os.makedirs(output_folder, exist_ok=True)

# SCRITTURA IN CSV
filename = os.path.join(output_folder, "melluso_scraping.csv")
with open(filename, "w", newline="", encoding="utf-8") as f:
    writer = csv.DictWriter(f, fieldnames=[
    "genere_categoria",
    "nome_categoria",
    "nome",
    "prezzo_originale",
    "prezzo_scontato",
    "immagine",
    "link",
    ])
    writer.writeheader()
    writer.writerows(dati_melluso)

# NeroGiardini

In [None]:
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.chrome.service import Service
from selenium.common.exceptions import NoSuchElementException
import time
import csv
import os

# === CONFIGURAZIONI ===
categorie_donna = [
    "sneakers", "ciabatte-e-sabot", "ballerine", "decollete",
    "slingback", "mocassini", "sandali", "sandali-eleganti",
    "tronchetti", "stivali"
]
categorie_uomo = ["sneakers", "derby", "mocassini","stringate"]

base_url = {
    "donna": "https://nerogiardini.it/it/donna/calzature",
    "uomo": "https://nerogiardini.it/it/uomo/calzature"
}

# === SETUP SELENIUM ===
chrome_options = Options()
chrome_options.add_argument("--headless")  # rimuovi per vedere il browser
chrome_options.add_argument("--disable-gpu")
chrome_options.add_argument("--window-size=1920,3000")
service = Service()  # metti qui il path a chromedriver se non è nel PATH
driver = webdriver.Chrome(service=service, options=chrome_options)

In [None]:
prodotti = []

def scroll_to_bottom():
    """Simula scroll per caricare tutti i prodotti"""
    last_height = driver.execute_script("return document.body.scrollHeight")
    for _ in range(10):  # scende piano piano
        driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
        time.sleep(1)
        new_height = driver.execute_script("return document.body.scrollHeight")
        if new_height == last_height:
            break
        last_height = new_height

def scrape_categoria(genere, categoria):
    print(f"\n Scraping: {genere.upper()} - {categoria}")
    for color_code in range(1, 200):
        url = f"{base_url[genere]}/{categoria}?color={color_code}&stock=0"
        driver.get(url)
        scroll_to_bottom()  # carica tutti i prodotti visibili
        
        items = driver.find_elements(By.CSS_SELECTOR, "ol.products.list.items.product-items > li.item.product.product-item")
        if not items:
            continue

        for item in items:
            try:
                titolo = item.find_element(By.TAG_NAME, "h2").text.strip()
                link = item.find_element(By.TAG_NAME, "a").get_attribute("href")
                img = item.find_element(By.CSS_SELECTOR, "img.product-image-photo").get_attribute("src")

                try:
                    prezzo_scontato = item.find_element(By.CSS_SELECTOR, ".price-box .old-price").text.strip()
                    prezzo_originale = item.find_element(By.CSS_SELECTOR, ".price-box .normal-price").text.strip()
                except NoSuchElementException:
                    prezzo_originale = item.find_element(By.CSS_SELECTOR, ".price-box .normal-price").text.strip()
                    prezzo_scontato = ""

                prodotti.append({
                    "titolo": titolo,
                    "prezzo_originale": prezzo_originale,
                    "prezzo_scontato": prezzo_scontato,
                    "immagine": img,
                    "link": link,
                    "colore_codice": color_code,
                    "categoria": categoria,
                    "genere": genere
                })
            except Exception as e:
                print(f" Errore: {e}")
                continue

# === AVVIO SCRAPING ===
for categoria in categorie_donna:
    scrape_categoria("donna", categoria)

for categoria in categorie_uomo:
    scrape_categoria("uomo", categoria)

In [None]:
# === SALVATAGGIO CSV ===
os.makedirs("csv", exist_ok=True)
output_file = "csv/nerogiardini_scraping.csv"

with open(output_file, "w", newline="", encoding="utf-8") as f:
    writer = csv.DictWriter(f, fieldnames=[
        "titolo", "prezzo_originale", "prezzo_scontato", "immagine",
        "link", "colore_codice", "categoria", "genere"
    ])
    writer.writeheader()
    writer.writerows(prodotti)

driver.quit()
print(f"\n FINE! Prodotti salvati in: {output_file}")

# IGI&CO

In [None]:
import requests
from bs4 import BeautifulSoup
import re
import time
import os
import csv

categorie = [
    ["donna", "sneakers"],
    ["donna", "zeppe"],
    ["donna", "mocassini-e-slip-on"],
    ["donna", "scarpe-con-tacco"],
    ["donna", "scarpe-ecosostenibili"],
    ["donna", "scarpe-eleganti"],
    ["donna", "stivaletti-e-anfibi"],
    ["donna", "sandali-e-infradito"],
    ["donna", "ballerine"],
    ["uomo", "sneakers"],
    ["uomo", "mocassini-e-scarpe-basse"],
    ["uomo", "stringate"],
    ["uomo", "scarpe-gore-tex"],
    ["uomo", "sandali"]
]

inizio_url = "https://www.igieco.it/shop/i_it/"
fine_url = ".html?product_list_limit=all"

def prepara_scraping(url):
    pagina = requests.get(url)
    analisi = BeautifulSoup(pagina.text, 'html.parser')
    return analisi

In [None]:
dati = []
for categoria in categorie:
    print(categoria)
    # PREPARAZIONE PARSING
    url = f"{inizio_url}{categoria[0]}/{categoria[1]}{fine_url}"
    soup = prepara_scraping(url)
    categoria_scraping = soup.find_all("div", class_="productCard")
    
    for prodotto in categoria_scraping:
        nome = prodotto.select_one("div.productCardDetails h3.product-title a")
        if nome: nome = nome.get("title")
        prezzo_tag = prodotto.select_one("span.old-price span.price")
        prezzo = prezzo_tag.get_text(strip=True) if prezzo_tag else "None"
        prezzo_scontato_tag = prodotto.select_one("span.special-price span.price")
        prezzo_scontato = prezzo_scontato_tag.get_text(strip=True) if prezzo_scontato_tag else "None"
        img = prodotto.select_one("img").get("src")
        link = prodotto.select_one("div.productCardDetails h3.product-title a")
        if link: link = link.get("href")
        if nome != None and prezzo != None and prezzo_scontato != None and img != None and link != None:
            dati.append({
                "genere_categoria": categoria[0],
                "nome_categoria": categoria[1],
                "nome": nome,
                "prezzo_originale": prezzo if prezzo else None,
                "prezzo_scontato": prezzo_scontato if prezzo_scontato else None,
                "immagine": img,
                "link": link,
            })
    time.sleep(1)  #PAUSA PER EVITARE SOVRACCARICO

In [None]:
# CREO LA CARTELLA PER SALVARE# SCRITTURA IN CSV
output_folder = "csv"
os.makedirs(output_folder, exist_ok=True)

# SCRITTURA IN CSV
filename = os.path.join(output_folder, "igieco_scraping.csv")
with open(filename, "w", newline="", encoding="utf-8") as f:
    writer = csv.DictWriter(f, fieldnames=[
    "genere_categoria",
    "nome_categoria",
    "nome",
    "prezzo_originale",
    "prezzo_scontato",
    "immagine",
    "link",
    ])
    writer.writeheader()
    writer.writerows(dati)