# Comparativa de Marcas Cosméticas (Similarweb API)
Este notebook analiza tráfico total, fuentes de tráfico, dispositivos y distribución geográfica de dominios del sector cosmético antiedad.

In [1]:
# ✅ Librerías necesarias
import requests
import pandas as pd

In [None]:
# 🔐 Tu API Key (reemplázala por la real)
API_KEY = 'TU_API_KEY_AQUI'
BASE_URL = 'https://api.similarweb.com/v1/website'

In [None]:
# 🔄 Funciones para obtener distintos tipos de datos
def get_traffic(domain):
    url = f"{BASE_URL}/{domain}/total-traffic-and-engagement/overview"
    params = {'api_key': API_KEY, 'start_date': '2024-12', 'end_date': '2024-12',
              'main_domain_only': 'true', 'granularity': 'monthly', 'format': 'json'}
    r = requests.get(url, params=params)
    return r.json() if r.status_code == 200 else {}

def get_sources(domain):
    url = f"{BASE_URL}/{domain}/traffic-sources/overview"
    params = {'api_key': API_KEY, 'start_date': '2024-12', 'end_date': '2024-12',
              'main_domain_only': 'true', 'format': 'json'}
    r = requests.get(url, params=params)
    return r.json() if r.status_code == 200 else {}

def get_geo(domain):
    url = f"{BASE_URL}/{domain}/geo-distribution/overview"
    params = {'api_key': API_KEY, 'start_date': '2024-12', 'end_date': '2024-12',
              'main_domain_only': 'true', 'format': 'json'}
    r = requests.get(url, params=params)
    return r.json() if r.status_code == 200 else {}

def get_devices(domain):
    url = f"{BASE_URL}/{domain}/devices/overview"
    params = {'api_key': API_KEY, 'start_date': '2024-12', 'end_date': '2024-12',
              'main_domain_only': 'true', 'format': 'json'}
    r = requests.get(url, params=params)
    return r.json() if r.status_code == 200 else {}

In [None]:
# 🔍 Lista de dominios a analizar
competidores = [
    'paulaschoice.es',
    'skinclinic.es',
    'laroche-posay.es',
    'cantabrialabs.es',
    'kiehls.es',
    'esthederm.es'
]

In [None]:
# 📊 Recolectar y combinar datos en una tabla
data = []
for dominio in competidores:
    t = get_traffic(dominio)
    s = get_sources(dominio)
    g = get_geo(dominio)
    d = get_devices(dominio)

    fila = {
        'Dominio': dominio,
        'Visitas': t.get('visits'),
        'Duración': t.get('average_visit_duration'),
        'Páginas por visita': t.get('pages_per_visit'),
        'Rebote (%)': t.get('bounce_rate'),
        'Tráfico Búsqueda': s.get('search', {}).get('value'),
        'Tráfico Directo': s.get('direct', {}).get('value'),
        'Tráfico Social': s.get('social', {}).get('value'),
        'Principal País': g.get('top_countries', [{}])[0].get('country'),
        'Tráfico desde móvil (%)': d.get('mobile', {}).get('percentage')
    }
    data.append(fila)

df = pd.DataFrame(data)
df.sort_values(by='Visitas', ascending=False)