In [28]:
import os
import re
import unicodedata
import httpx
import pandas as pd
import json
from datetime import datetime
import nest_asyncio
import uvicorn
from fastapi import FastAPI
from pydantic import BaseModel
from typing import Dict, List, Optional
from fastapi.responses import FileResponse
from fastapi.middleware.cors import CORSMiddleware
from urllib.parse import unquote

In [2]:
nest_asyncio.apply()
app = FastAPI()

class MarcaRequest(BaseModel):
    marca: str

In [3]:
class ModificarRequest(BaseModel):
    marca: str
    red: str
    enlaces_eliminar: Optional[List[int]] = None
    enlaces_agregar: Optional[List[str]] = None

In [4]:
###### Credenciales
api_key = 'AIzaSyDuIQSmkWuEDc32twaUDJ-2OJFThw4R9V8'
search_engine_id = 'd425b95fffdc64915'
#marca = 'coca-cola'
country = 'MX|US'

In [5]:
def normalizar_marca(nombre_marca: str) -> str:
    nombre_normalizado = ''.join(
        c for c in unicodedata.normalize('NFKD', nombre_marca) if unicodedata.category(c) != 'Mn'
    )
    nombre_normalizado = re.sub(r'[^a-zA-Z0-9]', '', nombre_normalizado)
    return nombre_normalizado.lower()

In [6]:
def guardar_logo(url_logo: str, carpeta:str):
    try:
        response = httpx.get(url_logo)
        if response.status_code == 200:
            ruta_logo = os.path.join(carpeta, 'logo.jpg')
            with open(ruta_logo, 'wb') as f:
                f.write(response.content)
            return ruta_logo
    except Exception as e:
        print(f"Error al descargar el logo: {e}")
    return None

In [7]:
def google_search(api_key, search_engine_id, query, **params):
    base_url = 'https://www.googleapis.com/customsearch/v1'
    params = {
        'key': api_key,
        'cx': search_engine_id,
        'q': query,
        'gl' : country,
        **params
    }
    response =  httpx.get(base_url, params = params)
    response.raise_for_status()
    return response.json()

In [8]:
def guardar_json(nombre_archivo, resultados, carpeta):
    ruta = os.path.join(carpeta, f"{nombre_archivo}.json")
    datos = {
        "fecha_busqueda": datetime.now().strftime("%Y-%m-%d %H:%M:%S"),
        "resultados": resultados
    }
    with open(ruta, 'w', encoding='utf-8') as f:
        json.dump(datos, f, indent=4, ensure_ascii=False)

In [9]:
def cargar_cuentas_verificadas(ruta_cuentas):
    estructura_inicial = {"automaticas": {}, "manuales": {}, "eliminadas": {}}
    if os.path.exists(ruta_cuentas):
        try:
            with open(ruta_cuentas, 'r', encoding='utf-8') as f:
                datos = json.load(f)
                if isinstance(datos, dict) and "automaticas" in datos and "manuales" in datos:
                    if "eliminadas" not in datos:
                        datos["eliminadas"] = {}
                    return datos
                else:
                    if isinstance(datos, dict):
                        datos_corregidos = {"automaticas": {}, "manuales": {}, "eliminadas": {}}
                        for red, cuentas in datos.items():
                            if isinstance(cuentas, list):
                                datos_corregidos["automaticas"][red] = cuentas
                            elif isinstance(cuentas, dict):
                                datos_corregidos.update(cuentas)
                        return datos_corregidos
                    else:
                        return estructura_inicial
        except json.JSONDecodeError:
            return estructura_inicial
    else:
        return estructura_inicial

In [10]:
def hacer_busquedas(marca):
    marca = normalizar_marca(marca)
    country = "MX|US"
    busquedas = {
    "X": [f"{marca} X Twitter MX Mexico cuenta", f"{marca} X Twitter US account"],
    "Facebook": [f"{marca} Facebook MX Mexico cuenta", f"{marca} Facebook US account"],
    "Instagram": [f"{marca} Instagram MX Mexico cuenta", f"{marca} Instagram US account"],
    "Tiktok": [f"{marca} Tiktok MX Mexico cuenta", f"{marca} Tiktok US account"]
    }

    dominios_por_red = {"X": "x.com",
                "Instagram": "www.instagram.com",
                "Tiktok": "www.tiktok.com",
                "Facebook": "www.facebook.com"
               }
    
    #verificar si existe la carpeta
    carpeta_resultados = f"Resultados_{marca}"
    os.makedirs(carpeta_resultados, exist_ok=True)

    ruta_cuentas = os.path.join(carpeta_resultados, "cuentas_verificadas.json")
    if os.path.exists(ruta_cuentas):
        print(f"La carpeta '{carpeta_resultados}' ya existe. Usando resultados existentes.")
        return cargar_cuentas_verificadas(ruta_cuentas)
    
    resultados_meta = []
    for red, queries in busquedas.items():
        resultados_red = []
        for query in queries:
            response = google_search(
                api_key=api_key,
                search_engine_id=search_engine_id,
                query=query,
                country=country,
                num=5
                )
            resultados_red.extend(response.get('items', [])[:5])
        if red in ["Facebook", "Instagram"]:
            resultados_meta.extend(resultados_red)
        else:
            guardar_json(f"Resultados_{marca}_{red}", resultados_red, carpeta_resultados)
    if resultados_meta:
        guardar_json(f"Resultados_{marca}_Meta", resultados_meta, carpeta_resultados)

    ruta_x_json = os.path.join(carpeta_resultados, f"Resultados_{marca}_X.json")
    if os.path.exists(ruta_x_json):
        with open(ruta_x_json, 'r', encoding='utf-8') as f:
            datos_x = json.load(f)
            primeros_tres_caracteres = marca[:3]

            for resultado in datos_x.get('resultados', []):
                link = resultado.get('link', '')
                if link.startswith("https://x.com/") and primeros_tres_caracteres in link.lower():
                    if resultado.get('pagemap', {}).get('cse_thumbnail'):
                        url_logo = resultado['pagemap']['cse_thumbnail'][0]['src']
                        guardar_logo(url_logo, carpeta_resultados)
                        break

    # Crear el archivo cuentas_verificadas.json con los enlaces encontrados
    cuentas_verificadas = {"automaticas": {}, "manuales": {}, "eliminadas": {}}
    for red in busquedas.keys():
        enlaces_filtrados = imprimir_enlaces(carpeta_resultados, marca, red, dominios_por_red[red])
        cuentas_verificadas["automaticas"][red] = enlaces_filtrados

    guardar_json("cuentas_verificadas", cuentas_verificadas, carpeta_resultados)
    return cuentas_verificadas

In [11]:
def filtrar_enlaces(resultados, dominio, marca_normalizada):
    enlaces_filtrados = []
    primeros_tres_caracteres = marca_normalizada[:3]
    for resultado in resultados:
        link = resultado.get("link", "")
        if link.startswith(f"https://{dominio}") or link.startswith(f"http://{dominio}"):
            if primeros_tres_caracteres in link.lower():
                if dominio == "www.tiktok.com":
                    if "/@" in link and not any(keyword in link.lower() for keyword in ["/video/", "/discover/"]):
                        enlaces_filtrados.append(link)
                else:
                    if not any(keyword in link.lower() for keyword in ["discover", "marketplace", "photo.php", "posts"]):
                        enlaces_filtrados.append(link)
    return enlaces_filtrados

In [12]:
def imprimir_enlaces(carpeta_resultados, marca, red, dominio):
    nombre_archivo = f"Resultados_{marca}_Meta.json" if red in ["Facebook", "Instagram"] else f"Resultados_{marca}_{red}.json"
    ruta_json = os.path.join(carpeta_resultados, nombre_archivo)

    if not os.path.exists(ruta_json):
        return []
    
    with open(ruta_json, 'r', encoding='utf-8') as f:
        resultados = json.load(f)
    marca_normalizada = normalizar_marca(marca)
    enlaces_filtrados = filtrar_enlaces(resultados.get("resultados", []), dominio, marca_normalizada)
    return enlaces_filtrados

In [30]:
def buscar_logo(marca: str) -> Optional[str]:
    marca_normalizada = normalizar_marca(marca)  # Sin unquote

    print(f"[LOGO] Marca original: {marca}")
    print(f"[LOGO] Marca normalizada: {marca_normalizada}")

    carpeta_resultados = f"Resultados_{marca_normalizada}"
    ruta_logo = os.path.join(carpeta_resultados, "logo.jpg")
    
    if os.path.exists(ruta_logo):
        return ruta_logo
    else:
        return None


In [13]:
@app.post("/modificar-enlaces/")
async def modificar_enlaces(request: ModificarRequest):
    marca = request.marca
    red = request.red
    enlaces_eliminar = request.enlaces_eliminar
    enlaces_agregar = request.enlaces_agregar

    # Ruta de la carpeta de resultados
    carpeta_resultados = f"Resultados_{marca}"
    ruta_cuentas = os.path.join(carpeta_resultados, "cuentas_verificadas.json")

    # Verificar si el archivo de cuentas verificadas existe
    if not os.path.exists(ruta_cuentas):
        raise HTTPException(status_code=404, detail="No se encontraron cuentas verificadas para la marca especificada.")

    # Cargar las cuentas verificadas
    cuentas_verificadas = cargar_cuentas_verificadas(ruta_cuentas)

    # Verificar si la red social existe
    if red not in cuentas_verificadas["automaticas"]:
        raise HTTPException(status_code=404, detail=f"No se encontraron enlaces para la red social {red}.")

    # Mostrar los enlaces actuales (automáticos y manuales)
    enlaces_automaticos = cuentas_verificadas["automaticas"][red]
    enlaces_manuales = cuentas_verificadas["manuales"].get(red, [])
    enlaces_actuales = enlaces_automaticos + enlaces_manuales

    print(f"Enlaces actuales para {red}:")
    print("Automáticos:")
    for i, enlace in enumerate(enlaces_automaticos):
        print(f"{i + 1}. {enlace} (Automático)")
    print("Manuales:")
    for i, enlace in enumerate(enlaces_manuales, len(enlaces_automaticos) + 1):
        print(f"{i}. {enlace} (Manual)")

    # Eliminar enlaces si se proporcionan índices
    if enlaces_eliminar:
        enlaces_eliminar = [i for i in enlaces_eliminar if 0 <= i < len(enlaces_actuales)]
        if enlaces_eliminar:
            # Guardar los enlaces eliminados
            if red not in cuentas_verificadas["eliminadas"]:
                cuentas_verificadas["eliminadas"][red] = []
            cuentas_verificadas["eliminadas"][red].extend([enlaces_actuales[i] for i in enlaces_eliminar])
            
            # Actualizar la lista de enlaces automáticos y manuales
            cuentas_verificadas["automaticas"][red] = [enlace for i, enlace in enumerate(enlaces_automaticos) if i not in enlaces_eliminar]
            cuentas_verificadas["manuales"][red] = [enlace for i, enlace in enumerate(enlaces_manuales, len(enlaces_automaticos)) if i not in enlaces_eliminar]

    # Agregar enlaces si se proporcionan
    if enlaces_agregar:
        if red not in cuentas_verificadas["manuales"]:
            cuentas_verificadas["manuales"][red] = []
        
        # Formatear los enlaces manuales según la red social
        for enlace in enlaces_agregar:
            if enlace.strip():  # Solo agregar si la cadena no está vacía
                if red == "Tiktok" and not enlace.startswith("https://"):
                    enlace = f"https://www.tiktok.com/@{enlace.lstrip('@')}"
                elif red == "Facebook" and not enlace.startswith("https://"):
                    enlace = f"https://www.facebook.com/{enlace}"
                elif red == "Instagram" and not enlace.startswith("https://"):
                    enlace = f"https://www.instagram.com/{enlace}"
                elif red == "X" and not enlace.startswith("https://"):
                    enlace = f"https://x.com/{enlace}"
                cuentas_verificadas["manuales"][red].append(enlace)

    # Eliminar la red social de "manuales" si no tiene enlaces
    if red in cuentas_verificadas["manuales"] and not cuentas_verificadas["manuales"][red]:
        del cuentas_verificadas["manuales"][red]

    # Guardar los cambios en el archivo JSON
    guardar_json("cuentas_verificadas", cuentas_verificadas, carpeta_resultados)
    return cuentas_verificadas

In [14]:
@app.post("/buscar/")
async def buscar(request: MarcaRequest):
    marca = request.marca
    return hacer_busquedas(marca)

In [26]:
@app.get("/obtener-logo/{marca}")
async def obtener_logo(marca: str):
    ruta_logo = buscar_logo(marca)
    
    if ruta_logo:
        return FileResponse(ruta_logo, media_type="image/jpeg")
    else:
        return {"error": "Logo no encontrado"}

In [16]:
app.add_middleware(
    CORSMiddleware,
    allow_origins=["http://marketing.test"],  # Origen permitido (tu frontend)
    allow_credentials=True,
    allow_methods=["*"],  # Permitir todos los métodos (GET, POST, etc.)
    allow_headers=["*"],  # Permitir todos los encabezados
)

In [17]:
def start_api():
    uvicorn.run(app, host="127.0.0.1", port=8000)

In [None]:
start_api()

INFO:     Started server process [22764]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://127.0.0.1:8000 (Press CTRL+C to quit)


INFO:     127.0.0.1:50872 - "GET /docs HTTP/1.1" 200 OK
INFO:     127.0.0.1:50872 - "GET /openapi.json HTTP/1.1" 200 OK
INFO:     127.0.0.1:50875 - "GET /obtener-logo/MCDONALD%27S HTTP/1.1" 200 OK
La carpeta 'Resultados_cocacola' ya existe. Usando resultados existentes.
INFO:     127.0.0.1:50936 - "POST /buscar/ HTTP/1.1" 200 OK
La carpeta 'Resultados_microsoft' ya existe. Usando resultados existentes.
INFO:     127.0.0.1:50937 - "POST /buscar/ HTTP/1.1" 200 OK
La carpeta 'Resultados_microsoft' ya existe. Usando resultados existentes.
INFO:     127.0.0.1:50935 - "POST /buscar/ HTTP/1.1" 200 OK
La carpeta 'Resultados_bimbo' ya existe. Usando resultados existentes.
INFO:     127.0.0.1:50951 - "POST /buscar/ HTTP/1.1" 200 OK
INFO:     127.0.0.1:50952 - "GET /obtener-logo/Bimbo HTTP/1.1" 200 OK
INFO:     127.0.0.1:50953 - "GET /obtener-logo/Bimbo HTTP/1.1" 200 OK
La carpeta 'Resultados_bimbo' ya existe. Usando resultados existentes.
INFO:     127.0.0.1:50976 - "POST /buscar/ HTTP/1.1" 200 