In [1]:
import os
import re
import unicodedata
import httpx
import pandas as pd
import json
from datetime import datetime
import nest_asyncio
import uvicorn
from fastapi import FastAPI
from pydantic import BaseModel
from typing import Dict, List, Optional
from fastapi.responses import FileResponse
from fastapi.middleware.cors import CORSMiddleware
from urllib.parse import unquote
import mysql.connector

In [2]:
def conectar_db():
    try:
        conexion = mysql.connector.connect(
            host="127.0.0.1",  # O "localhost"
            user="root",        # Usuario de MySQL
            password="",        # Contraseña de MySQL (vacía por defecto en Laragon)
            database="Marcas"  # Nombre de la base de datos
        )
        print("Conexión a la base de datos exitosa.")
        return conexion
    except mysql.connector.Error as err:
        print(f"Error al conectar a la base de datos: {err}")
        return None

In [3]:
nest_asyncio.apply()
app = FastAPI()

class MarcaRequest(BaseModel):
    marca: str

In [4]:
class ModificarRequest(BaseModel):
    marca: str
    red: str
    enlaces_eliminar: Optional[List[int]] = None
    enlaces_agregar: Optional[List[str]] = None

In [5]:
###### Credenciales
#api_key = 'AIzaSyDuIQSmkWuEDc32twaUDJ-2OJFThw4R9V8'
#search_engine_id = 'd425b95fffdc64915'
#marca = 'coca-cola'
country = 'MX|US'

### Credenciales 2
api_key = 'AIzaSyAfaMeGgowD2e6BkPGuHkD9ScMUg8mrtCQ'
search_engine_id = '0507d2831a0c64998'


In [6]:
def normalizar_marca(nombre_marca: str) -> str:
    nombre_normalizado = ''.join(
        c for c in unicodedata.normalize('NFKD', nombre_marca) if unicodedata.category(c) != 'Mn'
    )
    nombre_normalizado = re.sub(r'[^a-zA-Z0-9]', '', nombre_normalizado)
    return nombre_normalizado.lower()

In [7]:
def guardar_logo(url_logo: str, carpeta:str):
    try:
        response = httpx.get(url_logo)
        if response.status_code == 200:
            ruta_logo = os.path.join(carpeta, 'logo.jpg')
            with open(ruta_logo, 'wb') as f:
                f.write(response.content)
            return ruta_logo
    except Exception as e:
        print(f"Error al descargar el logo: {e}")
    return None

In [8]:
def google_search(api_key, search_engine_id, query, **params):
    base_url = 'https://www.googleapis.com/customsearch/v1'
    params = {
        'key': api_key,
        'cx': search_engine_id,
        'q': query,
        'gl' : country,
        **params
    }
    response =  httpx.get(base_url, params = params)
    response.raise_for_status()
    return response.json()

In [9]:
def guardar_json(nombre_archivo, resultados, carpeta):
    ruta = os.path.join(carpeta, f"{nombre_archivo}.json")
    datos = {
        "fecha_busqueda": datetime.now().strftime("%Y-%m-%d %H:%M:%S"),
        "resultados": resultados
    }
    with open(ruta, 'w', encoding='utf-8') as f:
        json.dump(datos, f, indent=4, ensure_ascii=False)

In [10]:
def cargar_cuentas_verificadas(ruta_cuentas):
    estructura_inicial = {"automaticas": {}, "manuales": {}, "eliminadas": {}}
    if os.path.exists(ruta_cuentas):
        try:
            with open(ruta_cuentas, 'r', encoding='utf-8') as f:
                datos = json.load(f)
                if isinstance(datos, dict) and "automaticas" in datos and "manuales" in datos:
                    if "eliminadas" not in datos:
                        datos["eliminadas"] = {}
                    return datos
                else:
                    if isinstance(datos, dict):
                        datos_corregidos = {"automaticas": {}, "manuales": {}, "eliminadas": {}}
                        for red, cuentas in datos.items():
                            if isinstance(cuentas, list):
                                datos_corregidos["automaticas"][red] = cuentas
                            elif isinstance(cuentas, dict):
                                datos_corregidos.update(cuentas)
                        return datos_corregidos
                    else:
                        return estructura_inicial
        except json.JSONDecodeError:
            return estructura_inicial
    else:
        return estructura_inicial

In [11]:
def guardar_o_actualizar_marca(marca, resultados_x, resultados_meta, resultados_tiktok, cuentas_verificadas, ruta_logo):
    conexion = conectar_db()
    if not conexion:
        return  # Detener la ejecución si no hay conexión

    cursor = conexion.cursor()

    try:
        # Leer el archivo del logo como binario
        logo_binario = None
        if ruta_logo and os.path.exists(ruta_logo):
            with open(ruta_logo, 'rb') as f:
                logo_binario = f.read()

        # Verificar si la marca ya existe
        cursor.execute("SELECT id, resultados_x, resultados_meta, resultados_tiktok, logo FROM Marcas WHERE nombre_marca = %s", (marca,))
        resultado = cursor.fetchone()

        if resultado:
            print(f"Actualizando datos para la marca: {marca}")
            # Preservar los valores existentes si no se proporcionan nuevos
            resultados_x = json.dumps(resultados_x) if resultados_x is not None else resultado[1]
            resultados_meta = json.dumps(resultados_meta) if resultados_meta is not None else resultado[2]
            resultados_tiktok = json.dumps(resultados_tiktok) if resultados_tiktok is not None else resultado[3]
            logo_binario = logo_binario if logo_binario is not None else resultado[4]

            # Convertir cuentas_verificadas a JSON
            cuentas_verificadas_json = json.dumps(cuentas_verificadas, ensure_ascii=False)
            print("JSON que se enviará a la base de datos:", cuentas_verificadas_json)

            query = """
            UPDATE Marcas
            SET resultados_x = %s, resultados_meta = %s, resultados_tiktok = %s, cuentas_verificadas = %s, logo = %s
            WHERE nombre_marca = %s
            """
            valores = (
                resultados_x,
                resultados_meta,
                resultados_tiktok,
                cuentas_verificadas_json,  # Usar el JSON serializado
                logo_binario,
                marca
            )
        else:
            print(f"Insertando datos para la marca: {marca}")
            # Convertir cuentas_verificadas a JSON
            cuentas_verificadas_json = json.dumps(cuentas_verificadas, ensure_ascii=False)
            print("JSON que se enviará a la base de datos:", cuentas_verificadas_json)

            query = """
            INSERT INTO Marcas (nombre_marca, resultados_x, resultados_meta, resultados_tiktok, cuentas_verificadas, logo)
            VALUES (%s, %s, %s, %s, %s, %s)
            """
            valores = (
                marca,
                json.dumps(resultados_x) if resultados_x else None,
                json.dumps(resultados_meta) if resultados_meta else None,
                json.dumps(resultados_tiktok) if resultados_tiktok else None,
                cuentas_verificadas_json,  # Usar el JSON serializado
                logo_binario
            )

        cursor.execute(query, valores)
        conexion.commit()
        print("Datos guardados correctamente.")
    except mysql.connector.Error as err:
        print(f"Error al guardar datos: {err}")
    finally:
        cursor.close()
        conexion.close()

In [12]:
def hacer_busquedas(marca):
    marca = normalizar_marca(marca)
    country = "MX|US"
    busquedas = {
        "X": [f"{marca} X Twitter MX Mexico cuenta", f"{marca} X Twitter US account"],
        "Facebook": [f"{marca} Facebook MX Mexico cuenta", f"{marca} Facebook US account"],
        "Instagram": [f"{marca} Instagram MX Mexico cuenta", f"{marca} Instagram US account"],
        "Tiktok": [f"{marca} Tiktok MX Mexico cuenta", f"{marca} Tiktok US account"]
    }

    dominios_por_red = {
        "X": "x.com",
        "Instagram": "www.instagram.com",
        "Tiktok": "www.tiktok.com",
        "Facebook": "www.facebook.com"
    }

    # Verificar si existe la carpeta
    carpeta_resultados = f"Resultados_{marca}"
    os.makedirs(carpeta_resultados, exist_ok=True)

    ruta_cuentas = os.path.join(carpeta_resultados, "cuentas_verificadas.json")
    if os.path.exists(ruta_cuentas):
        print(f"La carpeta '{carpeta_resultados}' ya existe. Usando resultados existentes.")
        return cargar_cuentas_verificadas(ruta_cuentas)

    # Inicializar las variables para los resultados
    resultados_x = []
    resultados_meta = []
    resultados_tiktok = []
    ruta_logo = None

    # Realizar las búsquedas
    for red, queries in busquedas.items():
        resultados_red = []
        for query in queries:
            response = google_search(
                api_key=api_key,
                search_engine_id=search_engine_id,
                query=query,
                country=country,
                num=5
            )
            resultados_red.extend(response.get('items', [])[:5])

        if red == "X":
            resultados_x = resultados_red  # Guardar resultados de X
        elif red == "Tiktok":
            resultados_tiktok = resultados_red  # Guardar resultados de TikTok
        elif red in ["Facebook", "Instagram"]:
            resultados_meta.extend(resultados_red)  # Guardar resultados de Meta

    # Guardar los resultados en archivos JSON
    if resultados_x:
        guardar_json(f"Resultados_{marca}_X", resultados_x, carpeta_resultados)
    if resultados_meta:
        guardar_json(f"Resultados_{marca}_Meta", resultados_meta, carpeta_resultados)
    if resultados_tiktok:
        guardar_json(f"Resultados_{marca}_Tiktok", resultados_tiktok, carpeta_resultados)

    # Buscar el logo
    ruta_x_json = os.path.join(carpeta_resultados, f"Resultados_{marca}_X.json")
    if os.path.exists(ruta_x_json):
        with open(ruta_x_json, 'r', encoding='utf-8') as f:
            datos_x = json.load(f)
            primeros_tres_caracteres = marca[:3]

            for resultado in datos_x.get('resultados', []):
                if isinstance(resultado, dict):  # Asegurarse de que resultado sea un diccionario
                    link = resultado.get('link', '')
                    if link.startswith("https://x.com/") and primeros_tres_caracteres in link.lower():
                        if resultado.get('pagemap', {}).get('cse_thumbnail'):
                            url_logo = resultado['pagemap']['cse_thumbnail'][0]['src']
                            ruta_logo = guardar_logo(url_logo, carpeta_resultados)
                            break

    # Crear el archivo cuentas_verificadas.json con los enlaces encontrados
    cuentas_verificadas = {"automaticas": {}, "manuales": {}, "eliminadas": {}}
    for red in busquedas.keys():
        enlaces_filtrados = imprimir_enlaces(carpeta_resultados, marca, red, dominios_por_red[red])
        cuentas_verificadas["automaticas"][red] = enlaces_filtrados

    guardar_json("cuentas_verificadas", cuentas_verificadas, carpeta_resultados)

    # Depuración: Verificar los datos antes de guardar en la base de datos
    #print("Datos que se enviarán a la base de datos:")
    #print("Resultados X:", resultados_x)
    #print("Resultados Meta:", resultados_meta)
    #print("Resultados TikTok:", resultados_tiktok)
    #print("Cuentas Verificadas:", cuentas_verificadas)
    #print("Ruta del logo:", ruta_logo)

    # Guardar o actualizar en la base de datos
    guardar_o_actualizar_marca(
        marca=marca,
        resultados_x=resultados_x,  # Datos de X
        resultados_meta=resultados_meta,  # Datos de Meta
        resultados_tiktok=resultados_tiktok,  # Datos de TikTok
        cuentas_verificadas=cuentas_verificadas,
        ruta_logo=ruta_logo  # Ruta del logo
    )

    return cuentas_verificadas

In [13]:
def filtrar_enlaces(resultados, dominio, marca_normalizada):
    enlaces_filtrados = []
    primeros_tres_caracteres = marca_normalizada[:3]
    for resultado in resultados:
        link = resultado.get("link", "")
        if link.startswith(f"https://{dominio}") or link.startswith(f"http://{dominio}"):
            if primeros_tres_caracteres in link.lower():
                if dominio == "www.tiktok.com":
                    if "/@" in link and not any(keyword in link.lower() for keyword in ["/video/", "/discover/"]):
                        enlaces_filtrados.append(link)
                else:
                    if not any(keyword in link.lower() for keyword in ["discover", "marketplace", "photo.php", "posts"]):
                        enlaces_filtrados.append(link)
    return enlaces_filtrados

In [14]:
def imprimir_enlaces(carpeta_resultados, marca, red, dominio):
    nombre_archivo = f"Resultados_{marca}_Meta.json" if red in ["Facebook", "Instagram"] else f"Resultados_{marca}_{red}.json"
    ruta_json = os.path.join(carpeta_resultados, nombre_archivo)

    if not os.path.exists(ruta_json):
        return []
    
    with open(ruta_json, 'r', encoding='utf-8') as f:
        resultados = json.load(f)
    marca_normalizada = normalizar_marca(marca)
    enlaces_filtrados = filtrar_enlaces(resultados.get("resultados", []), dominio, marca_normalizada)
    return enlaces_filtrados

In [15]:
def buscar_logo(marca: str) -> Optional[str]:
    marca_normalizada = normalizar_marca(marca)  # Sin unquote

    print(f"[LOGO] Marca original: {marca}")
    print(f"[LOGO] Marca normalizada: {marca_normalizada}")

    carpeta_resultados = f"Resultados_{marca_normalizada}"
    ruta_logo = os.path.join(carpeta_resultados, "logo.jpg")
    
    if os.path.exists(ruta_logo):
        return ruta_logo
    else:
        return None


In [16]:
@app.post("/modificar-enlaces/")
async def modificar_enlaces(request: ModificarRequest):
    marca = request.marca
    red = request.red
    enlaces_eliminar = request.enlaces_eliminar
    enlaces_agregar = request.enlaces_agregar

    # Ruta de la carpeta de resultados
    carpeta_resultados = f"Resultados_{marca}"
    ruta_cuentas = os.path.join(carpeta_resultados, "cuentas_verificadas.json")

    # Verificar si el archivo de cuentas verificadas existe
    if not os.path.exists(ruta_cuentas):
        raise HTTPException(status_code=404, detail="No se encontraron cuentas verificadas para la marca especificada.")

    # Cargar las cuentas verificadas
    cuentas_verificadas = cargar_cuentas_verificadas(ruta_cuentas)

    # Verificar si la red social existe
    if red not in cuentas_verificadas["automaticas"]:
        raise HTTPException(status_code=404, detail=f"No se encontraron enlaces para la red social {red}.")

    # Mostrar los enlaces actuales (automáticos y manuales)
    enlaces_automaticos = cuentas_verificadas["automaticas"][red]
    enlaces_manuales = cuentas_verificadas["manuales"].get(red, [])
    enlaces_actuales = enlaces_automaticos + enlaces_manuales

    print(f"Enlaces actuales para {red}:")
    print("Automáticos:")
    for i, enlace in enumerate(enlaces_automaticos):
        print(f"{i + 1}. {enlace} (Automático)")
    print("Manuales:")
    for i, enlace in enumerate(enlaces_manuales, len(enlaces_automaticos) + 1):
        print(f"{i}. {enlace} (Manual)")

    # Eliminar enlaces si se proporcionan índices
    if enlaces_eliminar:
        enlaces_eliminar = [i for i in enlaces_eliminar if 0 <= i < len(enlaces_actuales)]
        if enlaces_eliminar:
            # Guardar los enlaces eliminados
            if red not in cuentas_verificadas["eliminadas"]:
                cuentas_verificadas["eliminadas"][red] = []
            cuentas_verificadas["eliminadas"][red].extend([enlaces_actuales[i] for i in enlaces_eliminar])
            
            # Actualizar la lista de enlaces automáticos y manuales
            cuentas_verificadas["automaticas"][red] = [enlace for i, enlace in enumerate(enlaces_automaticos) if i not in enlaces_eliminar]
            cuentas_verificadas["manuales"][red] = [enlace for i, enlace in enumerate(enlaces_manuales, len(enlaces_automaticos)) if i not in enlaces_eliminar]

    # Agregar enlaces si se proporcionan
    if enlaces_agregar:
        if red not in cuentas_verificadas["manuales"]:
            cuentas_verificadas["manuales"][red] = []
        
        # Formatear los enlaces manuales según la red social
        for enlace in enlaces_agregar:
            if enlace.strip():  # Solo agregar si la cadena no está vacía
                if red == "Tiktok" and not enlace.startswith("https://"):
                    enlace = f"https://www.tiktok.com/@{enlace.lstrip('@')}"
                elif red == "Facebook" and not enlace.startswith("https://"):
                    enlace = f"https://www.facebook.com/{enlace}"
                elif red == "Instagram" and not enlace.startswith("https://"):
                    enlace = f"https://www.instagram.com/{enlace}"
                elif red == "X" and not enlace.startswith("https://"):
                    enlace = f"https://x.com/{enlace}"
                cuentas_verificadas["manuales"][red].append(enlace)

    # Eliminar la red social de "manuales" si no tiene enlaces
    if red in cuentas_verificadas["manuales"] and not cuentas_verificadas["manuales"][red]:
        del cuentas_verificadas["manuales"][red]

    print("Actualizando base de datos con los siguientes datos:")
    print("Cuentas verificadas:", cuentas_verificadas)
    guardar_json("cuentas_verificadas", cuentas_verificadas, carpeta_resultados)
    guardar_o_actualizar_marca(
        marca=marca,
        resultados_x=None,  # No se modifican estos campos
        resultados_meta=None,  # No se modifican estos campos
        resultados_tiktok=None,  # No se modifican estos campos
        cuentas_verificadas=cuentas_verificadas,
        ruta_logo=None  # No se modifica el logo
    )
    return cuentas_verificadas

In [17]:
@app.post("/buscar/")
async def buscar(request: MarcaRequest):
    marca = request.marca
    return hacer_busquedas(marca)

In [18]:
@app.get("/obtener-logo/{marca}")
async def obtener_logo(marca: str):
    ruta_logo = buscar_logo(marca)
    
    if ruta_logo:
        return FileResponse(ruta_logo, media_type="image/jpeg")
    else:
        return {"error": "Logo no encontrado"}

In [19]:
app.add_middleware(
    CORSMiddleware,
    allow_origins=["http://marketing.test"],  # Origen permitido (tu frontend)
    allow_credentials=True,
    allow_methods=["*"],  # Permitir todos los métodos (GET, POST, etc.)
    allow_headers=["*"],  # Permitir todos los encabezados
)

In [20]:
def start_api():
    uvicorn.run(app, host="127.0.0.1", port=8000)

In [None]:
start_api()

INFO:     Started server process [12084]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://127.0.0.1:8000 (Press CTRL+C to quit)


INFO:     127.0.0.1:56718 - "GET /docs HTTP/1.1" 200 OK
INFO:     127.0.0.1:56718 - "GET /openapi.json HTTP/1.1" 200 OK
Conexión a la base de datos exitosa.
Insertando datos para la marca: amazon
JSON que se enviará a la base de datos: {"automaticas": {"X": ["https://x.com/amazonmex?lang=en", "https://x.com/amazon?lang=en", "https://x.com/amazonnews?lang=en"], "Facebook": ["https://www.facebook.com/AmazonPay/", "https://www.facebook.com/Amazon/"], "Instagram": ["https://www.instagram.com/amazonmex/?hl=en", "https://www.instagram.com/amazon/?hl=en", "https://www.instagram.com/amazonhome/?hl=en"], "Tiktok": ["https://www.tiktok.com/@amazonmex", "https://www.tiktok.com/@amazon?lang=en"]}, "manuales": {}, "eliminadas": {}}
Datos guardados correctamente.
INFO:     127.0.0.1:56727 - "POST /buscar/ HTTP/1.1" 200 OK
La carpeta 'Resultados_amazon' ya existe. Usando resultados existentes.
INFO:     127.0.0.1:56778 - "POST /buscar/ HTTP/1.1" 200 OK
[LOGO] Marca original: amazon
[LOGO] Marca norma