In [1]:
import os
import httpx
import pandas as pd
import json
from datetime import datetime

In [2]:
def google_search(api_key, search_engine_id, query, **params):
    base_url = 'https://www.googleapis.com/customsearch/v1'
    params = {
        'key': api_key,
        'cx': search_engine_id,
        'q': query,
        'gl' : country,
        **params
    }
    response =  httpx.get(base_url, params = params)
    response.raise_for_status()
    return response.json()

In [3]:
def guardar_json(nombre_archivo, resultados, carpeta):
    ruta = os.path.join(carpeta, f"{nombre_archivo}.json")
    datos = {
        "fecha_busqueda": datetime.now().strftime("%Y-%m-%d %H:%M:%S"),
        "resultados": resultados
    }
    with open(ruta, 'w', encoding='utf-8') as f:
        json.dump(datos, f, indent=4, ensure_ascii=False)

In [4]:
def cargar_cuentas_verificadas(ruta_cuentas):
    estructura_inicial = {"automaticas": {}, "manuales": {}}  # Estructura por defecto
    
    if os.path.exists(ruta_cuentas):
        try:
            with open(ruta_cuentas, 'r', encoding='utf-8') as f:
                datos = json.load(f)
                
                # Verifica que los datos tengan la estructura correcta
                if isinstance(datos, dict) and "automaticas" in datos and "manuales" in datos:
                    return datos
                else:
                    if isinstance(datos, dict):
                        datos_corregidos = {"automaticas": {}, "manuales": {}}
                        for red, cuentas in datos.items():
                            if isinstance(cuentas, list):
                                datos_corregidos["automaticas"][red] = cuentas
                            elif isinstance(cuentas, dict):
                                datos_corregidos.update(cuentas)
                        return datos_corregidos
                    else:
                        print("No se pudo corregir la estructura. Se usará la estructura inicial.")
                        return estructura_inicial
        except json.JSONDecodeError:
            print("El archivo está corrupto o vacío. Se usará la estructura inicial.")
            return estructura_inicial
    else:
        print("El archivo no existe. Se usará la estructura inicial.")
        return estructura_inicial

In [5]:
def hacer_busquedas():
    resultados_meta = []
    for red, queries in busquedas.items():
        resultados_red = []
        for query in queries:
            response = google_search(
                api_key=api_key,
                search_engine_id=search_engine_id,
                query=query,
                country=country,
                num=5
            )
            resultados_red.extend(response.get('items', [])[:5])
        if red in ["Facebook", "Instagram"]:
            resultados_meta.extend(resultados_red)
        else:
            guardar_json(f"Resultados_{marca}_{red}", resultados_red, carpeta_resultados)

    if resultados_meta:
        guardar_json(f"Resultados_{marca}_Meta", resultados_meta, carpeta_resultados)

    # Crear el archivo cuentas_verificadas.json con los enlaces encontrados
    cuentas_verificadas = {"automaticas": {}, "manuales": {}}
    for red in busquedas.keys():
        enlaces_filtrados = imprimir_enlaces(carpeta_resultados, marca, red, dominios_por_red[red])
        cuentas_verificadas["automaticas"][red] = enlaces_filtrados

    guardar_json("cuentas_verificadas", cuentas_verificadas, carpeta_resultados)
    print(f"Búsqueda de {marca} completada y archivos JSON guardados.")

In [6]:
def filtrar_enlaces(resultados, dominio):
    enlaces_filtrados = []
    for resultado in resultados:
        link = resultado.get("link", "")
        if link.startswith(f"https://{dominio}") or link.startswith(f"http://{dominio}"):
            if "/photo.php?" not in link and "/posts/" not in link:
                enlaces_filtrados.append(link)
    return enlaces_filtrados

In [7]:
def imprimir_enlaces(carpeta_resultados, marca, red, dominio):
    nombre_archivo = f"Resultados_{marca}_Meta.json" if red in ["Facebook", "Instagram"] else f"Resultados_{marca}_{red}.json"
    ruta_json = os.path.join(carpeta_resultados, nombre_archivo)

    if not os.path.exists(ruta_json):
        print(f"El archivo '{nombre_archivo}' no existe.")
        return []
    
    with open(ruta_json, 'r', encoding='utf-8') as f:
        resultados = json.load(f)
    
    enlaces_filtrados = filtrar_enlaces(resultados.get("resultados", []), dominio)
    
    if enlaces_filtrados:
        print(f"Enlaces filtrados para {red}:")
        for enlace in enlaces_filtrados:
            print(enlace)
        return enlaces_filtrados
    else:
        print(f"No se encontraron enlaces válidos para {red}.")
        return []

In [8]:
def verificar_cuentas(carpeta_resultados):
    ruta_cuentas = os.path.join(carpeta_resultados, "cuentas_verificadas.json")
    cuentas_verificadas = cargar_cuentas_verificadas(ruta_cuentas)

    # Agregar un campo para cuentas eliminadas
    if "eliminadas" not in cuentas_verificadas:
        cuentas_verificadas["eliminadas"] = {}

    print("\nCuentas verificadas:")
    for tipo, cuentas in cuentas_verificadas.items():
        if tipo != "eliminadas":
            print(f"{tipo.capitalize()}:")
            for red, cuentas_red in cuentas.items():
                print(f"{red}: {', '.join(cuentas_red)}")

    modificar_previas = input("¿Quieres modificar las cuentas verificadas? (sí/no): ").strip().lower()
    if modificar_previas not in ["si", "sí", "s"]:
        print("Se mantienen las cuentas previas.")
        return

    cambios_realizados = False

    for red, cuentas_actuales in cuentas_verificadas["automaticas"].items():
        print(f"\nProcesando cuentas de {red}...")
        
        # Asegurar que haya una lista para cuentas eliminadas
        if red not in cuentas_verificadas["eliminadas"]:
            cuentas_verificadas["eliminadas"][red] = []

        while True:
            print("Cuentas actuales:")
            for i, cuenta in enumerate(cuentas_actuales, 1):
                print(f"{i}. {cuenta}")

            eliminar = input("¿Quieres eliminar alguna cuenta? (sí/no): ").strip().lower()
            if eliminar in ["si", "sí", "s"]:
                eliminar_indices = input("Ingresa los números de las cuentas a eliminar (separados por comas): ").strip()
                if eliminar_indices:
                    indices = {int(num.strip()) - 1 for num in eliminar_indices.split(",") if num.strip().isdigit()}
                    eliminadas = [cuentas_actuales[i] for i in indices if i < len(cuentas_actuales)]
                    
                    # Guardar las cuentas eliminadas
                    cuentas_verificadas["eliminadas"][red].extend(eliminadas)
                    
                    # Actualizar la lista eliminando las seleccionadas
                    cuentas_actuales = [cuenta for i, cuenta in enumerate(cuentas_actuales) if i not in indices]
                    print("Cuentas actualizadas:", cuentas_actuales)
                    cambios_realizados = True

            agregar_manual = input("¿Quieres agregar una cuenta manualmente? (sí/no): ").strip().lower()
            if agregar_manual in ["si", "sí", "s"]:
                nueva_cuenta = input(f"Ingrese la cuenta oficial de {red}: ").strip()
                if red == "Tiktok" and not nueva_cuenta.startswith("https://"):
                    nueva_cuenta = f"https://www.tiktok.com/@{nueva_cuenta}"
                if red == "Facebook" and not nueva_cuenta.startswith("https://"):
                    nueva_cuenta = f"https://www.facebook.com/{nueva_cuenta}"
                if red == "Instagram" and not nueva_cuenta.startswith("https://"):
                    nueva_cuenta = f"https://www.instagram.com/{nueva_cuenta}"
                if red == "X" and not nueva_cuenta.startswith("https://"):
                    nueva_cuenta = f"https://x.com/{nueva_cuenta}"
                
                if red not in cuentas_verificadas["manuales"]:
                    cuentas_verificadas["manuales"][red] = []
                cuentas_verificadas["manuales"][red].append(nueva_cuenta)
                print("Cuentas manuales actualizadas:", cuentas_verificadas["manuales"][red])
                cambios_realizados = True

            confirmar = input("¿Quieres hacer más cambios? (sí/no): ").strip().lower()
            if confirmar in ["no", "n"]:
                cuentas_verificadas["automaticas"][red] = cuentas_actuales
                break

    # Guardar cambios solo si se modificó algo
    if cambios_realizados:
        guardar_json("cuentas_verificadas", cuentas_verificadas, carpeta_resultados)
        print("Cuentas verificadas guardadas correctamente.")
    else:
        print("No se realizaron cambios. El archivo no se ha modificado.")

In [None]:
###### Credenciales
api_key = 'AIzaSyDuIQSmkWuEDc32twaUDJ-2OJFThw4R9V8'
search_engine_id = 'd425b95fffdc64915'
marca = 'coca-cola'
country = 'MX|US'

#Redes
busquedas = {
    "X": [f"{marca} X Twitter MX Mexico cuenta", f"{marca} X Twitter US account"],
    "Facebook": [f"{marca} Facebook MX Mexico cuenta", f"{marca} Facebook US account"],
    "Instagram": [f"{marca} Instagram MX Mexico cuenta", f"{marca} Instagram US account"],
    "Tiktok": [f"{marca} Tiktok MX Mexico cuenta", f"{marca} Tiktok US account"]
}

dominios_por_red = {"X": "x.com",
            "Instagram": "www.instagram.com",
            "Tiktok": "www.tiktok.com",
            "Facebook": "www.facebook.com"
           }

#verificar si existe la carpeta
carpeta_resultados = f"Resultados_{marca}"
resultados_meta = []
if os.path.exists(carpeta_resultados):
    print(f"Carpeta '{carpeta_resultados}' encontrada")
    verificar_cuentas(carpeta_resultados)
else:
    os.makedirs(carpeta_resultados, exist_ok=True)
    print("Realizando busqueda...")
    hacer_busquedas()

    enlaces_por_red = {}
    for red in busquedas.keys():
        enlaces_por_red[red] = imprimir_enlaces(carpeta_resultados, marca, red, dominios_por_red[red])
    verificar_cuentas(carpeta_resultados)



Realizando busqueda...
Enlaces filtrados para X:
https://x.com/cocacolamx?lang=en
https://x.com/cocacola?lang=en
https://x.com/cocacolaco?lang=en
Enlaces filtrados para Facebook:
https://www.facebook.com/CocaColaMx/?locale=es_LA
https://www.facebook.com/CocaColaMx/
https://www.facebook.com/cocacolafemsamexico/?locale=es_LA
https://www.facebook.com/TheCocaColaCo/
https://www.facebook.com/CocaColaUnitedStates/
https://www.facebook.com/Coca-Cola/
Enlaces filtrados para Instagram:
https://www.instagram.com/cocacolamx/
https://www.instagram.com/mcdonaldsmx/
https://www.instagram.com/cocacola_flow/
https://www.instagram.com/cocacola/
https://www.instagram.com/thecocacolaco/?hl=en
https://www.instagram.com/cocacolaunited/?hl=en
Enlaces filtrados para Tiktok:
https://www.tiktok.com/@cocacola?lang=en
Búsqueda de coca-cola completada y archivos JSON guardados.
Enlaces filtrados para X:
https://x.com/cocacolamx?lang=en
https://x.com/cocacola?lang=en
https://x.com/cocacolaco?lang=en
Enlaces filtra

¿Quieres modificar las cuentas verificadas? (sí/no):  s



Procesando cuentas de X...
Cuentas actuales:
1. https://x.com/cocacolamx?lang=en
2. https://x.com/cocacola?lang=en
3. https://x.com/cocacolaco?lang=en


¿Quieres eliminar alguna cuenta? (sí/no):  n
¿Quieres agregar una cuenta manualmente? (sí/no):  n
¿Quieres hacer más cambios? (sí/no):  n



Procesando cuentas de Facebook...
Cuentas actuales:
1. https://www.facebook.com/CocaColaMx/?locale=es_LA
2. https://www.facebook.com/CocaColaMx/
3. https://www.facebook.com/cocacolafemsamexico/?locale=es_LA
4. https://www.facebook.com/TheCocaColaCo/
5. https://www.facebook.com/CocaColaUnitedStates/
6. https://www.facebook.com/Coca-Cola/


¿Quieres eliminar alguna cuenta? (sí/no):  n
¿Quieres agregar una cuenta manualmente? (sí/no):  n
¿Quieres hacer más cambios? (sí/no):  n



Procesando cuentas de Instagram...
Cuentas actuales:
1. https://www.instagram.com/cocacolamx/
2. https://www.instagram.com/mcdonaldsmx/
3. https://www.instagram.com/cocacola_flow/
4. https://www.instagram.com/cocacola/
5. https://www.instagram.com/thecocacolaco/?hl=en
6. https://www.instagram.com/cocacolaunited/?hl=en


¿Quieres eliminar alguna cuenta? (sí/no):  s
Ingresa los números de las cuentas a eliminar (separados por comas):  6


Cuentas actualizadas: ['https://www.instagram.com/cocacolamx/', 'https://www.instagram.com/mcdonaldsmx/', 'https://www.instagram.com/cocacola_flow/', 'https://www.instagram.com/cocacola/', 'https://www.instagram.com/thecocacolaco/?hl=en']


¿Quieres agregar una cuenta manualmente? (sí/no):  n
¿Quieres hacer más cambios? (sí/no):  n



Procesando cuentas de Tiktok...
Cuentas actuales:
1. https://www.tiktok.com/@cocacola?lang=en


¿Quieres eliminar alguna cuenta? (sí/no):  n
¿Quieres agregar una cuenta manualmente? (sí/no):  s
