In [101]:
import re
import requests
import json

In [36]:
def eliminar_guiones(marca):
    return marca.replace("-", "").replace(" ", "")

In [28]:
def variaciones_separadores(marca):
    separadores = ["_", "-", ".", ""]
    variaciones = []
    for sep in separadores:
        variacion = marca.replace(" ", sep)
        variaciones.append(variacion)
    return variaciones

In [93]:
def variaciones_sin_separadores(marca):
    marca_sin_separadores = marca.replace("-", "").replace(" ", "")
    
    variaciones = [
        marca_sin_separadores.lower(),
        marca_sin_separadores.upper(), 
        marca_sin_separadores.title(), 
        marca_sin_separadores[0].upper() + marca_sin_separadores[1:].lower()
    ]
    
    return list(variaciones)
    
    

In [37]:
def variaciones_mayusculas(marca):
    return [marca.lower(), marca.upper(), marca.title(), marca[0].upper()+marca[1:].lower()]
    

In [73]:
def variaciones_geograficas(marca):
    geos = ["MX", "US"]
    variaciones = []
    for geo in geos:
        variaciones.append(f"{marca}{geo}")
        variaciones.append(f"{marca}_{geo}")
        variaciones.append(f"{marca}-{geo}")
    return variaciones

In [74]:
def variaciones_numericas(marca):
    numeros = [str(i) for i in range(1, 6)] + ["2020", "2021", "2022", "2023", "2024", "2025"]
    variaciones = []
    for num in numeros:
        variaciones.append(f"{marca}{num}")
        variaciones.append(f"{marca}_{num}")
        variaciones.append(f"{marca}-{num}")
    return variaciones

In [96]:
def variaciones_palabras_adicionales(marca):
    palabras = ["official", "fan", "page", "oficial", "america", "mexico"]
    variaciones = []
    for palabra in palabras:
        variaciones.append(f"{marca}{palabra}")
        variaciones.append(f"{marca}_{palabra}")
        variaciones.append(f"{marca}-{palabra}")
        variaciones.append(f"{marca} {palabra}")
    return variaciones

In [30]:
def variaciones_errores_tipograficos(marca):
    reemplazos = {
        "a": ["@", "4"],
        "e": ["3"],
        "i": ["1", "!"],
        "o": ["0"],
        "s": ["5", "$"]
    }
    variaciones = []
    for i, char in enumerate(marca):
        if char.lower() in reemplazos:
            for reemplazo in reemplazos[char.lower()]:
                nueva_variacion = marca[:i] + reemplazo + marca[i+1:]
                variaciones.append(nueva_variacion)
    return variaciones

In [81]:
def generar_todas_variaciones(marca):

    marca_sin_caracteres = eliminar_guiones(marca)
    marcas = [marca, marca_sin_caracteres]
    variaciones = []
    for m in marcas:
        
        variaciones.extend(variaciones_separadores(m))
        variaciones.extend(variaciones_mayusculas(m))
        variaciones.extend(variaciones_geograficas(m))
        variaciones.extend(variaciones_numericas(m))
        variaciones.extend(variaciones_palabras_adicionales(m))
        variaciones.extend(variaciones_errores_tipograficos(m))
        variaciones.extend(variaciones_sin_separadores(m))
    
    variaciones = list(set(variaciones))
    return variaciones

In [88]:
def generar_urls_con_variaciones(variaciones, plataformas):
    patrones_url = {
        "facebook": "https://www.facebook.com/{username}",
        "x": "https://x.com/{username}",
        "instagram": "https://www.instagram.com/{username}",
        "tiktok": "https://www.tiktok.com/{username}"
    }
    
    urls_por_plataforma = {plataforma: [] for plataforma in plataformas}
    
    for plataforma in plataformas:
        if plataforma in patrones_url:
            for variacion in variaciones:
                url = patrones_url[plataforma].format(username=variacion)
                urls_por_plataforma[plataforma].append(url)
    
    return urls_por_plataforma

In [99]:
def buscar_en_google(consulta, num_resultados=10):
    base_url = "https://www.google.com/search"
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"
    }
    params = {"q": consulta, "num": num_resultados}

    try:
        response = requests.get(base_url, headers=headers, params=params)
        response.raise_for_status()
        html = response.text

        enlaces = re.findall(r'/url\?q=(https?://[^&]*)', html)
        enlaces_limpios = [re.sub(r'%.*$', '', enlace) for enlace in enlaces]

        return enlaces_limpios[:num_resultados]
    except Exception as e:
        print(f"Error al realizar la búsqueda en Google: {e}")
        return []

In [109]:
def resultados_json():
    variaciones = generar_todas_variaciones(nombre_marca)
    archivo_resultados = "resultados_google.json"
    try:
        with open(archivo_resultados, "r") as archivo:
            resultados_totales = json.load(archivo)
            print("Archivo de resultados cargado correctamente.")
    except FileNotFoundError:
        print("Archivo de resultados no encontrado. Se generarán nuevos resultados.")
        resultados_totales = {}

    for variacion in variaciones:
        if variacion not in resultados_totales:
            print(f"Realizando búsqueda para: {variacion}")
            resultados = buscar_en_google(variacion, num_resultados=5)
            resultados_totales[variacion] = resultados

    with open(archivo_resultados, "w") as archivo:
        json.dump(resultados_totales, archivo, indent=4)

    print("Resultados de búsqueda guardados en 'resultados_google.json'")

In [98]:
if __name__== "__main__":
    nombre_marca = "coca-cola"
    plataformas = ["facebook", "x", "instagram"]
    
    variaciones = generar_todas_variaciones(nombre_marca)
    
    print(f"Variaciones generadas para '{nombre_marca}':")
    for i, variacion in enumerate(variaciones, 1):
        print(f"{i}. {variacion}")
    
    print(f"\nPlataformas a analizar: {', '.join(plataformas)}")

    urls_generadas = generar_urls_con_variaciones(variaciones, plataformas)
    
    for plataforma, urls in urls_generadas.items():
        print(f"\nURLs generadas para {plataforma}:")
        for i, url in enumerate(urls, 1):
            print(f"{i}. {url}")

    resultados_json()
            

Variaciones generadas para 'coca-cola':
1. coca-cola_2025
2. coca-cola-2021
3. cocacola-MX
4. coca-cola_2023
5. coca-cola page
6. Coca-cola
7. cocacola2024
8. coca-cola2024
9. cocacola_fan
10. coca-cola-page
11. cocacola-official
12. cocacola mexico
13. coca-cola-4
14. coca-cola_1
15. coca-colaamerica
16. coca-cola_america
17. cocacola-2024
18. cocacola official
19. cocacola
20. cocacola_MX
21. coca-colafan
22. coca-cola2020
23. coca-cola1
24. coc4-cola
25. cocacola-2020
26. cocacolaamerica
27. cocacola-mexico
28. cocacola-1
29. cocacolaUS
30. coca-cola-oficial
31. cocacola-2025
32. coca-cola fan
33. cocacol@
34. coca-cola-US
35. coca-cola2025
36. cocacola-2022
37. coca-c0la
38. coca-cola-2020
39. coca-cola-mexico
40. coca-cola_MX
41. cocacola_US
42. coca-cola_4
43. cocacola_2
44. coca-cola oficial
45. coca-cola_2020
46. coca-cola
47. cocacola-2021
48. cocacola2022
49. coca-cola-official
50. coca-colaMX
51. coca-colamexico
52. cocacola-2
53. coca-cola_2021
54. coc@cola
55. cocacola5
56