In [2]:
%%capture --no-stderr
%pip install -U langchain_openai langgraph langchain_core langchain_community pytrends requests beautifulsoup4 selenium webdriver_manager chromedriver-autoinstaller

In [None]:
import os, getpass


def _set_env(var: str):
    # Check if the variable is set in the OS environment
    env_value = os.environ.get(var)
    if not env_value:
        # If not set, prompt the user for input
        env_value = getpass.getpass(f"{var}: ")

    # Set the environment variable for the current process
    os.environ[var] = env_value


_set_env("OPENAI_API_KEY")

_set_env("SERP_API_KEY")

SERP_API_KEY = os.getenv("SERP_API_KEY")

In [4]:
context = """
            üöÄ Contexto
            Hoje, o WhatsApp √© um dos principais canais de vendas para pequenas e m√©dias empresas (PMEs). No entanto, muitas delas enfrentam dificuldades em gerenciar mensagens, responder clientes a tempo e transformar conversas em vendas. O atendimento manual consome tempo e, muitas vezes, resulta em oportunidades perdidas.

                ‚ùå O Problema das PMEs
                üìâ Perda de vendas por demora nas respostas ou atendimentos fora do hor√°rio.
                ‚è≥ Falta de tempo para responder manualmente a cada cliente.
                üí¨ Dificuldade em manter leads engajados e conduzi-los at√© a compra.
                üîó Falta de integra√ß√£o com ferramentas que otimizam o processo de vendas.

            ‚úÖ Nossa Solu√ß√£o: O Vendedor IA
            Criamos um Vendedor IA para WhatsApp, que automatiza o atendimento, responde clientes 24/7 e impulsiona as vendas sem necessidade de interven√ß√£o manual. Ele aprende sobre a marca, os produtos e os valores da empresa para oferecer um atendimento mais personalizado e eficiente.

                üéØ Principais Benef√≠cios
                ü§ñ Atendimento Autom√°tico 24/7 ‚Äì Nunca mais perca vendas por falta de resposta.
                ‚ö° Respostas r√°pidas e inteligentes ‚Äì Mant√©m clientes engajados no momento certo.
                üõ† F√°cil de configurar ‚Äì Sem necessidade de programa√ß√£o, pronto em minutos.
                üìä Dashboard com m√©tricas ‚Äì Acompanhe intera√ß√µes, leads e convers√µes.
                üîó Integra√ß√£o com CRM ‚Äì Gerencie leads e otimize o processo de vendas.
                üì≤ Totalmente conectado ao WhatsApp Business ‚Äì Funcionamento fluido no principal canal de vendas das PMEs.

            ü§ñ Mais que um Chatbot: Seu Vendedor IA
                Muita gente j√° ouviu falar em chatbots, mas nosso Vendedor IA vai al√©m!

                Os chatbots tradicionais apenas respondem perguntas de forma autom√°tica. J√° o Vendedor IA foi criado para entender sua marca, aprender sobre seus produtos e vender de verdade no WhatsApp.

                O que isso significa na pr√°tica?
                üöÄ Ele n√£o s√≥ responde ‚Äì ele engaja e converte.
                üß† Aprende sobre sua empresa para representar seu neg√≥cio de forma personalizada.
                üìä Fornece m√©tricas e insights, ajudando voc√™ a vender mais.
                üîó Integra-se com WhatsApp Business e CRM para um fluxo de vendas completo.

                üí° Enquanto um chatbot apenas atende, nosso Vendedor IA trabalha ativamente para aumentar suas vendas!
        """

In [None]:
from typing import List, TypedDict
from pydantic import BaseModel, Field


class GeneratedWords(BaseModel):
    words: List[str] = Field(
        ..., description="List of the words beloging to a specific context"
    )


class GeneratedAutoCompleteSentences(BaseModel):
    sentences: List[str] = Field(
        ...,
        description="List of the autocomplete sentences beloging to a specific context",
    )


class QuestionsWithAutoComplete(BaseModel):
    question: str
    autocomplete_questions: list[str]


class QuestionsWithPAA(BaseModel):
    question: str
    related_questions: list[str]


class WordPopularity(TypedDict):
    word: str
    popularity: float


def generate_most_insteresting_context_words(context: str) -> list[str]:
    pass


def get_google_trends_word_popularity(words: list[str]) -> list[WordPopularity]:
    pass


def generate_autocomplete_questions(
    words_w_popularity: list[WordPopularity],
) -> list[QuestionsWithAutoComplete]:
    pass


def get_related_questions(questions: list[str]) -> list[QuestionsWithPAA]:
    pass

In [None]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI


def generate_most_insteresting_context_words(
    context: str, number_of_words: int = 10
) -> list[str]:

    llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.0, max_tokens=12000).with_retry(
        stop_after_attempt=10
    )

    # Using with_structured_output feature to parse the output
    # to the pydantic models previous defined
    # with_retry -> https://python.langchain.com/api_reference/core/runnables/langchain_core.runnables.base.Runnable.html#langchain_core.runnables.base.Runnable.with_retry
    llm_w_structured_output = (
        ChatOpenAI(model="gpt-4o-mini", temperature=0.0)
        .with_structured_output(GeneratedWords)
        .with_retry(stop_after_attempt=10)
    )

    prompt = ChatPromptTemplate(
        [
            (
                "system",
                """Atue como um especialista em SEO e an√°lise de tend√™ncias de busca. Gere uma lista de **{number_of_words} palavras-chave (palavras √∫nicas)** relacionadas ao seguinte contexto:

                    ------------------------------------------------------------------
                    {context}
                    ------------------------------------------------------------------

                    üîπ **Requisitos:**  
                    1. As palavras devem ser altamente relevantes para pesquisas no Google.  
                    2. Inclua tanto **termos amplos** quanto **termos de cauda longa** para melhor identifica√ß√£o de tend√™ncias.  
                    3. Priorize palavras com potencial para aparecer em **Featured Snippets** e influenciar a se√ß√£o **People Also Ask (PAA)**.  
                    4. N√£o inclua perguntas, apenas **termos principais** que possam ser usados para otimiza√ß√£o de conte√∫do.  
    
                """,
            ),
        ]
    )

    chain = prompt | llm_w_structured_output

    return chain.invoke(input={"context": context, "number_of_words": number_of_words})


relevant_words = generate_most_insteresting_context_words(context=context)

In [None]:
import os
import json
from datetime import datetime
from typing import Generator
import requests


BKP_GOOGLE_TRENDS_REQUESTS_PATH: str = "./google_data/trends"
WORDS_POPULARITY_PATH: str = "./google_data/data/relevant_words.json"
WORDS_POPULARITY: dict[str, int]

with open(WORDS_POPULARITY_PATH, "r") as file:
    WORDS_POPULARITY = json.load(file)


def save_json(data: dict, folder_path: str, filename: str) -> str:
    """
    Salva um dicion√°rio como um arquivo JSON em uma pasta espec√≠fica.

    Args:
        data (dict): Dados a serem salvos em JSON.
        folder_path (str): Caminho da pasta onde o JSON ser√° salvo.
        filename (str): Nome do arquivo JSON (ex: "dados.json").

    Returns:
        str: Caminho completo do arquivo salvo.
    """
    # Garante que a pasta exista
    os.makedirs(folder_path, exist_ok=True)

    # Caminho completo do arquivo
    file_path = os.path.join(folder_path, filename)

    # Escreve os dados no arquivo JSON
    with open(file_path, "w", encoding="utf-8") as f:
        json.dump(data, f, indent=4, ensure_ascii=False)

    return file_path


def save_json_with_timestamp(data: dict, folder_path: str, suffix: str) -> str:
    """
    Salva um dicion√°rio como JSON, nomeando o arquivo com base na entrada e timestamp.

    Args:
        data (dict): Dados a serem salvos em JSON.
        folder_path (str): Caminho da pasta onde o JSON ser√° salvo.
        prefix (str): Prefixo para o nome do arquivo (ex: "usuario").

    Returns:
        str: Caminho completo do arquivo salvo.
    """
    # Garante que a pasta exista
    os.makedirs(folder_path, exist_ok=True)

    # Obt√©m a data/hora atual formatada como YYYYMMDD_HHMMSS
    timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")

    filename = f"{timestamp}_{suffix}.json"

    return save_json(data=data, folder_path=folder_path, filename=filename)


def google_trends_query(q: str) -> requests.Response:
    url: str = "https://serpapi.com/search?"
    params: dict = {
        "engine": "google_trends",
        "q": q,
        "data_type": "TIMESERIES",
        "hl": "pt-BR",
        "geo": "BR-SP",
        "date": "today 3-m",
        "api_key": SERP_API_KEY,
    }
    return requests.get(url=url, params=params)


def get_google_trends_word_popularity(
    words: list[str], step: int = 5
) -> dict[str, int]:

    indices: Generator[int, None, None] = range(0, len(words), step)

    list_words_popularity: list = []
    for k in indices:
        selected_words = words[k : k + step]
        if len(selected_words) == 1:
            selected_words = selected_words * 2
        words_to_query = ",".join(selected_words)

        # with open("./google_trends_data/requests/20250311_211805_WhatsApp,atendimento,automa√ß√£o,vendas,chatbot.json", "r") as file:
        #     response = json.load(file)
        #     data = response
        # print(data)

        response = google_trends_query(q=words_to_query)
        data = response.json()
        save_json_with_timestamp(
            data=data,
            folder_path=BKP_GOOGLE_TRENDS_REQUESTS_PATH,
            suffix=words_to_query,
        )
        print(words_to_query)

        list_words_popularity.append(
            {
                query["query"]: query["value"]
                for query in data["interest_over_time"]["averages"]
            }
        )

    # add the words popularity to the dict
    [
        WORDS_POPULARITY.setdefault(key, value)
        for words_popularity in list_words_popularity
        for key, value in words_popularity.items()
    ]


get_google_trends_word_popularity(["caf√©"], 2)

caf√©,caf√©


In [None]:
print(WORDS_POPULARITY)

with open(WORDS_POPULARITY_PATH, "w", encoding="utf-8") as f:
    json.dump(WORDS_POPULARITY, f, indent=4, ensure_ascii=False)

{'word': 'popularity', 'caf√©': 31, 'arroz': 31}

In [202]:
selected_words = {
    key: value
    for key, value in WORDS_POPULARITY.items()
    if key
    in [
        "WhatsApp",
        "atendimento",
        "automa√ß√£o",
        "vendas",
        "chatbot",
        "leads",
        "PMEs",
    ]
}


selected_words

{'WhatsApp': 71.22388059701493,
 'atendimento': 72.94029850746269,
 'automa√ß√£o': 61.92537313432836,
 'vendas': 78.6268656716418,
 'chatbot': 51.1044776119403,
 'leads': 55.71641791044776,
 'PMEs': 11.373134328358208}

In [211]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
import requests
import urllib.parse



def get_google_autocomplete_suggestions(query: str) -> list[str]:
    encoded_query = urllib.parse.quote(query)
    url = f"https://suggestqueries.google.com/complete/search?client=chrome&hl=pt-BR&gl=br&q={encoded_query}"
    # url = f"https://suggestqueries.google.com/complete/search?client=chromeq={encoded_query}"
    response = requests.get(url)

    if response.status_code == 200:
        return response.json()[
            1
        ]  # As sugest√µes est√£o na segunda posi√ß√£o da lista retornada
    return []
# def


def generate_autocomplete_questions(
    words_w_popularity: dict[str, int],
    context: str = context,
    number_of_sentences: int = 25,
):

    llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.0, max_tokens=12000).with_retry(
        stop_after_attempt=10
    )

    # Using with_structured_output feature to parse the output
    # to the pydantic models previous defined
    # with_retry -> https://python.langchain.com/api_reference/core/runnables/langchain_core.runnables.base.Runnable.html#langchain_core.runnables.base.Runnable.with_retry
    llm_w_structured_output = (
        ChatOpenAI(model="gpt-4o-mini", temperature=0.0)
        .with_structured_output(GeneratedAutoCompleteSentences)
        .with_retry(stop_after_attempt=10)
    )
    prompt = ChatPromptTemplate([
        (
            "system",
            """
            Voc√™ √© um especialista em SEO e padr√µes de pesquisa do Google. 
            Sua tarefa √© gerar {number_of_sentences} fragmentos de pesquisa que iniciem frases comuns no Google, 
            sem complet√°-las totalmente, permitindo que o autocomplete preencha o restante.

            ‚ö†Ô∏è **Regras Importantes:**  
            - **Use apenas as palavras-chave listadas.** O contexto serve apenas para refer√™ncia, **N√ÉO use palavras do contexto na sa√≠da.**  
            - **Priorize palavras-chave mais relevantes** (com maior peso na lista).  
            - **Produza frases INCOMPLETAS**, seguindo padr√µes comuns de pesquisa.  
            - **Evite frases gen√©ricas ou sem clareza dentro do contexto.** Se uma frase gerada n√£o fizer sentido como uma busca realista dentro do tema, descarte-a.  
            - **Se fizer sentido, combine duas palavras-chave para tornar a frase mais √∫til e natural.**  

            üìå **Contexto (Apenas para Refer√™ncia, N√ÉO Usar Palavras na Sa√≠da):** {context}  

            üìå **Lista de Palavras-Chave e Relev√¢ncia:**  
            (As palavras mais relevantes devem aparecer mais vezes.)  
            {relevant_words}  

            üìå **Padr√µes de Pesquisa a Seguir:**  
            - "Como [palavra-chave]..."  
            - "O que √© [palavra-chave]..."  
            - "Vale a pena [palavra-chave]..."  
            - "Melhores [palavra-chave]..."  
            - "Dicas para [palavra-chave]..."  
            - "Exemplos de [palavra-chave]..."  

            ‚ö° **Sa√≠da Esperada:**  
            - **As frases devem ser curtas e usar SOMENTE palavras da lista de palavras-chave.**  
            - **Frases gen√©ricas ou que n√£o fazem sentido dentro do contexto devem ser evitadas.**  
            - **Se necess√°rio, combine duas palavras-chave para gerar buscas mais naturais e √∫teis.**  

            -------------------------------  
            **Exemplo de Entrada:**  

            **Contexto:** Vendas autom√°ticas pelo WhatsApp para pequenas empresas  
            **Palavras-chave:**  
            - Automa√ß√£o de vendas: 100  
            - WhatsApp Business: 80  
            - CRM para PME: 60  
            - Chatbot: 50  
            - Gera√ß√£o de leads: 40  

            -------------------------------  
            **Sa√≠da Esperada:**  

            - "Como usar automa√ß√£o de vendas..."  
            - "O que √© WhatsApp Business..."  
            - "Vale a pena CRM para PME..."  
            - "Melhores chatbots para WhatsApp..."  
            - "Dicas para gera√ß√£o de leads..."  
            - "Exemplos de automa√ß√£o no WhatsApp..."  

            üö® **IMPORTANTE:**  
            - **As frases devem fazer sentido dentro do contexto!**  
            - **O Google completar√° a pesquisa via autocomplete.**  
            """,
        ),
    ])
  # - **N√£o adicione palavras extras.**  
            # - **As frases devem ser curtas e incompletas.**  


                
    
    chain = prompt | llm_w_structured_output

    generated_sentences = chain.invoke(
        input={
            "context": context,
            "relevant_words": selected_words,
            "number_of_sentences": number_of_sentences,
        }
    )

    # return generated_sentences
        
    return [
        QuestionsWithAutoComplete(
            question=sentence.replace('...', ''),
            autocomplete_questions=[sentence.replace('...', '')] + get_google_autocomplete_suggestions(sentence.replace('...', '')) 
        ) for sentence in generated_sentences.sentences
    ]



# relevant_words = generate_most_insteresting_context_words(context=context)




In [212]:
autocomplete_questions = generate_autocomplete_questions(
    words_w_popularity=selected_words, context=context, number_of_sentences=5
)
autocomplete_questions


# query = "Como automatizar o atendimento no WhatsApp"
# suggestions = get_google_autocomplete_suggestions(query)
# print(suggestions)

[QuestionsWithAutoComplete(question='Como melhorar o atendimento no WhatsApp', autocomplete_questions=['Como melhorar o atendimento no WhatsApp', 'como melhorar o atendimento pelo whatsapp', 'como melhorar o atendimento ao cliente via whatsapp']),
 QuestionsWithAutoComplete(question='O que √© automa√ß√£o de vendas', autocomplete_questions=['O que √© automa√ß√£o de vendas', 'o que √© automa√ß√£o da for√ßa de vendas', 'o que √© automa√ß√£o de marketing', 'o que √© automa√ß√£o comercial', 'o que √© automa√ß√£o de sistemas', 'o que √© automacao comercial', 'o que √© automatiza√ß√£o do atendimento']),
 QuestionsWithAutoComplete(question='Vale a pena usar chatbot para PMEs', autocomplete_questions=['Vale a pena usar chatbot para PMEs', 'vale a pena pagar o chat gpt', 'vale a pena assinar chat pt', 'vale a pena pagar chatgpt 4', 'vale a pena assinar o chatgpt']),
 QuestionsWithAutoComplete(question='Melhores pr√°ticas para engajar leads', autocomplete_questions=['Melhores pr√°ticas para engaj

In [216]:
r = get_google_related_questios('Como melhorar o atendimento no WhatsApp')

In [218]:
r.json()['related_questions']

[{'question': 'Como melhorar o atendimento ao cliente pelo WhatsApp?',
  'snippet': 'Fa√ßa pesquisas de satisfa√ß√£o Logo, use os recursos da pr√≥pria ferramenta para saber se o cliente est√° satisfeito com o atendimento via WhatsApp. Uma boa ideia √© aplicar o NPS ao final de cada conversa. Em poucas mensagens, o cliente pode informar se ficou satisfeito com o atendimento e o que precisa melhorar.',
  'title': 'Atendimento via WhatsApp: 10 dicas pr√°ticas | Blip Blog',
  'date': '3 de fev. de 2025',
  'link': 'https://www.blip.ai/blog/whatsapp/atendimento-via-whatsapp/#:~:text=Fa%C3%A7a%20pesquisas%20de%20satisfa%C3%A7%C3%A3o&text=Logo%2C%20use%20os%20recursos%20da,com%20o%20atendimento%20via%20WhatsApp.&text=Uma%20boa%20ideia%20%C3%A9%20aplicar,e%20o%20que%20precisa%20melhorar.',
  'displayed_link': 'https://www.blip.ai ‚Ä∫ P√°gina Inicial ‚Ä∫ WhatsApp',
  'source_logo': 'https://serpapi.com/searches/67d0da99929e2a264199b1ae/images/92a42761cd6d0b628f8b44f2f5f4a3ee395869d67d3a34b5182c

In [None]:
BKP_GOOGLE_SEARCH_REQUESTS_PATH = './google_data/search/requests.json'

def save_json_response(file_path: str, q:str, response: requests.Response):
    data: dict[str, requests.Response]
    with open(file_path, "r", encoding="utf-8") as f:
        data = json.load(file_path)

    data.setdefault(q, response)
    with open(file_path, "w", encoding="utf-8") as f:
        json.dump(data, f, indent=4, ensure_ascii=False)
        



def get_google_related_questios(q: str, file_path: str = BKP_GOOGLE_SEARCH_REQUESTS_PATH) -> requests.Response:
    url: str = "https://serpapi.com/search?"
    params: dict = {
        "q": q,
        "hl": "pt-BR",
        "geo": "BR-SP",
        "date": "today 3-m",
        "api_key": SERP_API_KEY,
    }

    if file_path is not None:
        data: dict[str, requests.Response]
        with open(file_path, "r", encoding="utf-8") as f:
            data = json.load(file_path)
        if q in data.keys():
            return data[q]
    else:
        response = requests.get(url=url, params=params)
        save_json_response(BKP_GOOGLE_SEARCH_REQUESTS_PATH, q, response)
        return response



def get_peolple_also_ask_questions(questions: str) -> list[QuestionsWithPAA]:
    pass



In [None]:
get_google_autocomplete_suggestions()

{'WhatsApp': 71.22388059701493,
 'atendimento': 72.94029850746269,
 'automa√ß√£o': 61.92537313432836,
 'vendas': 78.6268656716418,
 'chatbot': 51.1044776119403,
 'integra√ß√£o': 35.776119402985074,
 'leads': 55.71641791044776,
 'personaliza√ß√£o': 29.52238805970149,
 'CRM': 76.32835820895522,
 'PMEs': 11.373134328358208}

In [195]:
get_google_autocomplete_suggestions('Melhores pr√°ticas de engajamento no whatsapp')

['melhores pr√°ticas de pesquisas do nps']

In [174]:
import urllib.parse

query = 'Vale a pena investir em automa√ß√£o de vendas'
encoded_query = urllib.parse.quote(query)


url = f"https://suggestqueries.google.com/complete/search?client=chrome&hl=pt-br&gl=br&q={encoded_query}"
response = requests.get(url)

# if response.status_code == 200:
#     return response.json()[
#         1
#     ]  # As sugest√µes est√£o na segunda posi√ß√£o da lista retornada
# return []

In [175]:
response.json()

['Vale a pena investir em automa√ß√£o de vendas',
 [],
 [],
 [],
 {'google:clientdata': {'bpc': False, 'tlw': False},
  'google:suggesttype': [],
  'google:verbatimrelevance': 1300}]

In [176]:
print(url)

https://suggestqueries.google.com/complete/search?client=chrome&hl=pt-br&gl=br&q=Vale%20a%20pena%20investir%20em%20automa%C3%A7%C3%A3o%20de%20vendas
