# Gen AI Podcast

Cria um podcast com auxilio de agentes baseados em intelig√™ncia artificial (GenAI).

In [3]:
import pandas as pd
import numpy as np
from typing import Dict, Any
from langchain_community.chat_models import ChatOllama
from alpha_vantage.timeseries import TimeSeries
import requests
from dotenv import load_dotenv 
import json
from huggingface_hub import InferenceClient
from PIL import Image
import os
import time

## Parametros e Chaves

In [4]:
HUGGINGFACE_TOKEN = os.environ["HF_TEXT_TO_IMAGE"]
MODEL_NAME = "black-forest-labs/FLUX.1-dev"  # Modelo moderno e ativo

## Modelos

### Warpper para os modelos LLMs

In [94]:
class GenImage:
    def __init__(self, model, token):
        self.client = InferenceClient(model=model, token=token)

    def setClient(self, client: InferenceClient):
        self.client = client
    def make_image(self, prompt: str, output_path: str = "saida.png"):
        """
        Gera uma imagem a partir de um prompt de texto e salva no disco.
        """
        print(f"üß† Gerando imagem para o prompt:\n  \"{prompt}\"\n")
    
        # Gera a imagem
        image = self.client.text_to_image(
            prompt=prompt,
            negative_prompt="imagem borrada, baixa qualidade, arte ruim",
            guidance_scale=7.5,
            num_inference_steps=30,
            width=512,
            height=512,
        )
    
        # Salva e exibe
        image.save(output_path)
        print(f"‚úÖ Imagem salva como: {output_path}\n")
        try:
            image.show()
        except Exception:
            pass
        return image

In [65]:
import requests

class GenAudio:
    def __init__(self, token):
        self.API_URL = "https://router.huggingface.co/fal-ai/fal-ai/kokoro/brazilian-portuguese"
        self.headers = {
            "Authorization": f"Bearer {token}",
        }
    def query(self, payload):
        response = requests.post(self.API_URL, headers=self.headers, json=payload)
        return response.json()

### Agentes

In [7]:
class LlamaAgent:
    def __init__(self, model="gemma3:1b", url="http://localhost:11434/api/generate"):
        self.model = model
        self.url = url

    def ask(self, prompt: str) -> str:
        resp = requests.post(self.url, json={"model": self.model, "prompt": prompt, "stream": False})
        return resp.json()["response"]


In [68]:
import re

def clean_text(text, regexs):
    for s in regexs:
        text = re.sub(fr'{s}', '', text) 
    return text

class CopyWriterAgent:
    def __init__(self, llama_agent: LlamaAgent):
        self.llama = llama_agent
        
    def run(self, features: dict):
        prompt = f"""
        Voc√™ √© um especialista na cria√ß√£o de roteiros de podcast.
        Voc√™ possui as seguintes habilidades:
        - Conhecimento profundo na cria√ß√£o de podcast.
        - Roteiriza√ß√£o e estrutura√ß√£o de conte√∫do.
        - Comunica√ß√£o eficaz.
        - Prepara√ß√£o e pesquisa.
        - Adaptabilidade, flexibilidade e criatividade.
        - Consist√™ncia e organiza√ß√£o.

        Contexto: 
        {features['context']}
        
        Tarefa: 
        {features['task']}

        Regras: 
        {features['rules']}
        """

        #- A sa√≠da deve come√ßar e terminar diretamente com o conteudo da tarefa, mas fique atento as regras anteriores.
        #- N√£o adicione introdu√ß√µes (Ex: 'Aqui est√£o ...'), conclu√ß√µes (ex:'Espero que ajude...'), 
        #ou qualquer tipo de coment√°rio de adicional ou cortesia.

        response = self.llama.ask(prompt)
        return {"text": response}

In [31]:
class ArtistAgent:
    def __init__(self, gen_image: GenImage):
        self.agent = gen_image

    def run(self, features: dict):
        prompt = f"""
        Voc√™ √© um artista especialista na cria√ß√£o de imagens para capa de podcast.
        
        Tarefa: 
        {features["task"]}

        Configura√ß√µes da imagem: 
        {features['config']}

        Par√¢metros: 
        {features['params']}
        """
        response = self.agent.make_image(prompt, f"img-{time.time()}.png")
        return {"image": response}

In [86]:
class AudioAgent:
    def __init__(self, gen_audio: GenAudio):
        self.agent = gen_audio
    def run(self, features: str):
        audio = self.agent.query({"prompt": features, "voice": "pm_alex"})
        return {"audio": audio}

## Prompts

Os prompts s√£o dicion√°rios com a seguinte estrutura:
- context: define o contexto/situa√ß√£o em que o agente se encontra (lembrando que os agentes j√° possuem Papeis/Especializa√ß√£o definidas).
- task: √® a tarefa/obejtivo que o agente deve realizar.
- rules: s√£o as regras, restri√ß√µes ou formata√ß√µes que o modelo deve levar em conta durante a realiza√ß√£o da tarefa.
- config: s√£o as configura√ß√µes da imagem.
- params: s√£o os parametros que o modelo da agente deve levar em conta. 

In [89]:
podcaster_features = {
    "context": """vamos criar um podcast de tecnologia, focado em front end. 
    O podcast vai falar sobre dicas e novidades sobre o mundo do front end e o que est√° acontecendo no mercado""",
    "task": """criar 5 sugest√µes de nomes criativos para um podcast de front end feito por nerds, e que tenha algum trocadilho pop/nerd no nome""",
    "rules":"""
    - A sa√≠da deve conter apenas: nome, subt√≠tulo e por que funciona.
    - O nome deve ser enxuto.
    - O nome tenha algum trocadilho nerd com nomes de franquias conhecidas como harry potter, star wars, senhor dos an√©is,
    transformer, marvel, DC, miss√£o imposs√≠vel, jurassic park, etc.
    - O nome deve conter alguma palavra forte que remeta a front end.
    - O nome n√£o deve conter palavras em ingl√™s.
    - N√£o utilizar nenhuma das palavras desta lista: [javascript, programador, dev, jovem, nerd].
    - N√£o utilizar a palavra frontend no nome nem qualquer varia√ß√£o dela.
    """
}

roteirista_features = {
    "context":"""
    Vamos criar um  roteiro de um podcast de tecnologia, focado em frontend cujo o nome √© "Nexus Front - Conectando o futuro do web"
    e tem foco em frontend, com o p√∫blico alvo de iniciantes em frontend
    """
    ,
    "task":"Escrever um roteiro de um podcast de tecnologia, focado em frontend , com o p√∫blico alvo de iniciantes em frontend.",
    "rules":"""
    - O formato da sa√≠da deve conter apenas:
        [INTRODU√á√ÉO]
        [CURIOSIDADE 1]
        [CURIOSIDADE 2]
        [FINALIZA√á√ÉO]
    - No bloco [INTRODU√á√ÉO] substitua por uma introdu√ß√£o iguais as introdu√ß√µes dos v√≠deos do canal 'ei nerd', como se fossem escritos pelo Peter Jordan.
    - No bloco [CURIOSIDADE 2] sobre uma ferramenta para front ends.
    - No bloco [FINALIZA√á√ÉO] substitua por uma despedida cool com o final 'Eu sou Bruno e esse foi o Nexus Front dessa semana'.
    - Use termos de f√°cil explica√ß√£o.
    - O podcast vai ser apresentado somente por uma pessoa, chamada Bruno.
    - O podcast deve ser curto.
    - N√£o use muitos termos t√©cnicos.
    - N√£o ultrapasse 5 minutos de dura√ß√£o
    """
}

artista_features = {
    "task": "create knight character as podcaster medieval with microphone",
    "config": "retro style, isometric, cube, game style, low resolution, down angle , game boy colors, 8 bits, retro sprites",
    "params": "--ar 1:1"
}

## Testes

Atualmente cada agente realiza sua tarefa isoladamente. O objetivo √© no futuro integrar e coordenar as tarefas de cada agente.

Os Agentes s√£o:

- podcaster: Respons√°vel por criar o nome do podcast.
- roteirista: respons√°vel por escrever o roteiro do podcast.
- artista: respons√°vel por criar a capa do podcast.
- locutor: respons√°vel por narrar o podcast.

In [95]:
llama = LlamaAgent("gemma3:1b")
genImage = GenImage(MODEL_NAME, HUGGINGFACE_TOKEN)
genAudio = GenAudio(HUGGINGFACE_TOKEN)
podcaster = CopyWriterAgent(llama) # podcaster faz o papel de escolher o titulo e escrever o roteiro
artista = ArtistAgent(genImage)
locutor = AudioAgent(genAudio)

### Criar o t√≠tulo do podcast 

In [41]:
resp = podcaster.run(features=podcaster_features)

In [42]:
print(resp['text'])

## 5 Sugest√µes de Nomes Criativos para o Podcast de Front End:

Aqui est√£o 5 sugest√µes de nomes que combinam elementos de tecnologia, nerd e trocadilho, visando um podcast de front end com foco em novidades e dicas:

1.  **Nome:** "C√≥digo Sombrio"
    *   **Subt√≠tulo:** "Desvendando o C√≥digo, um Byte de Sabedoria."
    *   **Por que funciona:** A palavra "C√≥digo" √© central para o tema, e "Sombrio" evoca a ideia de profundidade e mist√©rio, inspirando-se em Harry Potter.

2.  **Nome:** "Raster & Pixel"
    *   **Subt√≠tulo:** "A Arte da Interface, com a Precis√£o do Desenho."
    *   **Por que funciona:** "Raster" e "Pixel" s√£o termos cruciais para o front end, combinados em uma frase que sugere o foco em design e constru√ß√£o visual.

3.  **Nome:** "A Plataforma Fantasma"
    *   **Subt√≠tulo:** "Onde a Tecnologia se Revela em Sil√™ncio."
    *   **Por que funciona:** "Fantasma" cria um senso de mist√©rio e descoberta, aludindo √† complexidade do c√≥digo e √† experi√™ncia de u

#### 5 Sugest√µes de Nomes Criativos para o Podcast de Front End:
1. **Nome:** "O C√≥digo M√°gico"
   *   **Subt√≠tulo:** "Desvendando o front end, um passo de cada vez."
   *   **Trajojado:** A ideia √© despertar a curiosidade e a fantasia do p√∫blico, combinando a complexidade da tecnologia com a magia do desenvolvimento.
2. **Nome:** "Nexus Front"
   *   **Subt√≠tulo:** "Conectando o futuro do web."
   *   **Trajojado:** "Nexus" (liderado) e "Front" (o front) ao mesmo tempo, criando uma sensa√ß√£o de conex√£o e import√¢ncia no mundo digital.
3. **Nome:** "Pixelado e Poderoso"
   *   **Subt√≠tulo:** "Analisando as tend√™ncias, moldando o futuro do design web."
   *   **Trajojado:** Jogando com a imagem visual do front end, transmitindo a ideia de conhecimento e capacidade.
4. **Nome:** "Estrutura em Movimento"
   *   **Subt√≠tulo:** "Entendendo o DNA do web."
   *   **Trajojado:** Uma alus√£o √† estrutura de um site, mas com a ideia de que est√° em constante evolu√ß√£o, como um sistema que se adapta.
6. **Nome:** "Decodificando Web"
   *   **Subt√≠tulo:** "Um guia para o digital, revelando os segredos do front end."
   *   **Trajojado:** Enfatiza o processo de compreens√£o e o desenvolvimento do front end, transmitindo a ideia de um "desvento" da complexidade digital.

### Roteirista do podcast

Resp√≥savel por escrever o eps√≥dio da semana.

In [44]:
resp = podcaster.run(features=roteirista_features)

In [91]:
# limpamos a sa√≠da para visualizar o resultado.
cresp = clean_text(resp['text'],["\[.*?\]", "\(.*?\)","(.)\1{2,}","\*"]).strip()
print(cresp)

## Nexus Front - Conectando o Futuro do Web





Ol√°, pessoal! Sejam bem-vindos ao Nexus Front, o podcast que te ajuda a entender o b√°sico do frontend. Eu sou Bruno, e hoje, estamos explorando um dos pilares da web: a cria√ß√£o de interfaces de usu√°rio que funcionam bem.  Acho que a gente tem todos esses conceitos de 'React', 'Vue', 'Angular' por a√≠, mas entender o porqu√™ de tudo isso funciona √© fundamental, n√©?  Vamos desmistificar um pouco essa √°rea e descobrir como voc√™ pode come√ßar a construir seus pr√≥prios sites e aplicativos.  Se voc√™ √© um iniciante, ou est√° se sentindo um pouco perdido, esse √© o seu podcast!  Vamos mergulhar e entender como o c√≥digo que vemos em sites, aplicativos e jogos √© realmente constru√≠do.  Se voc√™ quer se tornar um desenvolvedor frontend, essa √© a sua chance.  Deixe seu like, se inscreva no canal e ative o sininho para n√£o perder nenhum epis√≥dio!  Eu sou Bruno e esse foi o Nexus Front dessa semana.





E falando de ferramentas, e um

### Locutor

recebe a sa√≠da j√° tratada e narra o eps√≥dio da semana.

In [83]:
resp_audio = locutor.run(cresp)

In [84]:
print(resp_audio['audio'])

{'error': 'Invalid JSON'}


### Artista

cria a capa do podcast

In [None]:
resp_image = artista.run(features=artista_features)

üß† Gerando imagem para o prompt:
  "
    Voc√™ √© um artista especialista na cria√ß√£o de imagens para capa de podcast.
    
    Tarefa: 
    create knight character as podcaster medieval with microphone

    Configura√ß√µes da imagem: 
    retro style, isometric, cube, game style, low resolution, down angle , game boy colors, 8 bits, retro sprites

    Par√¢metros: 
    --ar 1:1
    "

    ![cavaleiro-podcaster.png](attachment:35ef1170-343c-47cc-95cd-862cd7fb7b17.png)