O projeto é desenhado pensando em uma rotina de consumo e ensino de contação de histórias para crianças.

Tem como objetivo ajudar a crinaça na criação do próprio conteúdo através de gravação de um vídeo.

```
A criança a partir do vídeo gravado (de 30 segundo a 1 minuto) terá como retorno sua história publicada.
Haverá a melhoria da mesma com base no contexto narrado, trazendo inclusive considerações sobre os pontos principais da obra.

Dentro do material também virá uma recomendação de livros (com base em um universo bem definido no momento da confecção deste trabalho)

Dentro deste material também virá uma comparação entre ambas as obras, para a criança entender aonde ela pode chegar com a criatividade.

Prezo que os pequenos ganhem uma ferrmanta que os ajude a ter histórias autorais e peguem gosto por novas obras e fomentem o gosto pela leitura
```



Instalação das dependências para execução do projeto


In [None]:
!pip install -q -U google-generativeai
!pip install moviepy
!pip install --upgrade pip
!pip install --upgrade python-docx markdown
!pip install docx
!pip install beautifulsoup4

Definições iniciais do Google Gemini


In [None]:
import os
url = ""
while not os.path.exists(url):
  url = input('Faça o upload do seu vídeo de 45 segundos antes de prosseguir, e depois digite a URL ou o caminho dentro do colab  no campo a seguir')

  if os.path.exists(url):
    print("O arquivo existe.")
  else:
    print("O arquivo não existe, ajuste e tente novamente.")
  mp4_file = url



In [None]:
import numpy as np
import pandas as pd
import google.generativeai as genai
#from google.colab import userdata

#GOOGLE_API_KEY=userdata.get('GOOGLE_API_KEY')
GOOGLE_API_KEY=""
genai.configure(api_key=GOOGLE_API_KEY)

Etapa de Scrapping

```
# Este código navega para https://www.todamateria.com.br para extrair uma lista de resenhas de livros.
# Esta resenhas serão utilizadas para compor o embbeding de onde faremos as recomendações de similaridades entre a história do Autor e livros famosos constantes nesse universo bem definido
```



In [None]:
import requests
from lxml import html

def extrair_links(url):
  """Extrai todos os links da página usando XPath."""
  response = requests.get(url)
  tree = html.fromstring(response.content)
  try:
    links = tree.xpath('/html/body/div[3]/div[2]/div[1]/div/a/@href')
  except:
    pass
  return ["https://www.todamateria.com.br" + link for link in links if link]

def extrair_dados(url):
  """Extrai título e texto completo da página do livro usando XPath."""
  titulo = ""
  texto_completo = ""
  response = requests.get(url)
  tree = html.fromstring(response.content)
  try:
    titulo = tree.xpath('//*[@id="article"]/div/h1/text()')[0].strip()
  except:
    pass

  # Extrair o texto de todos os parágrafos
  paragrafos = tree.xpath('//*[@id="article"]/div/p')
  texto_completo = ""
  for p in paragrafos:
    texto_completo += p.text_content().strip() + "\n"

  return titulo, texto_completo

Extração de dados baseadas nas funções acima

In [None]:
url = "https://www.todamateria.com.br/resumos-de-livros/"
# Extrair links da página principal
links_livros = extrair_links(url)


In [None]:
links_livros


Definições do modelo a ser utilizado

In [None]:
safety_settings={
    'HATE': 'BLOCK_NONE',
    'HARASSMENT': 'BLOCK_NONE',
    'SEXUAL' : 'BLOCK_NONE',
    'DANGEROUS' : 'BLOCK_NONE'
    }
generation_config = {
  "candidate_count": 1,
  "temperature": 0.4,
}

Modelos Disponíveis

In [None]:
for m in genai.list_models():
  if 'embedContent' in m.supported_generation_methods:
    print(m.name)

Modelo configurado para fazer o resumo dos conteudo dos livros que serão "embedados"

In [None]:
model = genai.GenerativeModel(model_name='gemini-1.0-pro',
                                  generation_config=generation_config,
                                  safety_settings=safety_settings,)

In [None]:
prompt_resumir_artigos = "Resuma de forma coesa, mantendo as seções e divisões, mantendo os padrões de escrita do seguinte texto:"

In [None]:
titulo = ""
texto = ""
documents = []
for link in links_livros:
  titulo, texto = extrair_dados(link)
  if "Sagarana" not in titulo:
    response = model.generate_content(prompt_resumir_artigos + texto)
    #Listagem de documentos que serão buscados
    try:
      DOCUMENT = {
        "Título": titulo,
        "Conteúdo": response.text
      }

      documents.append(DOCUMENT)
    except:
      pass


Criação de df

```
# Aqui todos os livvro estão carregados para um data frame
```



In [None]:
df = pd.DataFrame(documents)
df.columns = ["Titulo", "Conteudo"]

Início etapa de  embbeding

```
# Aplicação de função para os registros contidos no df e adicionando ao embedding
```



In [None]:
def embed_fn(title, text):
  return genai.embed_content(model="models/embedding-001",
                                 content=text,
                                 title=title,
                                 task_type="RETRIEVAL_DOCUMENT")["embedding"]

Finalização de DF de Embeddings

In [None]:
df["Embeddings"] = df.apply(lambda row: embed_fn(row["Titulo"], row["Conteudo"]), axis=1)

Extração de audio do vídeo
Próximos passos são implementar uma lógica para extrair dados do vídeo como descrição do local e do apresentador para compor o documento

In [None]:
from moviepy.editor import VideoFileClip

# Define the input video file and output audio file
#mp4_file = "/content/drive/MyDrive/teste video.mp4"
mp3_file = "uploads\\teste audio2.mp3"

# Load the video clip
video_clip = VideoFileClip(mp4_file)

# Extract the audio from the video clip
audio_clip = video_clip.audio

# Write the audio to a separate file
audio_clip.write_audiofile(mp3_file)

# Close the video and audio clips
audio_clip.close()
video_clip.close()

print("Audio extraction successful!")

In [None]:
def gerar_e_buscar_consulta(consulta, base, model):
  embedding_da_consulta = genai.embed_content(
      model="models/embedding-001",
      content=consulta,
      task_type="RETRIEVAL_QUERY")["embedding"]

  produtos_escalares = np.dot(np.stack(df["Embeddings"]), embedding_da_consulta)

  indice = np.argmax(produtos_escalares)
  return df.iloc[indice]["Conteudo"]

O prompt abaixo baseado em Chain of thoughts tem a função de nortear a geração de conteudo com base no texto extraído do vídeo

```
# Há a trasncrição, e complementação com uma resenha e compreensão além das expectativas para a contação de histórias. servirá de insumo para criação de uma recomendação de livro com base no nosso universo citado anteriormente
```



In [None]:
prompt_master = """Sobre o audio, ele será utilizado para compor um conto de um livro que estou escrevendo
Quero que vc gere um titulo legal do texto
É imprescindível que os dados do modelo de escrita sejam seguidos, porém ignore o conteúdo, é apenas para exemplo. não o use.
Geralemnte os pontos que vc deve seguir são os markdowns, então siga neste esquema
Faça a transcrição exata do audio de forma textual como se fosse um texto corrido, sem as marcações de tempo na etapa ### Conto
Crie a história com todas as informações que não estão contidas no audio


siga este exemplo abaixo de modelo de escrita, o conteudo do exemplo não é importante, apenas o formato:

## O Menino que Comia Demais: Uma Parábola Nordestina sobre Gula e Destino

**RESUMO**

Este capítulo explora o conto "O Menino que Comia Demais", escrito por Ariano Suassuna em 1997. A narrativa, com forte influência da tradição oral nordestina, apresenta a história de um menino guloso que, ao longo da vida, sofre as consequências de seus excessos. A história serve como uma parábola, abordando temas como gula, destino e a inevitabilidade das consequências de nossas ações. O capítulo analisa os elementos simbólicos presentes no conto, sua relação com a cultura popular nordestina e as reflexões que a narrativa propõe.

**Palavras-chave:** Literatura Nordestina, Parábola, Gula, Destino.

**ABSTRACT**

This chapter explores the tale "The Boy Who Ate Too Much," written by Ariano Suassuna in 1997. The narrative, heavily influenced by the Northeastern oral tradition, presents the story of a greedy boy who, throughout his life, suffers the consequences of his excesses. The story serves as a parable, addressing themes such as gluttony, destiny, and the inevitability of the consequences of our actions. The chapter analyzes the symbolic elements present in the tale, its relationship with popular Northeastern culture, and the reflections that the narrative proposes.

**Keywords:** , Northeastern Literature, Parable, Gluttony, Destiny.

### Conto

"Um, dois, três, testando...

Era uma vez um imbatível, um menino que comia demais.
Ele gostava de caça e mulanbê. Começou a ver o mundo e levou (o hábito de comer demais) para a vida inteira.
Um dia, um caminhão veio e atropelou o próprio menino. E quando (o caminhão o engoliu), na boca dele, ele portava um fino."



###  A GULA COMO ELEMENTO CENTRAL

O protagonista da história, cujo nome não é revelado, é apresentado como um "imbatível" na arte de comer. Seu apetite voraz o leva a devorar quantidades absurdas de comida, desde caça e peixes a frutas como mulanbê. Essa gula desmedida se torna o elemento central da narrativa, guiando o destino do personagem.

###  A VIAGEM E O ENCONTRO COM O CAMINHÃO

A história toma um rumo inesperado quando o menino, já adulto, se torna um viajante. Em suas andanças pelo mundo, ele se depara com um caminhão que, em uma reviravolta simbólica, o atropela e o engole. O caminhão, representando a inevitabilidade do destino e as consequências dos excessos, consome o protagonista, assim como ele havia consumido tudo ao seu redor durante a vida.

### O FINO COMO SÍMBOLO DE ESPERANÇA

Mesmo diante da morte iminente, o conto apresenta um elemento de esperança. O fino que o personagem carrega consigo representa a possibilidade de redenção, a chance de superar as limitações da própria natureza. O destino do fino, contudo, fica em aberto, deixando espaço para a interpretação do leitor e a reflexão sobre o potencial de transformação humana.

### REFLEXÕES SOBRE A CONDIÇÃO HUMANA

"O Menino que Comia Demais"  vai além de uma simples história sobre gula. A narrativa funciona como uma parábola, convidando o leitor a refletir sobre temas como a relação do homem com seus desejos, a importância do autocontrole e a inevitabilidade das consequências de nossos atos. A história também aborda a questão do destino e a possibilidade de transformação, mesmo diante de um futuro aparentemente determinado.

### A INFLUÊNCIA DA CULTURA NORDESTINA

A narrativa apresenta diversos elementos característicos da cultura popular nordestina. A linguagem simples e direta, o uso de expressões regionais e a presença de elementos do folclore, como a figura do caminhoneiro, contribuem para a construção de uma atmosfera familiar e envolvente para o leitor nordestino. A história também reflete valores e crenças presentes na região, como a importância da família, a força do destino e a presença do divino no cotidiano.

### CONCLUSÃO

"O Menino que Comia Demais" é uma narrativa curta, mas repleta de significados. A história, com sua linguagem simples e elementos simbólicos, transmite reflexões profundas sobre a condição humana e as consequências de nossas escolhas. A influência da cultura popular nordestina enriquece a narrativa, tornando-a uma obra representativa da produção literária de Ariano Suassuna e um convite à reflexão sobre a vida e o destino.
"""

Utilizado modelo 1.5 para trascrever o audio em texto. Aqui é gerado a história Autoral

In [None]:
from pathlib import Path
import hashlib
import google.generativeai as genai

# Set up the model
generation_config = {
  "temperature": 0.3,
  "top_p": 0.95,
  "top_k": 0,
  "max_output_tokens": 8192,
}

safety_settings = [
  {
    "category": "HARM_CATEGORY_HARASSMENT",
    "threshold": "BLOCK_MEDIUM_AND_ABOVE"
  },
  {
    "category": "HARM_CATEGORY_HATE_SPEECH",
    "threshold": "BLOCK_MEDIUM_AND_ABOVE"
  },
  {
    "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
    "threshold": "BLOCK_MEDIUM_AND_ABOVE"
  },
  {
    "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
    "threshold": "BLOCK_MEDIUM_AND_ABOVE"
  },
]

model = genai.GenerativeModel(model_name="gemini-1.5-pro-latest",
                              generation_config=generation_config,
                              safety_settings=safety_settings)

prompt_parts = [
  genai.upload_file(mp3_file),
  prompt_master,
]

response = model.generate_content(prompt_parts)
historia_autoral = response.text
print(historia_autoral)

Configuração específica para o prompt a seguir

In [None]:
generation_config = {
  "temperature": 0.4,
  "candidate_count": 1
}

Faz a seleção do livro com base na história contada e traz a resenha da mesma

In [None]:
consulta = response.text
trecho = gerar_e_buscar_consulta(consulta, df, model)
model_3 = genai.GenerativeModel("gemini-1.0-pro",
                                generation_config=generation_config)
response = model_3.generate_content("Faça o resumo de forma descritiva do conteudo demosntrado a seguire: " + trecho)
trecho = response.text
print(trecho)

Cria a Resenha e o paralelo com algum do livro da fonte https://www.todamateria.com.br/

```
# Uso de few shot learning
```



In [None]:
exemplos = """Paralelos entre "Toda vez que eu viajava pela estrada de ouro fino" e "Terra Sonâmbula":
Busca por identidade: Tanto a menina da estrada quanto Muidinga em "Terra Sonâmbula" estão em busca de sua verdadeira identidade.
Caminhada: Ambas as histórias envolvem jornadas a pé, simbolizando a busca por autodescoberta e compreensão.
Acompanhamento: A menina segue o viajante, enquanto Tuahir acompanha Muidinga em sua jornada.
Música: O berrante na história da estrada ecoa a música que acompanha Muidinga e Tuahir em "Terra Sonâmbula", criando uma atmosfera de esperança e orientação.
-----------------------------------
Paralelos entre "Na trilha dos sonhos perdidos" e "O Pintor de Sonhos":
Exploração da imaginação: Tanto o protagonista de "Na trilha dos sonhos perdidos" quanto o pintor em "O Pintor de Sonhos" estão em uma jornada para explorar os limites da imaginação e da criatividade.
Viagem pelo desconhecido: Ambas as histórias envolvem viagens através de paisagens surrealistas e fantásticas, refletindo a jornada interior dos personagens em busca de inspiração e autoconhecimento.
Companhia na jornada: O protagonista é acompanhado por um gato misterioso em sua jornada, enquanto o pintor tem seu cavalete e pincéis como companheiros constantes, simbolizando a busca pela expressão artística e pela verdade interior.
Música das cores: As cores vibrantes descritas na narrativa da trilha dos sonhos perdidos ecoam as pinceladas de cores vivas e intensas usadas pelo pintor em suas obras, criando uma atmosfera de magia e possibilidades infinitas.
"""
prompt = f"{exemplos}\nTrace paralelos, procure referencias, similaridades, morais, e ligações da historia em {consulta}  e o conteudo encontrado em  {trecho} de maneira ludica e em texto corrido. tente se ater ao que realmente foi contado na historia contida em {consulta}, tente traçar situações qeu possam se encaixar, mas sem fugir do contexto contado nas duas historias. É importante saber que é focado em crianças, portanto manter o resultado dentro de um filtro infantil"

model_2 = genai.GenerativeModel("gemini-1.0-pro",
                                generation_config=generation_config,
                                safety_settings = safety_settings)
response = model_2.generate_content(prompt)
analise_paralelos = response.text
print(analise_paralelos)

Formatação de conteúdo para exeibição

In [None]:
import markdown
from IPython.display import HTML
def markdown_para_html(texto_markdown, nome_arquivo):
    """Converte um texto Markdown para HTML e salva em um arquivo."""

    html = markdown.markdown(texto_markdown)

    with open(nome_arquivo, "w", encoding="utf-8") as arquivo:
        arquivo.write(html)
    display(HTML(html))

texto_mark = f"""<br /><br />
<h1>Novo conto</h1>
<br />
{historia_autoral}
<br /><br /><br />
<h1>Obra famosa sugerida</h1>
<br />
{trecho}
<br /><br /><br />
<h1>Paralelos entre as Histórias</h1>
<br />
{analise_paralelos}"""



Apresentação do Conteúdo

In [None]:
import datetime

data_hora = datetime.datetime.now().strftime("%Y-%m-%d_%H-%M-%S")
nome_arquivo = f"ReviewLer_{data_hora}.html"
markdown_para_html(texto_mark, nome_arquivo)