<a href="https://colab.research.google.com/github/crislanecas/estudos_python/blob/main/IA/03_Aula_imersao_IA_chat_bot.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Conteúdo desenvolvido durante a **imersão IA** da Alura com o Google Gemini, de 06 a 10 de maio de 2024.

# Preparando ambiente

In [2]:
#Instala o SDK do Google Gemini
!pip install -q -U google-generativeai

In [3]:
# Importa as bibliotecas do Google
import google.generativeai as genai
from google.colab import userdata

# Configurando acesso

In [4]:
# Configura acesso via API key
# google_api_key = 'sua_api_key'
# genai.configure(api_key=google_api_key)

In [7]:
# Configura acesso via API key, utilizando userdata para ocultar a key no código
api_key = userdata.get('secret_key_gemini')
genai.configure(api_key=api_key)

# Verificando vesões

In [8]:
# Verifica a lista dos modelos disponíveis para geração de conteúdo
for m in genai.list_models():
  if 'generateContent' in m.supported_generation_methods:
    print(m.name)

models/gemini-1.0-pro
models/gemini-1.0-pro-001
models/gemini-1.0-pro-latest
models/gemini-1.0-pro-vision-latest
models/gemini-1.5-pro-latest
models/gemini-pro
models/gemini-pro-vision


# Configurando parâmetros

Cria variáveis para serem usadas como parâmentros para o modelo.

In [9]:
# Configura os parâmentros gerais do modelo
generation_config = {
  'candidate_count': 1, # Número de respostas
  'temperature': 0.5, # Variabilidade da criatividade de 0 a 1
}

In [10]:
# Configura os parâmentros de segurança do modelo
safety_settings = {
    'HATE': 'BLOCK_NONE',
    'HARASSMENT': 'BLOCK_NONE',
    'SEXUAL': 'BLOCK_NONE',
    'DANGEROUS': 'BLOCK_NONE'
    }

# Configurando o modelo

In [11]:
# Configura o modelo e informando os argumentos especificados acima
model = genai.GenerativeModel(model_name='gemini-1.0-pro',
                                  generation_config=generation_config,
                                  safety_settings=safety_settings,)

# Configurando respostas

In [12]:
# Recebe a resposta do modelo
response = model.generate_content('Que empresa criou o modelo de IA Gemini?')
response.text # Seleciona apenas o atributo 'text' para a resposta

'Google'

# Criando Chat Bot

In [14]:
# Recebe uma lista com histórico
chat = model.start_chat(history=[])

# Recebe o prompt de entrada
prompt = input('Digiti o prompt: ')

# Cria um loop para receber o prompt e enviar para o modelo
while prompt != 'fim': # Define qualquer input diferente de 'fim' para execução
  response = chat.send_message(prompt)
  print('Resposta:', response.text, '\n\n')
  print('Digite FIM para encerrar a conversa.')
  prompt = input('Digiti um novo prompt: ')

Digiti o prompt: Qual a diferença entre Spark e PySpark?
Resposta: **Apache Spark** e **PySpark** são dois conceitos diferentes, embora relacionados:

**Apache Spark**

* Um mecanismo de processamento distribuído de código aberto para processamento de dados em grande escala.
* Fornece uma API unificada para processamento em lote, processamento de streaming e aprendizado de máquina.
* Pode ser usado em vários idiomas, incluindo Python, Java e Scala.

**PySpark**

* Uma interface Python para o Apache Spark.
* Permite que os desenvolvedores do Python usem as funcionalidades do Spark de forma conveniente.
* Fornece uma API Python para criar e manipular conjuntos de dados Spark, executar transformações e ações e interagir com outros componentes do Spark.

**Diferenças:**

* **Linguagem:** O Apache Spark é uma estrutura multi-linguagem, enquanto o PySpark é uma interface Python específica.
* **Nível de abstração:** O PySpark oferece um nível de abstração mais alto, tornando mais fácil para o

In [15]:
# Exibe o conteúdo da variável
chat

ChatSession(
    model=genai.GenerativeModel(
        model_name='models/gemini-1.0-pro',
        generation_config={'candidate_count': 1, 'temperature': 0.5},
        safety_settings={<HarmCategory.HARM_CATEGORY_HATE_SPEECH: 8>: <HarmBlockThreshold.BLOCK_NONE: 4>, <HarmCategory.HARM_CATEGORY_HARASSMENT: 7>: <HarmBlockThreshold.BLOCK_NONE: 4>, <HarmCategory.HARM_CATEGORY_SEXUALLY_EXPLICIT: 9>: <HarmBlockThreshold.BLOCK_NONE: 4>, <HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT: 10>: <HarmBlockThreshold.BLOCK_NONE: 4>},
        tools=None,
        system_instruction=None,
    ),
    history=[glm.Content({'parts': [{'text': 'Qual a difer...rk e PySpark?'}], 'role': 'user'}), glm.Content({'parts': [{'text': '**Apache Spa...esenvolvedor.'}], 'role': 'model'}), glm.Content({'parts': [{'text': 'Como configu...usar PySpark?'}], 'role': 'user'}), glm.Content({'parts': [{'text': 'Para configu...duas colunas.'}], 'role': 'model'})]
)

In [16]:
# Exibe o conteúdo da variável
chat.history

[parts {
   text: "Qual a diferen\303\247a entre Spark e PySpark?"
 }
 role: "user",
 parts {
   text: "**Apache Spark** e **PySpark** s\303\243o dois conceitos diferentes, embora relacionados:\n\n**Apache Spark**\n\n* Um mecanismo de processamento distribu\303\255do de c\303\263digo aberto para processamento de dados em grande escala.\n* Fornece uma API unificada para processamento em lote, processamento de streaming e aprendizado de m\303\241quina.\n* Pode ser usado em v\303\241rios idiomas, incluindo Python, Java e Scala.\n\n**PySpark**\n\n* Uma interface Python para o Apache Spark.\n* Permite que os desenvolvedores do Python usem as funcionalidades do Spark de forma conveniente.\n* Fornece uma API Python para criar e manipular conjuntos de dados Spark, executar transforma\303\247\303\265es e a\303\247\303\265es e interagir com outros componentes do Spark.\n\n**Diferen\303\247as:**\n\n* **Linguagem:** O Apache Spark \303\251 uma estrutura multi-linguagem, enquanto o PySpark \303\251

# Imprimindo histórico formatado

In [17]:
# Para formatação de texto, especificamente para 'quebrar' linhas
import textwrap
# Para exibir diversos tipos de conteúdo dentro de notebooks
from IPython.display import display
from IPython.display import Markdown

# Cria uma função para formar em Markdow a resposta do modelo
def to_markdown(text):
  text = text.replace('•', '  *') # Substitui marcadores ' *' no texto de entrada
  # Aplica um recuo a cada linha do texto usando o caractere '> ', criando o efeito de citação típico do Markdown
  return Markdown(textwrap.indent(text, '> ', predicate=lambda _: True)) # A função predicate=lambda _: True garante que todas as linhas sejam recuadas

# Cria um loop para percorre cada mensagem no histórico
for message in chat.history:
  display(to_markdown(f'**{message.role}**: {message.parts[0].text}')) # Formata a mensagem para exibição
  print('-------------------------------------------')

> **user**: Qual a diferença entre Spark e PySpark?

-------------------------------------------


> **model**: **Apache Spark** e **PySpark** são dois conceitos diferentes, embora relacionados:
> 
> **Apache Spark**
> 
> * Um mecanismo de processamento distribuído de código aberto para processamento de dados em grande escala.
> * Fornece uma API unificada para processamento em lote, processamento de streaming e aprendizado de máquina.
> * Pode ser usado em vários idiomas, incluindo Python, Java e Scala.
> 
> **PySpark**
> 
> * Uma interface Python para o Apache Spark.
> * Permite que os desenvolvedores do Python usem as funcionalidades do Spark de forma conveniente.
> * Fornece uma API Python para criar e manipular conjuntos de dados Spark, executar transformações e ações e interagir com outros componentes do Spark.
> 
> **Diferenças:**
> 
> * **Linguagem:** O Apache Spark é uma estrutura multi-linguagem, enquanto o PySpark é uma interface Python específica.
> * **Nível de abstração:** O PySpark oferece um nível de abstração mais alto, tornando mais fácil para os desenvolvedores do Python trabalhar com o Spark.
> * **Desempenho:** O Apache Spark geralmente oferece melhor desempenho do que o PySpark, pois é implementado em Java e Scala, que são mais eficientes para processamento de dados.
> * **Facilidade de uso:** O PySpark é mais fácil de usar para desenvolvedores do Python, pois fornece uma API mais intuitiva e familiar.
> 
> **Resumo:**
> 
> O Apache Spark é o mecanismo subjacente que fornece recursos de processamento de dados, enquanto o PySpark é uma interface Python que facilita o uso do Spark para desenvolvedores do Python. A escolha entre os dois depende das necessidades específicas do projeto e do nível de experiência do desenvolvedor.

-------------------------------------------


> **user**: Como configurar o Colab para usar PySpark?

-------------------------------------------


> **model**: Para configurar o Colab para usar o PySpark, siga estas etapas:
> 
> 1. **Crie um novo notebook do Colab.**
> 2. **Clique em "Editar" > "Configurações de tempo de execução".**
> 3. **Na seção "Tipo de tempo de execução", selecione "Python 3".**
> 4. **Na seção "Configurações de hardware", selecione uma GPU ou TPU, se disponível.**
> 5. **Clique em "Salvar".**
> 6. **Reinicie o tempo de execução clicando no botão "Reiniciar tempo de execução" na barra de ferramentas.**
> 
> Depois de reiniciar o tempo de execução, você pode instalar o PySpark usando o seguinte comando:
> 
> ```
> !pip install pyspark
> ```
> 
> Para verificar se o PySpark foi instalado com sucesso, execute o seguinte comando:
> 
> ```
> import pyspark
> pyspark.version.__version__
> ```
> 
> Se o comando retornar uma versão do PySpark, a instalação foi bem-sucedida.
> 
> **Observações:**
> 
> * O Colab oferece suporte apenas para versões específicas do PySpark. Verifique a documentação do Colab para obter a versão mais recente compatível.
> * Você pode precisar instalar o Java Development Kit (JDK) se ainda não o tiver instalado.
> * Se você estiver usando uma GPU ou TPU, poderá precisar instalar bibliotecas adicionais para suporte ao PySpark.
> 
> **Exemplo de uso:**
> 
> Depois de instalar o PySpark, você pode usá-lo para criar um DataFrame do Spark:
> 
> ```
> from pyspark.sql import SparkSession
> 
> spark = SparkSession.builder.appName("Colab PySpark").getOrCreate()
> 
> df = spark.createDataFrame([(1, "John"), (2, "Jane"), (3, "Bob")], ["id", "name"])
> 
> df.show()
> ```
> 
> Isso criará e exibirá um DataFrame do Spark com três linhas e duas colunas.

-------------------------------------------


# Fonte

https://www.alura.com.br/imersao-ia-google-gemini

[Guia de início rápido da API Gemini](https://ai.google.dev/gemini-api/docs/quickstart?hl=pt-br)

[Colab modelo - Google](https://colab.research.google.com/github/google/generative-ai-docs/blob/main/site/en/tutorials/quickstart_colab.ipynb?hl=pt-br)

[Colab da aula - Imersão IA 2° Edição | 2024](https://colab.research.google.com/drive/1wFIctGOaYwlgXD8xsyBiSi5LmTHrObai?usp=sharing#scrollTo=KpaQ6hm5f2_J)

# Glossário

**SDK** (Software Development Kit): conjunto de ferramentas utilizado para integrar os recursos do modelo de linguagem Gemini.