<a href="https://colab.research.google.com/github/MarceloClaro/Iniciador-de-Interface-Web-para-Gera-o-de-Texto/blob/main/Iniciador_de_Interface_Web_para_Gera%C3%A7%C3%A3o_de_Texto.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **"Iniciador de Interface Web para Geração de Texto"**

O projeto descrito envolve a criação de uma interface de usuário web usando a biblioteca Gradio para interagir com Modelos de Linguagem de Grande Escala. Este projeto tem um potencial significativo para estudos e aplicações em diversas áreas. Vamos explorar cada componente e seu potencial para estudo:

1. **Gradio web UI:**
   - **Potencial para Estudo:** A Gradio permite a rápida prototipagem e demonstração de modelos de machine learning, tornando-a ideal para fins educativos, experimentação e apresentação de projetos de pesquisa. Estudantes e pesquisadores podem usar a Gradio para visualizar como os modelos de PLN funcionam na prática, interagindo com eles em tempo real.

2. **Large Language Models:**
   - **Potencial para Estudo:** Estes modelos são fundamentais no campo do PLN e oferecem uma rica área de estudo. Eles podem ser explorados para entender a geração de linguagem, análise de sentimentos, respostas a perguntas, tradução automática, e mais. Há um vasto campo para pesquisa em melhorias de algoritmos, eficiência computacional, e aplicações práticas destes modelos.

3. **Supports transformers:**
   - **Potencial para Estudo:** A arquitetura de transformadores revolucionou o PLN, proporcionando avanços significativos em tarefas como compreensão de texto e geração de linguagem. O estudo destes modelos pode abranger desde a compreensão teórica de sua mecânica até a aplicação em problemas do mundo real, como processamento de linguagem em redes sociais ou sistemas de recomendação.

4. **GPTQ, AWQ, EXL2:**
   - **Potencial para Estudo:** Estas variantes específicas de modelos de linguagem oferecem oportunidades para explorar diferentes abordagens em PLN. Isso pode incluir estudos sobre eficiência de modelos, capacidade de geração de texto, e aplicações em contextos específicos como chatbots ou sistemas de análise de texto.

5. **llama.cpp (GGUF), Llama models:**
   - **Potencial para Estudo:** Estudar estas implementações específicas pode fornecer insights sobre como diferentes configurações e otimizações afetam o desempenho dos modelos de PLN. Isso pode levar a inovações em como os modelos são construídos e treinados, bem como a aplicações mais eficientes em termos de recursos.

**Conclusão:**
O projeto apresenta uma oportunidade excepcional para estudar e aplicar a teoria e prática dos modelos de linguagem de grande escala. A interface Gradio torna os modelos acessíveis e interativos, permitindo aos usuários não apenas estudar os fundamentos teóricos do PLN, mas também experimentar diretamente o impacto e as capacidades desses modelos avançados. Isso pode ser particularmente valioso em ambientes educacionais, de pesquisa, e para desenvolvedores buscando aplicar PLN em soluções práticas.


---

# oobabooga/text-generation-webui

Após executar ambas as células, um URL público do gradio aparecerá na parte inferior em alguns minutos. Você pode opcionalmente gerar um link de API.

* Página do projeto: https://github.com/oobabooga/text-generation-webui
* Status do servidor gradio: https://status.gradio.app/

---



In [None]:
#@title 1. Mantenha esta guia ativa para evitar que o Colab desconecte você { display-mode: "form" }

# Esta linha é um título em uma célula do Colab.

# "{ display-mode: "form" }" é uma configuração que altera a forma como a célula é exibida, tornando-a mais parecida com um formulário.

#@markdown Pressione play no music player que aparecerá abaixo:

# Esta é uma anotação Markdown fornecendo instruções ao usuário.


%%html



<audio src="https://oobabooga.github.io/silence.m4a" controls>

# Esta é uma tag HTML para incorporar um player de áudio na célula.
# O atributo 'src' especifica o URL do arquivo de áudio a ser reproduzido, que neste caso é "https://oobabooga.github.io/silence.m4a".
# O atributo 'controls' adiciona controles de reprodução padrão ao player de áudio (como play, pause, volume).


# **As listas com as descrições, funções, vantagens e desvantagens para cada alternativa:**

### 1. Model URL (`model_url`)
**Alternativa Atual:**
1. **[TheBloke/MythoMax-L2-13B-GPTQ](https://huggingface.co/TheBloke/MythoMax-L2-13B-GPTQ)**
   - **Descrição:** Modelo de linguagem GPTQ com 13 bilhões de parâmetros.
   - **Vantagens:** Capacidade avançada de geração e compreensão de texto.
   - **Desvantagens:** Exige alto poder computacional para processamento.

**Expansão da Lista:**
2. **[openai/gpt-3](https://huggingface.co/openai/gpt-3)**
   - **Descrição:** Modelo GPT-3 da OpenAI para diversas tarefas de PLN.
   - **Vantagens:** Muito versátil e poderoso em geração de texto.
   - **Desvantagens:** Acesso restrito e pode ser caro para uso intensivo.

3. **[google/t5-xxl](https://huggingface.co/google/t5-xxl)**
   - **Descrição:** Modelo T5 para tarefas de tradução, sumarização e mais.
   - **Vantagens:** Flexível em várias tarefas de PLN.
   - **Desvantagens:** Requer ajustes específicos para cada tarefa.

4. **[facebook/bart-large-cnn](https://huggingface.co/facebook/bart-large-cnn)**
   - **Descrição:** Modelo BART otimizado para sumarização.
   - **Vantagens:** Excelente para sumarização de textos.
   - **Desvantagens:** Menos versátil para outras tarefas de PLN.

5. **[deepset/roberta-base-squad2](https://huggingface.co/deepset/roberta-base-squad2)**
   - **Descrição:** RoBERTa treinado para QA (Question Answering) com SQuAD 2.0.
   - **Vantagens:** Especializado em responder perguntas com precisão.
   - **Desvantagens:** Focado em QA, não tão bom em geração de texto livre.

### 2. Branch (`branch`)
**Alternativa Atual:**
1. **gptq-4bit-32g-actorder_True**
   - **Descrição:** Configuração específica do modelo GPTQ.
   - **Vantagens:** Otimizado para eficiência em hardware específico.
   - **Desvantagens:** Menos flexível para outras configurações de hardware.

**Expansão da Lista:**
- Dado que as alternativas de `branch` são altamente específicas ao repositório e ao modelo em uso, não é possível listar outras sem conhecer o contexto específico do repositório de modelos.

### 3. Command Line Flags (`command_line_flags`)
**Alternativa Atual:**
1. **--n-gpu-layers 128 --load-in-4bit --use_double_quant**
   - **Descrição:** Configuração para 128 camadas de GPU, carregamento em 4 bits, e quantização dupla.
   - **Vantagens:** Otimiza o uso da GPU e da memória.
   - **Desvantagens:** Pode haver comprometimento na precisão.

**Expansão da Lista:**
2. **--n-gpu-layers 64 --load-in-8bit**
   - **Descrição:** Usa 64 camadas de GPU, carregando em 8 bits.
   - **Vantagens:** Menor uso de recursos comparado a 128 camadas.
   - **Desvantagens:** Menos capacidade de processamento paralelo.

3. **--n-gpu-layers 256 --use_float**
   - **Descrição:** Configuração para 256 camadas de GPU, usando precisão de ponto flutuante.
   - **Vantagens:** Maximiza a capacidade de processamento e precisão.
   - **Desvantagens:** Uso intensivo de recursos, necessitando de hardware robusto.

4. **--n-gpu-layers 32 --use_mixed_precision**
   - **Descrição:** Usa 32 camadas de GPU com precisão mista.
   - **Vantagens:** Bom equilíbrio entre desempenho e uso

 de recursos.
   - **Desvantagens:** Compromisso entre precisão e eficiência.

5. **--no-quantization**
   - **Descrição:** Desativa a quantização dos pesos do modelo.
   - **Vantagens:** Mantém a máxima qualidade e precisão do modelo.
   - **Desvantagens:** Aumenta significativamente o uso de memória.

Essas alternativas oferecem um leque de opções que podem ser ajustadas de acordo com as necessidades específicas da tarefa, recursos disponíveis e objetivos do projeto.

Vou explicar cada item do código minuciosamente, comentando o código existente:

```python
# Importação das bibliotecas necessárias.
import torch
from pathlib import Path
```
Essas linhas importam as bibliotecas necessárias para o código. `torch` é a biblioteca PyTorch, amplamente utilizada em aprendizado de máquina, e `Path` é uma classe para trabalhar com caminhos de arquivo.

```python
# Verifica se o diretório atual é 'text-generation-webui'. Se não for, instala a web UI.
if Path.cwd().name != 'text-generation-webui':
  print("Installing the webui...")
  # Clona o repositório do GitHub que contém o código da web UI.
  !git clone https://github.com/oobabooga/text-generation-webui
  %cd text-generation-webui
```
Este trecho verifica se o código está sendo executado no diretório 'text-generation-webui'. Se não estiver, ele clona um repositório GitHub que contém o código da interface de usuário web para geração de texto. Em seguida, ele muda o diretório de trabalho para 'text-generation-webui'.

```python
  # Verifica a versão do PyTorch instalada.
  torver = torch.__version__
  print(f"TORCH: {torver}")
  is_cuda118 = '+cu118' in torver  # Verifica se é a versão com CUDA 11.8.
  is_cuda117 = '+cu117' in torver  # Verifica se é a versão com CUDA 11.7.
```
Esta parte verifica a versão do PyTorch instalada e armazena em `torver`. Em seguida, ele verifica se a versão do PyTorch inclui 'cu118' ou 'cu117', indicando se é uma versão com suporte a CUDA 11.8 ou CUDA 11.7.

```python
  # Lê as dependências necessárias do arquivo 'requirements.txt'.
  textgen_requirements = open('requirements.txt').read().splitlines()
```
Aqui, ele lê as dependências necessárias do arquivo 'requirements.txt' e armazena em `textgen_requirements`.

```python
  # Ajusta as dependências com base na versão do CUDA.
  if is_cuda117:
      textgen_requirements = [req.replace('+cu121', '+cu117').replace('+cu122', '+cu117').replace('torch2.1', 'torch2.0') for req in textgen_requirements]
  elif is_cuda118:
      textgen_requirements = [req.replace('+cu121', '+cu118').replace('+cu122', '+cu118') for req in textgen_requirements]
  with open('temp_requirements.txt', 'w') as file:
      file.write('\n'.join(textgen_requirements))
```
Nesta seção, dependendo da versão do CUDA encontrada anteriormente, ele faz ajustes nas dependências listadas em `textgen_requirements`. Por exemplo, substituindo '+cu121' por '+cu117' ou '+cu118', e 'torch2.1' por 'torch2.0'. Em seguida, ele cria um arquivo 'temp_requirements.txt' atualizado com as dependências ajustadas.

```python
  # Instala as dependências.
  !pip install -r extensions/openai/requirements.txt --upgrade
  !pip install -r temp_requirements.txt --upgrade
```
Aqui, ele usa o `pip` para instalar as dependências listadas em 'extensions/openai/requirements.txt' e 'temp_requirements.txt', ambas atualizadas com as modificações necessárias.

```python
  # Exibe mensagens sobre a instalação.
  print("\033[1;32;1m\n --> If you see a warning about \"previously imported packages\", just ignore it.\033[0;37;0m")
  print("\033[1;32;1m\n --> There is no need to restart the runtime.\n\033[0;37;0m")
```
Essas linhas exibem mensagens informativas sobre a instalação das dependências, indicando como lidar com possíveis avisos e esclarecendo que não é necessário reiniciar o ambiente de execução.

```python
  # Tenta importar 'flash_attn', se falhar, desinstala.
  try:
    import flash_attn
  except:
    !pip uninstall -y flash_attn
```
Aqui, ele tenta importar o módulo 'flash_attn'. Se a importação falhar, ele desinstala o pacote 'flash_attn' usando o comando `pip uninstall -y flash_attn`.

```python
# Define os parâmetros para o modelo.
model_url = "https://huggingface.co/TheBloke/MythoMax-L2-13B-GPTQ" #@param {type:"string"}
branch = "gptq-4bit-32g-actorder_True" #@param {type:"string"}
command_line_flags = "--n-gpu-layers 128 --load-in-4bit --use_double_quant" #@param {type:"string"}
api = True #@param {type:"boolean"}
```
Nesta parte, são definidos os parâmetros para o modelo. O `model_url` especifica a URL do modelo a ser usado. A `branch` define a branch do repositório Git a ser usada. `command_line_flags` são as opções de linha de comando que serão passadas ao iniciar a interface de usuário web. `api` é uma variável booleana que indica se a interface de usuário web deve ser executada em modo API.

```python
# Adiciona parâmetros para a API, se necessário.
if api:
  for param in ['--api', '--public-api']:
    if param not in command_line_flags:
      command_line_flags += f" {param}"
```
Se `api` for verdadeiro, ele adiciona os parâmetros `--api` e `--public-api` a `command_line_flags` se eles ainda não estiverem presentes.

```python
# Trata o URL do modelo.
model_url = model_url.strip()
if model_url != "":
    if not model_url.startswith('http'):
        model_url = 'https://huggingface.co/' + model_url

    # Baixa o modelo.
    url_parts = model_url.strip('/').strip().split('/')
    output_folder = f"{url_parts[-2]}_{url_parts[-1]}"
    branch = branch.strip('"\' ')
    if branch.strip() not in ['', 'main']:
        output_folder += f"_{branch}"
        !python download-model.py {model_url} --branch {branch}
    else:
        !python download-model.py {model_url}
else:
    output_folder = ""
```
Nesta seção, o código trata o URL do modelo. Ele verifica se o URL é uma URL completa (começando com 'http'). Se não for, adiciona o prefixo correto. Em seguida, ele divide o URL para obter

 partes relevantes e cria um nome de pasta (`output_folder`) com base nas partes do URL. Se a branch não estiver vazia ou igual a 'main', ela é incluída no nome da pasta. Em seguida, ele usa um script chamado 'download-model.py' para baixar o modelo com o URL fornecido.

```python
# Inicia a interface de usuário web.
cmd = f"python server.py --share"
if output_folder != "":
    cmd += f" --model {output_folder}"
cmd += f" {command_line_flags}"
print(cmd)
!$cmd
```
Por fim, esta parte do código inicia a interface de usuário web. Ele monta um comando de linha de acordo com as configurações e parâmetros definidos anteriormente. O comando é então executado usando `!$cmd`, iniciando a interface de usuário web para o modelo de geração de texto.

In [None]:
#@title 2.  Iniciar a interface de usuário web

# Esta linha é um título em uma célula do Jupyter Notebook, usado para descrever visualmente o que a célula faz.
# Neste caso, indica que esta célula é responsável por lançar a interface de usuário web (web UI).

#@markdown  Se não tiver certeza sobre a branch, escreva "main" ou deixe em branco.

# Esta linha é uma anotação em formato Markdown, que fornece uma instrução ao usuário.
# Sugere que, se o usuário estiver incerto sobre qual branch do repositório Git usar, deve escrever "main" ou deixar em branco.


# Importação das bibliotecas necessárias.
import torch
from pathlib import Path

# Verifica se o diretório atual é 'text-generation-webui'. Se não for, instala a web UI.
if Path.cwd().name != 'text-generation-webui':
  print("Installing the webui...")

  # Clona o repositório do GitHub que contém o código da web UI.
  !git clone https://github.com/oobabooga/text-generation-webui
  %cd text-generation-webui

  # Verifica a versão do PyTorch instalada.
  torver = torch.__version__
  print(f"TORCH: {torver}")
  is_cuda118 = '+cu118' in torver  # Verifica se é a versão com CUDA 11.8.
  is_cuda117 = '+cu117' in torver  # Verifica se é a versão com CUDA 11.7.

  # Lê as dependências necessárias do arquivo 'requirements.txt'.
  textgen_requirements = open('requirements.txt').read().splitlines()
  # Ajusta as dependências com base na versão do CUDA.
  if is_cuda117:
      textgen_requirements = [req.replace('+cu121', '+cu117').replace('+cu122', '+cu117').replace('torch2.1', 'torch2.0') for req in textgen_requirements]
  elif is_cuda118:
      textgen_requirements = [req.replace('+cu121', '+cu118').replace('+cu122', '+cu118') for req in textgen_requirements]
  with open('temp_requirements.txt', 'w') as file:
      file.write('\n'.join(textgen_requirements))

  # Instala as dependências.
  !pip install -r extensions/openai/requirements.txt --upgrade
  !pip install -r temp_requirements.txt --upgrade

  # Exibe mensagens sobre a instalação.
  print("\033[1;32;1m\n --> If you see a warning about \"previously imported packages\", just ignore it.\033[0;37;0m")
  print("\033[1;32;1m\n --> There is no need to restart the runtime.\n\033[0;37;0m")

  # Tenta importar 'flash_attn', se falhar, desinstala.
  try:
    import flash_attn
  except:
    !pip uninstall -y flash_attn

# Define os parâmetros para o modelo.
model_url = "https://huggingface.co/TheBloke/MythoMax-L2-13B-GPTQ" #@param {type:"string"}
branch = "gptq-4bit-32g-actorder_True" #@param {type:"string"}
command_line_flags = "--n-gpu-layers 128 --load-in-4bit --use_double_quant" #@param {type:"string"}
api = True #@param {type:"boolean"}

# Adiciona parâmetros para a API, se necessário.
if api:
  for param in ['--api', '--public-api']:
    if param not in command_line_flags:
      command_line_flags += f" {param}"

# Trata o URL do modelo.
model_url = model_url.strip()
if model_url != "":
    if not model_url.startswith('http'):
        model_url = 'https://huggingface.co/' + model_url

    # Baixa o modelo.
    url_parts = model_url.strip('/').strip().split('/')
    output_folder = f"{url_parts[-2]}_{url_parts[-1]}"
    branch = branch.strip('"\' ')
    if branch.strip() not in ['', 'main']:
        output_folder += f"_{branch}"
        !python download-model.py {model_url} --branch {branch}
    else:
        !python download-model.py {model_url}
else:
    output_folder = ""

# Inicia a interface de usuário web.
cmd = f"python server.py --share"
if output_folder != "":
    cmd += f" --model {output_folder}"
cmd += f" {command_line_flags}"
print(cmd)
!$cmd
