<a href="https://colab.research.google.com/github/camilotmundim/imersao_alura_gemini/blob/main/imersao_alura_gerando_dataset.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

###Instalação da biblioteca Python do Gemini API

In [1]:
!pip install -q -U google-generativeai

###Importação dos pacotes necessários

In [2]:
from google.colab import userdata
import google.generativeai as genai
import pandas as pd

###Autenticação com sua API KEY
Após gerar sua API_KEY no Google AI Studio (https://aistudio.google.com), crie uma Secret com o nome 'GOOGLE_API_KEY' no Colab (ou somente cole o texto dela no parâmetro api_key abaixo).

In [3]:
GOOGLE_API_KEY=userdata.get('GOOGLE_API_KEY')
genai.configure(api_key=GOOGLE_API_KEY)

###Seleção do modelo

Listando os modelos disponíveis.

In [4]:
for m in genai.list_models():
  if 'generateContent' in m.supported_generation_methods:
    print(m.name)

models/gemini-1.0-pro
models/gemini-1.0-pro-001
models/gemini-1.0-pro-latest
models/gemini-1.0-pro-vision-latest
models/gemini-1.5-pro-latest
models/gemini-pro
models/gemini-pro-vision


Configurando os parâmetros do modelo

In [5]:
generation_config = {
  "candidate_count": 1,
  "temperature": 0.5,
}

Instanciando o modelo escolhido, utilizando as configurações personalizadas.

In [6]:
model = genai.GenerativeModel(model_name='gemini-1.0-pro',
                              generation_config=generation_config,
                              )

###Criação do dataset

Prompt para o Gemini criar um dataset, **com dados fictícios**, contendo uma lista de alunos e notas bimestrais dos mesmos.
Esse dataset será utilizado no ChatBot que será criado depois.

In [10]:
response =  model.generate_content("""
  Crie um dicionário de dados  com o seguinte formato:
  [
    "Nome": ["", "", ],
    "1º Bimestre": ["", "",],
    "2º Bimestre": ["", "",],
    "3º Bimestre": ["", "",],
    "4º Bimestre": ["", "",]
]
  No campo Nome, crie 30 nome e sobrenomes fictícios, sem repetir nenhum e nos outros campos escolha aleatoriamente notas, com números decimais, entre 0 e 10.
  É importante que alguns alunos, tenham notas menores que 5.
  A resposta precisa ter exatamente esse formato, para criar um dataframe pandas com ele.
""")
print(response.text)

[
    {
        "Nome": "Aline Souza",
        "1º Bimestre": 9.2,
        "2º Bimestre": 8.5,
        "3º Bimestre": 7.8,
        "4º Bimestre": 9.1
    },
    {
        "Nome": "Bruno Silva",
        "1º Bimestre": 7.5,
        "2º Bimestre": 6.8,
        "3º Bimestre": 5.9,
        "4º Bimestre": 7.2
    },
    {
        "Nome": "Camila Oliveira",
        "1º Bimestre": 8.7,
        "2º Bimestre": 9.4,
        "3º Bimestre": 8.9,
        "4º Bimestre": 9.6
    },
    {
        "Nome": "Daniel Costa",
        "1º Bimestre": 6.3,
        "2º Bimestre": 5.6,
        "3º Bimestre": 4.8,
        "4º Bimestre": 6.1
    },
    {
        "Nome": "Eduardo Santos",
        "1º Bimestre": 9.9,
        "2º Bimestre": 9.2,
        "3º Bimestre": 8.5,
        "4º Bimestre": 9.7
    },
    {
        "Nome": "Fernanda Rodrigues",
        "1º Bimestre": 8.1,
        "2º Bimestre": 7.4,
        "3º Bimestre": 6.7,
        "4º Bimestre": 8.0
    },
    {
        "Nome": "Gabriel Pereira",
        "1º 

Salvando os dados em um arquivo csv.

In [11]:
data = response.text
df = pd.read_json(data, orient='records')
df.to_csv('boletim_alunos.csv', index=False)

Abrindo o arquivo salvo e exibindo os dados

In [12]:
df = pd.read_csv("boletim_alunos.csv")
print(df)

                  Nome  1º Bimestre  2º Bimestre  3º Bimestre  4º Bimestre
0          Aline Souza          9.2          8.5          7.8          9.1
1          Bruno Silva          7.5          6.8          5.9          7.2
2      Camila Oliveira          8.7          9.4          8.9          9.6
3         Daniel Costa          6.3          5.6          4.8          6.1
4       Eduardo Santos          9.9          9.2          8.5          9.7
5   Fernanda Rodrigues          8.1          7.4          6.7          8.0
6      Gabriel Pereira          7.2          6.5          5.8          7.1
7          Helena Melo          9.0          8.3          7.6          8.9
8         Igor Almeida          6.2          5.5          4.7          6.0
9     Jéssica Ferreira          9.8          9.1          8.4          9.6
10         Lucas Souza          7.4          6.7          6.0          7.3
11         Maria Silva          8.6          7.9          7.2          8.5
12     Mateus Oliveira   