#Desafio 01

1. Criar um arquivo txt a partir de uma lista de perguntas vindas de um alista em python;
2. Ler as perguntas desse arquivo e salvá-las em uma lista em python;
3. Obter respostas de uma LLM para cada uma;
4. Salvar os resultados em um novo arquivo csv;
5. Ler o arquivo csv usando o pandas.

In [None]:
#Criando a lista de perguntas

lista_de_perguntas = [
    "De que é feito o Sol?",
    "De que é feito o planeta Saturno?",
    "Qual é a galáxia mais antiga já encontrada?",
    "Qual é a maior estrela já encontrada?",
    "Qual é a estrela mais próxima do Sol?"
]

In [None]:
# Criando txt

with open('lista_perguntas.txt', 'w', encoding = 'utf-8') as perguntas:
  for pergunta in lista_de_perguntas:
    perguntas.write(f'{pergunta}\n')

In [None]:
# Lendo o arquivo txt
leitura_perguntas = []

with open('lista_perguntas.txt', 'r', encoding = 'utf-8') as perguntas:
  leitura_perguntas = perguntas.readlines()

print(leitura_perguntas)

['De que é feito o Sol?\n', 'De que é feito o planeta Saturno?\n', 'Qual é a galáxia mais antiga já encontrada?\n', 'Qual é a maior estrela já encontrada?\n', 'Qual é a estrela mais próxima do Sol?\n']


In [None]:
# Importar e aplicar a LLM
# Instalar o Groq

!pip install -q groq


In [None]:
from google.colab import userdata
import os

os.environ['GROQ_API_KEY'] = userdata.get('GROQ_API_KEY')

In [None]:
from groq import Groq

client = Groq()
completion = client.chat.completions.create(
    model="openai/gpt-oss-20b",
    messages=[
      {
        "role": "user",
        "content": "De que é feito o Sol?"
      },

      {
          "role": "user",
          "content": "De que é feito o planeta Saturno?"
      },

      {
        "role": "user",
        "content": "Qual é a galáxia mais antiga já encontrada?"
      },

      {
        "role": "user",
        "content": "Qual é a maior estrela já encontrada?"
      },

      {
        "role": "user",
        "content": "Qual é a estrela mais próxima do Sol?"
      }

    ],
    temperature=1,
    max_completion_tokens=8192,
    top_p=1,
    reasoning_effort="medium",
    stream=True,
    stop=None
)

resposta_final = '' #Acrescentando este trecho pra poder salvar um csv
for chunk in completion:
    resposta_final += chunk.choices[0].delta.content or ""
print(resposta_final)

**1. De que é feito o Sol?**  
- **Geralmente**:  ≈ 74 % de hidrogênio, ≈ 24 % de hélio.  
- **Restante**: ~2 % de “metais” (todos os elementos mais pesados que o hélio).  
- A maior parte da energia que o Sol emite vem de fusão nuclear de hidrogênio → hélio no seu núcleo.

---

**2. De que é feito o planeta Saturno?**  
- **Gigante gasoso**: composto majoritariamente por hidrogênio (≈ 96 %) e hélio (≈ 3 %).  
- **Camadas externas**: nuvens de amônia, nitrogênio e água (em diferentes estados).  
- **Interior**: um “corpo sólido” de rochas e ices (água, amônia, metano) rodeado por uma camada de hidrogênio líquido/solido.  
- Não há uma crosta sólida como na Terra; tudo está em estado de gás ou líquido sob alta pressão.

---

**3. Qual é a galáxia mais antiga já encontrada?**  
- A galáxia de maior **redshift** conhecida (ou seja, a mais distante e mais antiga) é **GN‑z11** (ou **MACS 1149‑JD1** conforme novas descobertas com o JWST).  
- Estes objetos estão a cerca de **13,4–13,5 bilhõe

In [None]:
# Criando um CSV com as respostas

import csv

In [None]:
perguntas_respostas = 'perguntas_respostas.csv'

with open(perguntas_respostas, 'w', newline='', encoding = 'utf-8') as arquivo:
  writer = csv.writer(arquivo)
  writer.writerow(['Pergunta', 'Resposta'])
  perguntas_string = '\n'
  writer.writerow([perguntas_string, resposta_final.strip()])
print(perguntas_respostas)

perguntas_respostas.csv


In [None]:
#Importando Pandas

import pandas as pd

In [None]:
pd.read_csv('perguntas_respostas.csv')

Unnamed: 0,Pergunta,Resposta
0,\n,**1. De que é feito o Sol?** \n- **Geralmente...


Busquei ajuda no Gemini para criar esta parte do csv, ele me deu uma alternativa melhor de colocar as peguntas, mas mesmo assim acabei não assimilando muito bem. O final não ficou como eu esperava, as perguntas e respostas acabaram ficando como um só.

#Correção

In [1]:
lista_de_perguntas = [
    "De que é feito o Sol?",
    "De que é feito o planeta Saturno?",
    "Qual é a galáxia mais antiga já encontrada?",
    "Qual é a maior estrela já encontrada?",
    "Qual é a estrela mais próxima do Sol?"
]

In [2]:
with open('perguntas.txt', 'w', encoding = 'utf-8') as arquivo:
  for pergunta in lista_de_perguntas:
    arquivo.write(pergunta + '\n')

In [4]:
lista_desafio = []
with open('perguntas.txt', 'r', encoding = 'utf-8') as arquivo:
  for linha in arquivo:
    lista_desafio.append(linha.strip())

In [5]:
print(lista_desafio)

['De que é feito o Sol?', 'De que é feito o planeta Saturno?', 'Qual é a galáxia mais antiga já encontrada?', 'Qual é a maior estrela já encontrada?', 'Qual é a estrela mais próxima do Sol?']


In [8]:
import os
from google.colab import userdata

os.environ['google_api_key'] = userdata.get('gemini_api_key')

In [9]:
from google import genai
import os

api_key = os.environ.get('google_api_key')
client = genai.Client(api_key=api_key)

In [10]:
lista_de_dicionarios_de_respostas = []

In [12]:
for pergunta in lista_desafio:
  resposta = client.models.generate_content(
      model = 'gemini-2.5-flash',
      contents = f'Gere uma resposta muito sucinta para a pergunta: {pergunta}'
  )
  lista_de_dicionarios_de_respostas.append({'pergunta': pergunta, 'resposta': resposta.text})

In [13]:
with open('respostas1.csv', 'w', encoding = 'utf-8') as arquivo:
    arquivo.write('pergunta,resposta\n')
    for pergunta_dict in lista_de_dicionarios_de_respostas:
        arquivo.write(f'{pergunta_dict["pergunta"]}, {pergunta_dict["resposta"]}\n')

In [14]:
import pandas as pd

In [16]:
df_perguntas_e_respostas = pd.DataFrame(lista_de_dicionarios_de_respostas)
df_perguntas_e_respostas

Unnamed: 0,pergunta,resposta
0,De que é feito o Sol?,Hidrogênio e hélio.
1,De que é feito o planeta Saturno?,"Gás, principalmente hidrogênio e hélio."
2,Qual é a galáxia mais antiga já encontrada?,"Atualmente, JADES-GS-z13-0."
3,Qual é a maior estrela já encontrada?,UY Scuti.
4,Qual é a estrela mais próxima do Sol?,Alfa Centauri.


In [17]:
df_perguntas_e_respostas.to_csv('resposta2.csv', index = False, encoding = 'utf-8')

In [18]:
novo_df = pd.read_csv('resposta2.csv')
novo_df

Unnamed: 0,pergunta,resposta
0,De que é feito o Sol?,Hidrogênio e hélio.
1,De que é feito o planeta Saturno?,"Gás, principalmente hidrogênio e hélio."
2,Qual é a galáxia mais antiga já encontrada?,"Atualmente, JADES-GS-z13-0."
3,Qual é a maior estrela já encontrada?,UY Scuti.
4,Qual é a estrela mais próxima do Sol?,Alfa Centauri.
