In [5]:
import pandas as pd
import time
import os
import json
from google import genai
from google.genai import types
from dotenv import load_dotenv

In [3]:
load_dotenv()
client = genai.Client(api_key=os.getenv("api_key"))

In [44]:
df = pd.read_excel("source data/database cbo.xlsx", sheet_name = 0)

In [None]:
for idx, row in df.iterrows():
    linha_atual = idx + 1
    print(f"üîé Processando linha {linha_atual} de {len(df)}")

    cbo = row["cbo"]
    group = row["task_group"]
    task = row["task"]
    tarefa_texto = f"{group}: {task}"
    description = row["description"]
    key = row["key"]

    prompt_usuario = f"""
Voc√™ √© um especialista em an√°lise ocupacional e economia do trabalho, com profundo conhecimento da Classifica√ß√£o Brasileira de Ocupa√ß√µes (CBO) e do impacto de tecnologias emergentes no mundo do trabalho.

Sua tarefa √© avaliar a seguinte tarefa: {tarefa_texto} de id {key}, pertencente √† ocupa√ß√£o {description}, com base em um framework que considera tr√™s tecnologias espec√≠ficas: IA generativa (como Large Language Models), Vis√£o Computacional e Rob√≥tica para a√ß√µes f√≠sicas.

Com base nisso, gere os tr√™s indicadores:

Taxa de Substitui√ß√£o (TR): avalie o potencial de substitui√ß√£o da tarefa {tarefa_texto} da ocupa√ß√£o {description} por tecnologias de IA (IA generativa, vis√£o computacional ou rob√≥tica) em uma escala de 1 a 5, onde 1 representa tarefas quase imposs√≠veis de substituir por IA (exigindo habilidades humanas n√£o sintetiz√°veis, como empatia genu√≠na ou julgamento √©tico complexo), e 5 indica tarefas totalmente substitu√≠veis (como processamento de dados estruturados ou a√ß√µes repetitivas), facilmente substitu√≠veis com as tecnologias atuais. Inclua uma justificativa breve para o valor atribu√≠do.

Exemplo TR para 'Atendimento ao cliente padr√£o':
4 - LLMs podem resolver 80% das consultas rotineiras, mas falham em conflitos emocionais complexos
---

Taxa de Exposi√ß√£o (TE): avalie em uma escala de 1 a 5 o grau em que a tarefa {tarefa_texto} da ocupa√ß√£o {description} est√° exposta ou mediada pelas tecnologias mencionadas, considerando o quanto sua execu√ß√£o atual ou potencial pode depender, ser assistida ou aprimorada por essas ferramentas. Inclua uma justificativa breve para o valor atribu√≠do.

Exemplo TE para 'Atendimento ao cliente padr√£o':
5 - A tarefa est√° altamente exposta a tecnologias de IA generativa, sendo frequentemente mediada por chatbots e assistentes virtuais

---

Dummy de Automa√ß√£o Total: indique com 1 se a tarefa {tarefa_texto} da ocupa√ß√£o {description} pode ser totalmente automatizada pelas tecnologias avaliadas, sem necessidade de supervis√£o humana significativa; e com 0 se ainda requer interven√ß√£o humana por limita√ß√µes tecnol√≥gicas ou pela natureza da tarefa. Inclua uma justificativa breve para a decis√£o.

Exemplo Dummy para 'Atendimento ao cliente padr√£o':
1 - A automa√ß√£o total √© poss√≠vel para a maioria das intera√ß√µes padr√£o, sem necessidade significativa de supervis√£o humana, pois casos complexos s√£o exce√ß√µes

---
### *FORMATO DA RESPOSTA*

Gere um JSON com a an√°lise para cada uma das tarefas fornecidas. A resposta deve ser *apenas o objeto JSON*, sem nenhum texto introdut√≥rio ou explica√ß√µes adicionais.

[
  {{
    "key": id_tarefa #somente o id,
    "TE": <numero_de_1_a_5>,
    "justificativa_TE": "<texto_breve_e_objetivo>",
    "TR": <numero_de_1_a_5>,
    "justificativa_TR": "<texto_breve_e_objetivo>",
    "dummy": <0_ou_1>
  }}
]
"""

    try:
        tempo_inicio = time.time()

        response = client.models.generate_content(
            model="gemini-2.0-flash",
            contents=prompt_usuario,
        )
        resposta = response.text
        resposta = resposta.replace("```json", "").replace("```", "")
        tempo_fim = time.time()
        duracao = tempo_fim - tempo_inicio
        print(f"{key} processado em {duracao:.2f} segundos")

        arquivo_saida = os.path.join("json/te_google3", f"{key}.json")
        with open(arquivo_saida, "w", encoding="utf-8") as f:
            json.dump(json.loads(resposta), f, ensure_ascii=False, indent=4)

    except Exception as e:
        print(f"Erro ao processar {key} - {linha_atual}: {e}")

In [6]:
all_json = []
arquivos_com_erro = []

pasta = "json/te_tr"

for nome_arquivo in os.listdir(pasta):
    if nome_arquivo.endswith(".json"):
        caminho_arquivo = os.path.join(pasta, nome_arquivo)
        try:
            with open(caminho_arquivo, "r", encoding="utf-8") as f:
                conteudo = f.read().strip()
                if not conteudo:
                    raise ValueError("Arquivo vazio")
                dados = json.loads(conteudo)
                if isinstance(dados, list):
                    all_json.extend(dados)
                else:
                    all_json.append(dados)
        except Exception as e:
            print(f"Erro no arquivo '{nome_arquivo}': {e}")
            arquivos_com_erro.append(caminho_arquivo)


for caminho in arquivos_com_erro:
    try:
        os.remove(caminho)
        print(f"Arquivo deletado: {os.path.basename(caminho)}")
    except Exception as e:
        print(f"Erro ao deletar {os.path.basename(caminho)}: {e}")


with open("json/te_tr.json", "w", encoding="utf-8") as f:
    json.dump(all_json, f, ensure_ascii=False, indent=2)

In [7]:
with open("json/te_tr.json", "r", encoding="utf-8") as f:
    data = json.load(f)

df = pd.DataFrame(data)

df.to_excel("results/te_tr.xlsx", index=False)