<a href="https://colab.research.google.com/github/Yutce/desafio_ETL/blob/main/Desafio_ETL.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **DESAFIO BOOTCAMP SANTANDER CIÊNCIA DE DADOS COM PYTHON**
##**Explorando IA Generativa em um Pipeline de ETL com Python**

Este projeto é desenvolvido como parte do desafío proposto no **Santander Bootcamp 2023 - Ciência de Dados com Python.**

O projeto contempla a Extração, Transformação e Carregamento de dados **(ETL)**

Foi feito seguindo as intruções [do notebook modelo do projeto](https://colab.research.google.com/drive/1SF_Q3AybFPozCcoFBptDSFbMk-6IVGF-?usp=sharing#scrollTo=k5fA5OrXt1a3)


###**O projeto que desenvolvi**:


**Contexto:** Você é um cientista de dados no de uma multinacional que fabrica e vende produtos biologicos para a agricultura e recebeu a tarefa de fazer mais atrativa e inteligente a publicidade dos produtos da marca. Seu objetivo é usar o poder da IA Generativa para criar mensagens de marketing para cada tipo de defensivos agrícolas.


**Condições do Problema:**


1. Você recebeu uma planilha simples, em formato CSV ('DEFA2023.csv'), com uma lista com número de registro dos produtos:

  ```
registroProduto
198
291
317
  ```

2. Seu trabalho é consumir o endpoint `GET https://api.cnptia.embrapa.br/bioinsumos/v1/produtos-biologicos/{id}` (API de Bionsumos) para obter os dados de cada produto.
3. Depois de obter os dados dos produtos, você vai usar a API do ChatGPT (OpenAI) para gerar uma mensagem de marketing específica para cada defensivo agrícola. Essa mensagem deve enfatizar as caraterísticas e vantagens do uso do produto.
4. Uma vez que a mensagem para cada produto esteja pronta, você vai salvar tudo em um arquivo .csv.


In [18]:
# Repositório da API: https://api.cnptia.embrapa.br/bioinsumos/v1
defa2023_api_url = 'https://api.cnptia.embrapa.br/bioinsumos/v1/produtos-biologicos'

## **E**xtract

Vamos a lista de registro de produto a partir do arquivo CSV. Para cada registro de produto, vamos fazer uma requisição GET para obter os dados do defensivo agrícola correspondente.

In [3]:
import pandas as pd

df = pd.read_csv('DEFA2023.csv')
registro_Produtos = df['registroProduto'].tolist()
print(registro_Produtos)

[198, 291, 317]


In [7]:
import requests
import json


def get_produto(registroProduto):
  AGROAPI_Bearer = 'Authorization: Bearer 54626282-4b32-3e9b-9bf9-365a56189173'
  url = (f'https://api.cnptia.embrapa.br/bioinsumos/v1/produtos-biologicos/{registroProduto}')
  headers = {'Authorization': 'Bearer{}'.format(AGROAPI_Bearer)}
  response = requests.get(url=url, headers=headers)
  return response.json() if response.status_code == 200 else None

produtos = [produto for registroProduto in registro_Produtos if (produto := get_produto(registroProduto)) is not None]
print(json.dumps(produtos, indent=2))



[
  {
    "data": {
      "registroProduto": 198,
      "marcaComercial": "Lasitrap",
      "titularRegistro": "Tecnocell Agroflorestal",
      "ingredienteAtivo": "serricornim (cetona alif\u00e1tica) (240 g/kg)",
      "classes": [
        "Ferom\u00f4nio"
      ],
      "pragas": [
        {
          "cultura": "Fumo",
          "nomeCientifico": "Lasioderma serricorne",
          "nomeComum": [
            "Bicho-do-fumo",
            "Carruncho-do-fumo"
          ]
        }
      ],
      "aprovadoParaAgriculturaOrganica": false,
      "classificacaoToxicologica": "Pouco T\u00f3xico",
      "classificacaoAmbiental": "Produto Pouco Perigoso ao Meio Ambiente",
      "url": "https://agrofit.agricultura.gov.br/agrofit_cons/!ap_produto_form_detalhe_cons?p_id_produto=&p_nm_marca_comercial=&p_id_registrante_empresa=&p_id_ingrediente_ativo=&p_nm_comum_portugues=&p_id_tecnica_aplicacao=&p_id_classe=&p_nr_registro=198&p_id_classificacao_tox=&p_id_classificacao_amb=&p_tipo_aplicacao=C&p_id_

## **T**ransform

Nesta etapa usei a API do OpenAI GPT-4 para gerar uma mensagem de marketing apontando as vantagens de cada produto

In [9]:
!pip install openai

Collecting openai
  Downloading openai-0.28.1-py3-none-any.whl (76 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/77.0 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m77.0/77.0 kB[0m [31m2.6 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: openai
Successfully installed openai-0.28.1


In [6]:
#API Key da OpenAI
openai_api_key = 'inserir Key'

In [59]:
import openai

openai.api_key = openai_api_key


def generate_descricao(produto):
  completion = openai.ChatCompletion.create(
  model="gpt-3.5-turbo",
  messages=[
    {"role": "system", "content": "Você é um especialista em defesivos agrícolas."},
    {"role": "user", "content": f"Crie uma mensagem simples em português para incentivar a venda e uso de cada defesivo agrícola {produto['data']} (máximo de 100 caracteres sem incluir url)"}
  ]
)
  #print(completion.choices[0].message.content.strip('\"'))
  return completion.choices[0].message.content.strip('\"')

for produto in produtos:
  mensagem = generate_descricao(produto)
  print(mensagem)
  produto ["mensagem"]= mensagem


Proteja suas plantações com Lasitrap! Produto eficaz contra o Bicho-do-fumo. Compre agora!
Proteja suas culturas contra pragas! Use Dipel, o inseticida microbiológico eficaz contra o Curuquerê, Lagarta-desfolhadora, Lagarta-das-palmeiras, Mariposa do álamo e muitas outras pragas. Agricultura mais segura e produtiva com Dipel. Compre agora!
Proteja suas plantas contra nematóides! Experimente Quartzo e Surface.


## **L**oad

Agora vamos a salvar em um novo arquivo csv a descrição gerada para incentivar a venda de cada defesivo agrícola.

In [61]:
# Salvando as mensagens em um arquivo CSV

print(produtos)
dados = pd.DataFrame(data= produtos)
dados.to_csv("mensagem_produtos.csv")


[{'data': {'registroProduto': 198, 'marcaComercial': 'Lasitrap', 'titularRegistro': 'Tecnocell Agroflorestal', 'ingredienteAtivo': 'serricornim (cetona alifática) (240 g/kg)', 'classes': ['Feromônio'], 'pragas': [{'cultura': 'Fumo', 'nomeCientifico': 'Lasioderma serricorne', 'nomeComum': ['Bicho-do-fumo', 'Carruncho-do-fumo']}], 'aprovadoParaAgriculturaOrganica': False, 'classificacaoToxicologica': 'Pouco Tóxico', 'classificacaoAmbiental': 'Produto Pouco Perigoso ao Meio Ambiente', 'url': 'https://agrofit.agricultura.gov.br/agrofit_cons/!ap_produto_form_detalhe_cons?p_id_produto=&p_nm_marca_comercial=&p_id_registrante_empresa=&p_id_ingrediente_ativo=&p_nm_comum_portugues=&p_id_tecnica_aplicacao=&p_id_classe=&p_nr_registro=198&p_id_classificacao_tox=&p_id_classificacao_amb=&p_tipo_aplicacao=C&p_id_cultura=&p_id_praga_inseto=&p_id_cultura_planta=&p_id_planta_daninha=&p_id_cultura_praga=&p_id_cultura_inseto=&p_id_praga=&p_nm_sort=nm_marca_comercial&p_linha_inicial=0&p_id_produto_formulado