# Explorando IA Generativa em um Pipeline de ETL com Python

Este notebook foi desenvolvido com fins didáticos, como parte do Santander Bootcamp 2023 - Ciência de Dados com Python.

O objetivo é executar um processo de extração, transformação e carregamento de dados, explorando APIs e inteligência artificial.

Os dados serão extraídos da API [BGG XML API2](https://boardgamegeek.com/wiki/page/BGG_XML_API2#toc8), que acessa a base de dados do portal Board Game Geek, que é um repositório de jogos de tabuleiro. Aqui, será acessada a coleção de jogos que um usuário (essa que vos fala) possui.

A etapa de transformação será o acesso à API da OpenAI para trazer um resumo sobre cada jogo.

Em seguida, o carregamento será para salvar esse resumo em um dicionário.



## Importando pacotes


In [None]:
## Executar apenas se for necessário instalar pacotes
#!pip install lxml
#!pip install xmltodict

In [1]:
from xml.etree import ElementTree

import openai
import requests
import urllib
import xmltodict

## Extração: Acessando a API BGG XML API2

In [10]:
# Função para buscar os dados de um usuário
def get_user(username):
    response = requests.get(f'https://boardgamegeek.com/xmlapi2/collection?parameters&username={username}')
    return response if response.status_code == 200 else None

In [11]:
# Busca os dados do usuário andrezalook
response = get_user("andrezalook")

In [12]:
# Lê o resultado XML e transforma em dicionário
tree = ElementTree.fromstring(response.content)
dict_data = xmltodict.parse(response.content)

In [13]:
# Verifica a estrutura dos dados
dict_data

{'items': {'@totalitems': '11',
  '@termsofuse': 'https://boardgamegeek.com/xmlapi/termsofuse',
  '@pubdate': 'Sun, 10 Sep 2023 17:38:33 +0000',
  'item': [{'@objecttype': 'thing',
    '@objectid': '172308',
    '@subtype': 'boardgame',
    '@collid': '102023838',
    'name': {'@sortindex': '1', '#text': 'Broom Service'},
    'yearpublished': '2015',
    'image': 'https://cf.geekdo-images.com/PcxTKtTwov2vxkZZbRVDAw__original/img/kjg4hSkTE2a8MKlkZNgTGqfKqgc=/0x0/filters:format(jpeg)/pic2546156.jpg',
    'thumbnail': 'https://cf.geekdo-images.com/PcxTKtTwov2vxkZZbRVDAw__thumb/img/exJUDw66ox4k5H5dSX_oAOuRNXk=/fit-in/200x150/filters:strip_icc()/pic2546156.jpg',
    'status': {'@own': '1',
     '@prevowned': '0',
     '@fortrade': '0',
     '@want': '0',
     '@wanttoplay': '0',
     '@wanttobuy': '0',
     '@wishlist': '0',
     '@preordered': '0',
     '@lastmodified': '2023-01-08 11:19:37'},
    'numplays': '1'},
   {'@objecttype': 'thing',
    '@objectid': '216132',
    '@subtype': 'boa

In [16]:
# Salva os nomes dos jogos em uma lista
lista_jogos = []
for item in dict_data.get("items").get("item"):
    lista_jogos.append(item.get("name").get('#text'))
lista_jogos

['Broom Service',
 'Clans of Caledonia',
 'Galaxy Trucker',
 'Isle of Skye: From Chieftain to King',
 'The Red Cathedral',
 'Sprawlopolis',
 'Terra Mystica',
 'Terra Mystica',
 'Terra Mystica: Fire & Ice',
 'Terra Mystica: Merchants of the Seas',
 "Tzolk'in: The Mayan Calendar"]

## Transformação: Acessando a API OpenAI

In [18]:
# API Key
OPENAI_API_KEY = "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" # Substituir a API Key para executar

In [19]:
# Define função para criar os resumos
openai.api_key = OPENAI_API_KEY

def generate_game_abstract(jogo):
    completion = openai.ChatCompletion.create(
        model="gpt-3.5-turbo",
        messages=[
        {
            "role": "system",
            "content": "Você é um especialista em jogos de tabuleiro modernos."
        },
        {
            "role": "user",
            "content": f"Crie um resumo para o jogo de tabuleiro {jogo} (máximo de 500 caracteres)"
        }
        ]
    )
    return completion.choices[0].message.content.strip('\"')


In [23]:
# Aplica a função e salva no mesmo dicionário
# A lista foi reduzida para o tamanho 3 devido à limitação de acesso gratuito à API OpenAI com modelo gpt-3.5-turbo
for i,jogo in enumerate(lista_jogos[0:3]):
    game_abstract = generate_game_abstract(jogo)
    dict_data.get("items").get("item")[i]["Resumo"] = game_abstract

In [25]:
dict_data.get("items").get("item")[0:3]

[{'@objecttype': 'thing',
  '@objectid': '172308',
  '@subtype': 'boardgame',
  '@collid': '102023838',
  'name': {'@sortindex': '1', '#text': 'Broom Service'},
  'yearpublished': '2015',
  'image': 'https://cf.geekdo-images.com/PcxTKtTwov2vxkZZbRVDAw__original/img/kjg4hSkTE2a8MKlkZNgTGqfKqgc=/0x0/filters:format(jpeg)/pic2546156.jpg',
  'thumbnail': 'https://cf.geekdo-images.com/PcxTKtTwov2vxkZZbRVDAw__thumb/img/exJUDw66ox4k5H5dSX_oAOuRNXk=/fit-in/200x150/filters:strip_icc()/pic2546156.jpg',
  'status': {'@own': '1',
   '@prevowned': '0',
   '@fortrade': '0',
   '@want': '0',
   '@wanttoplay': '0',
   '@wanttobuy': '0',
   '@wishlist': '0',
   '@preordered': '0',
   '@lastmodified': '2023-01-08 11:19:37'},
  'numplays': '1',
  'Resumo': 'Broom Service é um jogo de tabuleiro estratégico baseado em cartas onde os jogadores assumem o papel de bruxas e druidas tentando entregar poções em diferentes locações. Cada jogador terá um conjunto de cartas com ações únicas que podem ser usadas para