<a id="summ"></a>
## Aplicando diferentes engines no watsonx.data através via watsonx.ai

Instalação das bibliotecas necessárias

In [None]:
! pip install presto-python-client | tail -1

In [None]:
import prestodb
import pandas as pd

## Conexão

### Configuração das credenciais

Todas as credencias definidas nas próximas células podem ser capturadas dentro do watsonx.data selecionando a engine desejada e no Cloud Object Storage de origem, dentro de Service Credentials.

Esta célula define as credenciais para acessar o watsonx.data. As credenciais incluem:

- wxd_hms_endpoint: o endpoint do serviço watsonx.data

- wxd_hms_username: o nome de usuário para acessar o watsonx.data

- wxd_hms_password: a senha para acessar o watsonx.data

- source_bucket_endpoint: o endpoint do bucket de armazenamento de dados

- source_bucket_access_key: a chave de acesso para o bucket de armazenamento de dados

- source_bucket_secret_key: a chave secreta para o bucket de armazenamento de dados

In [None]:
wxd_presto_java_host = "abcde123-ab12-3456-a78b-ab123c45de6f.abcdefgh0ij2kl3nopq4.lakehouse.appdomain.cloud"
wxd_presto_java_port = 12345
wxd_presto_username = wxd_hms_username
wxd_presto_password = wxd_hms_password

Esta célula estabelece uma conexão com o Presto Java utilizando a biblioteca prestodb.dbapi.
Os parâmetros utilizados são:
- host: o endereço do host do Presto Java

- port: a porta utilizada pelo Presto Java

- user: o nome de usuário para autenticação

- catalog: o catálogo de dados a ser utilizado

- http_scheme: o esquema de protocolo HTTP a ser utilizado (neste caso, https)

- auth: a autenticação a ser utilizada (neste caso, autenticação básica com nome de usuário e senha)

In [None]:
conn_prestojava =prestodb.dbapi.connect(
    host=wxd_presto_java_host,
    port=wxd_presto_java_port,
    user='ibmlhapikey',
    catalog='catalogo_destino',
    http_scheme='https',
    auth=prestodb.auth.BasicAuthentication('ibmlhapikey',wxd_presto_password)
)

Nesta célula, vamos executar uma consulta no Presto Java para recuperar os dados da tabela "cadastro" no catálogo "teste_silver".

A consulta será executada utilizando a função read_sql_query da biblioteca pandas e o resultado será armazenado no dataframe df_presto_java.

Além disso, vamos medir o tempo de execução da consulta para avaliar o desempenho do Presto Java.

In [None]:
start_time = time.time()

df_presto_java = pd.read_sql_query("""
SELECT 
  *
FROM
  teste_silver.cadastro
""", conn_prestojava)

time_presto_java = time.time() - start_time

df_presto_java.head()

# Utilizando o Presto C++

Esta célula estabelece uma conexão com o Presto C++ utilizando a biblioteca prestodb.dbapi.
Os parâmetros utilizados são:
- host: o endereço do host do Presto C++

- port: a porta utilizada pelo Presto C++

- user: o nome de usuário para autenticação

- catalog: o catálogo de dados a ser utilizado

- http_scheme: o esquema de protocolo HTTP a ser utilizado (neste caso, https)

- auth: a autenticação a ser utilizada (neste caso, autenticação básica com nome de usuário e senha)

In [None]:
wxd_presto_cpp_host = "abcde123-ab12-3456-a78b-ab123c45de6f.abcdefgh0ij2kl3nopq4.lakehouse.appdomain.cloud"
wxd_presto_cpp_port = 12345

De forma similar com a conexão do Presto Java, passamos as credenciais correspondentes ao Presto C++ para realizar a conexão.

In [None]:
conn_prestocpp =prestodb.dbapi.connect(
    host=wxd_presto_cpp_host,
    port=wxd_presto_cpp_port,
    user='ibmlhapikey',
    catalog='catalogo_destino',
    http_scheme='https',
    auth=prestodb.auth.BasicAuthentication('ibmlhapikey',wxd_presto_password)
)

Na célula abaixo, estamos executando uma consulta em Presto C++ para recuperar dados do lakehouse e medindo o tempo de execução da consulta.

In [None]:
start_time = time.time()

df_presto_c = pd.read_sql_query("""
SELECT 
  *
FROM
  teste_silver.cadastro
""", conn_prestocpp)

time_presto_c = time.time() - start_time

df_presto_c.head()