## Executando Consultas SQL em Databricks

In [None]:
%sql
select * from carros

Este comando SQL é executado diretamente no contexto do Databricks para visualizar o conteúdo da tabela carros. O uso de %sql permite a execução de consultas SQL nativas dentro do notebook.

### Salvando Dados no Formato Delta

In [None]:
from pyspark.sql.functions import col, when
carros_df = spark.table("carros")
carros_df.write.format("delta").save("/tmp/carros_delta")

Aqui, carregamos uma tabela chamada carros em um DataFrame e então salvamos esse DataFrame no formato Delta no caminho especificado. O formato Delta é um formato de armazenamento otimizado para grandes conjuntos de dados, que suporta operações de ACID para transações em big data.

### Visualizando Diretórios de Arquivos Delta

In [None]:
%fs ls /tmp/carros_delta

Este comando lista os arquivos dentro do diretório especificado onde os dados foram salvos no formato Delta. É útil para verificar a estrutura de diretório e os arquivos de metadados criados pelo Delta Lake.

### Carregando e Visualizando Dados Delta

In [None]:
delta_df = spark.read.format("delta").load("/tmp/carros_delta")
delta_df.show()

Carregamos os dados salvos em formato Delta de volta para um DataFrame e usamos o método show() para visualizar os dados, demonstrando a facilidade com que os dados podem ser acessados e verificados.

### Atualizando Dados em um DataFrame Delta

In [None]:
#atualiza tipo de motor
delta_df = delta_df.withColumn('TipoMotor',when(col('TipoMotor') == 0, 2).otherwise(col('TipoMotor')))

In [None]:
#grava, carrega e exibe
delta_df.write.format("delta").mode("overwrite").save("/tmp/carros_delta")
updated_delta_df = spark.read.format("delta").load("/tmp/carros_delta")
updated_delta_df.show()

Este bloco de código atualiza a coluna TipoMotor no DataFrame, substituindo valores 0 por 2. Em seguida, os dados atualizados são salvos no mesmo local, substituindo os dados anteriores. Demonstramos como carregar e visualizar os dados atualizados.

### Executando Rollback em Dados Delta

In [None]:
#rollback da tabela
version0_df = spark.read.format("delta").option("versionAsOf", 0).load("/tmp/carros_delta")
version0_df.show()

Aqui, fazemos um rollback para a versão inicial da tabela Delta usando a opção versionAsOf. Isso é extremamente útil para casos onde se deseja reverter para um estado anterior dos dados.

### Visualizando Versão Atual Após Rollback

In [None]:
#versao atual continua
updated_delta_df.show()

### Apagando Dados Delta

In [None]:
#apaga delta
dbutils.fs.rm("/tmp/carros_delta", recurse=True)

Este comando apaga o diretório e todos os arquivos associados aos dados Delta, limpando o espaço e removendo dados que não são mais necessários. É importante para a gestão eficiente do armazenamento.