# Databricks - SQL para Iniciante

## Carregando Dados

In [0]:
from pyspark import SparkFiles
from pyspark.sql import SparkSession
import pandas as pd

spark = SparkSession.builder.appName("Vendas_Carros_Usados").getOrCreate()

In [0]:
def dfGerador(url):
    filename = url.split('/')[url.count('/')]
    spark.sparkContext.addFile(url)
    df = spark.read.format("csv") \
              .option("sep", ",")\
              .option("header", "true")\
              .option("inferSchema", "true") \
              .csv("file://" + SparkFiles.get(filename))
    return df

In [0]:
url = 'https://raw.githubusercontent.com/italomarcelogit/pandas-top-queries-beginners/main/dataset_veiculos_usados.csv'
df = dfGerador(url)

In [0]:
df.show(5)

+-------------+--------------------+-------------------+---------------+----------------+-----------------+--------------------+--------------+----------------+-------------------+--------------------+-----------+-----------------+-------------+
|DATA DA VENDA|    NOME DO VENDEDOR|    NOME DO CLIENTE|SEXO DO CLIENTE|IDADE DO CLIENTE|CIDADE DO CLIENTE|             VEÍCULO|ANO DO VEÍCULO|MARCA DO VEÍCULO|  MODELO DO VEÍCULO|CATEGORIA DO VEÍCULO|VALOR BRUTO|VALOR DO DESCONTO|VALOR LIQUIDO|
+-------------+--------------------+-------------------+---------------+----------------+-----------------+--------------------+--------------+----------------+-------------------+--------------------+-----------+-----------------+-------------+
|   2021-01-03|       Juliana Jesus|      Augusto Pires|              M|              30|  Alves do Amparo|     FIAT 500 Abarth|          2019|            FIAT|         500 Abarth|           Hatchback|      10357|              931|         9426|
|   2021-01-04| 

In [0]:
# criando tabela temporaria de vendas (todos os dados)
df.createOrReplaceTempView('vendas')


In [0]:
# criando tabela temporária somente com os nomes únicos dos vendedores
from pyspark.sql.functions import lit
temp = df.select('NOME DO VENDEDOR').distinct()
temp = temp.withColumnRenamed('NOME DO VENDEDOR', 'NOME')
temp.withColumn("TIPO", lit("VENDEDOR")).createOrReplaceTempView('vendedores')

In [0]:
# criando tabela temporária somente com os nomes únicos dos clientes
temp = df.select('NOME DO CLIENTE').distinct()
temp = temp.withColumnRenamed('NOME DO CLIENTE', 'NOME')
temp.withColumn("TIPO", lit("CLIENTE")).createOrReplaceTempView('clientes')

## Comandos SQL

In [0]:
%sql
--  retornando todas as colunas
select * from vendas

DATA DA VENDA,NOME DO VENDEDOR,NOME DO CLIENTE,SEXO DO CLIENTE,IDADE DO CLIENTE,CIDADE DO CLIENTE,VEÍCULO,ANO DO VEÍCULO,MARCA DO VEÍCULO,MODELO DO VEÍCULO,CATEGORIA DO VEÍCULO,VALOR BRUTO,VALOR DO DESCONTO,VALOR LIQUIDO
2021-01-03,Juliana Jesus,Augusto Pires,M,30,Alves do Amparo,FIAT 500 Abarth,2019,FIAT,500 Abarth,Hatchback,10357,931,9426
2021-01-04,Sophie Peixoto,Davi Lucca Silveira,M,35,Costa,Freightliner Sprinter 3500 Cargo,2018,Freightliner,Sprinter 3500 Cargo,Van/Minivan,8920,868,8052
2021-01-04,Vitor Gabriel Castro,Ian Novaes,M,79,Pinto,Saab 3-Sep,2004,Saab,3-Sep,"Sedan, Convertible",12683,49,12634
2021-01-04,Sophie Peixoto,Augusto Ribeiro,M,23,Santos,Land Rover Range Rover Sport,2011,Land Rover,Range Rover Sport,SUV,11766,814,10952
2021-01-04,Sophie Peixoto,Alice Pires,F,48,Barros,Acura TL,1999,Acura,TL,Sedan,10715,397,10318
2021-01-06,Beatriz Gomes,Leandro Vieira,M,66,da Cunha,Toyota Sienna,2004,Toyota,Sienna,Van/Minivan,11460,692,10768
2021-01-07,Isabella da Rosa,Dra. Evelyn Dias,F,31,da Mota do Campo,Volvo S60,2007,Volvo,S60,Sedan,10470,444,10026
2021-01-08,Beatriz Gomes,Srta. Beatriz Campos,F,72,das Neves das Flores,Toyota Prius c,2015,Toyota,Prius c,Hatchback,9991,571,9420
2021-01-08,Francisco Silva,Dr. Luiz Otávio Campos,M,63,Barbosa,Ford Club Wagon,1993,Ford,Club Wagon,Van/Minivan,10942,816,10126
2021-01-08,Yasmin Fernandes,Olivia Jesus,F,48,Sales da Mata,Jeep Grand Cherokee,1996,Jeep,Grand Cherokee,SUV,8955,998,7957


In [0]:
%sql
--  retornando dados de certas colunas
select `NOME DO VENDEDOR`, `NOME DO CLIENTE` from vendas

NOME DO VENDEDOR,NOME DO CLIENTE
Juliana Jesus,Augusto Pires
Sophie Peixoto,Davi Lucca Silveira
Vitor Gabriel Castro,Ian Novaes
Sophie Peixoto,Augusto Ribeiro
Sophie Peixoto,Alice Pires
Beatriz Gomes,Leandro Vieira
Isabella da Rosa,Dra. Evelyn Dias
Beatriz Gomes,Srta. Beatriz Campos
Francisco Silva,Dr. Luiz Otávio Campos
Yasmin Fernandes,Olivia Jesus


In [0]:
%sql
--  filtrando dados usando a cláusula where
select `NOME DO CLIENTE`, `IDADE DO CLIENTE`, `MARCA DO VEÍCULO`  from vendas where `IDADE DO CLIENTE` > 60

NOME DO CLIENTE,IDADE DO CLIENTE,MARCA DO VEÍCULO
Ian Novaes,79,Saab
Leandro Vieira,66,Toyota
Srta. Beatriz Campos,72,Toyota
Dr. Luiz Otávio Campos,63,Ford
Ana Vitória Nogueira,63,GMC
Esther Lima,66,Audi
Raul da Conceição,68,Lamborghini
Evelyn da Mata,80,Mercedes-Benz
Yago Campos,78,Hyundai
Guilherme Jesus,68,Ford


In [0]:
%sql
--  filtrando dados usando a cláusula where e o operador AND
select `NOME DO CLIENTE`, `IDADE DO CLIENTE`, `MARCA DO VEÍCULO` 
from vendas 
where `IDADE DO CLIENTE` > 70 AND `MARCA DO VEÍCULO` = "Toyota"

NOME DO CLIENTE,IDADE DO CLIENTE,MARCA DO VEÍCULO
Srta. Beatriz Campos,72,Toyota
Larissa da Rocha,72,Toyota
Heloísa Ramos,80,Toyota
Marina Melo,76,Toyota
Maria Luiza da Rocha,77,Toyota
Dra. Ana Azevedo,74,Toyota
Pedro Miguel Cardoso,77,Toyota
Gustavo Henrique Campos,76,Toyota
João Gabriel Rezende,76,Toyota
Sra. Isabel Lima,73,Toyota


In [0]:
%sql
--  filtrando dados usando a cláusula where e o operador OR
select `NOME DO CLIENTE`, `IDADE DO CLIENTE`, `MARCA DO VEÍCULO` 
from vendas 
where `IDADE DO CLIENTE` =72 OR `IDADE DO CLIENTE` =80

NOME DO CLIENTE,IDADE DO CLIENTE,MARCA DO VEÍCULO
Srta. Beatriz Campos,72,Toyota
Evelyn da Mata,80,Mercedes-Benz
Larissa da Rocha,72,Toyota
Srta. Maria Julia Vieira,72,Audi
Henrique Freitas,80,Chevrolet
Sarah da Costa,80,Aston Martin
Srta. Heloísa Santos,80,Chevrolet
Nicolas Azevedo,72,Ford
João Guilherme Jesus,72,Mitsubishi
Sabrina Araújo,72,Honda


In [0]:
%sql
--  filtrando dados usando a cláusula where e os operadores AND e OR
select `NOME DO CLIENTE`, `IDADE DO CLIENTE`, `MARCA DO VEÍCULO` 
from vendas 
where (`IDADE DO CLIENTE` =72 OR `IDADE DO CLIENTE` =80) AND `MARCA DO VEÍCULO` = "Toyota"

NOME DO CLIENTE,IDADE DO CLIENTE,MARCA DO VEÍCULO
Srta. Beatriz Campos,72,Toyota
Larissa da Rocha,72,Toyota
Heloísa Ramos,80,Toyota


In [0]:
%sql
--  Utilizando DISTINCT
select distinct `MARCA DO VEÍCULO`, `ANO DO VEÍCULO`
from vendas 

MARCA DO VEÍCULO,ANO DO VEÍCULO
Buick,1999
Geo,1995
Audi,2011
Jeep,2000
Chevrolet,2012
Dodge,2004
Honda,2007
Lexus,2009
Suzuki,1993
Aston Martin,2010


In [0]:
%sql
--  Filtrando coluna por valor nulo
select `VEÍCULO`, `MARCA DO VEÍCULO`, `MODELO DO VEÍCULO`, `ANO DO VEÍCULO`
from vendas 
where `MARCA DO VEÍCULO` is null

VEÍCULO,MARCA DO VEÍCULO,MODELO DO VEÍCULO,ANO DO VEÍCULO
Kia Sportage,,Sportage,2017


In [0]:
%sql
--  Ordenando os dados de acordo por uma ou mais coluna
select `VEÍCULO`, `MARCA DO VEÍCULO`, `MODELO DO VEÍCULO`, `ANO DO VEÍCULO`
from vendas 
order by `MARCA DO VEÍCULO`, `ANO DO VEÍCULO` desc

VEÍCULO,MARCA DO VEÍCULO,MODELO DO VEÍCULO,ANO DO VEÍCULO
Kia Sportage,,Sportage,2017
Acura ILX,Acura,ILX,2019
Acura RDX,Acura,RDX,2019
Acura RLX Sport Hybrid,Acura,RLX Sport Hybrid,2018
Acura TLX,Acura,TLX,2018
Acura RDX,Acura,RDX,2017
Acura RLX Sport Hybrid,Acura,RLX Sport Hybrid,2016
Acura TSX,Acura,TSX,2014
Acura RLX Sport Hybrid,Acura,RLX Sport Hybrid,2014
Acura TSX,Acura,TSX,2012


In [0]:
%sql
--  Selecionando dados correspondente de acordo com um padrão de filtro
select `VEÍCULO`, `MARCA DO VEÍCULO`, `MODELO DO VEÍCULO`, `ANO DO VEÍCULO`
from vendas 
where `MODELO DO VEÍCULO` like '%Class%'

VEÍCULO,MARCA DO VEÍCULO,MODELO DO VEÍCULO,ANO DO VEÍCULO
Mercedes-Benz SL-Class,Mercedes-Benz,SL-Class,1996
Mercedes-Benz CLK-Class,Mercedes-Benz,CLK-Class,2000
Mercedes-Benz S-Class,Mercedes-Benz,S-Class,1998
Chevrolet Malibu (Classic),Chevrolet,Malibu (Classic),2008
Mercedes-Benz S-Class,Mercedes-Benz,S-Class,2015
Mercedes-Benz G-Class,Mercedes-Benz,G-Class,2010
Mercedes-Benz R-Class,Mercedes-Benz,R-Class,2010
Mercedes-Benz E-Class,Mercedes-Benz,E-Class,2020
Mercedes-Benz SL-Class,Mercedes-Benz,SL-Class,1996
Mercedes-Benz CLA-Class,Mercedes-Benz,CLA-Class,2014


In [0]:
%sql
--  Selecionando dados e concatenando colunas
select `VEÍCULO`, `MARCA DO VEÍCULO`, `MODELO DO VEÍCULO`, concat(`MARCA DO VEÍCULO`, ' ', `MODELO DO VEÍCULO`) as COLUNA
from vendas 
where `MODELO DO VEÍCULO` like '%Class%'

VEÍCULO,MARCA DO VEÍCULO,MODELO DO VEÍCULO,COLUNA
Mercedes-Benz SL-Class,Mercedes-Benz,SL-Class,Mercedes-Benz SL-Class
Mercedes-Benz CLK-Class,Mercedes-Benz,CLK-Class,Mercedes-Benz CLK-Class
Mercedes-Benz S-Class,Mercedes-Benz,S-Class,Mercedes-Benz S-Class
Chevrolet Malibu (Classic),Chevrolet,Malibu (Classic),Chevrolet Malibu (Classic)
Mercedes-Benz S-Class,Mercedes-Benz,S-Class,Mercedes-Benz S-Class
Mercedes-Benz G-Class,Mercedes-Benz,G-Class,Mercedes-Benz G-Class
Mercedes-Benz R-Class,Mercedes-Benz,R-Class,Mercedes-Benz R-Class
Mercedes-Benz E-Class,Mercedes-Benz,E-Class,Mercedes-Benz E-Class
Mercedes-Benz SL-Class,Mercedes-Benz,SL-Class,Mercedes-Benz SL-Class
Mercedes-Benz CLA-Class,Mercedes-Benz,CLA-Class,Mercedes-Benz CLA-Class


In [0]:
%sql
--  Utilizando operadores matemáticos
select `VEÍCULO`, `VALOR BRUTO`, `VALOR DO DESCONTO`, `VALOR LIQUIDO`, `VALOR BRUTO` - `VALOR DO DESCONTO` AS COLUNA
from vendas 
where `MODELO DO VEÍCULO` like '%Class%'

VEÍCULO,VALOR BRUTO,VALOR DO DESCONTO,VALOR LIQUIDO,COLUNA
Mercedes-Benz SL-Class,13080,869,12211,12211
Mercedes-Benz CLK-Class,11100,629,10471,10471
Mercedes-Benz S-Class,11412,297,11115,11115
Chevrolet Malibu (Classic),12862,446,12416,12416
Mercedes-Benz S-Class,11856,25,11831,11831
Mercedes-Benz G-Class,11751,762,10989,10989
Mercedes-Benz R-Class,12961,494,12467,12467
Mercedes-Benz E-Class,9140,457,8683,8683
Mercedes-Benz SL-Class,8777,906,7871,7871
Mercedes-Benz CLA-Class,13258,485,12773,12773


In [0]:
%sql
--  Selecionando dados de tabelas diferentes

select * from vendedores
union all
select * from clientes

NOME,TIPO
Vitor Gabriel Castro,VENDEDOR
Sophie Peixoto,VENDEDOR
Francisco Silva,VENDEDOR
Isabella da Rosa,VENDEDOR
Juliana Jesus,VENDEDOR
Beatriz Gomes,VENDEDOR
Yasmin Fernandes,VENDEDOR
Caroline Mendes,CLIENTE
Ana Vitória Santos,CLIENTE
Ana Beatriz Monteiro,CLIENTE


In [0]:
%sql
--  Selecionando NOME que estão listado nas duas tabelas

select NOME from vendedores
intersect
select NOME from clientes

NOME
Juliana Jesus


In [0]:
%sql
--  Unindo dados de diferentes Tabelas

select distinct NOME from vendedores
inner join vendas on vendedores.NOME = vendas.`NOME DO CLIENTE`

NOME
Juliana Jesus


In [0]:
%sql
--  usando alias em tabelas

select distinct NOME from vendedores as t1
inner join vendas as t2 on t1.NOME = t2.`NOME DO CLIENTE`

NOME
Juliana Jesus


In [0]:
%sql
--  retornando a quantidade de linhas de uma tabela

select count(NOME) as Qtde_Linhas from vendedores
union
select count(NOME) from clientes

Qtde_Linhas
7
1450


In [0]:
%sql
--  calculando a soma, o maior, o menor e a média de uma coluna

select sum(`VALOR LIQUIDO`) AS SOMA, min(`VALOR LIQUIDO`) as MENOR, 
max(`VALOR LIQUIDO`) AS MAIOR, avg(`VALOR LIQUIDO`) as MEDIA
from vendas

SOMA,MENOR,MAIOR,MEDIA
15844202,7033,13940,10562.801333333333


In [0]:
%sql
--  calculando o valor medio de uma coluna agrupando por outra

select `MARCA DO VEÍCULO`, round(avg(`VALOR LIQUIDO`), 2) as VALOR_MEDIO
from vendas
group by `MARCA DO VEÍCULO`

MARCA DO VEÍCULO,VALOR_MEDIO
Volkswagen,10363.32
Oldsmobile,10675.24
Lexus,10312.69
Jaguar,11013.82
Saturn,11265.33
FIAT,9970.83
Maserati,10215.33
Rolls-Royce,8520.2
Scion,9925.0
Jeep,10817.79


In [0]:
%sql
--  calculando o valor medio de uma coluna agrupando por outra

select `MARCA DO VEÍCULO`, round(avg(`VALOR LIQUIDO`), 2) as VALOR_MEDIO
from vendas
group by `MARCA DO VEÍCULO`
having VALOR_MEDIO < 9000

MARCA DO VEÍCULO,VALOR_MEDIO
Rolls-Royce,8520.2
Geo,8790.4
Freightliner,8052.0
Daihatsu,8945.0
