In [20]:
# Importando as bibliotecas utilizadas
from pyspark.sql import SparkSession
import pyspark.sql.functions as F

In [7]:
# Criando a sessão, nomeando e configurando para mostrar tabela do tipo pandas 
spark = (
    SparkSession.builder
    .appName('PySpark - Select')
    .config('spark.sql.repl.eagerEval.enabled', True)
    .getOrCreate()
)

In [9]:
# Carregando um arquivo PARQUET para dataframe
df = spark.read.parquet('./DATASETS/LOGINS.parquet')

In [10]:
df

cpf,email,senha,data_de_nascimento,estado,data_cadastro,ipv4,cor_favorita,profissao,telefone
981.507.362-12,pedro-lucas53@gma...,+7^7E%xFBc,2006-12-18,RR,2023-02-26,99.107.250.210,Roxo,Jogador De Golfe,31 7785-4046
493.705.168-75,rezendeisaac@hotm...,_O_2GRnGOe,1992-06-17,GO,2023-02-16,197.11.26.213,Ciano,Atleta De Arremes...,(031) 0803-6753
398.471.625-73,felipepires@uol.c...,*Aw5EOAvy9,1921-11-11,MG,2023-01-02,181.90.63.58,Azul,Papiloscopista,11 9674-0553
092.618.354-06,stellamoraes@bol....,mw0AWYAs#s,2021-06-01,AC,2023-01-08,26.121.127.94,Marrom,Aeromoça,+55 (071) 3033 9177
509.427.136-99,wcarvalho@ig.com.br,pGD%!2Pq5X,1969-10-28,AP,2023-02-14,76.184.52.163,Laranja,Fonoaudiólogo,+55 (071) 6272 2468
218.795.460-94,da-conceicaodavi-...,uhBbFxPA&9,1986-05-19,MG,2023-03-07,192.93.0.24,Rosa,Taxista,+55 84 0652 9691
715.836.940-48,efreitas@bol.com.br,s#q9VZt&xl,2018-04-20,MG,2023-01-13,76.251.188.148,Branco,Produtor De Audio...,+55 (084) 1363 0052
475.698.032-56,wnunes@bol.com.br,_8az1W%n7g,1996-05-12,SE,2023-02-04,139.196.176.154,Azul,Cadeirinha,(071) 1640-3388
217.639.540-99,jribeiro@bol.com.br,MEf1X7fj_0,2021-10-05,PA,2023-03-02,71.22.224.5,Marrom,Geólogo,21 1432 4092
261.938.750-77,murilo05@gmail.com,Te&gO7GkKs,1917-01-05,MT,2023-02-21,136.54.123.165,Marrom,Técnico De Som,+55 (084) 5878-3346


In [11]:
# Selecionar colunas específicas para mostrar
df.select('email', 'cpf')

email,cpf
pedro-lucas53@gma...,981.507.362-12
rezendeisaac@hotm...,493.705.168-75
felipepires@uol.c...,398.471.625-73
stellamoraes@bol....,092.618.354-06
wcarvalho@ig.com.br,509.427.136-99
da-conceicaodavi-...,218.795.460-94
efreitas@bol.com.br,715.836.940-48
wnunes@bol.com.br,475.698.032-56
jribeiro@bol.com.br,217.639.540-99
murilo05@gmail.com,261.938.750-77


In [13]:
# Selecionar colunas pelo nome (propriedade)
df.select(df.cpf)

cpf
981.507.362-12
493.705.168-75
398.471.625-73
092.618.354-06
509.427.136-99
218.795.460-94
715.836.940-48
475.698.032-56
217.639.540-99
261.938.750-77


In [16]:
# Selecionando colunas diretamente por índice ou nome
df.select(df[3], df['cpf'])

data_de_nascimento,cpf
2006-12-18,981.507.362-12
1992-06-17,493.705.168-75
1921-11-11,398.471.625-73
2021-06-01,092.618.354-06
1969-10-28,509.427.136-99
1986-05-19,218.795.460-94
2018-04-20,715.836.940-48
1996-05-12,475.698.032-56
2021-10-05,217.639.540-99
1917-01-05,261.938.750-77


In [21]:
# Selecionando coluna pela função col 
df.select(F.col('email'))

email
pedro-lucas53@gma...
rezendeisaac@hotm...
felipepires@uol.c...
stellamoraes@bol....
wcarvalho@ig.com.br
da-conceicaodavi-...
efreitas@bol.com.br
wnunes@bol.com.br
jribeiro@bol.com.br
murilo05@gmail.com


In [24]:
# Selecionar todas as colunas MENOS as especifícadas 
df.drop('email', F.col('cpf'))

senha,data_de_nascimento,estado,data_cadastro,ipv4,cor_favorita,profissao,telefone
+7^7E%xFBc,2006-12-18,RR,2023-02-26,99.107.250.210,Roxo,Jogador De Golfe,31 7785-4046
_O_2GRnGOe,1992-06-17,GO,2023-02-16,197.11.26.213,Ciano,Atleta De Arremes...,(031) 0803-6753
*Aw5EOAvy9,1921-11-11,MG,2023-01-02,181.90.63.58,Azul,Papiloscopista,11 9674-0553
mw0AWYAs#s,2021-06-01,AC,2023-01-08,26.121.127.94,Marrom,Aeromoça,+55 (071) 3033 9177
pGD%!2Pq5X,1969-10-28,AP,2023-02-14,76.184.52.163,Laranja,Fonoaudiólogo,+55 (071) 6272 2468
uhBbFxPA&9,1986-05-19,MG,2023-03-07,192.93.0.24,Rosa,Taxista,+55 84 0652 9691
s#q9VZt&xl,2018-04-20,MG,2023-01-13,76.251.188.148,Branco,Produtor De Audio...,+55 (084) 1363 0052
_8az1W%n7g,1996-05-12,SE,2023-02-04,139.196.176.154,Azul,Cadeirinha,(071) 1640-3388
MEf1X7fj_0,2021-10-05,PA,2023-03-02,71.22.224.5,Marrom,Geólogo,21 1432 4092
Te&gO7GkKs,1917-01-05,MT,2023-02-21,136.54.123.165,Marrom,Técnico De Som,+55 (084) 5878-3346
