In [None]:
# importando o pandas
import pandas as pd

In [None]:
# verificando a versão instalada
pd.__version__

In [None]:
# criando duas Series, fabricantes de carro e cores
carros = pd.Series(["Toyota", "Honda", "BMW"])
cores = pd.Series(["Azul", "Branco", "Vermelho"])

In [None]:
# exibindo os valores da Serie
carros

In [None]:
cores

In [None]:
# criando um DataFrame de carros e cores
df = pd.DataFrame({"Fabricante": carros,
                   "Cores": cores})
df

In [None]:
# importando os dados de venda de carros
df = pd.read_csv("venda-de-carros.csv")
df

In [None]:
# verificando os tipos de dados do DataFrame
df.dtypes

In [None]:
# verificando informações estatísticas dos dados
df.describe()

In [None]:
# verificando informações sobre os dados do DataFrame
# quantidade de linhas, colunas, tipos de dados, etc
df.info()

In [None]:
# chamando a função mean()
valores = pd.Series([3000, 3500, 11250])
valores.mean()

In [None]:
# utilizando a função sum()
valores.sum()

In [None]:
# exibindo os nomes das colunas do DataFrame
df.columns

In [None]:
df["Quilometragem"].mean()

In [None]:
# exibindo as primeiras 5 linhas do DataFrame
df.head()

In [None]:
# exibindo as últimas 5 linhas do DataFrame
df.tail()

In [None]:
# criando uma Serie exemplo
animais = pd.Series(["gato", "ave", "cachorro", "cobra", "leão", "cavalo"], 
                   index=[0, 3, 8, 9, 6, 3])
animais

In [None]:
# selecionando todos os dados que contém o índice 3
animais.loc[3]

In [None]:
# selecionando os dados na 3° posição no DataFrame
animais.iloc[3]

In [None]:
df.loc[3]

In [None]:
df.iloc[3]

In [None]:
# selecionando os dados do inicio até a 3° posição no DataFrame
animais.iloc[:3]

In [None]:
# selecionando uma única coluna
df["Fabricante"]

In [None]:
# selecionando carros com quilometragem acima de 100.000
df[df["Quilometragem"] > 100000]

In [None]:
# selecionando apenas os carros da Honda
df[df["Fabricante"] == "Honda"]

In [None]:
# agrupando os dados pelo fabricante e calculando a média das outras colunas
df.groupby(["Fabricante"]).mean()

In [None]:
# regex para transformar os dados da coluna Preco em números
df["Preco"] = df["Preco"].str.replace('[/R$\,]', '', regex=True)

In [None]:
df.head(3)

In [None]:
df.info()

In [None]:
# convertendo os dados da coluna Preco para float64
df["Preco"] = pd.to_numeric(df["Preco"])
df.head(3)

In [None]:
df.info()

In [None]:
# importando dados de venda de carros com valores ausentes
df2 = pd.read_csv("venda-de-carros-dados-ausentes.csv")
df2

In [None]:
# preenchendo dados ausentes na coluna de Quilometragem
df2["Quilometragem"].fillna(df2["Quilometragem"].mean(), inplace=True)
df2

In [None]:
# utilizando inplace=True
df2.dropna(inplace=True)
df2

In [None]:
# criando uma nova coluna a partir de uma Series
qtde_assentos = pd.Series([5, 5, 5, 5, 5, 5, 5, 5, 5, 5])
df["Assentos"] = qtde_assentos
df

In [None]:
# criando uma nova coluna a partir de uma Lista Python
motor_lista = [1.3, 2.0, 3.0, 4.2, 1.6, 1, 2.0, 2.3, 2.0, 3.0]
df["Motor"] = motor_lista
df

In [None]:
# criando uma nova coluna a partir de outras colunas
df["Preco por KM"] = df["Preco"] / df["Quilometragem"]
df

In [None]:
# removendo uma coluna
df = df.drop("Preco por KM", axis=1)
df

In [None]:
# criando uma amostra embaralhada
df_sample = df.sample(frac=1)
df_sample

In [None]:
# resetando os valores do índice
df_sample.reset_index()