# Introdução aos Pandas

## Módulo 1: Introdução à série Pandas
- Criando séries a partir de coleções Python
- Fazendo cálculos com séries de números
- Descrevendo nossos dados
- Filtrando séries
- Operando com séries de strings
- Usando atributos e métodos de séries integrados

## O que é Pandas?
- A biblioteca líder em análise de dados para Python
- Construída para aquisição, limpeza, organização e análise de dados
- Séries e DataFrames são conjuntos de dados poderosos do Pandas

## Por que Pandas?
- Pandas é a biblioteca *de fato* para análise de dados no ecossistema Python
- Pandas também é *rápido*, mais rápido que o Python básico
- Permite realizar mais com menos código

### Série Pandas Parte 1
- Criando objetos de série
- Atribuindo séries
- Fazendo cálculos em séries
- Descrevendo uma série

In [None]:
import pandas as pd

In [None]:
pd.Series([7, 8, 9])

In [None]:
# Atribuindo uma série a uma variável
resultados = pd.Series([True, False, True])
resultados

In [None]:
# A série pode ser qualquer tipo de dado Python
cores = ["red", "orange", "yellow", "green", "blue", "indigo", "violet"]
cores = pd.Series(cores)
cores

In [None]:
# Podemos atribuir intervalos para fazer séries de números
numeros = pd.Series(range(-3, 3))
numeros

In [None]:
# Podemos fazer aritmética em séries inteiras com nossos operadores matemáticos
numeros + 1

In [None]:
# Pandas, assim como Python, segue a ordem de operações PEMDAS
numeros * 2 + 5

In [None]:
# Observe como os operadores integrados do Python funcionam em toda a série
numeros ** 2

In [None]:
# Podemos tirar a raiz quadrada elevando à potência 1/2
numeros ** (1/2)

In [None]:
# Observe que a aritmética não altera a série original
numeros

In [None]:
# Atribuindo o resultado de uma operação a uma nova variável
triplo = numeros * 3
triplo

In [None]:
precos = pd.Series([1.30, 2.50, 2.50, 5.60, 10.10])
precos

In [None]:
# Reatribuir uma variável para sobrescrever os valores com o resultado de uma operação
precos = precos * .8
precos

In [None]:
s = pd.Series([7, 8, 8, 9, 9, 9])
s

In [None]:
# O atributo .index retorna informações sobre o índice
# Índices inteiros baseados em zero são o padrão
# O Pandas também pode usar strings e datas como valores de índice
s.index

In [None]:
# O atributo .dtype retorna
s.dtype

In [None]:
# O atributo .values ​​retorna apenas os valores de um conjunto de dados pandas
s.values

In [None]:
# Em uma série, .shape retorna o número de elementos dessa série.
# Em um dataframe, .shape retorna o número de linhas e colunas
s.shape

In [None]:
# .value_counts retorna uma contagem de frequência de valores
# O índice é o valor
s.value_counts()

In [None]:
# O modo é o valor que ocorre com mais frequência em um conjunto de dados
s.mode()

In [None]:
# A mediana é o meio ordinal dos dados classificados
s.median()

In [None]:
# Média
s.mean()

In [None]:
# O desvio padrão é uma medida de dispersão
s.std()

In [None]:
# .min retorna o menor valor
s.min()

In [None]:
# argmin retorna o índice do menor valor
s.argmin()

In [None]:
s.max()

In [None]:
s.argmax()

In [None]:
s

In [None]:
# O método .describe produz algumas estatísticas descritivas úteis
s.describe()

### Exercício, parte 1 de 3
- Crie uma série chamada `a` que representa os números `[1, 2, 3, 4, 5]`
- Crie uma série chamada `b` que representa os números `[1, 1, 2, 3, 5]`
- Eleve `a` ao quadrado e reatribua à variável `a`
- Eleve `b` ao quadrado e reatribua à variável `b`
- Some os quadrados `a` e `b`. Atribua a uma variável chamada `soma_de_quadrados`
- Agora calcule a raiz quadrada dessa soma (*dica* elevar à potência 0,5 resulta na raiz quadrada)

In [None]:
# Crie uma série chamada "a" e atribua a ela os números [1, 2, 3, 4, 5]


In [None]:
# Crie uma série chamada "b" e atribua a ela os números [1, 1, 2, 3, 5]


In [None]:
# Eleve ao quadrado todos os números em a e reatribua o resultado a a


In [None]:
# Eleve ao quadrado todos os números em b e reatribua o resultado a b


In [None]:
# Crie uma série chamada sum_of_squares que contém a soma dos quadrados a e b


In [None]:
# Avalie a raiz quadrada dessa soma_de_quadrados


Para mais informações sobre o método pandas .apply, consulte https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.apply.html