# Pandas


pandas é um biblioteca de python com o foco em manipulação e análise de dados. O nome vem do termo "<b>pa</b>nel <b>da</b>ta".

A biblioteca é construida a partir do NumPy, uma outra biblioteca que permite cálculos de formas mais rápidas do que o padrão do python (Usa C para realizar a maioria das contas)


O uso do pandas é realizado a partir de Series e DataFrames, a ideia é trazer para o python a visualização que é possível via Excel, PowerBI ou R

In [2]:
# Primeiro passo importação da biblioteca
import pandas as pd

import numpy as np

## Criando uma série

Você pode converter listas, numpy Arrays ou dicionários para Séries:

In [3]:
legenda = ["a", "b", "c"]
valores = [10, 20, 30]
vetor = np.array([10, 20, 30])
dicionario = {
    "a": 10,
    "b": 20,
    "c": 30,
}

In [4]:
## Usando Listas

pd.Series(data=valores)

0    10
1    20
2    30
dtype: int64

In [5]:
## Definindo o índice

pd.Series(data=valores, index=legenda)

a    10
b    20
c    30
dtype: int64

In [6]:
## Definindo o índice

pd.Series(valores, legenda) # Se colocado na ordem, nomear os parâmetros demonstra opcional

a    10
b    20
c    30
dtype: int64

In [7]:
## Renomeando a Série

pd.Series(data=valores, index=legenda).rename("Valores")

a    10
b    20
c    30
Name: Valores, dtype: int64

In [8]:
## Utilizando um dicionário

pd.Series(dicionario)

a    10
b    20
c    30
dtype: int64

In [9]:
## Utilizando um Numpy array

pd.Series(vetor)

0    10
1    20
2    30
dtype: int32

## Usando Index

Os index definidos anteriormente podem ser utilizados para rápidas obtenções de valores. A forma de uso é muito semelhante ao jeito que é utilizado para dicionários.

In [10]:
serie1 = pd.Series([1, 2, 3, 5], index = ["Pizza", "Pastel", "Coxinha", "Alface"])
serie2 = pd.Series([6, 8, 9, 11], index = ["Pizza", "Pastel", "Coxinha", "Tomate"])

serie1

Pizza      1
Pastel     2
Coxinha    3
Alface     5
dtype: int64

In [11]:
serie1["Pizza"]

1

In [12]:
serie2["Pastel"]

8

In [13]:
serie1 + serie2

Alface      NaN
Coxinha    12.0
Pastel     10.0
Pizza       7.0
Tomate      NaN
dtype: float64

## 1.3 Algumas operações

Há diversas funções pré-defindas para séries, algumas estão abaixo.

Para todas as funções: <a href="https://pandas.pydata.org/docs/reference/series.html">Series</a>

In [14]:
serie1.sum()

11

In [15]:
serie1.mean()

2.75

In [16]:
serie1.max()

5

In [17]:
serie1.min()

1

In [18]:
serie1.cumsum()

Pizza       1
Pastel      3
Coxinha     6
Alface     11
dtype: int64