## ***Pandas*** 🐼



### **Importando Pandas**
```python
import pandas as pd:
```
Importa a biblioteca pandas e a apelida de pd. O pandas é uma biblioteca poderosa para manipulação e análise de dados em Python.



In [None]:
pip install --upgrade pip

In [20]:
import pandas as pd

###**pd.Series**


```Python
pd.Series(...):
```

Converte a lista em uma Série do pandas. Uma Série é uma estrutura de dados unidimensional que pode armazenar qualquer tipo de dado. Cada elemento na Série possui um rótulo, chamado de índice.

```Python
list('abcdef'):
```
Cria uma lista contendo os caracteres 'a', 'b', 'c', 'd', 'e' e 'f'. A função list() converte a string em uma lista de caracteres.

Veja:

```python
s1 = pd.Series(list('abcdef'))
s1
```

***Exemplo Serie 1:***

A Série s1 foi criada com os valores 'a', 'b', 'c', 'd', 'e' e 'f', e os índices são automaticamente atribuídos de 0 a 5.


In [None]:
s1 = pd.Series(list('abcdef'))
s1

***Exemplo Serie 2:***

`pd.Series([...]):` Cria uma Série no pandas.

`[2, 4, 6, 8]:` Os valores que serão armazenados na Série.

 A Série s2 terá automaticamente índices atribuídos de 0 a 3, e você pode realizar diversas operações e análises de dados utilizando os recursos oferecidos pelo pandas para manipulação de Séries e DataFrames.

In [None]:
s2 = pd.Series([2,4,6,8])
s2

***Exemplo Serie 3:***

`pd.Series([...], index=['a', 'b', 'c', 'd']):`

Cria uma Série no pandas com valores específicos e índices associados.

A principal diferença em relação à Série anterior (s2) é que, desta vez, os índices são especificados manualmente como `['a', 'b', 'c', 'd']`, em vez de serem gerados automaticamente. Isso permite associar rótulos personalizados aos elementos da Série, facilitando a referência aos valores por meio desses rótulos.


In [None]:
s3 = pd.Series([2,4,6,8], index = ['a','b','c','d'])
s3

***Exemplo Serie 3.1:***

`s3['b']`: Acessa o valor na Série s3 correspondente ao índice 'b'.

Neste caso específico, a Série s3 foi criada com índices personalizados, onde 'b' é um desses índices. Portanto, a expressão `s3['b']` retornará o valor associado ao índice 'b', que é 4. Esse tipo de indexação baseada em rótulos é uma característica poderosa das estruturas de dados do pandas.

In [None]:
s3['b']

***Exemplo Serie 3.2:***

`s3[['b', 'c']]`: Seleciona os valores da Série s3 correspondentes aos índices 'b' e 'c', resultando em uma nova Série.

A expressão retorna uma Série contendo os valores 4 e 6, que estão associados aos índices 'b' e 'c', respectivamente. O uso de uma lista `['b', 'c']` na indexação permite selecionar múltiplos valores ao mesmo tempo. Essa é uma funcionalidade flexível do pandas que facilita a manipulação de dados em conjuntos.

In [None]:
s3[['b','c']]

***Exemplo Serie 4:***

O código `s4 = pd.Series(range(10), index=list('ababcedded'))` cria uma Série no pandas chamada s4 com valores de 0 a 9 e índices associados às letras 'a', 'b', 'a', 'b', 'c', 'e', 'd', 'd', 'e' e 'd'.

Em resumo:
`pd.Series(range(10), index=list('ababcedded'))`: Cria uma Série no pandas com valores de 0 a 9 e índices específicos.

Os índices são baseados na lista de caracteres 'ababcedded'. Cada letra na lista é associada a um valor na Série. Por exemplo, 'a' está associado a 0, 'b' está associado a 1, 'c' está associado a 4, e assim por diante.

In [None]:
s4 = pd.Series(range(10), index = list('ababcedded'))
s4

***Exemplo Serie 4:***

A expressão s4['a'] realiza uma operação de indexação na Série s4, retornando uma nova Série que contém os valores associados ao índice 'a'. Em resumo:

`s4['a']`: Seleciona os valores da Série s4 associados ao índice 'a'.

Se a Série s4 for definida como no exemplo anterior, onde os índices 'a' estão associados aos valores 0 e 2, então `s4['a']` resultará em uma Série contendo esses valores.

Esta Série resultante mostra os valores 0 e 2 associados aos índices 'a'. Note que, como os índices não são únicos, a operação de indexação pode retornar múltiplos valores.

In [None]:
s4['a']

***Exemplo Serie 4.1:***

s4['d']: Seleciona os valores da Série s4 associados ao índice 'd', resultando em uma nova Série.

[0]: Seleciona o primeiro elemento dessa nova Série.

Assumindo que a Série s4 tenha sido definida conforme mencionado anteriormente, onde os índices 'd' estão associados aos valores 6, 7 e 9, então s4['d'][0] resultará em:

In [None]:
s4['d'][1]

In [None]:
# Imprime a Serie 4
s4

a    0
b    1
a    2
b    3
c    4
e    5
d    6
d    7
e    8
d    9
dtype: int64

***Exemplo Serie 4.2:***

A expressão `s4[s4 < 2]` realiza uma operação de filtragem na Série s4, retornando uma nova Série contendo apenas os elementos cujos valores são menores que 2. Em resumo:

`s4 < 2`: Cria uma Série de valores booleanos indicando se cada elemento na Série s4 é menor que 2.

`s4[s4 < 2]`: Seleciona apenas os elementos da Série s4 onde a condição é verdadeira, ou seja, onde o valor é menor que 2.

Assumindo que a Série s4 tenha sido definida conforme mencionado anteriormente, onde os primeiros três valores são associados aos índices 'a', 'b' e 'a', e assim por diante, então `s4[s4 < 2]` resultará em:

In [None]:
s4[s4<2]

In [None]:
s4[s4>3]

***Exemplo Serie 4.3:***



In [None]:
s4>3

a    False
b    False
a    False
b    False
c     True
e     True
d     True
d     True
e     True
d     True
dtype: bool

In [None]:
s4+2

In [None]:
s4*2

a     0
b     2
a     4
b     6
c     8
e    10
d    12
d    14
e    16
d    18
dtype: int64

In [None]:
dicio = {'a':100, 'b':200, 'c':300}
s5 = pd.Series(dicio)
s5

a    100
b    200
c    300
dtype: int64

In [None]:
dicio2 = {'nome':'Maria', 'idade':'50','sexo':'feminino'}
s6 = pd.Series(dicio2)
s6

nome        Maria
idade          50
sexo     feminino
dtype: object

In [None]:
dicionario = {'b': 100, 'c': 150, 'd': 200}
s = pd.Series(dicionario)
s

b    100
c    150
d    200
dtype: int64

In [None]:
s = pd.Series(dicionario, list('abcd'))
s

a      NaN
b    100.0
c    150.0
d    200.0
dtype: float64

In [None]:
s6 = pd.Series([1,2,3], index = ['c','b','a'])
s6

c    1
b    2
a    3
dtype: int64

In [None]:
s*s6

a      NaN
b    200.0
c    150.0
d      NaN
dtype: float64

### ***ATIVIDADE: PRIMEIRA SÉRIE***

####PRIMEIRA SÉRIE

**O QUE FAZER?**
1. Criar duas series pandas com 4 posições cada, realizar as quatro operações matemáticas
básicas entre as series e mostrar o resultado;
2. Criar uma terceira serie pandas com apenas 3 posições, realizar as quatro operações
matemáticas básicas com uma das series do exercício anterior e explicar o resultado.
➔ **COMO FAZER?**

Em grupos de 3 a 4 pessoas.
➔ **FECHAMENTO**
Compartilhar as impressões gerais da atividade e dúvidas.


In [None]:
import pandas as pd

In [None]:
Sa = pd.Series([3,6,9,12])
Sa

In [None]:
Sb = pd.Series([5,10,15,20])
Sb

In [None]:
Sa+Sb

In [None]:
Sa*Sb

In [None]:
Sa-Sb

In [None]:
Sa/Sb

In [None]:
Sc = pd.Series([1,2,3])
Sc

In [None]:
Sc+Sa

In [None]:
Sc-Sb

In [None]:
Sc*Sa

In [None]:
Sc/Sb

#### ATIVIDADE 2

cfriar séries para guardar as seguintes informações sobre notas de alunos.
aluna maria tirou 7 no teste 10 na prova
aluno bruno tirou 6 no teste 8 na prova
aluno Lucas tirou 6 no teste e 10 na prova

In [None]:
# prompt: criar séries para guardar as seguintes informações sobre notas de alunos. aluna maria tirou 7 no teste 10 na prova aluno bruno tirou 6 no teste 8 na prova aluno Lucas tirou 6 no teste e 10 na prova

notas = pd.Series({'Maria': [7, 10], 'Bruno': [6, 8], 'Lucas': [6, 10]})
notas

## ***Importando CSV do Google Drive***

In [None]:
import os
from google.colab import drive
import pandas as pd

# Montar o Google Drive
drive.mount ('/content/drive', force_remount=True)

#Caminho para o arquivo .csv no google drive
csv_path = '/content/drive/MyDrive/ANALISTA DE DADOS/PROJETOS SENAC ANALISTA DE DADOS/PROJETO EM GRUPO - MODULO 4/precos-semestrais-ca-2022-01.csv'

# Ler o arquivo .csv usando Pandas
df = pd.read_csv(csv_path, encoding='utf-8', sep=';')

display(df)

Mounted at /content/drive


Unnamed: 0,Regiao - Sigla,Estado - Sigla,Municipio,Revenda,CNPJ da Revenda,Nome da Rua,Numero Rua,Complemento,Bairro,Cep,Produto,Data da Coleta,Valor de Venda,Valor de Compra,Unidade de Medida,Bandeira
0,N,AC,RIO BRANCO,AUTO POSTO AMAPA - EIRELI,00.529.581/0001-53,VIA CHICO MENDES,3570,,AREAL,69906-119,GASOLINA,03/01/2022,699,,R$ / litro,VIBRA ENERGIA
1,N,AC,RIO BRANCO,AUTO POSTO AMAPA - EIRELI,00.529.581/0001-53,VIA CHICO MENDES,3570,,AREAL,69906-119,ETANOL,03/01/2022,599,,R$ / litro,VIBRA ENERGIA
2,N,AC,RIO BRANCO,AUTO POSTO AMAPA - EIRELI,00.529.581/0001-53,VIA CHICO MENDES,3570,,AREAL,69906-119,DIESEL,03/01/2022,609,,R$ / litro,VIBRA ENERGIA
3,N,AC,RIO BRANCO,AUTO POSTO AMAPA - EIRELI,00.529.581/0001-53,VIA CHICO MENDES,3570,,AREAL,69906-119,GASOLINA ADITIVADA,03/01/2022,705,,R$ / litro,VIBRA ENERGIA
4,N,AC,RIO BRANCO,AUTO POSTO AMAPA - EIRELI,00.529.581/0001-53,VIA CHICO MENDES,3570,,AREAL,69906-119,DIESEL S10,03/01/2022,612,,R$ / litro,VIBRA ENERGIA
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
529419,CO,MT,CUIABA,OZ REVENDEDORA DE COMBUSTIVEIS LTDA,36.757.198/0001-08,AVENIDA SENADOR METELLO,868,,CENTRO-SUL,78020-600,GASOLINA,30/06/2022,649,,R$ / litro,BRANCA
529420,NE,MA,CAXIAS,POSTAO COMERCIO DE COMBUSTIVEIS LTDA,31.597.569/0001-00,RODOVIA BR-316,S/N,KM 552 SALA A,VOLTA REDONDA,65606-525,GASOLINA ADITIVADA,30/06/2022,699,,R$ / litro,BRANCA
529421,NE,MA,CAXIAS,POSTAO COMERCIO DE COMBUSTIVEIS LTDA,31.597.569/0001-00,RODOVIA BR-316,S/N,KM 552 SALA A,VOLTA REDONDA,65606-525,DIESEL S10,30/06/2022,759,,R$ / litro,BRANCA
529422,NE,MA,CAXIAS,POSTAO COMERCIO DE COMBUSTIVEIS LTDA,31.597.569/0001-00,RODOVIA BR-316,S/N,KM 552 SALA A,VOLTA REDONDA,65606-525,DIESEL,30/06/2022,755,,R$ / litro,BRANCA


## ***Importando CSV do SAMPLE_DATA***

In [None]:
import pandas as pd

csv_path = '/content/Preços semestrais - AUTOMOTIVOS_2023.01.1.csv'
df_csv = pd.read_csv(csv_path, encoding='utf-8', sep=';')

print('\nConteúdo do arquivo .csv:')
print(df_csv)