## Carregar

In [2]:
import pandas as pd
df = pd.read_pickle("..\\save\\df_chats")

## Salvar

In [8]:
df.to_pickle("..\\save\\df_chats")

##  Manipulações

# Exemplos

## Estatísticas

#### Listar todos os chats existentes
```python
for key in df.groupby('formatted_chat_name').groups.keys():
    print(key)
```

#### Listar todos os chats de que o contato "Menoor da Beka" participa
```python
for key in df[df['participants'].str.contains('Menoor da Beka')].groupby('formatted_chat_name').groups.keys():
    print(key)
```

#### Mostrar em qual chat o contato "Tal Do Max" é mais ativo. Contar quantas mensagens ele postou em cada chat
```python
df[df['from'].str.contains("Tal Do Max")].groupby("formatted_chat_name").size().sort_values(ascending=False)
```

#### Listar os aplicativos
```python
df.groupby('app').groups.keys()
```

#### Ver quem mais mandou mensagens no total
```python
df['from'].value_counts()
```

## Filtros

#### Somente Facebook e Whatsapp
```python
df[(df['app'] == 'WhatsApp') | (df['app'] == 'Facebook messenger')]
```

#### Somente WhatsApp
```python
df[(df['app'] == 'WhatsApp')]
```

#### Somente grupos que contenham no nome a palavra 'barraco'
```python
df[df['chat_name'].str.contains('barraco')]
```

#### Somente mensagens entre dois horários
```python
df[(df['timestamp'] > '2017-09-29 00:00:00') & (df['timestamp'] < '2017-09-29 23:59:59')]
```

#### Somente mensagens enviadas na madruga entre 00:00:00 e 06:00:00, independente do dia.
```python
import datetime
df[(df.timestamp.dt.time >= datetime.time(0,0,0)) & (df.timestamp.dt.time <= datetime.time(6,0,0))]
```

#### Somente mensagens dos grupos 12, 13 e 15 e em um período específico
```python
df[df.chat_id.isin(['12', '13', '15']) & (df['timestamp'] > '2017-09-29 00:00:00') & (df['timestamp'] < '2017-09-29 23:59:59')]
```

#### Somente mensagens com a palavra 'maconha'
```python
df[df['body'].str.contains('maconha')]
```

#### Ver mensagens que contenham a palavra 'maconha' mostrando apenas as colunas 'id' e 'body'
```python
df[df['body'].str.contains('maconha')][['id', 'body']]
```

#### Contar quantas mensagens possuem a palavra 'maconha':
```python
len(df[df['body'].str.contains('maconha')])
```

#### Somente mensagens com a palavra 'maconha', 'farinha' ou 'oleo'
```python
df[df['body'].str.contains('maconha|farinha|oleo')]
```

#### Somente mensagens com a palavra 'maconha', 'farinha', 'oleo' ou 'olio'
```python
df[df['body'].str.contains('maconha|farinha|ol[ei]o')]
```

#### Excluir as conversas de id números 12, 13 e 15
```python
df[~df.chat_id.isin(['12', '13', '15'])]
```

#### Somente as conversas cujo id seja 12, 13 ou 15
```python
df[df.chat_id.isin(['12', '13', '15'])]
```

#### Somente as conversas cujo nome do chat contenha "7555" ou "Jhon"
```python
df[df['formatted_chat_name'].str.contains('7555|Jhon')]
```

#### Somente as conversas de conversas onde o contato "Menoor da Beka" é participante
```python
df[df['participants'].str.contains('Menoor da Beka')]
```


## Outros

#### Gerar lista de ids para copiar e colar na lista de destaques
```python
#filtrar
df2 = df[df['body'].str.contains('maconha|farinha|oleo')]

#gerar 
" ".join([str(item) for item in df2['id']])
```
