# EDA 1 - Exploração Simples

Nessa rápida exploração de dados, o objetivo é obter rápidas informações sobre a Coletânea de Hinos da Igreja Cristã Maranata (ICM) - Edição 2018.

Como descrito na própria coletânea:
> Os hinos e louvores, editados nesta Coletânea, englobam partes de outras edições já publicadas que expressam gratidão, adoração e louvor ao nosso Deus, entoados em todas épocas vividas pela Igreja Fiel, momento também comemorado pela Igreja Cristã Maranata em seus cinquenta anos de existência. 

## Origem dos dados

A extração de dados para construção da base tem por origem slides oficiais disponibilizados pelo Departamento de Louvor da ICM. Todo processo de extração está descrito no notebook `pptx_txt_json.ipynb`, neste mesmo repositório.

Até o momento desta análise, os dados estão salvos em uma base de dados SQLite.



In [1]:
from sqlalchemy import create_engine

# Create an engine to the SQLite database
engine = create_engine("sqlite:///db//hinos.db")

# Connect to the database
connection = engine.connect()
connection

<sqlalchemy.engine.base.Connection at 0x2011a4a37d0>

In [2]:
import pandas as pd

sql_query = """
select
    numero,
    nome,
    texto,
    texto_limpo,
    categoria_id,
    c.descricao as categoria
from 
    hino
    left join categoria c on c.id = categoria_id
where
    coletanea_id = 1
"""

hinos_analise = pd.read_sql_query(sql_query, connection)
hinos_analise

Unnamed: 0,numero,nome,texto,texto_limpo,categoria_id,categoria
0,01,01 - O SANGUE DE JESUS TEM PODER,"O SANGUE DE JESUS TEM PODER, PODER QUE A MIM P...","O SANGUE DE JESUS TEM PODER, PODER QUE A MIM P...",1,CLAMOR
1,02,02 - O SANGUE DE JESUS TEM PODER PARA SALVAR,O SANGUE DE JESUS TEM PODER (2x) O SANGUE DE J...,O SANGUE DE JESUS TEM PODER O SANGUE DE JESUS...,1,CLAMOR
2,03,03 - CLAMO A TI,"CLAMO A TI, Ó MEU SENHOR, CLAMO A TI, MEU SALV...","CLAMO A TI, Ó MEU SENHOR, CLAMO A TI, MEU SALV...",1,CLAMOR
3,04,04 - QUANDO TE PROSTRARES,"QUANDO TE PROSTRARES DIANTE DE DEUS, LEMBRA QU...","QUANDO TE PROSTRARES DIANTE DE DEUS, LEMBRA QU...",1,CLAMOR
4,05,05 - CLAMANDO ESTOU,"CLAMANDO ESTOU, Ó MEU JESUS, POR TEU SANGUE RE...","CLAMANDO ESTOU, Ó MEU JESUS, POR TEU SANGUE RE...",1,CLAMOR
...,...,...,...,...,...,...
790,791,791 - EU QUERO MAIS E MAIS DE CRISTO,EU QUERO MAIS E MAIS DE CRISTO. EU QUERO MAIS ...,EU QUERO MAIS E MAIS DE CRISTO. EU QUERO MAIS ...,11,CORINHOS
791,792,792 - LOUVANDO A DEUS,LOUVANDO A DEUS E CAINDO NA GRAÇA DE TODO O PO...,LOUVANDO A DEUS E CAINDO NA GRAÇA DE TODO O PO...,11,CORINHOS
792,793,793 - MESA PREPARADA,"MESA PREPARADA, CABEÇA UNGIDA, CÁLICE TRANSBOR...","MESA PREPARADA, CABEÇA UNGIDA, CÁLICE TRANSBOR...",11,CORINHOS
793,794,794 - JESUS LIBERTOU,JESUS LIBERTOU MINH’ALMA DO MEU VIL PECADO. EL...,JESUS LIBERTOU MINH’ALMA DO MEU VIL PECADO. EL...,11,CORINHOS


In [3]:
hinos_analise.loc[hinos_analise["numero"] == "null", "numero"] = 0
hinos_analise["numero_int"] = hinos_analise["numero"].astype(int)
hinos_analise["nome_limpo"] = hinos_analise["nome"].str.split(" - ").str[1].str.strip()
hinos_analise.loc[hinos_analise["numero_int"] == 0, "nome_limpo"] = hinos_analise[
    "nome"
]
hinos_analise = hinos_analise.drop(columns=["numero", "nome"])
hinos_analise.sort_values("numero_int")

Unnamed: 0,texto,texto_limpo,categoria_id,categoria,numero_int,nome_limpo
794,"AQUILO QUE FUI NÃO SOU MAIS, NEM SOU TUDO O QU...","AQUILO QUE FUI NÃO SOU MAIS, NEM SOU TUDO O QU...",1,CLAMOR,0,AQUILO QUE FUI NÃO SOU MAIS
0,"O SANGUE DE JESUS TEM PODER, PODER QUE A MIM P...","O SANGUE DE JESUS TEM PODER, PODER QUE A MIM P...",1,CLAMOR,1,O SANGUE DE JESUS TEM PODER
1,O SANGUE DE JESUS TEM PODER (2x) O SANGUE DE J...,O SANGUE DE JESUS TEM PODER O SANGUE DE JESUS...,1,CLAMOR,2,O SANGUE DE JESUS TEM PODER PARA SALVAR
2,"CLAMO A TI, Ó MEU SENHOR, CLAMO A TI, MEU SALV...","CLAMO A TI, Ó MEU SENHOR, CLAMO A TI, MEU SALV...",1,CLAMOR,3,CLAMO A TI
3,"QUANDO TE PROSTRARES DIANTE DE DEUS, LEMBRA QU...","QUANDO TE PROSTRARES DIANTE DE DEUS, LEMBRA QU...",1,CLAMOR,4,QUANDO TE PROSTRARES
...,...,...,...,...,...,...
789,AQUELE QUE HABITA NO ESCONDERIJO DO ALTÍSSIMO ...,AQUELE QUE HABITA NO ESCONDERIJO DO ALTÍSSIMO ...,11,CORINHOS,790,AQUELE QUE HABITA NO ESCONDERIJO
790,EU QUERO MAIS E MAIS DE CRISTO. EU QUERO MAIS ...,EU QUERO MAIS E MAIS DE CRISTO. EU QUERO MAIS ...,11,CORINHOS,791,EU QUERO MAIS E MAIS DE CRISTO
791,LOUVANDO A DEUS E CAINDO NA GRAÇA DE TODO O PO...,LOUVANDO A DEUS E CAINDO NA GRAÇA DE TODO O PO...,11,CORINHOS,792,LOUVANDO A DEUS
792,"MESA PREPARADA, CABEÇA UNGIDA, CÁLICE TRANSBOR...","MESA PREPARADA, CABEÇA UNGIDA, CÁLICE TRANSBOR...",11,CORINHOS,793,MESA PREPARADA


795 louvores ao todo.

Categorias:

In [4]:
categorias_count = (
    hinos_analise[["categoria_id", "categoria", "numero_int"]]
    .groupby(["categoria_id", "categoria"])
    .count()
    .reset_index()
    .rename(columns={"numero_int": "contagem"})
)
categorias_count

Unnamed: 0,categoria_id,categoria,contagem
0,1,CLAMOR,57
1,2,INVOCAÇÃO E COMUNHÃO,40
2,3,DEDICAÇÃO,104
3,4,"MORTE, RESSURREIÇÃO E SALVAÇÃO",94
4,5,CONSOLO E ENCORAJAMENTO,91
5,6,SANTIFICAÇÃO E DERRAMAMENTO DO ESPÍRITO SANTO,92
6,7,VOLTA DE JESUS E ETERNIDADE,94
7,8,LOUVOR,78
8,9,SALMOS DE LOUVOR,16
9,10,GRUPO DE LOUVOR,65


In [9]:
import plotly.express as px

fig = px.bar(
    categorias_count.sort_values(by="categoria_id", ascending=False),
    x="contagem",
    y="categoria",
    orientation="h",
)
fig.show()

In [11]:
fig = px.bar(
    categorias_count.sort_values(by="contagem"),
    x="contagem",
    y="categoria",
    orientation="h",
)
fig.show()