# Projeto de Big Data

## Análise de satisfação dos clientes

---

- ### Instalar todas as bibliotecas usadas

    Aconselho criar e ativar uma venv antes de rodar o código

In [7]:
# !pip3 install pandas plotly nbformat openpyxl
# !pip3 install --upgrade google-api-python-client google-auth-httplib2 google-auth-oauthlib

- ### Vinculo com o google sheets e criação dos arquivos em .xlsx

In [8]:
import os.path
import openpyxl

from google.auth.transport.requests import Request
from google.oauth2.credentials import Credentials
from google_auth_oauthlib.flow import InstalledAppFlow
from googleapiclient.discovery import build
from googleapiclient.errors import HttpError


# If modifying these scopes, delete the file token.json.
SCOPES = ["https://www.googleapis.com/auth/spreadsheets.readonly"]

# The ID and range of a sample spreadsheet.
SAMPLE_SPREADSHEET_ID = "1TUNcZRjWbSVB5bw-547Tv0bm5JdKzbjjC4GEi2xw27E"
SAMPLE_RANGE_NAME = "A:M"

"""
1 - Antes de começar crie uma pasta chamada 'security' e adicione o arquivo de credenciais do Google Cloud.
2 - Renomeie o arquivo para credentials.json ou altere o nome do arquivo no código.
"""

creds = None
if os.path.exists("security\\token.json"):
  creds = Credentials.from_authorized_user_file("security\\token.json", SCOPES)
if not creds or not creds.valid:
  if creds and creds.expired and creds.refresh_token:
    creds.refresh(Request())
  else:
    flow = InstalledAppFlow.from_client_secrets_file(
        "security\\credentials.json", SCOPES
    )
    creds = flow.run_local_server(port=0)
  with open("security\\token.json", "w") as token:
    token.write(creds.to_json())

try:
  service = build("sheets", "v4", credentials=creds)

  sheet = service.spreadsheets()
  result = (
      sheet.values()
      .get(spreadsheetId=SAMPLE_SPREADSHEET_ID, range=SAMPLE_RANGE_NAME)
      .execute()
  )
  
  val = result['values']
  
  if not os.path.exists('archives'):
    os.mkdir('archives')
  
  # Criar planilha em excel com base na planilha do google sheets
  book = openpyxl.Workbook()
  page = book['Sheet']
  for linha in val:
    linhaCorrigida = list()
    for celula in linha:
      if celula != '':
        linhaCorrigida.append(celula)
      
    page.append(linhaCorrigida)
  
  book.save('archives\\avaliacaoClientes.xlsx')
  
except HttpError as err:
  print(err)


- ### Criação e exibição do DataFrame

In [9]:
# importar o modulo pandas
import pandas as pd

df_AvaliacaoClientes = pd.read_excel('archives\\avaliacaoClientes.xlsx')
display(df_AvaliacaoClientes)

Unnamed: 0,Carimbo de data/hora,Nome completo,Como você avaliaria a qualidade dos equipamentos de nossa academia?,Como você avaliaria a limpeza e manutenção das instalações da academia?,Como você avaliaria a atmosfera e o ambiente da academia são acolhedores e agradáveis para você?,Nossos instrutores são atenciosos e competentes em ajudá-lo a atingir seus objetivos de fitness?,Os instrutores e treinadores estão atentos e disponíveis para ajudá-lo durante seus treinos?,Os banheiros e vestiários da academia atendem às suas expectativas em termos de limpeza e conforto?,Você considera que as instalações da academia são seguras para a prática de exercícios físicos?,Qual é a sua opinião sobre a música ambiente e a iluminação da academia durante os treinos?,Você recomendaria esta academia a amigos e familiares?,Oque você melhoraria na academia?
0,14/05/2024 09:37:41,Renata maques,Excelente,Excelente,Bom,Excelente,Bom,Excelente,Excelente,Regular,Sim,Variedades de alimentos
1,14/05/2024 09:40:05,Mônica Santana,Excelente,Excelente,Excelente,Excelente,Excelente,Excelente,Excelente,Regular,Sim,Por enquanto nada
2,14/05/2024 09:42:24,Rita Pantoja,Bom,Bom,Bom,Excelente,Excelente,Excelente,Excelente,Excelente,Sim,Nenhuma
3,14/05/2024 09:45:21,Nilda Brandão,Bom,Excelente,Regular,Excelente,Excelente,Excelente,Excelente,Bom,Sim,Uma televisão e ar condicionado
4,14/05/2024 09:47:31,Leonardo Brito,Bom,Excelente,Excelente,Bom,Excelente,Excelente,Excelente,Bom,Sim,Tranquilo
5,14/05/2024 09:49:28,Diego pinho,Excelente,Excelente,Excelente,Excelente,Excelente,Excelente,Excelente,Bom,Sim,Aparelho para ombro
6,14/05/2024 09:51:08,Vanessa da Silva,Excelente,Excelente,Bom,Excelente,Excelente,Excelente,Regular,Excelente,Sim,Nenhuma
7,14/05/2024 09:53:41,Vanessa farias,Bom,Bom,Regular,Excelente,Excelente,Regular,Excelente,Regular,Sim,Climatizar
8,14/05/2024 09:55:19,Isaac trindade,Bom,Bom,Bom,Excelente,Excelente,Excelente,Bom,Bom,Talvez,Ramificações de equipamentos
9,14/05/2024 09:57:34,Anthony Gabriel,Excelente,Excelente,Bom,Excelente,Regular,Excelente,Excelente,Bom,Sim,Nenhuma


- ### Criação da planilha com nomes e respostas discursivas.

In [10]:
respostasPorPessoa = df_AvaliacaoClientes[['Carimbo de data/hora','Nome completo',
                                            'Oque você melhoraria na academia?']]

display(respostasPorPessoa)
respostasPorPessoa.to_excel('archives\\respostasPorPessoa.xlsx')

Unnamed: 0,Carimbo de data/hora,Nome completo,Oque você melhoraria na academia?
0,14/05/2024 09:37:41,Renata maques,Variedades de alimentos
1,14/05/2024 09:40:05,Mônica Santana,Por enquanto nada
2,14/05/2024 09:42:24,Rita Pantoja,Nenhuma
3,14/05/2024 09:45:21,Nilda Brandão,Uma televisão e ar condicionado
4,14/05/2024 09:47:31,Leonardo Brito,Tranquilo
5,14/05/2024 09:49:28,Diego pinho,Aparelho para ombro
6,14/05/2024 09:51:08,Vanessa da Silva,Nenhuma
7,14/05/2024 09:53:41,Vanessa farias,Climatizar
8,14/05/2024 09:55:19,Isaac trindade,Ramificações de equipamentos
9,14/05/2024 09:57:34,Anthony Gabriel,Nenhuma


- ### Criação dos gráficos / Dashboards das perguntas de multipla escolha

In [11]:
# Importação do plotly.express para a criação de gráficos do tipo Histograma
  # Instalar o nbformat para a utilização da versão mais atual: pip install nbformat
import plotly.express as px
df_perguntasObjetivas = df_AvaliacaoClientes.drop(columns=['Carimbo de data/hora','Nome completo',
                                                        'Oque você melhoraria na academia?'])

if not os.path.exists('report'):
  os.makedirs('report\\graphics')
  os.makedirs('report\\text')
else:
  print('Caminhos já criados.')

# Cria um grafico para cada coluna
for colunas in df_perguntasObjetivas.columns:
  grafico = px.histogram(df_perguntasObjetivas,x=colunas, color=colunas)
  grafico.show()
  display(df_perguntasObjetivas[colunas].value_counts(normalize=True).map('{:.2%}'.format))
  print('\n')


Caminhos já criados.


Como você avaliaria a qualidade dos equipamentos de nossa academia?
Bom          50.91%
Excelente    45.45%
Regular       3.64%
Name: proportion, dtype: object





Como você avaliaria a limpeza e manutenção das instalações da academia?
Excelente    52.73%
Bom          41.82%
Regular       5.45%
Name: proportion, dtype: object





Como você avaliaria a atmosfera e o ambiente da academia são acolhedores e agradáveis para você?
Excelente    41.82%
Bom          30.91%
Regular      27.27%
Name: proportion, dtype: object





Nossos instrutores são atenciosos e competentes em ajudá-lo a atingir seus objetivos de fitness?
Excelente    89.09%
Bom           7.27%
Regular       3.64%
Name: proportion, dtype: object





Os instrutores e treinadores estão atentos e disponíveis para ajudá-lo durante seus treinos?
Excelente    85.45%
Regular      10.91%
Bom           3.64%
Name: proportion, dtype: object





Os banheiros e vestiários da academia atendem às suas expectativas em termos de limpeza e conforto?
Excelente    69.09%
Regular      14.55%
Bom          14.55%
Ruim          1.82%
Name: proportion, dtype: object





 Você considera que as instalações da academia são seguras para a prática de exercícios físicos?
Excelente    81.82%
Bom          12.73%
Regular       5.45%
Name: proportion, dtype: object





Qual é a sua opinião sobre a música ambiente e a iluminação da academia durante os treinos?
Bom          50.91%
Regular      27.27%
Excelente    21.82%
Name: proportion, dtype: object





Você recomendaria esta academia a amigos e familiares?
Sim       98.18%
Talvez     1.82%
Name: proportion, dtype: object



