<a href="https://colab.research.google.com/github/PedroFlorencioNeto/acquisition-of-clinics/blob/main/notebooks/20231113_ClinicasEDA.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

![](https://drive.google.com/uc?export=view&id=147ISZNwW7pfykfUtl_5kln6Q2R5JEsGl)

---

<h3><center> <b>An√°lise Estrat√©gica da Aquisi√ß√£o de Clientes: O Caso da Empresa Real</b>

Mentoria - Renata Biaggi</center></h3>

Este notebook apresenta um estudo sobre [...]

**Autor:** Pedro Florencio de Almeida Neto - Cientista de Dados

<i>pedroflorencio@alu.ufc.br</i>

---

**Objetivo:** Apresentar as principais m√©tricas relacionadas √† aquisi√ß√£o de cl√≠nicas, de forma a identificar gargalos e oportunidades para otimizar a entrada de cl√≠nicas na empresa Real.

<br>**Perguntas Norteadoras:**<br>

<b>P.N.1.</b> Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum
* Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum ?
* Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum Lorem Ipsum ?
* Lorem Ipsum Lorem Ipsum Lorem Ipsum ?

**Dados Disponibilizados:**
* clinics.csv
* subscriptions.csv
* activity.csv

#### **1. Contextualiza√ß√£o**

A Real constr√≥i uma plataforma de trabalho (SaaS - Software as a Service) focada especificamente em cl√≠nicas odontol√≥gicas, onde os dentistas e propriet√°rios de cl√≠nica encontram todos os servi√ßos necess√°rios para gerir suas opera√ß√µes. O software oferece uma agenda moderna, prontu√°rio eletr√¥nico e ficha de pacientes, al√©m de acesso a gest√£o financeira entre outros. O fluxo de aquisi√ß√£o de novos clientes funciona assim:
- O usu√°rio pode se cadastrar diretamente ou pedir para conversar com um especialista antes disso.
- Uma vez cadastrado, ele tem acesso a um per√≠odo de teste do produto (trial) onde pode usar todas as funcionalidades antes de assinar.
- Terminado seu per√≠odo de testes, ele s√≥ poder√° usar o produto quando assinar. O foco deste case ser√° entender o per√≠odo de trial e como ele pode ser melhorado.

Uma das funcionalidades mais populares do produto √© o Financiamento Real, onde a Real financia o tratamento de um paciente sem riscos para a cl√≠nica, e o paciente paga para a Real em at√© 36 vezes (basicamente funcionando como um empr√©stimo). Este produto tamb√©m √© conhecido internamente como Buy now, pay later (BNPL).

Desta forma, deve ser mencionada a exist√™ncia do credenciamento. O processo de credenciamento √© uma valida√ß√£o de identidade da cl√≠nica, que a Real faz antes de aprovar ela para o uso do financiamento. √â um processo anti-fraude e que nos permite avaliar de maneira mais assertiva os riscos de realizar financiamentos para clientes dessa cl√≠nica.

> <b>Datasets</b>
<br>Os arquivos incluem as cl√≠nicas que se cadastraram nos meses de Agosto e Setembro de 2023, e suas intera√ß√µes at√© a data de extra√ß√£o (18/10/2023).

-  A tabela <b>clinics</b> cont√©m informa√ß√µes sobre as cl√≠nicas cadastradas e alguns marcos temporais delas, como trial e credenciamento. Aqui vale citar que a Real possui algumas parcerias com grandes redes e franquias de cl√≠nicas odontol√≥gicas pelo Brasil (diferenciadas das outras por colunas como business_segmentation e is_chain_clinic . Essas cl√≠nicas usam apenas o Financiamento Real, e desta forma devem ser removidas de an√°lises sobre convers√£o de assinaturas.

- A tabela <b>subscriptions</b> cont√©m informa√ß√µes de assinaturas de cl√≠nicas. A assinatura √© definida como o in√≠cio de um esquema de pagamentos recorrentes, possuindo in√≠cio, data de fim (caso tenha sido encerrada) e a recorr√™ncia de pagamentos. Se uma cl√≠nica come√ßar uma assinatura, encerrar ela e depois voltar a ser assinante, ela ter√° m√∫ltiplas linhas de assinatura.

- A tabela <b>activity</b> registra todas as atividades realizadas pela cl√≠nica, contendo registros temporais de quando a cl√≠nica desempenhou uma determinada a√ß√£o. Temos diversos tipos de atividades no produto, que por sua vez est√£o organizadas em n√≠veis hierarquicos para facilitar nosso trabalho com elas. Esses n√≠veis est√£o dispon√≠veis na tabela ( module , analytics_domain , feature ). As atividades tamb√©m s√£o divididas entre atividades v√°lidas ou n√£o, por uma quest√£o de conveni√™ncia: algumas m√©tricas s√£o calculadas apenas considerando atividades ‚Äúv√°lidas‚Äù e outras n√£o. Esta extra√ß√£o cont√©m apenas atividades realizadas em per√≠odo de trial.

#### **2. Bibliotecas**

In [None]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

#### **3. Aquisi√ß√£o dos Dados**

In [None]:
df_activity = pd.read_csv('../data/activity.csv')
df_clinics = pd.read_csv('../data/clinics.csv')
df_subscriptions = pd.read_csv('../data/subscriptions.csv')

#### **4. Entendimento dos Dados**

In [None]:
df_activity.head()

Unnamed: 0,CLINIC_ID,ACTIVITY_AT,ACTIVITY_TYPE,FEATURE,MODULE,ANALYTICS_DOMAIN,IS_TRANSACTION,IS_BNPL_ACTIVITY,IS_VALID_ACTIVITY,IS_DELETION_ACTIVITY,IS_MANAGEMENT_ACTIVITY,IS_FINANCE_ACTIVITY
0,9825,2023-08-24 18:46:47.733,patient_discarded,patient_management,patient,patient,False,False,True,True,True,False
1,9984,2023-08-24 19:41:43.497,patient_created,patient_management,patient,patient,False,False,False,False,True,False
2,9984,2023-08-24 19:41:44.037,time_slot_created,scheduling,schedule,scheduling,False,False,True,False,True,False
3,9984,2023-08-24 19:51:20.451,patient_created,patient_management,patient,patient,False,False,False,False,True,False
4,9984,2023-08-24 19:51:46.663,time_slot_created,scheduling,schedule,scheduling,False,False,True,False,True,False


In [None]:
df_activity.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 13941 entries, 0 to 13940
Data columns (total 12 columns):
 #   Column                  Non-Null Count  Dtype 
---  ------                  --------------  ----- 
 0   CLINIC_ID               13941 non-null  int64 
 1   ACTIVITY_AT             13941 non-null  object
 2   ACTIVITY_TYPE           13941 non-null  object
 3   FEATURE                 13941 non-null  object
 4   MODULE                  13941 non-null  object
 5   ANALYTICS_DOMAIN        13941 non-null  object
 6   IS_TRANSACTION          13941 non-null  bool  
 7   IS_BNPL_ACTIVITY        13941 non-null  bool  
 8   IS_VALID_ACTIVITY       13941 non-null  bool  
 9   IS_DELETION_ACTIVITY    13941 non-null  bool  
 10  IS_MANAGEMENT_ACTIVITY  13941 non-null  bool  
 11  IS_FINANCE_ACTIVITY     13941 non-null  bool  
dtypes: bool(6), int64(1), object(5)
memory usage: 735.3+ KB


In [None]:
df_clinics.head()

Unnamed: 0,CLINIC_ID,CLINIC_CREATED_AT,BUSINESS_SEGMENTATION,IS_CHAIN_CLINIC,FIRST_USER_HUBSPOT_SOURCE,INTEREST_REASONS,INTEREST_CATEGORY_SIGNUP,HAS_INTEREST_BNPL,HAS_INTEREST_BNPL_ONLY,HAS_INTEREST_SAAS,...,IS_PAID_MEDIUM,HAS_ASKED_FOR_ACCREDITATION,HAS_STARTED_ACCREDITATION_AND_NOT_FINISHED,IS_ACCREDITATION_APPROVED,IS_ACCREDITATION_REPROVED,CLINIC_ACCREDITATION_STATUS,REQUEST_FINISHED_AT,ACCREDITATION_REQUESTED_AT,ACCREDITATION_APPROVED_AT,ACCREDITATION_REJECTED_AT
0,8993,2023-08-01 06:25:16.121,Independente,False,Inbound,"[""bnpl"", ""finance_management"", ""patients_manag...",BNPL e SaaS,True,False,True,...,True,False,False,False,False,,,,,
1,8994,2023-08-01 06:58:36.251,Independente,False,Inbound,"[""finance_management"", ""patients_management"", ...",BNPL e SaaS,True,False,True,...,True,False,False,False,False,,,,,
2,8995,2023-08-01 06:59:23.156,Independente,False,Inbound,"[""bnpl""]",Apenas BNPL,True,True,False,...,True,False,False,False,False,,,,,
3,8996,2023-08-01 08:03:38.557,Independente,False,Inbound,"[""calendar"", ""bnpl"", ""patients_management"", ""f...",BNPL e SaaS,True,False,True,...,True,False,False,False,False,,,,,
4,8997,2023-08-01 08:34:33.894,Independente,False,Inbound,"[""patients_management""]",Apenas SaaS,False,False,True,...,True,False,False,False,False,,,,,


In [None]:
df_clinics.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2219 entries, 0 to 2218
Data columns (total 33 columns):
 #   Column                                      Non-Null Count  Dtype 
---  ------                                      --------------  ----- 
 0   CLINIC_ID                                   2219 non-null   int64 
 1   CLINIC_CREATED_AT                           2219 non-null   object
 2   BUSINESS_SEGMENTATION                       2219 non-null   object
 3   IS_CHAIN_CLINIC                             2219 non-null   bool  
 4   FIRST_USER_HUBSPOT_SOURCE                   2219 non-null   object
 5   INTEREST_REASONS                            2066 non-null   object
 6   INTEREST_CATEGORY_SIGNUP                    2219 non-null   object
 7   HAS_INTEREST_BNPL                           2219 non-null   bool  
 8   HAS_INTEREST_BNPL_ONLY                      2219 non-null   bool  
 9   HAS_INTEREST_SAAS                           2219 non-null   bool  
 10  TRIAL_DURATION          

#### **5. Pr√©-Processamento dos Dados**

#### **6. An√°lise Explorat√≥ria dos Dados (E.D.A)**

**Obrigado!** üôÇ