# Descrição
O conjunto de dados utilizado foi tirado do [portal de dados públicos do governo brasileiro](https://dados.gov.br/dados/conjuntos-dados/indice-geral-de-reclamacoes---igr--metodologia-a-partir-de-2023) disponibilizado pela ANS (Agência Nacional de Saúde Suplementar).
O dados tem como base as reclamações registrados por consumidores, que utilizam planos de saúde, via Notificação de Intermediação Preliminar (NIP). </br>
O IGR (Índice Geral de Reclamações) é uma métrica calculada pela ANS utilizando a seguinte fórmula:</br>
IGR = $\frac{𝑀é𝑑𝑖𝑎 𝑑𝑎𝑠 𝐷𝑒𝑚𝑎𝑛𝑑𝑎𝑠 𝑁𝐼𝑃 𝑑𝑜 𝑝𝑒𝑟í𝑜𝑑𝑜 𝑎𝑛𝑎𝑙𝑖𝑠𝑎𝑑𝑜 𝑐𝑙𝑎𝑠𝑠𝑖𝑓𝑖𝑐𝑎𝑑𝑎𝑠 𝑐𝑜𝑚𝑜 𝐼𝑛𝑎𝑡𝑖𝑣𝑎, 𝑁𝑃, 𝑅𝑉𝐸, 𝑁ú𝑐𝑙𝑒𝑜 𝑜𝑢 𝐸𝑚 𝐴𝑛𝑑𝑎𝑚𝑒𝑛𝑡o}{Média de beneficiários de plano de saúde do período analisado} \times 100$ </br>
Ele apresenta uma relação inversamente proporcional à satisfação dos beneficiários, onde pode-se dizer que quanto menor for o valor do IGR, maior é a satisfação dos beneficiários com a(s) Operadora(s).</br>
De forma complementar foi utilizado também os dados refentes as operadoras de planos de saúde [ativas](https://dados.gov.br/dados/conjuntos-dados/operadoras-de-planos-privados-de-saude) pois o intuito é criar um único dataframe com o IGR de todas as operadoras de planos de saúde ativas.


# Extrair Dados

In [1]:
import pandas as pd

In [44]:
# Carregando os arquivos csv
df_IGR= pd.read_csv('/content/IGR_202309.csv', delimiter=';', encoding='utf-8')
df_operadoras_ativas = pd.read_csv('/content/Relatorio_cadop.csv', delimiter=';', encoding='utf-8')

In [45]:
df_IGR.head(5)

Unnamed: 0,REGISTRO_ANS,RAZAO_SOCIAL,COBERTURA,IGR,QTD_RECLAMACOES,QTD_BENEFICIARIOS,PORTE_OPERADORA,COMPETENCIA,COMPETENCIA_BENEFICIARIO,DT_ATUALIZACAO
0,477,SUL AMÉRICA SEGURADORA DE SAÚDE S.A.,Assistência médica,15633,97,62049,Médio,202309,202308,2023-10-09
1,515,ALLIANZ SAÚDE S/A,Assistência médica,5569,13,23342,Médio,202309,202308,2023-10-09
2,582,PORTO SEGURO - SEGURO SAÚDE S/A,Assistência médica,6962,343,492684,Grande,202309,202308,2023-10-09
3,582,PORTO SEGURO - SEGURO SAÚDE S/A,Exclusivamente odontológica,109,8,733646,Grande,202309,202308,2023-10-09
4,701,UNIMED SEGUROS SAÚDE S/A,Assistência médica,4633,358,772785,Grande,202309,202308,2023-10-09


In [46]:
df_operadoras_ativas.head(5)

Unnamed: 0,Registro_ANS,CNPJ,Razao_Social,Nome_Fantasia,Modalidade,Logradouro,Numero,Complemento,Bairro,Cidade,UF,CEP,DDD,Telefone,Fax,Endereco_eletronico,Representante,Cargo_Representante,Regiao_de_Comercializacao,Data_Registro_ANS
0,418374,11828089000103,CAIXA DE ASSISTÊNCIA DO SETOR DE ENERGIA -EVI...,E-VIDA,Autogestão,SETOR DE HABITAÇÕES COLETIVAS GEMINADAS,QUADRA 704/705,"BLOCO C, LOJA 48",ASA NORTE,Brasília,DF,70730630,61.0,39668300.0,,governanca@evida.org.br,ELI PINTO DE MELO JUNIOR,PRESIDENTE,4.0,2012-01-12
1,419761,19541931000125,18 DE JULHO ADMINISTRADORA DE BENEFÍCIOS LTDA,,Administradora de Benefícios,RUA CAPITÃO MEDEIROS DE REZENDE,274,,PRAÇA DA BANDEIRA,Além Paraíba,MG,36660000,32.0,34624649.0,,contabilidade@cbnassessoria.com.br,LUIZ HENRIQUE MARENDINO GONÇALVES,SÓCIO ADMINISTRADOR,6.0,2015-05-19
2,421545,22869997000153,2B ODONTOLOGIA OPERADORA DE PLANOS ODONTOLÓGIC...,,Odontologia de Grupo,RUA CATÃO,128,SALA 126,VILA ROMANA,São Paulo,SP,5049000,11.0,34415852.0,,labmarisol@gmail.com,MARISOL BECHELLI,SÓCIO ADMINISTRADORA,4.0,2019-06-13
3,421421,27452545000195,2CARE OPERADORA DE SAÚDE LTDA.,,Medicina de Grupo,RUA: BERNARDINO DE CAMPOS,230,1º ANDAR,CENTRO,Campinas,SP,13010151,19.0,37901224.0,,ans.2care@planodesaudeveracruz.com.br,FABIO PEREIRA FRAGA,REPRESENTANTE,5.0,2018-10-09
4,422908,41788751000100,3S ADMINISTRADORA DE BENEFICIOS LTDA,3S ADMINISTRADORA DE BENEFICIOS,Administradora de Benefícios,RUA ITÁLIA,33,SALA 6,JARDIM BONFIGLIOLI,Jundiaí,SP,13207280,11.0,42263247.0,,pietrorocchi37@gmail.com,ANAMELIA MONTEIRO GUERRA ROCCHI,SÓCIO ADMINISTRADOR,6.0,2021-07-12


# Transformar Dados

Eliminando algumas colunas das tabelas, que podem não ser necessárias para fins de análise.

In [47]:
# Eliminando as colunas CNPJ, Nome_Fantasia, Logradouro, Numero Complemento, CEP, DDD, Telefone, Fax, Endereco_eletronico, Representante, Cargo_Representante, Regiao_de_Comercializacao
df_operadoras_ativas.drop(['CNPJ', 'Nome_Fantasia', 'Logradouro', 'Numero', 'Complemento', 'Bairro', 'CEP',
       'DDD', 'Telefone', 'Fax', 'Endereco_eletronico', 'Representante',
       'Cargo_Representante', 'Regiao_de_Comercializacao'], axis=1, inplace=True)

In [48]:
# Deletando a coluna DT_ATUALIZACAO, já que a mesma apenas corresponde a data e a hora da última atualização do arquivo
df_IGR.drop('DT_ATUALIZACAO', axis=1, inplace=True)

Verificando dados nulos nas tabelas

In [50]:
# df_IGR
df_IGR.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 119421 entries, 0 to 119420
Data columns (total 9 columns):
 #   Column                    Non-Null Count   Dtype 
---  ------                    --------------   ----- 
 0   REGISTRO_ANS              119421 non-null  int64 
 1   RAZAO_SOCIAL              119421 non-null  object
 2   COBERTURA                 119421 non-null  object
 3   IGR                       119421 non-null  object
 4   QTD_RECLAMACOES           119421 non-null  int64 
 5   QTD_BENEFICIARIOS         119421 non-null  int64 
 6   PORTE_OPERADORA           119421 non-null  object
 7   COMPETENCIA               119421 non-null  int64 
 8   COMPETENCIA_BENEFICIARIO  119421 non-null  int64 
dtypes: int64(5), object(4)
memory usage: 8.2+ MB


In [51]:
# df_operadoras_ativas
df_operadoras_ativas.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1127 entries, 0 to 1126
Data columns (total 6 columns):
 #   Column             Non-Null Count  Dtype 
---  ------             --------------  ----- 
 0   Registro_ANS       1127 non-null   int64 
 1   Razao_Social       1127 non-null   object
 2   Modalidade         1127 non-null   object
 3   Cidade             1127 non-null   object
 4   UF                 1127 non-null   object
 5   Data_Registro_ANS  1127 non-null   object
dtypes: int64(1), object(5)
memory usage: 53.0+ KB


Isolando no df_IGR apenas as operadoras de saúde ativas, utilizando o dataframe de operadoras de saúde ativas e encontrando a insterseção desses dois dataframes.


In [52]:
# Alterando o nome das colunas do df_operadoras_ativas para letra maiúscula, para seguir o padrao do df_IGR
df_operadoras_ativas.columns = df_operadoras_ativas.columns.str.upper()
df_operadoras_ativas.columns

Index(['REGISTRO_ANS', 'RAZAO_SOCIAL', 'MODALIDADE', 'CIDADE', 'UF',
       'DATA_REGISTRO_ANS'],
      dtype='object')

In [53]:
# Interseção de registros
df_IGR_ativas = pd.merge( df_operadoras_ativas, df_IGR, how='inner')

### Limpeza do novo dataframe df_IGR_ativas


In [57]:
df_IGR_ativas.head(3)

Unnamed: 0,REGISTRO_ANS,RAZAO_SOCIAL,MODALIDADE,CIDADE,UF,DATA_REGISTRO_ANS,COBERTURA,IGR,QTD_RECLAMACOES,QTD_BENEFICIARIOS,PORTE_OPERADORA,COMPETENCIA,COMPETENCIA_BENEFICIARIO
0,421545,2B ODONTOLOGIA OPERADORA DE PLANOS ODONTOLÓGIC...,Odontologia de Grupo,São Paulo,SP,2019-06-13,Exclusivamente odontológica,0,0,545,Pequeno,202309,202308
1,421545,2B ODONTOLOGIA OPERADORA DE PLANOS ODONTOLÓGIC...,Odontologia de Grupo,São Paulo,SP,2019-06-13,Exclusivamente odontológica,0,0,545,Pequeno,202308,202308
2,421545,2B ODONTOLOGIA OPERADORA DE PLANOS ODONTOLÓGIC...,Odontologia de Grupo,São Paulo,SP,2019-06-13,Exclusivamente odontológica,0,0,553,Pequeno,202307,202307


In [54]:
# Verificando dados nulos e os tipode de dados de cada coluna
df_IGR_ativas.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 97396 entries, 0 to 97395
Data columns (total 13 columns):
 #   Column                    Non-Null Count  Dtype 
---  ------                    --------------  ----- 
 0   REGISTRO_ANS              97396 non-null  int64 
 1   RAZAO_SOCIAL              97396 non-null  object
 2   MODALIDADE                97396 non-null  object
 3   CIDADE                    97396 non-null  object
 4   UF                        97396 non-null  object
 5   DATA_REGISTRO_ANS         97396 non-null  object
 6   COBERTURA                 97396 non-null  object
 7   IGR                       97396 non-null  object
 8   QTD_RECLAMACOES           97396 non-null  int64 
 9   QTD_BENEFICIARIOS         97396 non-null  int64 
 10  PORTE_OPERADORA           97396 non-null  object
 11  COMPETENCIA               97396 non-null  int64 
 12  COMPETENCIA_BENEFICIARIO  97396 non-null  int64 
dtypes: int64(5), object(8)
memory usage: 10.4+ MB


Transformação:</br>
IGR em float </br>
DATA_REGISTRO_ANS em date </br>
COMPETENCIA em date </br>
COMPETENCIA_BENEFICIARIO em date </br>

In [60]:
df_IGR_ativas['DATA_REGISTRO_ANS'] = pd.to_datetime(df_IGR_ativas['DATA_REGISTRO_ANS'])

In [63]:
df_IGR_ativas['COMPETENCIA'] = pd.to_datetime(df_IGR_ativas['COMPETENCIA'], format='%Y%m')

In [64]:
df_IGR_ativas['COMPETENCIA_BENEFICIARIO'] = pd.to_datetime(df_IGR_ativas['COMPETENCIA_BENEFICIARIO'], format='%Y%m')

In [65]:
df_IGR_ativas['IGR'] = pd.to_numeric(df_IGR_ativas['IGR'].str.replace(',', '.', regex=True))

In [66]:
df_IGR_ativas.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 97396 entries, 0 to 97395
Data columns (total 13 columns):
 #   Column                    Non-Null Count  Dtype         
---  ------                    --------------  -----         
 0   REGISTRO_ANS              97396 non-null  int64         
 1   RAZAO_SOCIAL              97396 non-null  object        
 2   MODALIDADE                97396 non-null  object        
 3   CIDADE                    97396 non-null  object        
 4   UF                        97396 non-null  object        
 5   DATA_REGISTRO_ANS         97396 non-null  datetime64[ns]
 6   COBERTURA                 97396 non-null  object        
 7   IGR                       97396 non-null  float64       
 8   QTD_RECLAMACOES           97396 non-null  int64         
 9   QTD_BENEFICIARIOS         97396 non-null  int64         
 10  PORTE_OPERADORA           97396 non-null  object        
 11  COMPETENCIA               97396 non-null  datetime64[ns]
 12  COMPETENCIA_BENEFI

# Carregar Dados

In [67]:
# Nome do arquivo CSV
nome_arquivo = 'IGR_operadoras_ativas.csv'

# Salvar o DataFrame em um arquivo CSV
df_IGR_ativas.to_csv(nome_arquivo, index=False)
print(f'Arquivo CSV "{nome_arquivo}" criado com sucesso.')

Arquivo CSV "IGR_operadoras_ativas.csv" criado com sucesso.
