## Libraries

In [1]:
# import libraries
import numpy as np
import pandas as pd
import datetime as dt
from Modules.validaciones import *
from Modules.df_local_functions import *

---

## Local Modules

In [2]:
# insert an header into a file

In [3]:
t_DataFrame = type(pd.DataFrame())
def add_header(file_url, header: str):
    with open(file_url, 'r+', encoding='utf-8') as outf:
        content = outf.read()
        outf.seek(0, 0)
        outf.write(header.strip() + '\n' + content)

---

## Input: Base-txt.csv

In [4]:
# import PAMI & base_sql file from local proyect.

In [5]:
t = pd.read_csv('../Datos/202106/base_txt_202106.csv')

In [6]:
# copy the DatasFrames

In [7]:
base_txt_file = t.copy() 

In [8]:
# display the columns name of 'base_txt_file'

In [9]:
base_txt_file.columns

Index(['Apellido y Nombre', 'Tipo Documento', 'Nro Documento', 'Estado Civil',
       'Nacionalidad', 'Calle', 'Puerta', 'Piso', 'Dpto', 'CP', 'Telefono',
       'Fecha Nacimiento', 'Sexo', 'CUIT', 'CUIL', 'Beneficio', 'Parentesco',
       'Sucursal', 'Agencia', 'Corresponsalia', 'Afip', 'Afiliacion',
       'Formulario', 'Fecha Baja', 'Codigo Baja', 'B1', 'CodDiagno',
       'CodDiagnostico', 'Tipo Diagnostico', 'B2', 'CodPresta',
       'Cod Prestación', 'Fecha Práctica', 'Cantidad', 'Modalidad',
       'Nro Orden', 'B3', 'Ctrol 1', 'CTROL 2', 'Ctrol 3', 'CONCATENAR',
       'CONTROL 4', 'CONTROL  DIAS', 'CONTROL 5 COD', '****', '¨¨¨¨', 'VERDE',
       'CONTROL TRANSMISION', 'CONTROL TRANSMISION- N°', 'Unnamed: 49',
       'DIAS MES', '30/6/2021', 'Unnamed: 52', '4/6/2021', '7', '4',
       '2/7/2021'],
      dtype='object')

---

## Output: Afiliado_piloto.txt

In [10]:
# build output file with 'afiliados' data

In [11]:
# columns of interest

In [12]:
interest_col = ['Apellido y Nombre', 'Tipo Documento', 'Nro Documento', 'Estado Civil', 'Nacionalidad', 'Calle',
                'Puerta', 'Piso', 'Dpto', 'CP', 'Telefono', 'Fecha Nacimiento', 'Sexo', 'CUIT', 'CUIL',
                'Beneficio', 'Parentesco', 'Sucursal', 'Agencia', 'Corresponsalia', 'Afip', 'Afiliacion', 
                'Formulario', 'Fecha Baja', 'Codigo Baja'
               ]

full_interest_col = ['Apellido y Nombre', 'Tipo Documento', 'Nro Documento', 'Estado Civil', 'Nacionalidad', 'Pais', 'Calle',
                     'Puerta', 'Piso', 'Dpto', 'CP', 'Telefono', 'Fecha Nacimiento', 'Sexo', 'CUIT', 'CUIL',
                     'Beneficio', 'Parentesco', 'Sucursal', 'Agencia', 'Corresponsalia', 'Afip', 'Afiliacion', 
                     'Formulario', 'Fecha Baja', 'Codigo Baja'
                    ]

In [13]:
# create a copy of 'base_txt_file' df

In [14]:
base_txt_file_copy = base_txt_file.copy()

In [15]:
# cast 'Fecha Nacimiento' column type to datetime type

In [16]:
base_txt_file_copy['Fecha Nacimiento'] = pd.to_datetime(base_txt_file_copy['Fecha Nacimiento'], dayfirst=True, 
                                                        format="%d/%m/%Y").dt.strftime('%d/%m/%Y')

In [17]:
# add leading zeros to each value.

In [18]:
base_txt_file_copy['Beneficio'] = add_zeros_to_left(base_txt_file_copy, 'Beneficio', 12)
base_txt_file_copy['Parentesco'] = add_zeros_to_left(base_txt_file_copy, 'Parentesco', 2)

In [19]:
# sort by full name & date

In [20]:
base_txt_file_copy = base_txt_file_copy.sort_values(by=['Apellido y Nombre'])

In [21]:
# create a new DataFrame only with interest columns

In [22]:
afiliado_df = base_txt_file_copy.loc[:, interest_col]


In [23]:
# add a column called 'pais'

In [24]:
afiliado_df.insert(5, 'Pais', '')

In [25]:
# aplicar filtro y eliminar registros repetidos.

In [26]:
final_afiliado_df = afiliado_df.drop_duplicates(subset='Apellido y Nombre', keep='first')
final_afiliado_df = final_afiliado_df.reset_index().drop(['index'], axis=1)

In [27]:
# check the validity of 'Tipo Documento' in each register.

In [28]:
# final_afiliado_df['Tipo Documento'] = final_afiliado_df['Tipo Documento'].apply(lambda x: 'DNI' if x == 'DI' else x)

In [29]:
final_afiliado_df['Tipo Documento']

0      DI
1      DI
2      DI
3      DI
4      DI
       ..
187    DI
188    DI
189    DI
190    LC
191    DI
Name: Tipo Documento, Length: 192, dtype: object

In [30]:
final_afiliado_df['Tipo Documento'] = replace_Series_values(final_afiliado_df, 'Tipo Documento', 'DI', 'DNI')

In [31]:
final_afiliado_df['Tipo Documento']

0      DNI
1      DNI
2      DNI
3      DNI
4      DNI
      ... 
187    DNI
188    DNI
189    DNI
190     LC
191    DNI
Name: Tipo Documento, Length: 192, dtype: object

In [32]:
# change the order of the 'CP' column.

In [33]:
col_new_order = ['Apellido y Nombre', 'Tipo Documento', 'Nro Documento', 'Estado Civil', 'Nacionalidad', 'Pais', 'Calle', 
                 'Puerta', 'Piso', 'CP', 'Dpto', 'Telefono', 'Fecha Nacimiento', 'Sexo', 'CUIT', 'CUIL', 'Beneficio', 
                 'Parentesco', 'Sucursal', 'Agencia', 'Corresponsalia', 'Afip', 'Afiliacion', 'Formulario', 'Fecha Baja', 
                 'Codigo Baja']

In [34]:
final_afiliado_df = final_afiliado_df.reindex(columns=col_new_order)

In [35]:
# export 'final_afiliado_df' to a txt file

In [36]:
final_afiliado_df.to_csv('../Datos/202106/Auxiliares/afiliado_piloto.txt', sep=';', header=False, index=False, encoding='utf-8')

In [37]:
# add 'AFILIADO', as an header, into the 'afiliado_piloto.txt' file

In [38]:
afiliado_piloto_url = '../Datos/202106/Auxiliares/afiliado_piloto.txt'

add_header(afiliado_piloto_url, 'AFILIADO')

---

## In/Out: Afiliado_original.txt

In [39]:
# import the original file

In [40]:
afiliado_original = pd.read_csv('../Datos/202106/Auxiliares/afiliado-original.csv', 
                                sep=';', names=full_interest_col, index_col=False)

In [41]:
# add leading zeros to each value.

In [42]:
afiliado_original['Beneficio'] = add_zeros_to_left(afiliado_original, 'Beneficio', 12)
afiliado_original['Parentesco'] = add_zeros_to_left(afiliado_original, 'Parentesco', 2)

In [43]:
# sort the registers by 'Apellido y Nombre' column

In [44]:
afiliado_original = afiliado_original.sort_values(by=['Apellido y Nombre'])

In [45]:
# export 'afiliado_original' df to a txt file

In [46]:
afiliado_original.to_csv('../Datos/202106/Auxiliares/afiliado_original_ordenado.txt', sep=';', header=False, index=False, encoding='utf-8')

In [47]:
# add header into the generated file

In [48]:
afiliado_original_url = '../Datos/202106/Auxiliares/afiliado_original_ordenado.txt'

add_header(afiliado_original_url, 'AFILIADO')

---