# BVS Files Maker
`VERSION: 1.0`
## Indice
> * `TARJETA_EQUIPO.csv`
> * `LINEAS_CONTRATO.csv`
> * `CABECERA_CONTRATO.txt`

## Generación TARJETA_EQUIPO

In [1]:
import pandas as pd
import numpy as np

#### Carga cruda de datos en datagrama y generación de columnas adicionales

In [2]:
# Lectura del quote Cisco (unicamente). Se descartan las 27 primeras líneas del header ("skiprows").
df = pd.DataFrame(pd.read_excel('quote.xlsx', skiprows=26,encoding='ISO-8859-1'))

In [4]:
# Agregado de columnas faltantes
df["insID"] = df.index+1 #indice
df["status"] = "sns_Active" #preguntar de donde sale este feature

In [None]:
# Reemplazo de index por insID
# df.set_index("insID", inplace=True)

In [6]:
# Tamaño del datagrama
df.shape

(34, 66)

#### Limpieza de datos y generación de datagrama definitivo

In [7]:
# Reemplazo de np.nan's por " "
df.replace(np.nan,"",inplace=True)

In [8]:
df.head(3)

Unnamed: 0,Product Number,Product Description,Last Date of Support,PAK/Serial Number,Instance Number,Major/Minor,Parent Instance Number,Line Type,Host ID/Mac ID,Service Level,...,Service List Factor,Smart Account / Virtual Account,Initial Term (Months),Billing Frequency,Automatically Renews For,Subscription ID,Reference Serial Number,Reference Instance Number,insID,status
0,ASR1004,"Cisco ASR1004 Chassis, Dual P/S",1.7459712e+18,FOX1517H4HE,810189597,Major,810189597,NEW,,SNTP,...,,,,,,,,,1,sns_Active
1,SPA-10X1GE-V2,Cisco 10-Port Gigabit Ethernet Shared Port Ada...,,JAE15130B5S,810189641,Minor,810189597,NEW,,SNTP,...,,,,,,,,,2,sns_Active
2,ASR1000-SIP-BLANK,Blank Cover ASR1000 SIP,,,810189705,Minor,810189597,NEW,,SNTP,...,,,,,,,,,3,sns_Active


In [9]:
# Generación de nombres de columnas
 # filtro_columnas: son las columnas que nos interesan del DF fuente y se utilizarán para filtrar el mismo DF
 # columnas_definitivas: son los nombres con los que deben llamarse en df_tarjeta_equipo
 # cabecera: es un requerimiento del SAP, se traduce como un DF con dos headers
filtro_columnas = ["insID", "End Customer ID", "Instance Number", "PAK/Serial Number", "Product Number", "Product Description", "End Customer Address Line 1","End Customer Zip/Postal Code" ,"End Customer City", "End Customer Country", "status"]
columnas_definitivas = ["insID","customer", "manufSN", "internalSN", "itemCode", "itemName", "street", "zip", "city", "county", "status"]
cabecera = ["EquipmentCardNum", "CustomerCode", "ManufacturerSerialNum", "InternalSerialNum", "ItemCode", "ItemDescription","Street", "ZipCode", "City", "County", "StatusOfSerialNumber"]

In [10]:
# Generación de DF definitivo (df_tarjeta_equipo) con las columnas de interés
df_tarjeta_equipo = pd.DataFrame(df[filtro_columnas])

# DF final con los nombres de columnas actualizados según "columnas_definitivas"
df_tarjeta_equipo.columns = columnas_definitivas

# Agregado de un segundo Header (Asi lo requiere SAP...). En este caso ambos Headers son idénticos
df_tarjeta_equipo.columns = pd.MultiIndex.from_tuples(
    zip(cabecera, 
        df_tarjeta_equipo.columns))

In [11]:
# Listado de ejemplo
df_tarjeta_equipo.head(3)

Unnamed: 0_level_0,EquipmentCardNum,CustomerCode,ManufacturerSerialNum,InternalSerialNum,ItemCode,ItemDescription,Street,ZipCode,City,County,StatusOfSerialNumber
Unnamed: 0_level_1,insID,customer,manufSN,internalSN,itemCode,itemName,street,zip,city,county,status
0,1,405432182,810189597,FOX1517H4HE,ASR1004,"Cisco ASR1004 Chassis, Dual P/S",PERU 169,1067,CAPITAL FEDERAL,AR,sns_Active
1,2,405432182,810189641,JAE15130B5S,SPA-10X1GE-V2,Cisco 10-Port Gigabit Ethernet Shared Port Ada...,PERU 169,1067,CAPITAL FEDERAL,AR,sns_Active
2,3,405432182,810189705,,ASR1000-SIP-BLANK,Blank Cover ASR1000 SIP,PERU 169,1067,CAPITAL FEDERAL,AR,sns_Active


#### Generación de archivo de salida.txt

In [12]:
# *** EN PROCESO DE TESTING ***
# *** POR EL MOMENTO NO ESTA DESARROLLADA LA SALIDA EN .TXT ***

# numpy_array = df_tarjeta_equipo.to_numpy()
# np.savetxt("test_tarjeta_equipo.txt", numpy_array, fmt = "%s")


In [13]:
# Salida en formato xls
# df_tarjeta_equipo.to_excel("1.test_tarjeta_equipo.xls", index = False)

In [14]:
# Salida en formato csv
df_tarjeta_equipo.to_csv("1.test_tarjeta_equipo.csv", index = False)

## Generación LINEAS_CONTRATO

In [None]:
import pandas as pd
import numpy as np

#### Carga cruda de datos en datagrama y generación de columnas adicionales

In [None]:
# Lectura del quote Cisco (unicamente)
df = pd.DataFrame(pd.read_excel('quote.xlsx', skiprows=26,encoding='ISO-8859-1'))

In [None]:
# TBModify: Features para tomar nombre desde teclado
u_vendor_contract = "* CISCO *"
u_ov = "* OV xxxxx BVS TV SA *"

# TBModify: Features que no se saben de donde sales
u_status_vendor = "* ACTIVE *"

# Agregado de columnas faltantes
df["LineNum"] = df.index+1
df["U_VendorContract"] =  u_vendor_contract # preguntar de donde sale este feature
df["U_OV"] = u_ov # preguntar de donde sale este feature
df["U_StatusVendor"] = u_status_vendor # preguntar de donde sale este feature

# Tamaño del datagrama
df.shape

#### Limpieza de datos y generación de datagrama definitivo

In [None]:
# Reemplazo de np.nan's por " "
df.replace(np.nan,"",inplace=True)

df.head(3)

In [None]:
# Generación de nombres de columnas
 # filtro_columnas: son las columnas requeridas del DF fuente
 # columnas_definitivas: son los nombres con los que deben llamarse en df_tarjeta_equipo
filtro_columnas = ["Parent Instance Number", "LineNum", "Product Number", "Product Description", "Instance Number", "PAK/Serial Number", "Start Date","End Date" ,"U_StatusVendor", "Service Level Description", "U_OV", "End Customer Name", "U_VendorContract"]
columnas_definitivas = ["ParentKey", "LineNum", "itemCode", "itemName", "ManufSN", "InternalSN", "StartDate", "EndDate", "U_StatusVendor", "U_ServSKU", "U_OV", "U_EndCustomer", "U_VendorContract"]

In [None]:
# Generación de DF definitivo (df_tarjeta_equipo) con las columnas de interés
df_lineas_contrato = pd.DataFrame(df[filtro_columnas])

# DF final con los nombres de columnas actualizados según "columnas_definitivas"
df_lineas_contrato.columns = columnas_definitivas

# Agregado de un segundo Header (Asi lo requiere SAP...). En este caso ambos Headers son idénticos
df_lineas_contrato.columns = pd.MultiIndex.from_tuples(
    zip(columnas_definitivas, 
        df_lineas_contrato.columns))

# Listado de ejemplo
df_lineas_contrato.head(3)

In [None]:
#### Generación de archivo de salida.txt

# df_lineas_contrato.to_excel("2.test_lineas_contrato.xls", index = False)
df_lineas_contrato.to_csv("2.test_lineas_contrato.csv", index = False)