# **Analisi Margini & Ricarichi v1_0**
## **Data Preparation Notebook**
***A Jupyther Notebook by Cristiano Esposito - ©2019***<br><br>
**Dalla analisi dei prezzi di listino di un catalogo, individuare le relative marginature e determinare i ricarichi da applicare al listino di vendita, per ottenere marginature pari al 20%-30%-35%**

## **Sorgenti**
<li>Listino.csv: Esportazione del magazzino ottenuto da AS400</li>

## **Changelog**
<li>19-08-2019: Inizio del progetto</li>
<li>29-08-2019: Implementazione struttura attuale</li>
<li>01-09-2019: Fine della fase di test e completamento del Notebook nella versione finale</li>

## **Imports** 
Iniziamo importando le librerie python che andremo ad utilizzare nel progetto:<br>
**pandas** --> caricamento e gestione dati<br>
**pathlib** --> operazioni sulla gestione dei path di file<br>
**datetime** --> libreria di operazioni sulle date

In [1]:
import pandas as pd
from pathlib import Path
from datetime import datetime

## **File Locations**

In [2]:
# Collegamento e importazione dataframe dal file esterno
today = datetime.today()
listini_file = Path.cwd() / "data" / "raw" / "Listini.csv" # file di lettura Listini
summary_listini_file = Path.cwd() / "data" / "processed" / f"summary_listini.pkl"
df_listini = pd.read_csv(listini_file, encoding="ISO-8859-1", sep=";")

## **Formattazione Dati**
In questa sezione apportiamo le giuste definizioni ai tipi dati contenuti nel DataFrame, correggendo anche i valori in maniera opportuna

In [3]:
# Controlliamo il dataframe appena importato
df_listini

Unnamed: 0,COD-ARTICOLO,PREF.FORNITORE,COD.ART.FORNITORE,REFER.FORNITORE,BARCODE,COD.HIDROS,VISIB.AZIENDA,COD.SETTORE,COD.REPARTO,COD.SOTTO REPARTO,...,Unnamed: 58,Unnamed: 59,Unnamed: 60,Unnamed: 61,Unnamed: 62,Unnamed: 63,Unnamed: 64,Unnamed: 65,Unnamed: 66,Unnamed: 67
0,24796,ALA,200204GRL,,,ALIGRL,,,0,0,...,200,17100,200,21386,",00",",00",",00",",00",17355,",00"
1,24795,ALA,200204,,,ALIVUOTATOIO,,,0,0,...,600,106800,600,137759,100,17800,100,23317,108402,18884
2,3146,ALM,,01100081000,8033813890799,TUBOGPL,T,04,15,113,...,3500000,827600,3237100,1013477,2160000,513750,1687900,525718,767335,404476
3,3147,ALM,,01200130500,8033813890805,TUBOMET,T,04,15,113,...,2350000,965450,2156850,1249569,300000,123000,698500,411884,885868,286384
4,4307,ALT,31075,31075,8032862547593,AXA65*65,,,0,0,...,9800,205800,11000,333455,4200,88200,5200,154367,244312,112761
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
6083,4637,ZIN,,573040Z,8059173993970,SPORA,T,04,15,68,...,70000,255176,59400,326990,2000,7290,16900,93386,216477,61585
6084,3114,ZIN,,593545Z,,SPORG,,,0,0,...,11000,46172,11500,69901,2000,8394,5000,31346,48242,20976
6085,52147,ZIN,533310,,,533310,,,0,0,...,",00",",00",2400,32535,",00",",00",1500,19198,19416,12135
6086,52148,ZIN,535010,,,535010,,,0,0,...,",00",",00",",00",",00",",00",",00",300,5893,",00",3777


In [4]:
# Andiamo a modificare i tipi dati delle colonne che ci interesseranno per il calcolo dei margini e dei ricarichi
df_listini.replace({"," : "."}, inplace = True, regex = True)
df_listini.columns = [x.strip() for x in df_listini.columns]
df_listini['LISTINO  1']=df_listini['LISTINO  1'].str.strip().astype(float)
df_listini['LISTINO  5']=df_listini['LISTINO  5'].str.strip().astype(float)
df_listini['LISTINO  6']=df_listini['LISTINO  6'].str.strip().astype(float)
df_listini['SC.1 LIS.  1']=df_listini['SC.1 LIS.  1'].str.strip().astype(float)
df_listini['SC.1 LIS.  5']=df_listini['SC.1 LIS.  5'].str.strip().astype(float)
df_listini['SC.1 LIS.  6']=df_listini['SC.1 LIS.  6'].str.strip().astype(float)

## **Salvataggio del file nella directory di processo**

Creazione di un nuovo DataFrame con le colonne necessarie estrapolate dal file CSV e salvataggio del nuovo file.

In [5]:
# Richiamiamo il dataframe per osservarne i dati all'interno correttamente formattati
df_listini.head()

Unnamed: 0,COD-ARTICOLO,PREF.FORNITORE,COD.ART.FORNITORE,REFER.FORNITORE,BARCODE,COD.HIDROS,VISIB.AZIENDA,COD.SETTORE,COD.REPARTO,COD.SOTTO REPARTO,...,Unnamed: 58,Unnamed: 59,Unnamed: 60,Unnamed: 61,Unnamed: 62,Unnamed: 63,Unnamed: 64,Unnamed: 65,Unnamed: 66,Unnamed: 67
0,24796,ALA,200204GRL,,,ALIGRL,,,0,0,...,2.0,171.0,2.0,213.86,0.0,0.0,0.0,0.0,173.55,0.0
1,24795,ALA,200204,,,ALIVUOTATOIO,,,0,0,...,6.0,1068.0,6.0,1377.59,1.0,178.0,1.0,233.17,1084.02,188.84
2,3146,ALM,,1100081000.0,8033813890799.0,TUBOGPL,T,4.0,15,113,...,35000.0,8276.0,32371.0,10134.77,21600.0,5137.5,16879.0,5257.18,7673.35,4044.76
3,3147,ALM,,1200130500.0,8033813890805.0,TUBOMET,T,4.0,15,113,...,23500.0,9654.5,21568.5,12495.69,3000.0,1230.0,6985.0,4118.84,8858.68,2863.84
4,4307,ALT,31075,31075.0,8032862547593.0,AXA65*65,,,0,0,...,98.0,2058.0,110.0,3334.55,42.0,882.0,52.0,1543.67,2443.12,1127.61


In [6]:
# Definizione del nuovo DataFrame Listini
listini=df_listini[['COD.FAMIGLIA WEB','DES.FAMIGLIA WEB', 'LISTINO  1','SC.1 LIS.  1','LISTINO  5','SC.1 LIS.  5', 'LISTINO  6', 'SC.1 LIS.  6']].copy()

In [7]:
# Salvataggio dei DataFrame nel nuovo file di interscambio
listini.to_pickle(summary_listini_file)