<img src="./cover.png" />

# Intro Notebooks con C#

Tenemos varias opciones, como escribir codígo o usar Markdown para escribir nuestros articulos y despues mostrar nuestros resultados gracias a la ejecución del codígo.
En este Workshop trabajaremos el caso de nuestro cliente Tailwind Sports.

Así que lo primero que haremos sera cargar nuestras librerías a este espacio de trabajo.

## Trabajando con Nuget Packages desde un Notebook

Para usar las librerias de nuget haremos uso de la siguiente sintaxis : 

```
#r "<nuget package>, <nuget package version>"
```

En este proyecto utilizaremos las sig. librerías:


1. FSharp.Data : Nos permitira trabajar con servicios externos de manera facil.
2. Deedle : Inspirada en pandas, nos permitira trabajar con Dataframes.
3. XPlot.Plotly : Nos permite crear graficos en HTML muy similar a lo que hace Bokeh y Matplotlib en Python.
4. Newtonsoft.Json : Libreria para trabajar con JSON 

In [12]:
#r "nuget:FSharp.Data"
#r "nuget:Deedle"
#r "nuget: XPlot.Plotly, 4.0.6"
#r "nuget: Newtonsoft.Json"
// #r "nuget: XPlot.Plotly.Interactive, 4.0.6" <- Descomentar, si usan .NET Notebooks

# Cargando datos en un Dataframe con Deedle

### Para cargar datos desde un archivo, usaremos Deedle, importamos el namespace de Deedle, y posteriormente usamos la siguiente sintaxis:

```
using Deedle;

var df = Deedle.Frame.ReadCsv("archivo.csv", separators: ",", hasHeaders: true);

# hasHeaders en caso de que el archivo CSV cuente con headers en la primera fila
# separators indica el tipo de separadores usados en el CSV, comunmente veremos ",", ";" , "\t" , etc 
```

En este taller usaremos el archivo `tailwind_sports_db.csv` que se encuentra en el directorio de DATASET

In [13]:
using Deedle;
using System;
using System.Globalization;

var df = Deedle.Frame.ReadCsv(@"./DATASET/tailwind_sports_db.csv", separators: ",", hasHeaders: true);

#### Para visualizar los primeros 5 registros del dataframe, debemos usar la propiedad `Rows` y su metodo `Between`. Para imprimir usamos el metodo `Print` al final.


dataframe.<b style="color: purple;">Rows</b>.<b style="color: blue;">Between</b>(<b style="color: green;">indice 1</b>, <b style="color: orange;">indice 2</b>)

In [14]:
df.Rows.Between(0, 5).Print();

0 -> series [ Orden => 1; Fecha => 06/08/2017; Medio => Propio; Vendedor => Directo en Tienda; Plataforma => Website;  ... ; Ingreso => 40.00] 
1 -> series [ Orden => 1; Fecha => 06/08/2017; Medio => Propio; Vendedor => Directo en Tienda; Plataforma => Website;  ... ; Ingreso => 50.00] 
2 -> series [ Orden => 1; Fecha => 06/08/2017; Medio => Propio; Vendedor => Directo en Tienda; Plataforma => Website;  ... ; Ingreso => 36.00] 
3 -> series [ Orden => 1; Fecha => 06/08/2017; Medio => Propio; Vendedor => Directo en Tienda; Plataforma => Website;  ... ; Ingreso => 40.00] 
4 -> series [ Orden => 1; Fecha => 06/08/2017; Medio => Propio; Vendedor => Directo en Tienda; Plataforma => Website;  ... ; Ingreso => 50.00] 
5 -> series [ Orden => 1; Fecha => 06/08/2017; Medio => Propio; Vendedor => Directo en Tienda; Plataforma => Website;  ... ; Ingreso => 45.00] 



#### Para visualizar el listado de columnas que tiene nuestro Dataframe, usamos la propiedad `Columns` y su propiedad `Keys`. Usando el comodin especial `display` podemos visualizar el resultado en el notebook.


<b style="color: orange;">display</b><b style="color: green;">(</b>**dataframe**.<b style="color: purple;">Columns</b>.<b style="color: blue;">Keys</b><b style="color: green;">)</b>

In [15]:
// Mostrar Columnas
display(df.Columns.Keys)

index,value
0,Orden
1,Fecha
2,Medio
3,Vendedor
4,Plataforma
5,Comisión
6,Tipo Orden
7,Tipo de Cliente
8,Sexo
9,Categoría


In [16]:
// Mostrar el tipo de datos de cada columna
display(df.ColumnTypes)

index,value
0,System.Int32
1,System.String
2,System.String
3,System.String
4,System.String
5,System.Int32
6,System.String
7,System.String
8,System.String
9,System.String


# Ventas Totales

De acuerdo al documento, Tailwind Sports desea conocer el total de las ventas, para ello debemos hacer la suma de nuestra columna `Ingreso` y aplicar la operacion suma. Así que para seleccionar una columna en especifico de un dataframe, usaremos la siguiente sintaxis:

<b style="color: blue;">df</b>[<b style="color: orange;">columna</b>];

Para aplicar la suma podemos la propiedad `Values`, el cual nos va regresar un Enumerable del tipo de dato, y podemos aplicar `Sum` de `System.Linq` y obtener el resultado. Pero para evitar hacer todo eso, usaremos la clase `Stats` y su metodo `sum`, al cual le pasamos la Serie seleccionada. Ejemplo:

<b style="color: green;">Stats</b>.**sum**(<b style="color: blue;">df</b>[<b style="color: orange;">columna</b>]);

In [17]:
var vTotal = Stats.sum(df["Ingreso"]);
display($"Ventas Totales: {vTotal.ToString("C")}")

Ventas Totales: $2,571,850.00

# Integracion de las ventas totales

Si **$2,571,850.00** representa las ventas totales, queremos ver como se divide ese total entre compras y devoluciones. Para ello ocupamos filtrar por el `Tipo de Orden` . Para ello usaremos el metodo `FilterRowsBy` el cual recibe `columna a filtrar` y `valor a filtrar`.

var df_filtrado = dataframe.<b style="color: purple;">FilterRowsBy</b>(<b style="color: blue;">"columna"</b>, <b style="color: green;">"Valor"</b>)

var serieFiltrada = dataframe.<b style="color: purple;">FilterRowsBy</b>(<b style="color: blue;">"columna"</b>, <b style="color: green;">"Valor"</b>)[<b style="color: orange;">"Columna"</b>]

In [18]:
var compras = Stats.sum(df.FilterRowsBy("Tipo Orden", "Compra")["Ingreso"]);
var percCompras = compras/vTotal;
var devoluciones = Stats.sum(df.FilterRowsBy("Tipo Orden", "Devolucion")["Ingreso"]);
var percDevoluciones = devoluciones / vTotal;

display(new {
    Compra = compras.ToString("C"),
    PercCompra = percCompras.ToString("0.00%"),
    Devoluciones = devoluciones.ToString("C"),
    PercDevoluciones = percDevoluciones.ToString("0.00%"),
    Total = vTotal.ToString("C")
})

Compra,PercCompra,Devoluciones,PercDevoluciones,Total
"$2,340,276.00",91.00%,"$231,574.00",9.00%,"$2,571,850.00"


# Graficar las ventas mensuales

En este apartado procederemos a usar Xplot. Para ello debemos importar el namespace Xplot.Plotly , el cuál contiene todas las funciones necesarias para renderizar nuestras grafícas. A continuacion mostraremos la sintaxis basíca para una grafica de columnas o barras.

```csharp

using XPlot.Plotly;

// valores
var x = new  [] {".NET", "Python", "Scala"};
var y = new  [] {20, 20, 20};

// Generamos nuestro grafíco
var chart = Chart.Plot(
    new Bar
    {
        y = y,
        x = x,
        marker = new Marker{color = "rgb(0, 0, 109)"}
    }
);

// Le damos estilo al 
var chart_layout = new Layout.Layout{
    title="Titulo",
    xaxis =new Xaxis{
        title = "Texto Eje X"
    },
    yaxis = new Yaxis{
        title = "Texto Eje Y"
    }
};
chart.WithLayout(chart3_layout);
chart.Show(); // chart en el notebook
```

Antes de graficar, debemos agrupar nuestra informacion, para ello usaremos el metodo `GroupRowsUsing` el cual recibe una funcion anonima o lambda donde el primer elemento es el indice y el segundo elemento son los elementos de nuestro dataframe.

```csharp

var data = df.GroupRowsUsing((index, kvp) => kvp.GetAs<Type>("Columna")).Nest().Observations
    .Select(key => new {
        // operacion
    }).ToList()

```

Una vez agrupados, aplicamos el metodo Nest para crear una tupla entre el nuevo indice de la agrupacion y los valores que pertenecen a ese conjunto de datos. Posteriormente con la propiedad Observations convertimos el dataframe a tipo IEnumerable y con Select al estilo Linq armamos una nueva salida y convertimos esa salida a una Lista. Y luego pasamos a graficar nuestra información.

In [19]:
// Lambda para obtener el mes
Func<int, string> getMonthName = month => CultureInfo.CurrentCulture.DateTimeFormat.GetMonthName(month);

// Agrupando nuestros datos
var data = df.GroupRowsUsing((x, kvp) => getMonthName(kvp.GetAs<DateTime>("Fecha").Month))
    .Nest().Observations.Select(key => new {
        Mes = key.Key,
        Total = Stats.sum(key.Value.GetColumn<double>("Ingreso"))
    }).ToList();

display(data);

index,Mes,Total
0,agosto,218232
1,octubre,246142
2,septiembre,238412
3,febrero,167106
4,mayo,199591
5,julio,229188
6,noviembre,204031
7,abril,195132
8,marzo,213630
9,diciembre,237670


In [21]:
// Graficando
using XPlot.Plotly;


// Graficando
var chart = Chart.Plot(
    new Scatter
    {
        x = data.Select(k => k.Mes).ToArray(),
        y = data.Select(k => k.Total).ToArray(),
        marker = new Marker{color = "rgb(0, 0, 109)"}
    }
);

var chart_layout = new Layout.Layout{
    title="Ventas Mensuales",
    xaxis =new Xaxis{
        title = "Meses"
    },
    yaxis = new Yaxis{
        title = "Ingreso"
    }
};
chart.WithLayout(chart_layout);
chart.Show() // usar solo chart si usan .NET Notebooks

## Finalmente , nuestro ultimo requerimiento consiste en graficar el comportamiento de sus ventas en las diferentes plataformas donde vende sus productos la empresa.

Para ello agruparemos sobre la columna: **Plataforma**

In [22]:
// agrupando x plataforma
var gplataformas = df.GroupRowsUsing((x, kvp) => kvp.GetAs<string>("Plataforma"))
    .Nest().Observations.Select(key => new {
    Plataforma = key.Key,
    Total = Stats.sum(key.Value.GetColumn<double>("Ingreso"))
}).ToList();

In [23]:
// Graficando
var chart2 = Chart.Plot(
    new Bar
    {
        x = gplataformas.Select(x => x.Plataforma),
        y = gplataformas.Select(x => x.Total),        
        marker = new Marker{color = "rgb(0, 0, 109)"}
    }
);
var chart2_layout = new Layout.Layout{
    title="Ventas x Plataforma",
    xaxis =new Xaxis{
        title = "Plataforma"
    },
    yaxis = new Yaxis{
        title = "Ingreso"
    }           
};
chart2.Show() // usar solo chart si usan .NET Notebooks