## Entregable Actividad 04 

- **Fuente de datos**: https://rndc.mintransporte.gov.co/MenuPrincipal/tabid/204
- **Intro**: Leer y graficar archivos mediante las librerias vistas en clase (pandas-numpy-plotly-matplotlib,etc). 
- **Objetivo principal**: Analizar el comportamiento de los clientes y las características de los viajes realizados en 2024 para identificar patrones de uso, tendencias de facturación y distribución geográfica de los servicios.

## Preguntas de interes

1. **¿Cómo varía la demanda de viajes por cliente en los primeros tres meses del año y qué factores pueden influir en la frecuencia de solicitud?**

2. **¿Cuáles son las tendencias en la solicitud de servicios por parte de los clientes en 2024 en términos de volumen, rentabilidad y facturación electrónica?**

3. **¿Qué modalidades de viaje han predominado en los viajes planillados durante 2024 y cómo se distribuyen geográficamente en los diferentes municipios?**


## Importacion de librerias

In [13]:
import matplotlib as mpl
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
import os
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go

## Lectura de DataSet

In [14]:
df_1 = pd.read_csv('Data_rndc_year_2024.csv', sep=';', encoding='utf-8')

## Consulta de servicios solicitados por cliente

In [15]:
df_2=print(df_1["Sucursal"].value_counts())

Sucursal
OPAV TOCANCIPA          5602
OPAV FUNZA              3083
ATA BOGOTA              2969
OLIMPICO BOGOTA         2741
MILUC BOGOTA            2262
OPAV RIONEGRO           1200
BIGMARKET COTA           292
OPAV IBAGUE              227
AGROINDUSTRIA BOGOTA     150
ANTILLANA TOCANCIPA       40
Name: count, dtype: int64


In [16]:
df_1.columns

Index(['Item', 'Fecha', 'Sucursal', 'Origen', 'Destino', 'Nit', 'Cliente',
       'Categoria', 'Orden de Servicio', 'Doc. Cliente', 'Doc. Cliente 2',
       'Mercancia', 'Embalaje', 'Modalidad', 'Descripción Precinto', 'Remesa',
       'Manifiesto', 'Man.Electronico', 'Póliza Estampilla CHUBB',
       'Póliza Estampilla Allianz', 'Peso', 'Entregado', 'C.C. Conductor',
       'Conductor', 'Celular', 'Placa', 'PlacaR', 'Id del Vehiculo',
       'Tipo Veh.', 'C.C. Tenedor', 'Tenedor', 'C.C. Propietario',
       'Propietario', 'C.C. Trayler', 'P Trayler', 'Valor Orden',
       'Costo Orden', 'Comision Orden', 'Rentabilidad', 'Rentabilidad %',
       'Anticipo', 'Flete Factura', 'Devolucion Factura', 'Acompanante Fctura',
       'Cargue Fac', 'Descargue Fac', 'Comision Fac', 'Montacarga Fac',
       'Otros Fac', 'Stand By Fac', 'Seguro Fac', 'Flete Man',
       'Devolucion Man', 'Seguro Aseg', 'Acompanante Man', 'Cargue Man',
       'Descargue Man', 'Comision Terc', 'Montacarga Man', 'Otros

In [17]:
df_3=df_1[['Fecha','Sucursal','Modalidad','Origen','Destino','Mercancia','Peso','Placa','Tipo Veh.','Valor Orden','Costo Orden','Rentabilidad','Rentabilidad %','Fecha Factura','Factura','Orden de Servicio']]
df_3

Unnamed: 0,Fecha,Sucursal,Modalidad,Origen,Destino,Mercancia,Peso,Placa,Tipo Veh.,Valor Orden,Costo Orden,Rentabilidad,Rentabilidad %,Fecha Factura,Factura,Orden de Servicio
0,2/01/2024,ATA BOGOTA,Urbano,BOGOTA,BOGOTA,HUEVOS DE AVES CON CASCARA,1353.0,WEP829,LUV,250000.0,190000.0,60000,24%,0000-00-00,,5835
1,2/01/2024,ATA BOGOTA,Urbano,BOGOTA,BOGOTA,HUEVOS DE AVES CON CASCARA,1155.0,UPS536,LUV,250000.0,190000.0,60000,24%,0000-00-00,,5836
2,2/01/2024,ATA BOGOTA,Urbano,BOGOTA,BOGOTA,HUEVOS DE AVES CON CASCARA,1157.0,TBZ881,NHR,250000.0,190000.0,60000,24%,0000-00-00,,5837
3,2/01/2024,ATA BOGOTA,Urbano,BOGOTA,BOGOTA,HUEVOS DE AVES CON CASCARA,1352.0,TRK045,NHR,250000.0,190000.0,60000,24%,0000-00-00,,5838
4,2/01/2024,ATA BOGOTA,Urbano,BOGOTA,BOGOTA,HUEVOS DE AVES CON CASCARA,1111.0,JVK609,NHR,250000.0,190000.0,60000,24%,0000-00-00,,5839
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
18561,31/12/2024,ATA BOGOTA,Urbano,BOGOTA,BOGOTA,HUEVOS DE AVES CON CASCARA,1541.0,JVK625,NHR,314700.0,242000.0,72700,23.1 %,0000-00-00,,25661
18562,31/12/2024,ATA BOGOTA,Urbano,BOGOTA,BOGOTA,HUEVOS DE AVES CON CASCARA,1187.0,THV286,LUV,273200.0,205000.0,68200,25%,0000-00-00,,25663
18563,31/12/2024,ATA BOGOTA,Urbano,BOGOTA,BOGOTA,HUEVOS DE AVES CON CASCARA,1438.0,SKX124,NHR,314700.0,242000.0,72700,23.1 %,0000-00-00,,25662
18564,31/12/2024,OPAV TOCANCIPA,Urbano,TOCANCIPA,TOCANCIPA,POLLO FRESCO,1800.0,NOW663,NHR,427434.0,330000.0,97434,22.8 %,0000-00-00,,25707


## Demanda por cliente en los primeros 3 meses del año 2024

In [None]:
df_3['Fecha'] = pd.to_datetime(df_3['Fecha'], format='%d/%m/%Y')

df_filtered = df_3[df_3['Fecha'].dt.month.isin([1, 2, 3])]

df_grouped = df_filtered.groupby([df_filtered['Fecha'].dt.month, 'Sucursal']).size().reset_index(name='Cantidad')

meses = {1: 'Enero', 2: 'Febrero', 3: 'Marzo'}
df_grouped['Fecha'] = df_grouped['Fecha'].map(meses)

fig = px.bar(df_grouped, x='Sucursal', y='Cantidad', color='Fecha', barmode='group',
                title='Demanda de Clientes en los Primeros 3 Meses de 2024')

fig.show()



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



## Visualizacion opcional

In [19]:
fig = px.bar(df_grouped, x='Fecha', y='Cantidad', color='Sucursal', barmode='group')
fig.show()

## Factores claves 

El factor clave es la mercancia transportada sobre cada sucursal. 

In [20]:
df_grouped = df_filtered.groupby([df_filtered['Fecha'].dt.month, 'Mercancia']).size().reset_index(name='Cantidad')

meses = {1: 'Enero', 2: 'Febrero', 3: 'Marzo'}
df_grouped['Fecha'] = df_grouped['Fecha'].map(meses)

fig = px.bar(df_grouped, x='Fecha', y='Cantidad', color='Mercancia', barmode='group')
fig.show()

## Volumen de servicios del año 2024

In [None]:
df_3['Fecha'] = pd.to_datetime(df_3['Fecha'], format='%d/%m/%Y')

df_filtered_2 = df_3.loc[df_3['Fecha'].dt.month.isin([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12])]

df_2024 = df_filtered_2.loc[df_filtered_2['Fecha'].dt.year == 2024]

volumen_servicios = df_2024.groupby(df_2024['Fecha'].dt.month)['Orden de Servicio'].count().reset_index()
volumen_servicios.columns = ['Mes', 'Total_Servicios']

fig = px.line(volumen_servicios, x='Mes', y='Total_Servicios', markers=True,
                title="Tendencia del Volumen de Servicios en 2024",
                labels={"Mes": "Mes del Año", "Total_Servicios": "Cantidad de Servicios"})

fig.show()



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy

