# Lectura y muestra del dataset

Lectura del archivo y visualización de registros

In [38]:
import pandas as pd

df = pd.read_csv('../Datos/data.csv')
print(df.head())

      region    category       parameter  mode powertrain  year      unit  \
0  Australia  Historical        EV sales  Cars        BEV  2011  Vehicles   
1  Australia  Historical  EV stock share  Cars         EV  2011   percent   
2  Australia  Historical  EV sales share  Cars         EV  2011   percent   
3  Australia  Historical        EV stock  Cars        BEV  2011  Vehicles   
4  Australia  Historical        EV stock  Cars        BEV  2012  Vehicles   

       value  
0   49.00000  
1    0.00039  
2    0.00650  
3   49.00000  
4  220.00000  


# Procesamiento de datos

Acá se hace uso de la función to_dict para almacenar en una lista llamada ventas todos los registros o filas de la tabla en forma de diccionario.

In [39]:
ventas = df.to_dict(orient='records')
for i, fila in enumerate(ventas, start=1):
    print(f"Fila {i}: {fila}")

Fila 1: {'region': 'Australia', 'category': 'Historical', 'parameter': 'EV sales', 'mode': 'Cars', 'powertrain': 'BEV', 'year': 2011, 'unit': 'Vehicles', 'value': 49.0}
Fila 2: {'region': 'Australia', 'category': 'Historical', 'parameter': 'EV stock share', 'mode': 'Cars', 'powertrain': 'EV', 'year': 2011, 'unit': 'percent', 'value': 0.0003900000010617}
Fila 3: {'region': 'Australia', 'category': 'Historical', 'parameter': 'EV sales share', 'mode': 'Cars', 'powertrain': 'EV', 'year': 2011, 'unit': 'percent', 'value': 0.0065000001341104}
Fila 4: {'region': 'Australia', 'category': 'Historical', 'parameter': 'EV stock', 'mode': 'Cars', 'powertrain': 'BEV', 'year': 2011, 'unit': 'Vehicles', 'value': 49.0}
Fila 5: {'region': 'Australia', 'category': 'Historical', 'parameter': 'EV stock', 'mode': 'Cars', 'powertrain': 'BEV', 'year': 2012, 'unit': 'Vehicles', 'value': 220.0}
Fila 6: {'region': 'Australia', 'category': 'Historical', 'parameter': 'EV stock', 'mode': 'Cars', 'powertrain': 'PHEV

## Funciones para estructuración de los datos

Primero filtramos las filas donde el parametro sea EV sales y la unidad sea Vehicles para así representar la venta de vehículos electricos.

In [40]:
ventas_filtradas = []
for fila in ventas:
    if fila['parameter'] == 'EV sales' and fila['unit'] == 'Vehicles':
        ventas_filtradas.append(fila)

### Total de ventas

In [41]:
def total_ventas(ventas):
    total = 0
    for fila in ventas:
        if 'value' in fila:
            total += fila['value']
    return total

### Ventas totales por año

In [42]:
def ventas_por_ano(ventas):
    ventas_año = {}
    for fila in ventas:
        año = fila['year']
        venta = fila['value']
        if año not in ventas_año:
            ventas_año[año] = 0
        ventas_año[año] += venta
    return ventas_año


### Ventas por país

In [43]:
def ventas_por_pais(ventas):
    ventas_pais = {}
    for fila in ventas:
        pais = fila['region']
        venta = fila['value']
        if pais not in ventas_pais:
            ventas_pais[pais] = 0
        ventas_pais[pais] += venta
    return ventas_pais

### Top países con más ventas

In [44]:
def top_paises(ventas, top_n=5):
    ventas_pais = ventas_por_pais(ventas)
    
    items = []
    for pais in ventas_pais:
        items.append((pais, ventas_pais[pais]))

    def clave_venta(item):
        return item[1]
    
    items.sort(key=clave_venta, reverse=True)
    
    resultado = []
    for i in range(min(top_n, len(items))):
        resultado.append(items[i])
    return resultado

### Ventas promedio por powertrain

In [45]:
def ventas_promedio_por_powertrain(ventas):
    suma_ventas = {}
    cuenta = {}
    for fila in ventas:
        pt = fila['powertrain']
        venta = fila['value']
        if pt not in suma_ventas:
            suma_ventas[pt] = 0
            cuenta[pt] = 0
        suma_ventas[pt] += venta
        cuenta[pt] += 1

    promedio = {}
    for pt in suma_ventas:
        if cuenta[pt] > 0:
            promedio[pt] = suma_ventas[pt] / cuenta[pt]
        else:
            promedio[pt] = 0
    return promedio

# Muestra de resultados

A continuación se mostrara el resultado de las operaciones realizadas

In [47]:
print("Total ventas mundial:", total_ventas(ventas_filtradas))
print("Ventas por año:", ventas_por_ano(ventas_filtradas))
print("Ventas por país:", ventas_por_pais(ventas_filtradas))
print("Top 5 países con más ventas:", top_paises(ventas_filtradas))
print("Ventas promedio por powertrain:", ventas_promedio_por_powertrain(ventas_filtradas))

Total ventas mundial: 101614765.20000005
Ventas por año: {2011: 116745.0, 2012: 285910.0, 2013: 510334.0, 2014: 810712.2000000477, 2015: 1412771.0, 2016: 1852523.0, 2017: 2825756.0, 2018: 4735114.0, 2019: 5177232.0, 2020: 8412203.0, 2021: 17209065.0, 2022: 25150045.0, 2023: 33098874.0, 2010: 17481.0}
Ventas por país: {'Australia': 184404.0, 'Austria': 221539.0, 'Belgium': 470571.0, 'Brazil': 90240.0, 'Bulgaria': 4623.0, 'Canada': 564997.0, 'Chile': 3877.0, 'China': 21775929.0, 'Colombia': 16023.0, 'Costa Rica': 8831.0, 'Croatia': 7557.0, 'Cyprus': 2260.0, 'Czech Republic': 34300.0, 'Denmark': 259270.0, 'Estonia': 4585.0, 'EU27': 8556994.0, 'Europe': 11584008.0, 'Finland': 145832.0, 'France': 1542434.0, 'Germany': 2913809.0, 'Greece': 35644.0, 'Hungary': 42035.0, 'Iceland': 50337.0, 'India': 152646.0, 'Ireland': 88570.0, 'Israel': 150285.0, 'Italy': 488089.0, 'Japan': 611749.0, 'Korea': 548363.0, 'Latvia': 4687.0, 'Lithuania': 6673.0, 'Luxembourg': 42100.0, 'Mexico': 39610.0, 'Netherlan