In [33]:
# Importamos la libreria csv para manejar mas facilmente
# archivos de tipo csv
import csv 

#Esto es una funcion magica que establece todo los valores de salidad
# de numeros en punto flotante con dos decimales de precision
# SOLO ESTA DISPONIBLE EN IPython
%precision 2

#Abrimos en modo lectura el archivo especificado y le asignamos un
# alias igual a 'csvfile'
# El bloque with se utiliza en Python para asegurarse de que ciertos
# recursos se gestionen adecuadamente, como archivos, conexiones de red 
# o bases de datos. Proporciona una forma más limpia y segura de trabajar
# con estos recursos, ya que se encarga automáticamente de las tareas de 
# apertura y cierre, incluso si ocurren excepciones durante la ejecución
# del código.
with open('data/mpg.csv') as csvfile:
    # El metodo de la librería csv DictReader nos devuelve una instancia
    # del objeto DictReader que consiste en una secuencia de diccionarios,
    # un diccionario por cada fila del archivo csv donde cada diccionario, tiene
    # como clave el encabezado de columna y como valor el valor de esa fila en esa 
    # columna
    objetoDictReader = csv.DictReader(csvfile)
    
    #se puede iterar en cada fila de datos de DictReader
    #for filaDatos in objetoDictReader:
         #print(filaDatos)
    # En esta linea se transforma la secuencia customizada de DictReader
    # en una secuencia mas general en python de tipo "list"
    mpg = list(objetoDictReader)

#Para obtener los nombres de las columnas basta con invocar una de las filas 
# y obtener las keys
print(f"Las cabeceras de las columnas son: {mpg[0].keys()}")
    
mpg[0:3] #obtener desde la posicion 0 hasta la (3 -1 = 2) los diccionarios

Las cabeceras de las columnas son: dict_keys(['', 'manufacturer', 'model', 'displ', 'year', 'cyl', 'trans', 'drv', 'cty', 'hwy', 'fl', 'class'])


[{'': '1',
  'manufacturer': 'audi',
  'model': 'a4',
  'displ': '1.8',
  'year': '1999',
  'cyl': '4',
  'trans': 'auto(l5)',
  'drv': 'f',
  'cty': '18',
  'hwy': '29',
  'fl': 'p',
  'class': 'compact'},
 {'': '2',
  'manufacturer': 'audi',
  'model': 'a4',
  'displ': '1.8',
  'year': '1999',
  'cyl': '4',
  'trans': 'manual(m5)',
  'drv': 'f',
  'cty': '21',
  'hwy': '29',
  'fl': 'p',
  'class': 'compact'},
 {'': '3',
  'manufacturer': 'audi',
  'model': 'a4',
  'displ': '2',
  'year': '2008',
  'cyl': '4',
  'trans': 'manual(m6)',
  'drv': 'f',
  'cty': '20',
  'hwy': '31',
  'fl': 'p',
  'class': 'compact'}]

In [28]:

#Utilizamos tecnica de lista por comprension para extraer todos los valores de la columna cty
columna_cty_extraida_en_forma_de_lista = [float(filaCsv['cty']) for filaCsv in mpg]

suma_todos_elementos_lista = sum(columna_cty_extraida_en_forma_de_lista)
media = suma_todos_elementos_lista / len(columna_cty_extraida_en_forma_de_lista)

media

16.86

In [29]:
# Obtener la media que se gasta de fuel segun la clase de vehiculos
clasesDeVehiculos = set(vehicle['class'] for vehicle in mpg)
print(f'Las clases de vehiculos que hay son: {clasesDeVehiculos}')
mapaContadorPorClase = { clase: { 'count': 0, 'suma': 0 } for clase in clasesDeVehiculos}
mapaContadorPorClase

Las clases de vehiculos que hay son: {'midsize', 'subcompact', 'suv', 'pickup', 'compact', '2seater', 'minivan'}


{'midsize': {'count': 0, 'suma': 0},
 'subcompact': {'count': 0, 'suma': 0},
 'suv': {'count': 0, 'suma': 0},
 'pickup': {'count': 0, 'suma': 0},
 'compact': {'count': 0, 'suma': 0},
 '2seater': {'count': 0, 'suma': 0},
 'minivan': {'count': 0, 'suma': 0}}

In [30]:
for fila in mpg:
    mapaContadorPorClase[fila['class']]['count'] += 1
    mapaContadorPorClase[fila['class']]['suma'] += float(fila['hwy'])
    
mapaContadorPorClase
    

{'midsize': {'count': 41, 'suma': 1119.00},
 'subcompact': {'count': 35, 'suma': 985.00},
 'suv': {'count': 62, 'suma': 1124.00},
 'pickup': {'count': 33, 'suma': 557.00},
 'compact': {'count': 47, 'suma': 1330.00},
 '2seater': {'count': 5, 'suma': 124.00},
 'minivan': {'count': 11, 'suma': 246.00}}

In [34]:
for clase in mapaContadorPorClase:
    print(f"La clase {clase} tiene una media de: {mapaContadorPorClase[clase]['suma'] / mapaContadorPorClase[clase]['count']}")

La clase midsize tiene una media de: 27.29268292682927
La clase subcompact tiene una media de: 28.142857142857142
La clase suv tiene una media de: 18.129032258064516
La clase pickup tiene una media de: 16.87878787878788
La clase compact tiene una media de: 28.29787234042553
La clase 2seater tiene una media de: 24.8
La clase minivan tiene una media de: 22.363636363636363
