# Leitura e gravação de arquivos CSV

#### Fundamentos de iterações via arquivos CSV, separados por vírgula, para criar dicionários e organizar estatísticas descritivas.

##### Leitura dos dados para dicionários

In [None]:
# Primeiro vamos importar o móduloCSV, o qual nos ajudará a ler nosso arquivo CSV. 
import csv

# Estabelecer a precisão de mostrar 2 casas decimais. 
%precision 2

# Ler o mpg.csv usando o csv.DictReader
with open('datasets/mpg.csv') as arquivoCSV:
    # Convertendo em uma lista de dicionários
    lista_dicionarios = list(csv.DictReader(arquivoCSV))

    # OBS: O csv.DictReader considera que a primeira linha do CSV é cabeçalho, e que o delimitador sempre é a ','. Isso são parâmetros opcionais, então se não existir cabeçalho, precisa informar quais são as colunas, e se for outro delimitador, precisa informar qual é. 

    """
    Exemplo: 

    campos = ["id", "manufacturer", "model", "displ", "year", "cyl"]
    lista_dicionarios = list(csv.DictReader(arquivoCSV, fieldnames = campos, delimiter=';'))
    ou 
    lista_dicionarios = list(csv.DictReader(arquivoCSV, fieldnames = ("tal", "tal"...), delimiter=';'))
    """

# Agora vamos ver os três primeiros elementos de nossa lista
lista_dicionarios[:3]



[{'': '1',
  'manufacturer': 'audi',
  'model': 'a4',
  'displ': '1.8',
  'year': '1999',
  'cyl': '4',
  'trans': 'auto(l5)',
  'drv': 'f',
  'cty': '18',
  'hwy': '29',
  'fl': 'p',
  'class': 'compact'},
 {'': '2',
  'manufacturer': 'audi',
  'model': 'a4',
  'displ': '1.8',
  'year': '1999',
  'cyl': '4',
  'trans': 'manual(m5)',
  'drv': 'f',
  'cty': '21',
  'hwy': '29',
  'fl': 'p',
  'class': 'compact'},
 {'': '3',
  'manufacturer': 'audi',
  'model': 'a4',
  'displ': '2',
  'year': '2008',
  'cyl': '4',
  'trans': 'manual(m6)',
  'drv': 'f',
  'cty': '20',
  'hwy': '31',
  'fl': 'p',
  'class': 'compact'}]

In [2]:
# Cada carro representa um dicionário
len(lista_dicionarios)

234

In [3]:
# Podemos ver o nome das colunas do CSV usando o método key
lista_dicionarios[0].keys() # Aqui vemos o nome de cada chave do dicionário

dict_keys(['', 'manufacturer', 'model', 'displ', 'year', 'cyl', 'trans', 'drv', 'cty', 'hwy', 'fl', 'class'])

##### Cálculo separado por coluna

In [4]:
# SE quisermos encontrar a média do consumo na cidade em milhas por galão, para todos os carros do arquivo CSV, vamos somar todos os valores da coluna "cty" (city miles per gallon)

consumo_medio = sum(float(dicionario['cty']) for dicionario in lista_dicionarios) / len(lista_dicionarios)

consumo_medio

16.86

In [5]:
# Consumo na estrada

consumo_medio_estrada = sum(float(dicionario['hwy']) for dicionario in lista_dicionarios) / len(lista_dicionarios)

consumo_medio_estrada

23.44

##### Consumo médio na cidade agrupado por cilindros

In [None]:
# Queremos saber o consumo médio na cidade agrupado pelo núero de cilindros que um carro tem
cilindros = set(dicionario['cyl'] for dicionario in lista_dicionarios)

# POR QUE UM SET (CONJUNTO)?
# R: Para eliminar as repetições 
cilindros 


{'4', '5', '6', '8'}

In [None]:
# Lista para armazenar os cálculos
consumo_medio_cilindros = []

# Soma o consumo por cilindro
for cilindro in cilindros:
    soma = 0
    contador_cilindro = 0 # Conta quantos cilindros daquele tipo foram somados
    
    for dicionario in lista_dicionarios:
        if dicionario['cyl'] == cilindro: 
            soma += float(dicionario['cty'])
            contador_cilindro += 1
        
    consumo_medio_cilindros.append((cilindro, soma / contador_cilindro))

# Ordena crescente 
consumo_medio_cilindros.sort(key = lambda x: x[0])
consumo_medio_cilindros

[('4', 21.01), ('5', 20.50), ('6', 16.22), ('8', 12.57)]

##### Consumo médio da cidade para as diferentes classes de veículos 

In [15]:
# Set para armazenar as diferentes classes de veículos
classes = set(dicionario['class'] for dicionario in lista_dicionarios)
classes

{'2seater', 'compact', 'midsize', 'minivan', 'pickup', 'subcompact', 'suv'}

In [20]:
# Lista para armazenar o consumo para os diferentes tipos de classes
consumo_medio_classes = []

for classe in classes:
    soma = 0
    contador = 0 # Armazena a quantidade de valores da mesma classe que já foram somados

    for dicionario in lista_dicionarios:
        if dicionario['class'] == classe:
            soma += float(dicionario['cty'])
            contador += 1
    
    carro = {'classe': classe, 'consumo_medio': soma / contador}
    consumo_medio_classes.append(carro)

consumo_medio_classes.sort(key = lambda x: x['consumo_medio'])
consumo_medio_classes

[{'classe': 'pickup', 'consumo_medio': 13.00},
 {'classe': 'suv', 'consumo_medio': 13.50},
 {'classe': '2seater', 'consumo_medio': 15.40},
 {'classe': 'minivan', 'consumo_medio': 15.82},
 {'classe': 'midsize', 'consumo_medio': 18.76},
 {'classe': 'compact', 'consumo_medio': 20.13},
 {'classe': 'subcompact', 'consumo_medio': 20.37}]