## Lendo Arquivo

&emsp;&emsp;Vamos começar percorrendo alguns conceitos básicos das biblitecas apresentadas (pandas, numpy, matplotlib).

&emsp;&emsp;Primeiro, vamos importar essas bibliotecas para nossa aplicação.

In [None]:
import pandas as pd
import numpy as np 
from matplotlib import pyplot as plt 

&emsp;&emsp;Com as bibliotecas já importadas, podemos começar a mexer com as funções armazenadas nelas. Como por exemplo, a read_csv() do pandas, que vamos utilizar para abrir o arquivo carros.csv. E o head(), que vamos utilizar para dar uma olhada na estrutura dos dados que estamos lendo. 

In [None]:
data = pd.read_csv('/content/carros.csv')
print(type(data))
print(data.head(5))

## O que é DataFrame ?

&emsp;&emsp;Os DataFrames são objetos bidimensionais, de tamanho variável. O seu formato é de uma tabela, onde os dados são organizados em linhas e colunas, é possível ver no primeiro print da célula acima que a variável 'data' é um DataFrame. Além disso, enquanto podemos pensar a Series como uma única coluna, o DataFrame seria uma união de várias Series sob um mesmo index. A estrutura do DataFrame é apresentada quando executamos o segundo print da célula anterior.

In [None]:
data_np = data.values

print(type(data_np))
print(data_np)

## O que é ndArray ?

&emsp;&emsp;Um array é uma estrutura multidimensional que nos permite armazenar dados na memória do nosso computador, de modo que cada item localizado nessa estrutura pode ser encontrado por meio de um esquema de indexação. O NumPy denomina essa estrutura como ndarray, como forma de abreviação a array N-dimensional.

## Manipulando dados

&emsp;&emsp;Ao utilizar a bilbioteca numpy, ela permite algumas manipulações de dados, o que é muito importante para uma análise mais detalhada, mas mais importante que manipular os dados e entender o que eles significam. Algumas das manipulações possíveis serão exemplificadas a seguir.

&emsp;&emsp;Para mais funções para manipular os dados de seu array, acesse [aqui](https://numpy.org/doc/stable/reference/routines.array-manipulation.html).

In [None]:
ano = data['YEAR'].values
marca = data['Make'].values

print(ano)
print(marca)

# 1 - Definir a quantidade de dados
print(len(ano))

# 2 - Definir o modelo mais novo
print(max(ano))

# 3 - Definir o modelo mais antigo
print(min(ano))

# 4 - Definir a média de idade dos modelos
print(2023 - round(ano.mean()))

# 5 - Definir quantos carros de determinada marca estam em estoque
tesla = np.sum(marca == 'TESLA')
print("Tesla aparece " + str(tesla) + " vezes, o que corresponde a " + str((tesla/len(marca))*100) + "% dos carros")
bmw = np.sum(marca == 'BMW')
print("BMW aparece " + str(bmw) + " vezes, o que corresponde a " + str((bmw/len(marca))*100) + "% dos carros")


## Visualizando dados

&emsp;&emsp;Com a biblioteca matplotlib é possível plotar gráficos que nos permitem analisar as informações de forma mais visual. Como por exemplo na célula seguinte, onde plotamos um gráfico de dispersão comparando a potência da bateria dos carros e o consumo combinado do veículo.

&emsp;&emsp;A seguir também esta presente um gráfico de barras que compara o consumo de energia na cidade por modelo de carro elétrico.

&emsp;&emsp;Logo abaixo temos um gráfico de barras agrupadas, comparando o consumo de energia de diferentes modelos de carros, tanto na cidade quanto na estrada.

&emsp;&emsp;Por último temos um gráfico de pizza que demonstra a porcentagem de determinado tamanho de carro no estoque.

&emsp;&emsp;Nos exemplos dados foi utilizada apenas a estrutura mínima para que as informações ficassem compreensivas, porém a biblioteca matplotlib ainda permite muitas manipulações nos gráficos plotados, além de permitir a criação de outros tipos de gráficos.

In [None]:
# Gráfico de Dispersão

potencia = data['(kW)']
consumo_combinado = data['COMB (kWh/100 km)']

# Cria o gráfico de dispersão
plt.scatter(potencia, consumo_combinado)

# Personalizar o gráfico
plt.title('Relação entre potência e Consumo combinado')
plt.xlabel('Potência (kW)')
plt.ylabel('Consumo combinado (kWh/100 km)')

# Exibir o gráfico
plt.show()

![Gráfico de Disperção](../img/grafico_dispercao.png "Gráfico de Disperção")

In [None]:
# Gráfico de Barras

models = ['MITSUBISHI i-MiEV', 'NISSAN LEAF', 'FORD FOCUS ELECTRIC']
city_consumption = [16.9, 19.3, 19.0]

# Plotagem do gráfico de barras
plt.bar(models, city_consumption)
plt.xlabel('Modelos')
plt.ylabel('Consumo de energia na cidade (kWh/100 km)')
plt.title('Consumo de energia na cidade por modelo de carro elétrico')
plt.xticks(rotation=45)
plt.show()

![Gráfico de Barras](../img/grafico_barra.png "Gráfico de Barras")

In [None]:
# Gráfico de Barras Agrupadas

# Dados
models = ['MITSUBISHI i-MiEV', 'NISSAN LEAF', 'FORD FOCUS ELECTRIC']
city_consumption = [16.9, 19.3, 19.0]
highway_consumption = [21.4, 23.0, 21.1]

# Configuração do gráfico de barras agrupadas
bar_width = 0.35
index = np.arange(len(models))

# Plotagem do gráfico de barras agrupadas
plt.bar(index, city_consumption, bar_width, label='Cidade')
plt.bar(index + bar_width, highway_consumption, bar_width, label='Estrada')
plt.xlabel('Modelos')
plt.ylabel('Consumo de energia (kWh/100 km)')
plt.title('Consumo de energia na cidade e na estrada por modelo de carro elétrico')
plt.xticks(index + bar_width/2, models, rotation=45)
plt.legend()
plt.show()

![Gráfico de Barras Agrupadas](../img/grafico_barra_agrupados.png "Gráfico de Barras Agrupadas")

In [None]:
# Gráfico de Pizza

# Dados
size = data['Size'].values
types = ['SUBCOMPACT', 'MID-SIZE', 'COMPACT']

subcompact = np.sum(size == 'SUBCOMPACT')
midsize = np.sum(size == 'MID-SIZE')
compact = np.sum(size == 'COMPACT')

porcentagem = [((subcompact/len(size))*100), ((midsize/len(size))*100), ((compact/len(size))*100)]

# Plotagem do gráfico de pizza
plt.pie(porcentagem, labels=types, autopct='%1.1f%%')
plt.title('Distribuição percentual dos tipos de carros elétricos')
plt.axis('equal')
plt.show()

![Gráfico de Pizza](../img/grafico_pizza.png "Gráfico de Pizza")

## Final 

Chegando até aqui você adquiriu conhecimento suficiente para resolver o exercício proposto, basta clicar [aqui](https://github.com/StrangeUnit28/Tutoria_de_Python-BRISA/blob/main/exercicios/Exerc%C3%ADcio1.md) para acessá-lo.