<p style="font-size: 20px; color:#24ff5e; text-align: center"> 
    Importando Libs
</p>

In [4]:
import pandas as pd  # Manipulação e análise de dados em estruturas como DataFrames
import numpy as np  # Operações matemáticas e arrays multidimensionais
import seaborn as sns  # Visualização de dados, especialmente gráficos estatísticos
import matplotlib.pyplot as plt  # Criação de gráficos e visualizações
from scipy.stats import pearsonr  # Cálculos estatísticos, como correlação de Pearson
from IPython.display import display  # Exibição de objetos em ambientes interativos, como Jupyter Notebooks
import warnings  # Controle de mensagens de alerta e aviso
warnings.filterwarnings("ignore", category=FutureWarning)  # Ignora avisos de "FutureWarning"

<p style="font-size: 20px; color:#24ff5e; text-align: center"> 
   Importando Dados
</p>

In [5]:
arquivo = r'..\data\Electric_Vehicle_Population_Data.csv'


# Lendo as coluna 'Postal Code', 'VIN (1-10)' e 'DOL Vehicle ID como string (str)'.
dados = pd.read_csv(arquivo, 
    dtype={
        'Postal Code': 'str',        
        'VIN (1-10)': 'str',        
        'DOL Vehicle ID': 'str'      
    }
)

# Substitui os valores ausentes (NaN) na coluna 'City' por 'Desconhecida'.
dados['City'] = dados['City'].fillna('Desconhecida')

# Substitui os valores ausentes (NaN) na coluna 'County' por 'Desconhecido'.
dados['County'] = dados['County'].fillna('Desconhecido')

# Verifica se a coluna 'Vehicle Location' existe no DataFrame 'dados'.
if 'Vehicle Location' in dados.columns:
    # Caso a coluna 'Vehicle Location' exista, utiliza uma expressão regular para extrair as coordenadas geográficas (longitude e latitude)
    # O padrão 'POINT (longitude latitude)' é buscado, e os valores de longitude e latitude são extraídos e atribuídos nas colunas 'Longitude' e 'Latitude'.
    dados[['Longitude', 'Latitude']] = dados['Vehicle Location'].str.extract(r'POINT \(([-\d\.]+) ([-\d\.]+)\)')


<p style="font-size: 20px; color:#02faf6; text-align: center"> 
    Quais cidades possuem a maior quantidade de veículos elétricos e híbridos registrados?
</p>

In [6]:
# Conta a quantidade de veículos por cidade, ordena em ordem decrescente e seleciona as 10 primeiras.
top_cidades = dados['City'].value_counts().head(10).reset_index()

# Renomeia as colunas do DataFrame 'top_cidades'. A primeira coluna passa a se chamar 'City' e a segunda, 'Vehicle Count'.
top_cidades.columns = ['City', 'Vehicle Count']


In [None]:
# Configurar o estilo do gráfico
sns.set(style="whitegrid")
"""
    white: Fundo branco simples, sem linhas de grade.
    whitegrid: Fundo branco com linhas de grade (o que você está usando atualmente).
    dark: Fundo escuro, sem linhas de grade.
    darkgrid: Fundo escuro com linhas de grade.
    ticks: Fundo branco ou escuro com linhas de marcação nos eixos.
"""

# Criar o gráfico de barras com barras mais finas
plt.figure(figsize=(12, 6))
ax = sns.barplot(
    x='Vehicle Count',
    y='City',
    data=top_cidades,
    palette='viridis',  # cor das barras 
                        # Categóricas (para representar diferentes categorias com cores distintas):
                                # 'deep' 'muted' 'pastel' 'dark' 'colorblind' 'Blues' 
                        # Sequenciais (para representar uma progressão de valores):
                                # 'Greens' 'Oranges' 'Purples' 'Reds' 'YlGnBu' 'YlOrRd' 'PuBu' 'GnBu'
                        # Divergentes (para representar valores com uma diferença central):
                                # 'coolwarm' 'RdBu' 'PiYG' 'BrBG' 'Spectral' 'seismic'
                        # Qualitativas (para representar categorias sem uma ordem específica):
                                # 'husl' 'hls' 'Set1' 'Set2' 'Set3' 'Paired' 'Accent')

    edgecolor=None,   # Remover bordas das barras
    linewidth=0.0,    # Certificar-se de que não há contornos
    dodge=False       # Garantir que barras permaneçam alinhadas
    # hue=[1]*len(top_cidades)  # Atribuindo uma coluna constante para 'hue'
)

# Ajustar largura das barras (mais finas)
for patch in ax.patches:
    patch.set_height(0.6)  # Define a altura das barras, deixando-as mais finas

# Configurar o fundo do gráfico
ax.set_facecolor("#101010")
plt.gcf().set_facecolor("#101010")

# Adicionar valores na frente das barras com maior afastamento
for i, valor in enumerate(top_cidades['Vehicle Count']):
    ax.text(
        valor + 3,   # Afastar mais os valores das barras
        i,          # Posição no eixo y
        f"{valor:,}",  # Formatação com separação de milhar
        color="white",
        va='center',  # Ajuste automático do alinhamento vertical
        fontsize=12
    )

# Ajustar as bordas do gráfico (remover direita e superior)
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)
ax.spines['bottom'].set_visible(False)
ax.spines['left'].set_color('white')

# ax.legend_.remove()


# Remover o eixo x e linhas de grade
ax.xaxis.set_visible(False)
ax.grid(False)

# Ajustar as cores do texto e dos títulos
plt.title('Top 10 Cidades com Maior Quantidade de Veículos Elétricos e Híbridos Registrados', fontsize=16, color="white", pad=20)
ax.tick_params(colors="white")  # Cor dos ticks nos eixos

# Ajustar layout
plt.tight_layout()

# display(top_cidades)

# Mostrar o gráfico
plt.show()



Qual é a distribuição do alcance elétrico (Electric Range) dos veículos registrados?

In [None]:
# Divide a coluna 'Electric Range' em 20 intervalos (bins) e conta quantos valores estão em cada intervalo.
# A função pd.cut cria os intervalos, e value_counts conta quantos elementos caem em cada intervalo.
frequencia_bins = pd.cut(dados['Electric Range'], bins=20).value_counts().sort_index().reset_index(name='Qtd')

# Exibe o DataFrame resultante com a contagem de elementos em cada intervalo de 'Electric Range', 
# renomeando a coluna de contagem para 'Qtd'.
frequencia_bins


In [None]:
# Configurar o estilo do gráfico
sns.set(style="whitegrid")

# Definir os intervalos (bins) de 25 milhas
bin_width = 25  # Largura dos intervalos no eixo X
max_range = dados['Electric Range'].max()
bins = list(range(0, int(max_range) + bin_width, bin_width))  # Cria limites para os intervalos

# Criar o gráfico de histograma com a curva de densidade
plt.figure(figsize=(12, 6))
ax = sns.histplot(
    data=dados,
    x='Electric Range',
    bins=bins,  # Usar intervalos bem definidos
    kde=True,   # Adicionar a curva de densidade
    color='dodgerblue'
)

# Configurar o fundo do gráfico
ax.set_facecolor("#101010")
plt.gcf().set_facecolor("#101010")

# Ajustar título e rótulos
plt.title('Distribuição do Alcance Elétrico dos Veículos Registrados', fontsize=16, color="white", pad=20)
plt.xlabel('Alcance Elétrico (milhas)', fontsize=12, color="white")
plt.ylabel('', fontsize=12, color="white")  # Remover rótulo do eixo Y

# Ajustar as cores dos ticks
ax.tick_params(axis='y', left=False, labelleft=False)  # Remove os ticks e os valores do eixo Y
ax.tick_params(colors="white", axis='x')  # Mantém os ticks do eixo X

# Definir os limites e espaçamento do eixo X
plt.xticks(bins, labels=[f"{b:,}".replace(",", ".") for b in bins], color="white")  # Adicionar separador de milhar
plt.xlim(0, max_range)

# Remover as linhas de grade
ax.grid(False)

# Remover os contornos das barras
for patch in ax.patches:
    patch.set_edgecolor('none')

# Ajustar as bordas do gráfico
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)
ax.spines['left'].set_visible(False)  # Remove a borda do eixo Y
ax.spines['bottom'].set_color('white')

# Adicionar valores nas barras com separador de milhar
for patch in ax.patches:
    height = patch.get_height()
    if height > 0:  # Apenas para barras visíveis
        ax.text(
            patch.get_x() + patch.get_width() / 2,  # Centro da barra
            height + 0.1,  # Um pouco acima da barra
            f"{int(height):,}".replace(",", "."),  # Exibe o valor com separador de milhar
            ha="center",
            va="bottom",  # Ajusta para que fique em cima
            color="white",
            fontsize=10,
        )

# Ajustar layout
plt.tight_layout()

# Mostrar o gráfico
plt.show()

'''
Histograma:
    As barras do histograma representam a distribuição dos valores de "Electric Range" (alcance elétrico) dentro de intervalos (bins) de 25 milhas. 
    Cada barra mostra quantos veículos têm um alcance elétrico dentro daquele intervalo específico.
    O eixo X (horizontal) mostra os intervalos de alcance elétrico (de 0 a, por exemplo, 300 milhas, dependendo da base de dados).
    O eixo Y (vertical) mostra o número de veículos (frequência) que caem dentro de cada intervalo de alcance.

Curva de densidade (KDE):
    A linha suavizada sobre o histograma mostra a densidade de probabilidade dos dados. Ela ajuda a identificar padrões 
    e a forma da distribuição dos dados, ou seja, se os valores de alcance elétrico tendem a se concentrar mais em determinadas 
    faixas de valores ou se estão mais espalhados.
'''


 Como a elegibilidade para combustível alternativo limpo (CAFV Eligibility) está distribuída entre os tipos de veículos?

In [44]:
# Agrupa os dados pelas colunas 'Electric Vehicle Type' e 'Clean Alternative Fuel Vehicle (CAFV) Eligibility',
# contando a quantidade de ocorrências em cada grupo.
agrupados = dados.groupby(['Electric Vehicle Type', 'Clean Alternative Fuel Vehicle (CAFV) Eligibility']).size().reset_index(name='Count')

# Filtra o DataFrame 'agrupados' para manter apenas os grupos onde a contagem é maior que 0.
agrupados = agrupados[agrupados['Count'] > 0]


In [None]:
# Configurar o estilo do gráfico
sns.set(style="whitegrid")

# Criar o gráfico de barras agrupadas
plt.figure(figsize=(12, 6))
ax = sns.barplot(
    data=agrupados,
    x='Electric Vehicle Type',
    y='Count',
    hue='Clean Alternative Fuel Vehicle (CAFV) Eligibility',
    palette='viridis'  # Paleta de cores para o gráfico
)

# Configurar o fundo do gráfico
ax.set_facecolor("#101010")
plt.gcf().set_facecolor("#101010")

# Ajustar título e rótulos
plt.title('Distribuição da Elegibilidade para Combustível Alternativo Limpo por Tipo de Veículo',
          fontsize=16, color="white", pad=20)
plt.xlabel('Tipo de Veículo', fontsize=12, color="white")
plt.ylabel('Frequência', fontsize=12, color="white")

# Ajustar as cores dos ticks
ax.tick_params(colors="white")

# Ajustar a escala do eixo Y
ax.set_yticks(range(0, agrupados['Count'].max() + 1, 25000))
ax.set_yticklabels([f"{int(tick):,}".replace(",", ".") for tick in ax.get_yticks()], color="white")

# Ajustar o texto da legenda
legend = ax.legend(title="Elegibilidade CAFV", loc='upper right', fontsize=10, title_fontsize=12)
plt.setp(legend.get_texts(), color="black")  # Cor preta para o texto da legenda
plt.setp(legend.get_title(), color="black")

# Remover as linhas de grade
ax.grid(False)

# Ajustar as bordas do gráfico
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)
ax.spines['left'].set_color('white')
ax.spines['bottom'].set_color('white')

# Remover as bordas das colunas
for patch in ax.patches:
    patch.set_edgecolor('none')  # Remove o contorno das barras

# Adicionar valores nas barras com separador de milhar
for patch in ax.patches:
    height = patch.get_height()
    if height > 0:  # Apenas para barras visíveis
        ax.text(
            patch.get_x() + patch.get_width() / 2,  # Centro da barra
            height + 100,  # Acima da barra
            f"{int(height):,}".replace(",", "."),  # Exibe o valor com separador de milhar
            ha="center",
            va="bottom",
            color="white",
            fontsize=10,
        )

# Ajustar layout
plt.tight_layout()

# Mostrar o gráfico
plt.show()


Qual é a correlação entre o preço base (Base MSRP) e o alcance elétrico dos veículos?

In [12]:
# Remove as linhas onde há valores ausentes (NaN) nas colunas 'Base MSRP' ou 'Electric Range'.
# O resultado é armazenado no DataFrame 'dados_limpos'.
dados_limpos = dados.dropna(subset=['Base MSRP', 'Electric Range'])

# Calcula a correlação de Pearson entre as colunas 'Base MSRP' (Preço Base) e 'Electric Range' (Alcance Elétrico).
# A função 'pearsonr' retorna a correlação e o valor-p, mas aqui estamos interessados apenas na correlação.
correlacao, _ = pearsonr(dados_limpos['Base MSRP'], dados_limpos['Electric Range'])

In [None]:
# Criar o gráfico de dispersão com linha de regressão
plt.figure(figsize=(12, 6))
ax = sns.regplot(
    data=dados_limpos,
    x='Base MSRP',
    y='Electric Range',
    scatter_kws={'color': 'dodgerblue', 'alpha': 0.6},  # Estilo dos pontos
    line_kws={'color': 'lime', 'alpha': 0.8},  # Estilo da linha de tendência
)

# Configurar título e rótulos
plt.title(f'Correlação entre Preço Base e Alcance Elétrico\nCoeficiente de Correlação: {correlacao:.2f}',
          fontsize=16, color="white", pad=20)
plt.xlabel('Preço Base (USD)', fontsize=12, color="white")
plt.ylabel('Alcance Elétrico (milhas)', fontsize=12, color="white")

# Ajustar as cores dos ticks
ax.tick_params(colors="white")

# Configurar fundo
ax.set_facecolor("#101010")
plt.gcf().set_facecolor("#101010")

# Ajustar bordas do gráfico
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)
ax.spines['left'].set_color('white')
ax.spines['bottom'].set_color('white')

# Ajustar layout
plt.tight_layout()

# Mostrar o gráfico
plt.show()


Quais são as áreas com maior concentração de veículos elegíveis para CAFV?


In [14]:
# Contar o número de veículos elegíveis por área (ajuste conforme a coluna de localização)
elegiveis_por_area = dados[dados['Clean Alternative Fuel Vehicle (CAFV) Eligibility'] == 'Clean Alternative Fuel Vehicle Eligible'] \
    .groupby('City').size().reset_index(name='Count')

# Ordenar as áreas pela concentração
elegiveis_por_area = elegiveis_por_area.sort_values(by='Count', ascending=False)

# Remover valores nulos na coluna 'City' e na coluna de elegibilidade
dados_filtrados = dados.dropna(subset=['City', 'Clean Alternative Fuel Vehicle (CAFV) Eligibility'])

# Filtrar apenas veículos elegíveis
elegiveis_por_area = dados_filtrados[dados_filtrados['Clean Alternative Fuel Vehicle (CAFV) Eligibility'] == 'Clean Alternative Fuel Vehicle Eligible']

# Contar veículos elegíveis por cidade
agrupados_por_cidade = elegiveis_por_area.groupby('City').size().reset_index(name='Count')

# Filtrar apenas cidades com contagens significativas
agrupados_por_cidade = agrupados_por_cidade[agrupados_por_cidade['Count'] > 0]

# Ordenar pelas cidades com maior concentração
agrupados_por_cidade = agrupados_por_cidade.sort_values(by='Count', ascending=False).head(10)


# Preparar os dados para o gráfico radar
categorias = agrupados_por_cidade['City']
valores = agrupados_por_cidade['Count']

# Normalizar valores para o gráfico radar
max_valor = max(valores)
valores_normalizados = [v / max_valor for v in valores]

In [None]:
# Criar o gráfico radar (teia de aranha)
ângulos = np.linspace(0, 2 * np.pi, len(categorias), endpoint=False).tolist()

# Fechar o gráfico de forma circular
valores_normalizados += valores_normalizados[:1]
ângulos += ângulos[:1]

# Criar o gráfico
fig, ax = plt.subplots(figsize=(8, 8), dpi=100, subplot_kw=dict(polar=True))

# Ajustar a escala radial, aumentando a distância entre o centro e o primeiro círculo
ax.set_ylim(0, 1)  # Ajuste a escala do gráfico para deixar o centro maior

ax.fill(ângulos, valores_normalizados, color='dodgerblue', alpha=0.6)
ax.plot(ângulos, valores_normalizados, color='dodgerblue', linewidth=2)

# Ajustar os rótulos para as cidades
ax.set_yticklabels([])  # Remover as etiquetas do eixo radial
ax.set_xticks(ângulos[:-1])
ax.set_xticklabels(categorias, color='white', fontsize=12)

# Ajustar título e estilo
ax.set_title('Concentração de Veículos Elegíveis para CAFV por Cidade', fontsize=16, color="white", pad=40)
ax.set_facecolor("#101010")
fig.patch.set_facecolor('#101010')

# Ajustar bordas
ax.spines['polar'].set_visible(False)

# Mostrar gráfico
plt.tight_layout()
plt.show()



Quais modelos (Model) possuem a maior participação na base de veículos?

In [16]:
# Contar a quantidade de cada modelo
modelos_populares = dados['Model'].value_counts().reset_index()
modelos_populares.columns = ['Model', 'Count']

# Selecionar os 10 modelos mais populares
top_modelos = modelos_populares.head(10)

# Adicionar a coluna Make para combinar com o Model
top_modelos = top_modelos.merge(dados[['Model', 'Make']].drop_duplicates(), on='Model', how='left')

# Calcular a participação percentual de cada modelo
top_modelos['Percentage'] = (top_modelos['Count'] / top_modelos['Count'].sum()) * 100

# Criar uma nova coluna para combinar Modelo e Fabricante
top_modelos['Label'] = top_modelos['Make'] + " - " + top_modelos['Model']

# Dados para o gráfico
labels = top_modelos['Label']
sizes = top_modelos['Percentage']
colors = sns.color_palette('viridis', len(sizes))

In [None]:
# Criar gráfico de rosquinha
plt.figure(figsize=(12, 8))
wedges, texts, autotexts = plt.pie(
    sizes,
    labels=None,  # Remove os rótulos diretos
    autopct='%1.1f%%',
    startangle=90,
    colors=colors,
    wedgeprops={'edgecolor': 'black', 'linewidth': 1},  # Contorno das fatias
    pctdistance=0.60,  # Posição dos percentuais dentro do gráfico
    textprops={'fontsize': 10, 'color': 'white'}  # Cor e tamanho dos percentuais
)

# Adicionar o círculo interno para criar o efeito de rosquinha
centre_circle = plt.Circle((0, 0), 0.70, fc='#101010')
plt.gca().add_artist(centre_circle)

# Adicionar rótulos com linhas conectando à borda
for i, wedge in enumerate(wedges):
    angle = (wedge.theta2 - wedge.theta1) / 2 + wedge.theta1
    x = 1 * np.cos(np.radians(angle))  # Posição na borda
    y = 1 * np.sin(np.radians(angle))
    label_x = 1.2 * np.cos(np.radians(angle))  # Posição do rótulo fora do gráfico
    label_y = 1.2 * np.sin(np.radians(angle))

    plt.plot([x, label_x], [y, label_y], color='white', lw=0.8)  # Linha conectando à borda
    plt.text(
        label_x, label_y, labels[i],
        ha=('left' if label_x > 0 else 'right'),  # Alinhamento horizontal
        va='center', fontsize=10, color='white'
    )

# Configurar título
plt.title('Participação Percentual dos Top 10 Modelos por Fabricante', fontsize=16, color="white", pad=40)

# Configurar fundo
plt.gcf().set_facecolor("#101010")

# Ajustar layout
plt.tight_layout()

# Mostrar gráfico
plt.show()


Existe uma relação entre o distrito legislativo (Legislative District) e a quantidade de veículos elétricos registrados?

In [None]:
contagem_distritos = dados['Legislative District'].value_counts().reset_index()
contagem_distritos.columns = ['Legislative District', 'Quantidade de Veículos']

# Criar uma nova coluna com faixas de quantidade de veículos
bins = [0, 1000, 5000, 10000, 20000, 30000]  # Definindo as faixas
labels = ['0-1k', '1k-5k', '5k-10k', '10k-20k', '20k-30k']  # Rótulos das faixas
contagem_distritos['Faixa de Veículos'] = pd.cut(contagem_distritos['Quantidade de Veículos'], bins=bins, labels=labels)
contagem_distritos

In [None]:

# Configurar o estilo do gráfico
sns.set(style="whitegrid")

# Criar o gráfico de dispersão
plt.figure(figsize=(12, 8))
ax = sns.scatterplot(
    data=contagem_distritos,  
    x='Legislative District',  
    y='Quantidade de Veículos', 
    hue='Faixa de Veículos',  # Usar as faixas para colorir os pontos
    palette='viridis',  # Nova paleta de cores mais contrastante
    s=300,  # Aumentando o tamanho das bolinhas
    marker='o',  # Usando bolinhas
    edgecolor='black',  # Cor da borda dos pontos
    alpha=0.6  # Adicionando transparência para o efeito de mancha
)

# Alterando o fundo e a grade
ax.set_facecolor("#101010")  # Cor de fundo do gráfico
plt.gcf().set_facecolor("#101010")  # Cor de fundo da figura
ax.grid(True, linestyle='--', color='white', alpha=0.1)  # Grade mais suave e branca

# Ajustando o título e rótulos
plt.title('Relação entre o Distrito Legislativo e a Quantidade de Veículos Elétricos',
          fontsize=18, color="white", pad=20)
plt.xlabel('Distrito Legislativo', fontsize=14, color="white")
plt.ylabel('Quantidade de Veículos', fontsize=14, color="white")

# Ajustando os ticks
ax.tick_params(colors="white")
ax.set_xticklabels(ax.get_xticklabels(), rotation=90, fontsize=12, color="white")

# Ajustando as bordas
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)
ax.spines['left'].set_color('white')
ax.spines['bottom'].set_color('white')

# Ajuste manual de margens
plt.subplots_adjust(right=0.9, left=0.1, top=0.9, bottom=0.1)

# Exibir o gráfico
plt.tight_layout()
plt.show()


Com base na taxa de crescimento anual, qual seria a quantidade projetada de veículos elétricos para 2025?


In [None]:
import pandas as pd
import matplotlib.pyplot as plt

# Supondo que os dados estejam carregados na variável 'dados'
# Filtrar apenas os veículos de 2024
dados_2024 = dados[dados['Model Year'] == 2024]

# Contar a quantidade de veículos por ano
quantidade_ano = dados.groupby('Model Year').size()

# Calcular a taxa de crescimento anual
# Vamos usar o cálculo de taxa de crescimento simples entre 2023 e 2024
taxa_crescimento = (quantidade_ano[2024] - quantidade_ano[2023]) / quantidade_ano[2023]

# Calcular a projeção para 2025
quantidade_2025 = quantidade_ano[2024] * (1 + taxa_crescimento)

# Exibir o valor projetado
print(f"Quantidade projetada de veículos elétricos para 2025: {quantidade_2025:.0f}")

# Gerar gráfico com a projeção de crescimento
anos = [2023, 2024, 2025]
quantidades = [quantidade_ano[2023], quantidade_ano[2024], quantidade_2025]

# Calcular a porcentagem de crescimento entre os anos
percentual_2024 = (quantidade_ano[2024] - quantidade_ano[2023]) / quantidade_ano[2023] * 100
percentual_2025 = (quantidade_2025 - quantidade_ano[2024]) / quantidade_ano[2024] * 100

# Gerar gráfico
plt.figure(figsize=(12, 8))

# Plotando a linha de projeção em vermelho
plt.plot(anos, quantidades, marker='o', color='red', linestyle='-', markersize=8, label='Projeção de Veículos Elétricos')

# Adicionando o preenchimento abaixo da linha em vermelho claro
plt.fill_between(anos, quantidades, color='lightcoral', alpha=0.5)

# Configuração de título e rótulos
plt.title('Projeção de Veículos Elétricos até 2025', fontsize=16, color="white", pad=20, weight='bold')
plt.xlabel('Ano', fontsize=12, color="white")
plt.ylabel('Quantidade de Veículos', fontsize=12, color="white")

# Configuração dos ticks
plt.xticks(anos, color="white")
plt.yticks(color="white")

# Ajustando fundo do gráfico para escuro
plt.gcf().set_facecolor("#101010")
plt.gca().set_facecolor("#101010")


# Remover as linhas de grade
plt.grid(False)

# Ajustando as bordas do gráfico
plt.gca().spines['right'].set_visible(False)
plt.gca().spines['top'].set_visible(False)
plt.gca().spines['left'].set_color('white')
plt.gca().spines['bottom'].set_color('white')

# Adicionar valores e percentuais **em cima dos marcadores**
for i, (x, y) in enumerate(zip(anos, quantidades)):
    percentual = percentual_2024 if x == 2024 else percentual_2025 if x == 2025 else 0
    # Formatar rótulo com valor e percentual
    rotulo = f"{int(y):,}".replace(",", ".") + f"\n({percentual:+.2f}%)"
    plt.text(x, y + 2000, rotulo, ha="center", va="bottom", color="white", fontsize=12, weight='bold')

# Ajustar layout para evitar sobreposição
plt.tight_layout()

# Exibir gráfico
plt.show()


Qual é a proporção de veículos por tipo de combustível (BEV vs. PHEV) em cada ano?


In [None]:
# Agrupar os dados por ano e tipo de veículo
proporcao_ano_tipo = dados.groupby(['Model Year', 'Electric Vehicle Type']).size().unstack(fill_value=0)

# Calcular a proporção de BEVs e PHEVs para cada ano
proporcao_ano_tipo['Proporcao BEV'] = proporcao_ano_tipo['Battery Electric Vehicle (BEV)'] / proporcao_ano_tipo.sum(axis=1)
proporcao_ano_tipo['Proporcao PHEV'] = proporcao_ano_tipo['Plug-in Hybrid Electric Vehicle (PHEV)'] / proporcao_ano_tipo.sum(axis=1)

# # Exibir as proporções
# print(proporcao_ano_tipo[['Proporcao BEV', 'Proporcao PHEV']])

# Gerar gráfico de barras empilhadas para visualizar as proporções
ax = proporcao_ano_tipo[['Proporcao BEV', 'Proporcao PHEV']].plot(kind='bar', stacked=True, figsize=(12, 8), color=['lightblue', 'lightcoral'])

# Configuração de título e rótulos
ax.set_title('Proporção de Veículos Elétricos por Tipo de Combustível (BEV vs PHEV)', fontsize=16, color="white", pad=20, weight='bold')
ax.set_xlabel('Ano', fontsize=12, color="white")
ax.set_ylabel('Proporção', fontsize=12, color="white")

# Ajustar a cor dos ticks
ax.tick_params(axis='x', colors="white")
ax.tick_params(axis='y', colors="white")

# Ajustar fundo do gráfico
plt.gcf().set_facecolor("#101010")
plt.gca().set_facecolor("#101010")

# Remover as linhas de grade
ax.grid(False)

# Ajustar as bordas do gráfico
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)
ax.spines['left'].set_color('white')
ax.spines['bottom'].set_color('white')

# Ajustar layout para evitar sobreposição
plt.tight_layout()

# Exibir gráfico
plt.show()


Qual é a distribuição da quantidade de veículos por faixa de alcance elétrico (e.g., 0-50, 51-100, 101-200, etc.)?

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

# Definir o gráfico
plt.figure(figsize=(12, 8))

# Plotando o gráfico de dispersão com suavização de KDE
sns.kdeplot(
    data=dados,
    x='Electric Range',  # Variável de alcance elétrico
    shade=True,  # Suavizar a área
    color='skyblue',  # Cor para a área
    alpha=0.5,  # Transparência
    linewidth=3  # Espessura da linha
)

# Adicionar pontos de dispersão
sns.scatterplot(
    x=dados['Electric Range'],  # Variável de alcance elétrico
    y=[0]*len(dados),  # Dispersão na linha Y (0 para ficar na linha base)
    color='red',  # Cor dos pontos
    alpha=0.7,  # Transparência dos pontos
    edgecolor=None,  # Sem bordas nos pontos
    s=50  # Tamanho dos pontos
)

# Ajustar título e rótulos
plt.title('Distribuição de Veículos Elétricos por Alcance Elétrico', fontsize=16, color="white", pad=20, weight='bold')
plt.xlabel('Alcance Elétrico (km)', fontsize=12, color="white")
plt.ylabel('Densidade', fontsize=12, color="white")

# Ajustando o fundo do gráfico
plt.gcf().set_facecolor("#101010")

# Ajustando a cor dos ticks
plt.xticks(color="white")
plt.yticks(color="white")

# Remover as linhas de grade
plt.grid(False)

# Ajustando as bordas do gráfico
plt.gca().spines['right'].set_visible(False)
plt.gca().spines['top'].set_visible(False)
plt.gca().spines['left'].set_color('white')
plt.gca().spines['bottom'].set_color('white')

# Ajustando layout
plt.tight_layout()

# Exibindo o gráfico
plt.show()
