<a href="https://colab.research.google.com/github/DanielSFreitas/Eficiencia_Combustivel/blob/main/Efici%C3%AAncia_de_Combust%C3%ADvel.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Introdução


Este conjunto de dados apresenta uma visão abrangente e detalhada sobre o consumo de combustível e as emissões de CO2 de diversos tipos de navios que operam nas vias navegáveis da Nigéria. Ele inclui informações cruciais, como categorias de navios, rotas navegadas, eficiência dos motores, consumo de combustível, período (mês) e níveis de emissões. Diante disso, vamo entender o consumo de combustivel para planejar sua melhor utilização.

In [None]:
import pandas as pd
import numpy as np
import os

import matplotlib.pyplot as plt
import plotly.express as px

pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', 50)
pd.set_option('display.width', 1000)

fuel = pd.read_csv('/content/drive/MyDrive/CSV/ship_fuel_efficiency.csv')
fuel.head()

Unnamed: 0,ship_id,ship_type,route_id,month,distance,fuel_type,fuel_consumption,CO2_emissions,weather_conditions,engine_efficiency
0,NG001,Oil Service Boat,Warri-Bonny,January,132.26,HFO,3779.77,10625.76,Stormy,92.14
1,NG001,Oil Service Boat,Port Harcourt-Lagos,February,128.52,HFO,4461.44,12779.73,Moderate,92.98
2,NG001,Oil Service Boat,Port Harcourt-Lagos,March,67.3,HFO,1867.73,5353.01,Calm,87.61
3,NG001,Oil Service Boat,Port Harcourt-Lagos,April,71.68,Diesel,2393.51,6506.52,Stormy,87.42
4,NG001,Oil Service Boat,Lagos-Apapa,May,134.32,HFO,4267.19,11617.03,Calm,85.61


In [None]:
fuel.shape

(1440, 10)

In [None]:
fuel.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1440 entries, 0 to 1439
Data columns (total 10 columns):
 #   Column              Non-Null Count  Dtype  
---  ------              --------------  -----  
 0   ship_id             1440 non-null   object 
 1   ship_type           1440 non-null   object 
 2   route_id            1440 non-null   object 
 3   month               1440 non-null   object 
 4   distance            1440 non-null   float64
 5   fuel_type           1440 non-null   object 
 6   fuel_consumption    1440 non-null   float64
 7   CO2_emissions       1440 non-null   float64
 8   weather_conditions  1440 non-null   object 
 9   engine_efficiency   1440 non-null   float64
dtypes: float64(4), object(6)
memory usage: 112.6+ KB


In [None]:
fuel.describe()

Unnamed: 0,distance,fuel_consumption,CO2_emissions,engine_efficiency
count,1440.0,1440.0,1440.0,1440.0
mean,151.753354,4844.246535,13365.454882,82.582924
std,108.47223,4892.352813,13567.650118,7.158289
min,20.08,237.88,615.68,70.01
25%,79.0025,1837.9625,4991.485,76.255
50%,123.465,3060.88,8423.255,82.775
75%,180.78,4870.675,13447.12,88.8625
max,498.55,24648.52,71871.21,94.98


###Através do describe podemos tirar alguns insights:



* Tanto a distância (108,47 km) quanto o consumo de combustível (4.892 litros) e  as emissões de CO2 (13.567 kg) têm alta variabilidade. Isso sugere que algumas rotas e operações consomem muito mais combustível e emitem significativamente mais CO2 do que outras.

*   A eficiência do motor tem menor variabilidade (7,16%), indicando que os motores estão geralmente operando em uma faixa estreita de eficiência.

* 25% das operações percorrem menos de 79 km, enquanto 75% percorrem até 180 km. Indicando que a maioria das operações são de curta ou média distância.

* 25% consomem menos de 1.838 litros, enquanto 75% consomem até 4.871 litros.
Operações que consomem acima desse valor são provavelmente rotas longas ou menos eficientes.

Através da visualização abaixo veremos as distâncias percorridas nas rotas e o seu consumo






In [None]:
fig = px.scatter(
    fuel,
    x="distance",
    y="fuel_consumption",
    color="route_id",
    size="fuel_consumption",
    title="Distância vs Consumo de Combustível",
    labels={"distance": "Distância (km)", "fuel_consumption": "Consumo de Combustível (litros)"}
)

fig.show()

Vamos entender em qual mês teve maior consumo médio nas viagens, o  total de combustível utilizado no mês e se está relacionado com a quantidade de viagens.

In [None]:
# Calcular o consumo médio por mês
consumo_tot = fuel.groupby('month')['fuel_consumption'].sum().reset_index()

# Criar o gráfico
fig = px.bar(
    consumo_tot,
    x="month",
    y="fuel_consumption",
    text="fuel_consumption",  # Usar a coluna 'fuel_consumption' diretamente
    title="Consumo Total de Combustível por Mês",
    labels={"month": "Mês", "fuel_consumption": "Consumo Médio (litros)"},
    color="fuel_consumption",
    color_continuous_scale="Oranges"
)

# Customizar o layout para remover as linhas de grade
fig.update_traces(texttemplate='%{text:.2f}', textposition='outside')
fig.update_layout(
    xaxis=dict(tickangle=-45, showgrid=False),  # Remover a linha de grade do eixo x
    yaxis=dict(title="Consumo Médio (litros)", showgrid=False),  # Remover a linha de grade do eixo y
    title_font_size=18,
    title_x=0.5,  # Centralizar o título
    template="plotly_white"
)

# Exibir o gráfico
fig.show()


In [None]:
# Calcular o consumo médio por mês
consumo_mes = fuel.groupby('month')['fuel_consumption'].mean().reset_index()

# Criar o gráfico
fig = px.bar(
    consumo_mes,
    x="month",
    y="fuel_consumption",
    text="fuel_consumption",  # Usar a coluna 'fuel_consumption' diretamente
    title="Consumo Médio de Combustível por Mês",
    labels={"month": "Mês", "fuel_consumption": "Consumo Médio (litros)"},
    color="fuel_consumption",
    color_continuous_scale="Greens"
)

# Customizar o layout para remover as linhas de grade
fig.update_traces(texttemplate='%{text:.2f}', textposition='outside')
fig.update_layout(
    xaxis=dict(tickangle=-45, showgrid=False),  # Remover a linha de grade do eixo x
    yaxis=dict(title="Consumo Médio (litros)", showgrid=False),  # Remover a linha de grade do eixo y
    title_font_size=18,
    title_x=0.5,  # Centralizar o título
    template="plotly_white"
)

# Exibir o gráfico
fig.show()


In [None]:
viagens_mes = fuel.groupby('month')['ship_id'].count()
viagens_mes.sort_values(ascending=False)

Unnamed: 0_level_0,ship_id
month,Unnamed: 1_level_1
April,120
August,120
December,120
February,120
January,120
July,120
June,120
March,120
May,120
November,120


Podemos perceber que possuem o mesmo número de viagens porém no mês de Março houve maior consumo de combustível com 649478.80 total e 5412.32 em média nas suas viagens. O que poderia ter influenciado o maior consumo neste mês?

In [None]:
month_distance = fuel.groupby('month')['distance'].mean().reset_index()

# Criar o gráfico
fig = px.bar(
    month_distance,
    x="month",
    y="distance",
    text="distance",  # Usar a coluna 'fuel_consumption' diretamente
    title="Distância Média percorrida por Mês",
    labels={"month": "Mês", "distance": "Distância (KM)"},
    color="distance",
    color_continuous_scale="Blues"
)

# Customizar o layout para remover as linhas de grade
fig.update_traces(texttemplate='%{text:.2f}', textposition='outside')
fig.update_layout(
    xaxis=dict(tickangle=-45, showgrid=False),  # Remover a linha de grade do eixo x
    yaxis=dict(title="Consumo Médio (litros)", showgrid=False),  # Remover a linha de grade do eixo y
    title_font_size=18,
    title_x=0.5,  # Centralizar o título
    template="plotly_white"
)

# Exibir o gráfico
fig.show()

In [None]:
# Agrupando os dados
weather_counts = fuel.groupby('month')['weather_conditions'].value_counts().unstack()
weather_counts

weather_conditions,Calm,Moderate,Stormy
month,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
April,47,37,36
August,34,35,51
December,40,46,34
February,45,37,38
January,51,35,34
July,40,39,41
June,47,38,35
March,44,42,34
May,31,47,42
November,50,32,38


Apesar de possuírem o mesmo número de viagens, foi escolhido março para poder fazer viagens mais longas. Podemos ver também que março teve "águas" mais calmas. E que meses como Janeiro e Novembro possuem uma condição marítima mais calma podendo ser bons para planejar viagens mais longas. Outra questão é interessante que podemos ver que Agosto o mês com maior mar agitado foram percorridas distâncias mais curtas.

#Consumo e comparativo de combustíveis

Agora vamos analisar como está sendo o consumo de combustível e sua eficiência nos motores

In [None]:
fuel['fuel_type'].value_counts()

Unnamed: 0_level_0,count
fuel_type,Unnamed: 1_level_1
Diesel,899
HFO,541


In [None]:
consumo_rota = fuel.groupby(['fuel_type', 'route_id'])['fuel_consumption'].sum().reset_index()

# Criar o gráfico
fig = px.bar(
    consumo_rota,
    x="route_id",
    y="fuel_consumption",
    text="fuel_consumption",  # Usar a coluna 'fuel_consumption' diretamente
    title="Consumo Total de combustível por Tipo",
    labels={"route_id": "rota", "fuel_type": "Tipo"},
    color="fuel_type",
    color_continuous_scale="Blues"
)

# Customizar o layout para remover as linhas de grade
fig.update_traces(texttemplate='%{text:.2f}', textposition='outside')
fig.update_layout(
    xaxis=dict(tickangle=-45, showgrid=False),  # Remover a linha de grade do eixo x
    yaxis=dict(title="Consumo Médio (litros)", showgrid=False),  # Remover a linha de grade do eixo y
    title_font_size=18,
    title_x=0.5,  # Centralizar o título
    template="plotly_white"
)

# Exibir o gráfico
fig.show()

In [None]:
consumo_rota = fuel.groupby(['fuel_type', 'route_id'])['fuel_consumption'].mean().reset_index()

# Criar o gráfico
fig = px.bar(
    consumo_rota,
    x="route_id",
    y="fuel_consumption",
    text="fuel_consumption",  # Usar a coluna 'fuel_consumption' diretamente
    title="Consumo Médio de combustível por Tipo",
    labels={"route_id": "rota", "fuel_type": "Tipo"},
    color="fuel_type",
    color_continuous_scale="Oranges"
)

# Customizar o layout para remover as linhas de grade
fig.update_traces(texttemplate='%{text:.2f}', textposition='outside')
fig.update_layout(
    xaxis=dict(tickangle=-45, showgrid=False),  # Remover a linha de grade do eixo x
    yaxis=dict(title="Consumo Médio (litros)", showgrid=False),  # Remover a linha de grade do eixo y
    title_font_size=18,
    title_x=0.5,  # Centralizar o título
    template="plotly_white"
)

# Exibir o gráfico
fig.show()

Temos um consumo total maior do Diesel nas rotas mas é perceptível que quando se trata do consumo médio nas viagens o uso do HFO é maior. Vamos entender melhor sua utilização de acordo com as condições do mar e sua eficiência de motor!

In [None]:
# Agrupar os dados
consumo_weather = fuel.groupby(['fuel_type', 'weather_conditions'])['fuel_consumption'].mean().reset_index()

# Criar o gráfico
fig = px.bar(
    consumo_weather,
    x='weather_conditions',
    y='fuel_consumption',
    color='fuel_type',
    barmode='group',
    title='Consumo Médio de Combustível por Tipo de Combustível e Condições Climáticas',
    labels={
        'weather_conditions': 'Condições Climáticas',
        'fuel_consumption': 'Consumo Médio (litros)',
        'fuel_type': 'Tipo de Combustível'
    },
    color_discrete_sequence=px.colors.qualitative.Set1  # Escolha de cores
)

# Customizar o layout
fig.update_layout(
    xaxis=dict(tickangle=-45, showgrid=False),  # Remover a linha de grade do eixo x
    yaxis=dict(title="Consumo Médio (litros)"),
    title_font_size=18,
    title_x=0.5,  # Centralizar o título
    template="plotly_white"
)

# Exibir o gráfico
fig.show()


Podemos perceber que a média é maior devido a ter tido mais viagens com mar calmo utilizando o combustível HFO. Porém apesar de ter tido mais viagens com o mar moderado utilizando o Diesel o consumo se mostra maior também com as viagens no mar calmo. Vamos entender como a distância impacta no uso do combustível

In [None]:
distance_weather = fuel.groupby(['fuel_type','weather_conditions'])['distance'].mean().reset_index()

# Criar o gráfico
fig = px.bar(
    distance_weather,
    x='weather_conditions',
    y='distance',
    color='fuel_type',
    barmode='group',
    title='Distância Média percorrida por Tipo de Combustível e Condições Climáticas',
    labels={
        'weather_conditions': 'Condições Climáticas',
        'distance': 'Distância',
        'fuel_type': 'Tipo de Combustível'
    },
    color_discrete_sequence=px.colors.qualitative.Set1  # Escolha de cores
)

# Customizar o layout
fig.update_layout(
    xaxis=dict(tickangle=-45, showgrid=False),  # Remover a linha de grade do eixo x
    yaxis=dict(title="Consumo Médio (litros)"),
    title_font_size=18,
    title_x=0.5,  # Centralizar o título
    template="plotly_white"
)

# Exibir o gráfico
fig.show()

Na utilização do combustível HFO percorremos uma maior distância no mar revolto(stormy), o que pode ser perigoso devido a instabilidade do mar sendo mais prudente percorrer menores distâncias com esse tempo. E com o diesel foram percorridas maiores distâncias com o mar moderato, possibilitando viagens mais prudentes.





In [None]:
metrics = fuel.groupby('fuel_type').agg({
    "fuel_consumption": "mean",
    "CO2_emissions": "mean",
    "engine_efficiency": "mean"
}).rename(columns = {
    "fuel_consumption": "mean_fuel_consumption",
    "CO2_emissions": "mean_CO2_emissions",
    "engine_efficiency": "mean_engine_efficiency"
})

metrics.reset_index(inplace=True)
metrics

Unnamed: 0,fuel_type,mean_fuel_consumption,mean_CO2_emissions,mean_engine_efficiency
0,Diesel,4315.168509,11893.876162,82.309511
1,HFO,5723.435342,15810.832458,83.037264


In [None]:
# Calcular métricas médias por rota
rota_eficiencia = fuel.groupby('route_id').agg(
    consumo_medio=('fuel_consumption', 'mean'),
    co2_medio=('CO2_emissions', 'mean'),
    eficiencia_media=('engine_efficiency', 'mean'),
    distancia_media=('distance', 'mean')
).sort_values('eficiencia_media', ascending=False)

print(rota_eficiencia)




                     consumo_medio     co2_medio  eficiencia_media  distancia_media
route_id                                                                           
Lagos-Apapa            5171.549716  14217.092036         82.683557       158.860644
Warri-Bonny            4353.314048  12073.386769         82.650918       141.752347
Port Harcourt-Lagos    4805.137301  13201.129563         82.512648       150.819923
Escravos-Lagos         4932.468780  13672.650976         82.497019       153.232412


Diante das duas métricas acima podemos ver que o combustível HFO  possui maior faixa de consumo e também produz maior emissão de CO2 e a sua eficiência nos motores não é tão grande a favor de fazer diferença para ser amplamente utilizada. A rota de Lagos-Apapa e Escravos-Lagos tem as maiores faixa de consumo, emissão de CO2 e distância percorrida podendo ser analisadas para encontrar melhorias em seu percurso.      

#Resumo

Objetivo da análise: Entender o consumo de combustível de navios nas vias navegáveis da Nigéria para otimizar seu uso.

Insights e observações:

Variabilidade:
* Alta variabilidade no consumo de combustível e emissões de CO2, indicando diferenças significativas entre rotas e operações.
Distância e consumo:
* As rotas mais longas tendem a ter maior consumo de combustível, como Lagos-Apapa e Escravos-Lagos.
Consumo por mês:
* Março teve o maior consumo total de combustível, apesar de ter o mesmo número de viagens que outros meses, possivelmente devido a viagens mais longas.

Condições climáticas:
* Condições climáticas mais calmas, como em Janeiro e Novembro, podem ser favoráveis para viagens mais longas.
Comparativo de combustíveis:
* Diesel teve maior consumo total, mas HFO teve maior consumo médio por viagem. HFO percorreu distâncias maiores em condições de mar revolto, o que pode ser arriscado.
* Diesel teve maior consumo em condições de mar calmo e moderado.
Eficiência e emissões:
* HFO apresentou maior consumo e emissões de CO2, com menor eficiência de motor
* Rotas com maior consumo e emissões (Lagos-Apapa e Escravos-Lagos) podem ser otimizadas.

Recomendações:
* Otimizar rotas com alto consumo e emissões, como Lagos-Apapa e Escravos-Lagos, buscando reduzir distâncias ou melhorar a eficiência.
* Priorizar viagens mais longas em meses com condições climáticas favoráveis, como Janeiro e Novembro.
* Avaliar o uso de combustíveis mais eficientes e com menor impacto ambiental, como o Diesel em detrimento do HFO, considerando as condições de navegação.
* Monitorar e analisar continuamente os dados de consumo e emissões para identificar oportunidades de otimização.

