# Setup

In [1]:
import warnings
warnings.simplefilter('ignore')

In [2]:
import os

import pandas as pd
import altair as vg
import seaborn as sns

import numpy as np
import math as m

from itertools import combinations

# Data Prep

In [3]:
filepath = '../data/demand_raw/Dados_v3.xlsx'
df = pd.read_excel(filepath)

In [4]:
df.head()

Unnamed: 0,Sigla,Nome,Latitude,Longitude,Município,Modal,Rio,Latitude_2,Longitude_2,OBS,Considerar,Carga_2023,Carga_2024,GN,GNL,Conteineres/Ano
0,AM-000,MANAUS,-3.138087,-60.027484,Manaus,,Negro,-3.138087,-60.027484,Porto de Manaus,0,0,0,,,
1,AM-083,SACAMBU,-3.272442,-60.952701,Manacapuru,Hidroviário,Solimões,-3.274633,-60.933956,"Lago Cabaliana, UTE Sacambu; este nó será agre...",0,1487,1511,455875.7,759.792829,15.195857
2,AM-028,CAMPINAS,-3.278834,-61.099313,Manacapuru,Hidroviário,Solimões,-3.278834,-61.099313,Lago Cabaliana + Rio Paraná do Aramã; este nó ...,1,1085,1099,331573.4,552.622316,11.052446
3,AM-023,CAAPIRANGA,-3.324601,-61.212903,Manacapuru,Gasoduto,Solimões,-3.278834,-61.099313,Verificar acesso ao município; supondo entrega...,0,9984,10253,3093378.0,5155.629306,103.112586
4,AM-004,ANAMÃ,-3.572283,-61.407035,Anamã,Gasoduto,Solimões,-3.572283,-61.407035,,0,12675,13347,4026852.0,6711.41952,134.22839


In [5]:
df.dtypes

Sigla               object
Nome                object
Latitude           float64
Longitude          float64
Município           object
Modal               object
Rio                 object
Latitude_2         float64
Longitude_2        float64
OBS                 object
Considerar           int64
Carga_2023           int64
Carga_2024           int64
GN                 float64
GNL                float64
Conteineres/Ano    float64
dtype: object

# EDA

In [6]:
df.describe()

Unnamed: 0,Latitude,Longitude,Latitude_2,Longitude_2,Considerar,Carga_2023,Carga_2024,GN,GNL,Conteineres/Ano
count,86.0,86.0,86.0,86.0,96.0,96.0,96.0,82.0,82.0,82.0
mean,-3.773587,-63.488361,-3.778263,-63.564175,0.625,20103.364583,20673.541667,6879314.0,11465.524114,229.310482
std,2.07632,4.406264,2.087978,4.343704,0.486664,31821.860685,32843.231021,10439840.0,17399.725018,347.9945
min,-8.747551,-72.581236,-8.747551,-72.581236,0.0,0.0,0.0,65168.2,108.613667,2.172273
25%,-4.721653,-67.061608,-4.7197,-67.061608,0.0,1568.25,1626.75,798084.2,1330.140293,26.602806
50%,-3.354899,-62.973198,-3.350754,-63.020109,1.0,10170.0,10398.0,3806758.0,6344.596973,126.891939
75%,-2.746235,-59.750366,-2.707575,-60.004683,1.0,21500.5,22015.5,7134032.0,11890.053804,237.801076
max,1.190652,-56.668167,1.190652,-56.668167,1.0,210942.0,220434.0,66505960.0,110843.264444,2216.865289


In [7]:
df.Rio.value_counts(dropna=False)

Solimões    23
Negro       11
Madeira     11
Amazonas    11
NaN         10
Purus        9
--           9
Juruá        8
Japurá       3
Javari       1
Name: Rio, dtype: int64

In [8]:
# Drop localities without rivers attached
df = df[~df.Rio.isin(['--'])]
df = df.dropna(subset=['Rio'])

## Mapa de demanda

In [9]:
# Topo map
filepath = 'https://raw.githubusercontent.com/tbrugz/geodata-br/master/geojson/geojs-13-mun.json'

topo = vg.Chart(filepath).mark_geoshape(
    stroke="#dd",
    strokeWidth=2.5,
    color="lightgray",
).project(
    type='mercator'
)

# Demanda
selection = vg.selection_multi(fields=['Rio'], bind='legend')
points = vg.Chart(df).mark_point().encode(
    vg.Longitude('Longitude:Q',
                ),
    vg.Latitude('Latitude:Q',
               ),
    color= vg.condition(selection,
                        vg.Color('Rio:N', scale=vg.Scale(scheme='set1')),
                        vg.value('lightgray'),
                       ),
    size=vg.Size('Conteineres/Ano:Q', 
                 scale=None,
                 legend=vg.Legend(title='Conteineres por Ano')),
    tooltip=['Sigla', 'Nome', 'Latitude', 'Longitude', 'Município', 'Modal', 'Rio',
             'Latitude_2', 'Longitude_2', 'OBS', 'Considerar', 'Carga_2023',
             'Carga_2024', 'GN', 'GNL', 'Conteineres/Ano']
)

# Mapa + Demanda + Configs
vg.layer(
    topo,
    points,
).properties(
    width=600,
    height=600,
).configure_title(
    fontSize=24,
).configure_axis(
    grid=False,
    labelFontSize=14,
    titleFontSize=20,
).configure_legend(
    titleFontSize=16,
    labelFontSize=14, 
).add_selection(
    selection
)

## Demanda (permite zoom e seleção na legenda)

In [10]:
selection = vg.selection_multi(fields=['Rio'], bind='legend')

chart = vg.Chart(df).mark_point().encode(
    vg.X('Longitude:Q',
          scale=vg.Scale(zero=False)
        ),
    vg.Y('Latitude:Q',
         scale=vg.Scale(zero=False)
        ),
    color= vg.condition(selection,
                        vg.Color('Rio:N', scale=vg.Scale(scheme='set1')),
                        vg.value('lightgray'),
                       ),
    size=vg.Size('Conteineres/Ano:Q', 
                 scale=None,
                 legend=vg.Legend(title='Conteineres por Ano')),
    tooltip=['Sigla', 'Nome', 'Latitude', 'Longitude', 'Município', 'Modal', 'Rio',
             'Latitude_2', 'Longitude_2', 'OBS', 'Considerar', 'Carga_2023',
             'Carga_2024', 'GN', 'GNL', 'Conteineres/Ano']
).properties(
    width=600,
    height=600,
).configure_title(
    fontSize=24,
).configure_axis(
    labelFontSize=14,
    titleFontSize=20,
).configure_legend(
    titleFontSize=16,
    labelFontSize=14, 
).add_selection(
    selection
).interactive()

chart

## Pareto

In [11]:
df_pareto = df.copy()
df_pareto = df_pareto[df_pareto['Conteineres/Ano'].notna()]
df_pareto = df_pareto.sort_values(by=['Conteineres/Ano'], ascending=False)

df_pareto["count cumsum"] = df_pareto['Conteineres/Ano'].cumsum()
df_pareto["cumpercentage"] = df_pareto["count cumsum"]/(df_pareto['Conteineres/Ano'].sum())


sort_order = df_pareto["Nome"].tolist()

selection = vg.selection_multi(fields=['Rio'], bind='legend')

# Create Base
base = vg.Chart(df_pareto).encode(
    vg.X("Nome:O",
         sort=sort_order),
).properties(
    width=800,
    height=600,
)
# Bars chart
bars = base.mark_bar().encode(
    vg.Y("Conteineres/Ano:Q",
    axis=vg.Axis(labelFontSize=15)
        ),
    color= vg.condition(selection,
                        vg.Color('Rio:N', scale=vg.Scale(scheme='set1')),
                        vg.value('lightgray'),
                       ),
).properties(
    width=800,
    height=600,
)
# Line chart
line = base.mark_line(strokeWidth=1.5, color="#cb4154" ).encode(
    vg.Y('cumpercentage:Q',
    title='Cumulative Count',
    axis=vg.Axis(format=".0%", labelFontSize=15, )
        ),
    text = vg.Text('cumpercentage:Q')
)
# Mark the percentage values on the line with Circle marks
points = base.mark_circle(strokeWidth= 3, color = "#cb4154").encode(
    vg.Y('cumpercentage:Q', axis=None),
    tooltip=['Nome', 'Município', 'Modal', 'Rio', 'OBS', 'Considerar', 'Conteineres/Ano'],
)

# Layer all the elements together 
(bars + line + points).resolve_scale(
    y = 'independent'
).configure_title(
    fontSize=24,
).configure_axis(
    grid=False,
    labelFontSize=10,
    titleFontSize=20,
).add_selection(
    selection
).interactive()

# Considerar

In [12]:
df.loc[df.Nome == 'ALTEROSA', 'Considerar'] = 0

In [13]:
# Topo map
filepath = 'https://raw.githubusercontent.com/tbrugz/geodata-br/master/geojson/geojs-13-mun.json'

topo = vg.Chart(filepath).mark_geoshape(
    stroke="#dd",
    strokeWidth=0.3,
    opacity=0.2,
    color="lightgray",
).project(
    type='mercator'
)

# Demanda
selection = vg.selection_multi(fields=['Rio'], bind='legend')
points = vg.Chart(df[(df.Considerar == 1) & (df.Nome != 'ALTEROSA') & (df.Rio != 'Japurá')]
                 ).mark_line(point=True, size=3).encode(
    vg.Longitude('Longitude:Q',
                ),
    vg.Latitude('Latitude:Q',
               ),
    color= vg.condition(selection,
                        vg.Color('Rio:N', scale=vg.Scale(scheme='set1')),
                        vg.value('lightgray'),
                       ),
    #size=vg.Size('Conteineres/Ano:Q', 
    #             scale=None,
    #             legend=vg.Legend(title='Conteineres por Ano')),
    tooltip=['Sigla', 'Nome', 'Latitude', 'Longitude', 'Município', 'Modal', 'Rio',
             'Latitude_2', 'Longitude_2', 'OBS', 'Considerar', 'Carga_2023',
             'Carga_2024', 'GN', 'GNL', 'Conteineres/Ano']
)

# Mapa + Demanda + Configs
vg.layer(
    topo,
    points,
).properties(
    width=600,
    height=600,
).configure_title(
    fontSize=24,
).configure_axis(
    grid=False,
    labelFontSize=14,
    titleFontSize=20,
).configure_legend(
    titleFontSize=16,
    labelFontSize=14, 
).add_selection(
    selection
)

A fazer:

[DONE] 1) Levantar a matriz de distâncias (Solimões, Madeira e Amazonas) para qualquer origem e destino

2) Calcular tempo de ciclo:

Tempo de ciclo = Tempo de Nav + Tempo de mov de carga

Tempo de Nav = distancia / vel. média

Tempo de Mov de carga = 4 x 5 min

(Demanda por ciclo de 14 dias, 14 dias, 7 dias) - dos nós extremos baseado na velocidade média (ajustado pra cima, múltiplos de 7 são convenientes)

- Tempo de Porto total é de 4 movimentos do conteiner (carreta)

- Estabelecer a frequência de entrega (1, 2, 3 vezes por ciclo)

- Demanda por entrega - aredondar por cima (= Demanda / frequencia)

3) Levantamento da capacidade de navios

4) Geração de rotas (itertools -Python) 
 
 - Limitar trechos entre Portos com alta distância (300 km - verificar qual limite)
 - Capacidade máxima do navio

# Distâncias

In [14]:
filepath = '../data/distances/distance.xlsx'
df_dist = pd.read_excel(filepath, index_col=0)

In [15]:
df_dist.style.format("{:.2f}").background_gradient('Blues')

Unnamed: 0,BENJAMIN CONSTANT,TABATINGA,FEIJOAL,BELÉM DO SOLIMÕES,SANTA RITA DO WEILL,SÃO PAULO DE OLIVENÇA,AMATURÁ,SANTO ANTÔNIO DO IÇÁ,TONANTINS,JUTAÍ,FONTE BOA,UARINI,ALVARÃES,TEFÉ,CAIAMBÉ,CAMPINAS,NOVO REMANÇO,VILA AMAZÔNIA,PARINTINS,URUCARÁ,AUGUSTO MONTENEGRO,URUCURITUBA,ITACOATIARA,AUTAZES,NOVA OLINDA DO NORTE,AXINIM,BORBA,NOVO ARIPUANÃ,MANICORÉ,AUXILIADORA,HUMAITÁ,MANAUS
BENJAMIN CONSTANT,0.0,12.25,53.85,98.75,161.8,212.65,299.8,353.4,385.3,524.7,636.75,802.95,845.05,873.3,903.8,1449.9,1577.35,1913.35,1905.85,1854.35,1796.45,1687.85,1650.25,1665.15,1692.05,1729.05,1780.15,1926.15,2073.15,2178.15,2428.15,2045.9
TABATINGA,12.25,0.0,51.75,96.65,159.7,210.55,297.7,351.3,383.2,522.6,634.65,800.85,842.95,871.2,901.7,1447.8,1575.25,1911.25,1903.75,1852.25,1794.35,1685.75,1648.15,1663.05,1689.95,1726.95,1778.05,1924.05,2071.05,2176.05,2426.05,2043.8
FEIJOAL,53.85,51.75,0.0,45.0,108.05,158.9,246.05,299.65,331.55,470.95,583.0,749.2,791.3,819.55,850.05,1396.15,1523.6,1859.6,1852.1,1800.6,1742.7,1634.1,1596.5,1611.4,1638.3,1675.3,1726.4,1872.4,2019.4,2124.4,2374.4,1992.15
BELÉM DO SOLIMÕES,98.75,96.65,45.0,0.0,63.55,114.4,201.55,255.15,287.05,426.45,538.5,704.7,746.8,775.05,805.55,1351.65,1479.1,1815.1,1807.6,1756.1,1698.2,1589.6,1552.0,1566.9,1593.8,1630.8,1681.9,1827.9,1974.9,2079.9,2329.9,1947.65
SANTA RITA DO WEILL,161.8,159.7,108.05,63.55,0.0,50.9,138.05,191.65,223.55,362.95,475.0,641.2,683.3,711.55,742.05,1288.15,1415.6,1751.6,1744.1,1692.6,1634.7,1526.1,1488.5,1503.4,1530.3,1567.3,1618.4,1764.4,1911.4,2016.4,2266.4,1884.15
SÃO PAULO DE OLIVENÇA,212.65,210.55,158.9,114.4,50.9,0.0,87.35,140.95,172.85,312.25,424.3,590.5,632.6,660.85,691.35,1237.45,1364.9,1700.9,1693.4,1641.9,1584.0,1475.4,1437.8,1452.7,1479.6,1516.6,1567.7,1713.7,1860.7,1965.7,2215.7,1833.45
AMATURÁ,299.8,297.7,246.05,201.55,138.05,87.35,0.0,54.1,86.0,225.4,337.45,503.65,545.75,574.0,604.5,1150.6,1278.05,1614.05,1606.55,1555.05,1497.15,1388.55,1350.95,1365.85,1392.75,1429.75,1480.85,1626.85,1773.85,1878.85,2128.85,1746.6
SANTO ANTÔNIO DO IÇÁ,353.4,351.3,299.65,255.15,191.65,140.95,54.1,0.0,34.1,173.5,285.55,451.75,493.85,522.1,552.6,1098.7,1226.15,1562.15,1554.65,1503.15,1445.25,1336.65,1299.05,1313.95,1340.85,1377.85,1428.95,1574.95,1721.95,1826.95,2076.95,1694.7
TONANTINS,385.3,383.2,331.55,287.05,223.55,172.85,86.0,34.1,0.0,139.9,251.95,418.15,460.25,488.5,519.0,1065.1,1192.55,1528.55,1521.05,1469.55,1411.65,1303.05,1265.45,1280.35,1307.25,1344.25,1395.35,1541.35,1688.35,1793.35,2043.35,1661.1
JUTAÍ,524.7,522.6,470.95,426.45,362.95,312.25,225.4,173.5,139.9,0.0,112.1,278.3,320.4,348.65,379.15,925.25,1052.7,1388.7,1381.2,1329.7,1271.8,1163.2,1125.6,1140.5,1167.4,1204.4,1255.5,1401.5,1548.5,1653.5,1903.5,1521.25


# Definição do horizonte de planejamento

In [16]:
df['Rio'] = df['Rio'].apply(lambda x: 'Solimoes' if x == 'Solimões' else x)

In [17]:
# Dataframe com apenas localidades consideradas e rios
rios = ['Amazonas', 'Madeira', 'Solimoes']
df_sample = df[(df.Considerar == 1) & (df.Rio.isin(rios))]
df_sample = df_sample[['Rio', 'Nome', 'Conteineres/Ano']]

In [18]:
(35*50)/0.9

1944.4444444444443

In [19]:
400 / 50

8.0

In [20]:
# Parameters
vel_media = 10 * 1.852 # velocidade média do navio
t_carregamento = 4 * 5 / 60 # 5 minutos para cada movimento (4 movimentos por carga)
f_corredor = 0.9 # porcentagem da capacidade útil do navio
capac_navio_nominal = 2000 # capacidade nominal do navio em volume [m3]
capac_carga  = 50 # capacidade do conteiner em volume [m3]

# Frequencia de visitas específica por rio, ajustada pensando na capacidade do navio
freq_visitas = [2, 3, 2]

distancias_maximas_de_manaus = [458, 972.8, 2043]

In [21]:
# Capacidade do navio
capac_navio = (f_corredor * capac_navio_nominal) / capac_carga

for i in range(0, len(rios)):
    rio = rios[i]
    freq = freq_visitas[i]
    
    # Selecionar localidades "Consideradas" e de dado "Rio"
    df_sample_rio = df_sample[df_sample.Rio == rio]
    loc_rio = df_sample_rio['Nome'].tolist()
    # Maxima dist entre localidades (extremos)
    max_dist = distancias_maximas_de_manaus[i]

    # Tempo de Navegação é 2 vezes a distancia dividida pela vel 
    tempo_nav = 2 * max_dist / vel_media
    
    # Demanda total por ano (arredonda para cima)
    demanda_total = m.ceil(df_sample_rio['Conteineres/Ano'].sum())
    
    # Viagens redondas por ano (arredonda por cima)
    viagens_redondas = m.ceil(demanda_total / capac_navio)
    
    # Tempo de ciclo
    t_ciclo = (freq * tempo_nav + demanda_total/ (12 * 30 * 24) * t_carregamento)
    
    print(rio)
    print(f'Frequência de entrega: {freq} [-]')
    print(f'Distância máxima: {max_dist} [km]')
    print(f'Tempo de Navegação: {round(tempo_nav, 2)} [h]')
    print(f'Demanda total: {demanda_total} [cargas/ano]')
    print(f'Viagens redondas: {viagens_redondas} [viagens]')
    print(f'Tempo de ciclo: {round(t_ciclo, 2)} [h] ou {round(t_ciclo /24, 2)} [dias] \n')

Amazonas
Frequência de entrega: 2 [-]
Distância máxima: 458 [km]
Tempo de Navegação: 49.46 [h]
Demanda total: 4544 [cargas/ano]
Viagens redondas: 127 [viagens]
Tempo de ciclo: 99.1 [h] ou 4.13 [dias] 

Madeira
Frequência de entrega: 3 [-]
Distância máxima: 972.8 [km]
Tempo de Navegação: 105.05 [h]
Demanda total: 2493 [cargas/ano]
Viagens redondas: 70 [viagens]
Tempo de ciclo: 315.26 [h] ou 13.14 [dias] 

Solimoes
Frequência de entrega: 2 [-]
Distância máxima: 2043 [km]
Tempo de Navegação: 220.63 [h]
Demanda total: 3428 [cargas/ano]
Viagens redondas: 96 [viagens]
Tempo de ciclo: 441.38 [h] ou 18.39 [dias] 



Os números apresentados justificam a extensão do horizonte de planejamento para cada rio: No Amazonas, o tempo de ciclo de 4.54 dias indica um horizonte de 7 dias; no rio Madeira,  o tempo de ciclo de 10.3 dias indica um horizonte de 14 dias, e no Solimões 21 dias.

# Frequência de visitas

In [22]:
def _tempo_de_ciclo(data):
    if data == 'Amazonas':
        return 7
    if data == 'Madeira':
        return 14
    if data == 'Solimoes':
        return 21

In [23]:
df_sample['tempo_ciclo'] = df_sample.Rio.apply(_tempo_de_ciclo)

In [24]:
df_sample['demanda_por_ciclo'] = (df_sample['Conteineres/Ano'] / (12 * 30) * df_sample['tempo_ciclo'] ).apply(m.ceil)

# Simulando 1, 2, 3 ou 4 visitas por ciclo (para ver as aderencias e definir)
freqs_possiveis = [1, 2, 3, 4]
for f in freqs_possiveis:
    df_sample[f'demanda_{f}_visita'] = (df_sample['demanda_por_ciclo'] / f).apply(m.ceil)

df_sample[['Rio', 'Nome','demanda_1_visita', 'demanda_2_visita', 'demanda_3_visita', 'demanda_4_visita']]

Unnamed: 0,Rio,Nome,demanda_1_visita,demanda_2_visita,demanda_3_visita,demanda_4_visita
2,Solimoes,CAMPINAS,1,1,1,1
8,Solimoes,CAIAMBÉ,3,2,1,1
9,Solimoes,TEFÉ,60,30,20,15
10,Solimoes,ALVARÃES,8,4,3,2
11,Solimoes,UARINI,8,4,3,2
12,Solimoes,FONTE BOA,13,7,5,4
13,Solimoes,JUTAÍ,13,7,5,4
14,Solimoes,TONANTINS,7,4,3,2
15,Solimoes,SANTO ANTÔNIO DO IÇÁ,11,6,4,3
17,Solimoes,AMATURÁ,5,3,2,2


In [25]:
# Observando qual demanda por visita parece razoavel:
freq_visita = {'CAMPINAS': 1,
 'CAIAMBÉ': 1,
 'TEFÉ': 4,
 'ALVARÃES': 1,
 'UARINI': 1,
 'FONTE BOA': 2,
 'JUTAÍ': 2,
 'TONANTINS': 1,
 'SANTO ANTÔNIO DO IÇÁ': 1,
 'AMATURÁ': 1,
 'SÃO PAULO DE OLIVENÇA': 1,
 'SANTA RITA DO WEILL': 1,
 'BELÉM DO SOLIMÕES': 1,
 'FEIJOAL': 1,
 'BENJAMIN CONSTANT': 3,
 'TABATINGA': 4,
 'AUTAZES': 2,
 'NOVA OLINDA DO NORTE': 2,
 'AXINIM': 1,
 'BORBA': 2,
 'NOVO ARIPUANÃ': 1,
 'MANICORÉ': 2,
 'AUXILIADORA': 1,
 'HUMAITÁ': 3,
 'ITACOATIARA': 4,
 'NOVO REMANÇO': 1,
 'URUCURITUBA': 1,
 'AUGUSTO MONTENEGRO': 1,
 'URUCARÁ': 1,
 'PARINTINS': 3,
 'VILA AMAZÔNIA': 1
              }

In [26]:
def _demanda_por_visita(data):
    return data[data[4] - 1]

In [27]:
# Mapear frequencias observadas
df_sample['freq_visita'] = df_sample['Nome'].map(freq_visita)
df_sample['demanda_por_visita'] = df_sample.iloc[:, -5:].apply(_demanda_por_visita, axis=1)

In [28]:
df_sample[['Nome', 'Rio', 'demanda_por_visita', 'freq_visita']]

Unnamed: 0,Nome,Rio,demanda_por_visita,freq_visita
2,CAMPINAS,Solimoes,1,1
8,CAIAMBÉ,Solimoes,3,1
9,TEFÉ,Solimoes,15,4
10,ALVARÃES,Solimoes,8,1
11,UARINI,Solimoes,8,1
12,FONTE BOA,Solimoes,7,2
13,JUTAÍ,Solimoes,7,2
14,TONANTINS,Solimoes,7,1
15,SANTO ANTÔNIO DO IÇÁ,Solimoes,11,1
17,AMATURÁ,Solimoes,5,1


In [29]:
df_sample[['Nome', 'Rio', 'demanda_por_visita', 'freq_visita']]

Unnamed: 0,Nome,Rio,demanda_por_visita,freq_visita
2,CAMPINAS,Solimoes,1,1
8,CAIAMBÉ,Solimoes,3,1
9,TEFÉ,Solimoes,15,4
10,ALVARÃES,Solimoes,8,1
11,UARINI,Solimoes,8,1
12,FONTE BOA,Solimoes,7,2
13,JUTAÍ,Solimoes,7,2
14,TONANTINS,Solimoes,7,1
15,SANTO ANTÔNIO DO IÇÁ,Solimoes,11,1
17,AMATURÁ,Solimoes,5,1


In [30]:
cwd = os.getcwd()
pattern_path = os.path.join(cwd, '../data/preprocessing/departure_patterns/7_days.xlsx')
df_pattern_7_days = pd.read_excel(pattern_path)
pattern_path = os.path.join(cwd, '../data/preprocessing/departure_patterns/14_days.xlsx')
df_pattern_14_days = pd.read_excel(pattern_path)
pattern_path = os.path.join(cwd, '../data/preprocessing/departure_patterns/21_days.xlsx')
df_pattern_21_days = pd.read_excel(pattern_path)
pattern_path = os.path.join(cwd, '../data/preprocessing/departure_patterns/42_days.xlsx')
df_pattern_42_days = pd.read_excel(pattern_path)

def  _pattern_index(data, df_pattern):
    pattern_index = df_pattern[df_pattern.freq == data].num.tolist()
    return pattern_index

In [31]:
df_sample['pattern'] = 0
df_sample.loc[df_sample['Rio'] == 'Amazonas', 'pattern'] =  df_sample['freq_visita'].apply(_pattern_index, 
                                                                                           df_pattern=df_pattern_7_days)
df_sample.loc[df_sample['Rio'] == 'Madeira', 'pattern'] =  df_sample['freq_visita'].apply(_pattern_index, 
                                                                                           df_pattern=df_pattern_14_days)
df_sample.loc[df_sample['Rio'] == 'Solimoes', 'pattern'] =  df_sample['freq_visita'].apply(_pattern_index, 
                                                                                           df_pattern=df_pattern_21_days)

In [32]:
# Create dataframe above for each river, ordered by distance from Manaus
for rio in rios:
    lista_localidades = df_sample[df_sample.Rio == rio]['Nome'].tolist()
    localidades_ordenadas = df_dist.loc[lista_localidades].sort_values('MANAUS').index.tolist()
    sorterIndex = dict(zip(localidades_ordenadas, range(len(localidades_ordenadas))))
    
    df_freq_visita = df_sample.copy()
    df_freq_visita = df_freq_visita[df_sample.Rio == rio]
    df_freq_visita['sort'] = df_freq_visita['Nome'].map(sorterIndex)
    df_freq_visita = df_freq_visita.sort_values('sort')
    
    df_freq_visita = df_freq_visita[['Nome', 'Rio', 'demanda_por_visita', 'freq_visita', 'pattern']]
    df_freq_visita.to_parquet(f'../data/preprocessing/demands/{rio}.parquet')

### Modelo Multiplas viagens

In [36]:
rios_mult = ['Amazonas', 'Madeira']

df_sample['pattern'] = 0
df_sample.loc[df_sample['Rio'].isin(rios_mult), 'pattern'] =  df_sample['freq_visita'].apply(_pattern_index, 
                                                                                           df_pattern=df_pattern_14_days)

In [37]:
lista_localidades = df_sample[df_sample.Rio.isin(rios_mult)]['Nome'].tolist()
localidades_ordenadas = df_dist.loc[lista_localidades].sort_values('MANAUS').index.tolist()
sorterIndex = dict(zip(localidades_ordenadas, range(len(localidades_ordenadas))))

df_freq_visita = df_sample.copy()
df_freq_visita = df_freq_visita[df_sample.Rio.isin(rios_mult)]
df_freq_visita['sort'] = df_freq_visita['Nome'].map(sorterIndex)
df_freq_visita = df_freq_visita.sort_values(['Rio', 'sort'])

df_freq_visita = df_freq_visita[['Nome', 'Rio', 'demanda_por_visita', 'freq_visita', 'pattern']]
df_freq_visita.to_parquet(f'../data/preprocessing/demands/{rios_mult}.parquet')

In [38]:
df_freq_visita

Unnamed: 0,Nome,Rio,demanda_por_visita,freq_visita,pattern
76,NOVO REMANÇO,Amazonas,7,1,"[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]"
75,ITACOATIARA,Amazonas,11,4,"[35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 4..."
77,URUCURITUBA,Amazonas,5,1,"[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]"
78,AUGUSTO MONTENEGRO,Amazonas,1,1,"[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]"
79,URUCARÁ,Amazonas,4,1,"[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]"
80,PARINTINS,Amazonas,10,3,"[21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 3..."
82,VILA AMAZÔNIA,Amazonas,2,1,"[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]"
55,AUTAZES,Madeira,8,2,"[14, 15, 16, 17, 18, 19, 20]"
56,NOVA OLINDA DO NORTE,Madeira,7,2,"[14, 15, 16, 17, 18, 19, 20]"
57,AXINIM,Madeira,1,1,"[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]"


# Geração de Rotas

- Gerar todas as combinações de localidades (contendo 1, 2, 3, 4, etc.) para cada rio, até que a capacidade do navio se esgote (Ter as localidades ordenadas em ordem crescente de distância a Manaus).
- A cada rota, registrar:
    - tempo de ciclo da rota (separado por tempo navegando e tempo de porto)
    - demanda total da rota,
    - custo de navegação da rota
    - se a localidade i está na rota r ou não

## Loop principal

In [30]:
# Capacidade maxima da embarcacao
cap_max = 35 # 2000 * 0.9 / 50 = 36
vel_media = 10 * 1.852 # velocidade média do navio
t_carregamento = 4 * 5 / 60 # 5 minutos para cada movimento (4 movimentos por carga)

In [31]:
def vetor_no_pertence_a_rota(data, localidades_ordenadas):
    vetor = np.zeros(len(localidades_ordenadas))
    for i in range(0, len(vetor)):
        if localidades_ordenadas[i] in data:
            vetor[i] = 1
    return vetor

In [42]:
def make_route(data: pd.DataFrame, 
               matrix_distancias: pd.DataFrame, 
               rio: str) -> pd.DataFrame:
    
    # Ordenar localidades por distancia a Manaus
    lista_localidades = data[data.Rio == rio]['Nome'].tolist()
    localidades_ordenadas = matrix_distancias.loc[lista_localidades].sort_values('MANAUS').index.tolist()
    
    localidades =  data.set_index('Nome').loc[localidades_ordenadas].index.tolist()
    demandas = data.set_index('Nome').loc[localidades_ordenadas]['demanda_por_visita'].tolist()
    
    rotas = []
    demandas_rotas = []

    distancias_manaus = []
    tempos_porto = []
    tempos_nav = []
    tempos_ciclo = []

    num_rotas_totais = 0

    for i in range(1, len(localidades) + 1): # Para cada combinacao (1 a 1, 2 a 2....)
     #   print(f'Combinações {i} a {i}:')
        comb_demandas = list(combinations(demandas,i))
        comb_locais = list(combinations(localidades,i))

        target_capac_max = 0
        for j, demanda_comb in enumerate(comb_demandas): # Para cada rota nas combinacoes
            demanda_comb = sum(demanda_comb)
            if demanda_comb <= cap_max: # se atingir a capacidade maxiam do navio
    #            print(f'Demanda total da rota: {demanda_comb}')
                demandas_rotas.append(demanda_comb)

                target_capac_max +=1
                # Estabelecer os nos da combinacao
                nos_comb = list(comb_locais[j])
    #            print(f'Rota: {nos_comb}')
                rotas.append(nos_comb)

                dist_manaus = 0
                dist_manaus += df_dist.loc[nos_comb[0], 'MANAUS']
                final = df_dist.loc[nos_comb[-1], 'MANAUS']
  #              print(f'Distância do Primeiro local até Manaus: {dist_manaus}')
  #              print(f'Distância último local até Manaus: {final}')
                for k in range(0, len(nos_comb)):
                    if k < len(nos_comb) - 1:
                        no_anterior = nos_comb[k]
                        no_posterior = nos_comb[k+1]
                        distancia_entre_nos = df_dist.loc[no_anterior, no_posterior]
    #                    print(f'Arcos: {no_anterior} + {no_posterior}')
   #                     print(f'Distância do arco: {distancia_entre_nos}')
                        dist_manaus += distancia_entre_nos

                dist_manaus = round(dist_manaus, 2)
    #            print(f'Distância percorrida: {round(dist_manaus,2)}')
                distancias_manaus.append(dist_manaus)

                tempo_porto = round(demanda_comb * t_carregamento, 2)
                tempo_nav = round(2 * dist_manaus / vel_media, 2)
                tempo_ciclo = round(tempo_porto + tempo_nav, 2)

    #            print(f'Tempo de porto: {tempo_porto}')
                tempos_porto.append(tempo_porto)
    #            print(f'Tempo de nav: {tempo_nav}')
                tempos_nav.append(tempo_nav)
    #            print(f'Tempo de ciclo: {tempo_ciclo}')
                tempos_ciclo.append(tempo_ciclo)

    #            print('*******************************************')
    #    print(f'Total de rotas com {i} localidades: {target_capac_max}')
        num_rotas_totais += target_capac_max
    #    print('-------------------------------------------------')

        if target_capac_max == 0:
    #        print('Não há combinações maiores possíveis\n')
            break
    
    #print(f'Número total de rotas: {num_rotas_totais}\n')
    #print(f'Lista de rotas: {rotas}\n')
    #print(f'Demanda [containers] das rotas: {demandas_rotas}\n')
    #print(f'Tempo [h] de porto das rotas: {tempos_porto}')
    #print(f'Tempo [h] de navegação nas rotas: {tempos_nav}')
    #print(f'Tempo [h] de ciclo nas rotas: {tempos_ciclo}')
    #print(f'Distâncias máximas até Manaus: {distancias_manaus}')
    
    dict_to_dataframe = {
    'nos': pd.Series(rotas),
    'demanda': pd.Series(demandas_rotas),
    'tempo_porto': pd.Series(tempos_porto),
    'tempo_nav': pd.Series(tempos_nav),
    'tempo_ciclo': pd.Series(tempos_ciclo),
    'distancia': pd.Series(distancias_manaus),
}
    
    rotas = pd.DataFrame.from_dict(dict_to_dataframe, orient='index').T
    rotas['vetor_loc_rota'] = rotas['nos'].apply(vetor_no_pertence_a_rota, localidades_ordenadas =localidades_ordenadas)
    
    return rotas

In [47]:
# Escolha o rio que quer gerar as rotas
rio = 'Amazonas'  # 'Amazonas', 'Madeira', 'Solimões'

rota = make_route(data=df_sample, 
                  matrix_distancias=df_dist,
                  rio=rio)

In [48]:
# Salvar a base
folderpath_rotas = '../data/preprocessing/routes/'
rota.to_parquet(folderpath_rotas + f'rotas_{rio}.parquet')