In [8]:
import xml.etree.ElementTree as ET
import pandas as pd

## Leitura dos Dados

In [9]:
data = []

tree = ET.parse('resultados-completos.xml')
root = tree.getroot()

# timesteps
for child in root:
	# edge
	for subchild in child:
		# lane
		for subsubchild in subchild:
			# vehicle
			for subsubsubchild in subsubchild:
				new_row = [child.attrib['time'], subchild.attrib['id'], subsubchild.attrib['id'], subsubsubchild.attrib['id'], subsubsubchild.attrib['pos'], subsubsubchild.attrib['speed']]
				data.append(new_row)

df = pd.DataFrame(data, columns=['time', 'edge', 'lane', 'vehicle', 'pos', 'speed'])

df.head(10)

Unnamed: 0,time,edge,lane,vehicle,pos,speed
0,0.0,sai-morro,sai-morro_0,F1MAM.0,5.1,0.0
1,0.0,sai-sp,sai-sp_0,F1SMM.0,2.3,0.0
2,0.0,sai-sp,sai-sp_1,F1SAM.0,5.1,0.0
3,0.0,sai-uf,sai-uf_1,F1UAM.0,5.1,0.0
4,1.0,sai-morro,sai-morro_0,F1MAM.0,7.22,2.12
5,1.0,sai-sp,sai-sp_0,F1SMM.0,6.89,4.59
6,1.0,sai-sp,sai-sp_1,F1SAM.0,6.5,1.4
7,1.0,sai-uf,sai-uf_0,F1UAS.0,5.1,0.0
8,1.0,sai-uf,sai-uf_1,F1UAM.0,7.06,1.96
9,2.0,sai-morro,sai-morro_0,F1MAM.0,11.77,4.55


## Fazendo o tracking de um carro

É possível ver que começa nas edges de "sai-xxxxxx", por exemplo e termina em "ent-xxxxxx"

In [10]:
# track a vehicle
df[df['vehicle'] == 'F1MAM.0']

Unnamed: 0,time,edge,lane,vehicle,pos,speed
0,0.0,sai-morro,sai-morro_0,F1MAM.0,5.1,0.0
4,1.0,sai-morro,sai-morro_0,F1MAM.0,7.22,2.12
9,2.0,sai-morro,sai-morro_0,F1MAM.0,11.77,4.55
17,3.0,sai-morro,sai-morro_0,F1MAM.0,18.15,6.38
27,4.0,sai-morro,sai-morro_0,F1MAM.0,26.64,8.49
37,5.0,sai-morro,sai-morro_0,F1MAM.0,37.63,11.0
50,6.0,sai-morro,sai-morro_0,F1MAM.0,51.1,13.47
65,7.0,sai-morro,sai-morro_0,F1MAM.0,65.66,14.56
79,8.0,sai-morro,sai-morro_0,F1MAM.0,79.55,13.89
99,9.0,sai-morro,sai-morro_0,F1MAM.0,92.98,13.42


Todas as edges de "saída", que na verdade são de entrada.

In [11]:
# all edges (that begin with 'ent')
df[df['edge'].str.startswith('ent')]['edge'].unique()

array(['ent-morro', 'ent-uf', 'ent-sp'], dtype=object)

Fazer uma função que conta o fluxo (carros diferentes / tempo) em uma edge específica.

In [12]:
# a function that gets the flux of a given edge with a given time interval size
def calc_flux(df, edge):
	df_edge = df[df['edge'] == edge]
	df_edge['time'] = df_edge['time'].astype(float)
	df_edge['time'] = df_edge['time'] // time_interval
	df_edge['time'] = df_edge['time'] * time_interval
	df_edge = df_edge.groupby('time').count()
	df_edge = df_edge.reset_index()
	df_edge = df_edge.rename(columns={'vehicle': 'flux'})
	df_edge['flux'] = df_edge['flux'] / time_interval
	return df_edge

- Já possuíamos uma contagem dos carros em 5 tipos: Carro, Moto, Ônibus, Van e Caminhão
- Para a análise aqui feita e ajuste de parâmetros futuro, vamos simplificar
- Apenas 2 tipos: 
	- Carro (individual: acumulará a contagem de todos os 4 exceto ônibus e moto)
	- Ônibus
- Motos desconsideradas
- Servirá também para a análise futura de "mais ônibus menos carro ajuda a não saturação do sistema?"
- Para essa análise futura também precisamos verificar se a saturação ocorre e seu nome científico
![Alt text](https://lh3.googleusercontent.com/keep-bbsk/AFgXFlK9jk5UWA3f0vkiAMDtz4ugqpyjdVDAPTNMGJ7UZtNuWHMj0blhVSE_WaJIbuSZ-IWgd3xi8wQXCmRI-g94sa3NQXhSNGbeffpzq9VinEPqEo6BVg_bLw=s600 "a title")

In [18]:
experimental_data = [
	['morro', 0, 'carro',   2, 49, 15],
	['morro', 1, 'carro',   3, 43,  9],
	['morro', 2, 'carro',   2, 54, 16],
	['morro', 0, 'onibus',  0,  1,  1],
	['morro', 1, 'onibus',  0,  1,  0],
	['morro', 2, 'onibus',  0,  0,  0],
	['UF',    0, 'carro',  78,  0, 61],
	['UF',    1, 'carro',  82,  1, 57],
	['UF',    2, 'carro',  89,  0, 74],
	['UF',    0, 'onibus',  0,  0,  2],
	['UF',    1, 'onibus',  0,  0,  1],
	['UF',    2, 'onibus',  1,  0,  0],
	['SP',    0, 'carro',  32, 91,  2],
	['SP',    1, 'carro',  50, 76,  4],
	['SP',    2, 'carro',  41, 78,  8],
	['SP',    0, 'onibus',  3,  1,  0],
	['SP',    1, 'onibus',  1,  3,  0],
	['SP',    2, 'onibus',  4,  1,  0]
]

experimental_df = pd.DataFrame(experimental_data, columns=['entrada', 'intervalo', 'veiculo', 'saida-morro', 'saida-UF', 'saida-SP'])
experimental_df = experimental_df.melt(id_vars=['entrada', 'intervalo', 'veiculo'], value_vars=['saida-morro', 'saida-UF', 'saida-SP'], var_name='saida', value_name='contagem')
experimental_df['saida'] = experimental_df['saida'].str.replace('saida-', '')
experimental_df = experimental_df[['entrada', 'saida', 'intervalo', 'veiculo', 'contagem']]
experimental_df = experimental_df.sort_values(by=['entrada', 'saida', 'intervalo', 'veiculo'])

experimental_df

Unnamed: 0,entrada,saida,intervalo,veiculo,contagem
48,SP,SP,0,carro,2
51,SP,SP,0,onibus,0
49,SP,SP,1,carro,4
52,SP,SP,1,onibus,0
50,SP,SP,2,carro,8
53,SP,SP,2,onibus,0
30,SP,UF,0,carro,91
33,SP,UF,0,onibus,1
31,SP,UF,1,carro,76
34,SP,UF,1,onibus,3
