In [47]:
import xml.etree.ElementTree as ET
import pandas as pd

## Leitura dos Dados

In [48]:
data = []

tree = ET.parse('rawDump.xml')
root = tree.getroot()

# timesteps
for child in root:
	# edge
	for subchild in child:
		# lane
		for subsubchild in subchild:
			# vehicle
			for subsubsubchild in subsubchild:
				new_row = [child.attrib['time'], subchild.attrib['id'], subsubchild.attrib['id'], subsubsubchild.attrib['id'], subsubsubchild.attrib['pos'], subsubsubchild.attrib['speed']]
				data.append(new_row)

df = pd.DataFrame(data, columns=['time', 'edge', 'lane', 'vehicle', 'pos', 'speed'])

df.head(10)

Unnamed: 0,time,edge,lane,vehicle,pos,speed
0,0.0,morro-0,morro-0_0,CMUF.0,5.1,0.0
1,0.0,sp-0,sp-0_0,CSPUF.0,5.1,0.0
2,0.0,sp-0,sp-0_1,CSPM.0,5.1,0.0
3,0.0,uf-0,uf-0_0,CUFM.0,5.1,0.0
4,1.0,morro-0,morro-0_0,CMUF.0,7.31,2.21
5,1.0,sp-0,sp-0_0,CSPUF.0,7.12,2.02
6,1.0,sp-0,sp-0_1,CSPM.0,7.59,2.49
7,1.0,uf-0,uf-0_0,CUFM.0,7.61,2.51
8,2.0,morro-0,morro-0_0,CMUF.0,11.81,4.51
9,2.0,sp-0,sp-0_0,CSPUF.0,10.97,3.85


## Fazendo o tracking de um carro

É possível ver que começa nas edges de "sai-xxxxxx", por exemplo e termina em "ent-xxxxxx"

In [49]:
# track a vehicle
df[df['vehicle'] == 'CMUF.0']

Unnamed: 0,time,edge,lane,vehicle,pos,speed
0,0.0,morro-0,morro-0_0,CMUF.0,5.1,0.0
4,1.0,morro-0,morro-0_0,CMUF.0,7.31,2.21
8,2.0,morro-0,morro-0_0,CMUF.0,11.81,4.51
13,3.0,morro-0,morro-0_0,CMUF.0,18.72,6.9
19,4.0,morro-0,morro-0_0,CMUF.0,27.31,8.59
27,5.0,morro-0,morro-0_0,CMUF.0,37.64,10.33
35,6.0,morro-0,morro-0_0,CMUF.0,49.81,12.18
44,7.0,morro-0,morro-0_0,CMUF.0,63.28,13.47
54,8.0,morro-0,morro-0_0,CMUF.0,77.3,14.02
65,9.0,morro-0,morro-0_0,CMUF.0,92.01,14.71


Todas as edges de "saída", que na verdade são de entrada.

In [50]:
# all edges (that begin with 'ent')
df[df['edge'].str.startswith('saida')]['edge'].unique()

array(['saida-uf', 'saida-morro', 'saida-sp'], dtype=object)

Fazer uma função que conta o fluxo (carros diferentes / tempo) em uma edge específica.

In [51]:
# a function that gets the flux of a given edge //////with a given time interval size
def calc_flux(df, edge):
	df_edge = df[df['edge'] == edge]
	vehicles = len(df_edge['vehicle'].unique())
	min_time = float(df_edge['time'].min())
	max_time = float(df_edge['time'].max())
	time = max_time - min_time
	print('vehicles:', vehicles)
	print('time:', time)
	return vehicles / time

print(calc_flux(df, 'saida-morro'))

- Já possuíamos uma contagem dos carros em 5 tipos: Carro, Moto, Ônibus, Van e Caminhão
- Para a análise aqui feita e ajuste de parâmetros futuro, vamos simplificar
- Apenas 2 tipos: 
	- Carro (individual: acumulará a contagem de todos os 4 exceto ônibus e moto)
	- Ônibus
- Motos desconsideradas
- Servirá também para a análise futura de "mais ônibus menos carro ajuda a não saturação do sistema?"
- Para essa análise futura também precisamos verificar se a saturação ocorre e seu nome científico
![Alt text](https://lh3.googleusercontent.com/keep-bbsk/AFgXFlK9jk5UWA3f0vkiAMDtz4ugqpyjdVDAPTNMGJ7UZtNuWHMj0blhVSE_WaJIbuSZ-IWgd3xi8wQXCmRI-g94sa3NQXhSNGbeffpzq9VinEPqEo6BVg_bLw=s600 "a title")

In [35]:
experimental_data = [
	['morro', 0, 'carro',   2, 49, 15],
	['morro', 1, 'carro',   3, 43,  9],
	['morro', 2, 'carro',   2, 54, 16],
	['morro', 0, 'onibus',  0,  1,  1],
	['morro', 1, 'onibus',  0,  1,  0],
	['morro', 2, 'onibus',  0,  0,  0],
	['UF',    0, 'carro',  78,  0, 61],
	['UF',    1, 'carro',  82,  1, 57],
	['UF',    2, 'carro',  89,  0, 74],
	['UF',    0, 'onibus',  0,  0,  2],
	['UF',    1, 'onibus',  0,  0,  1],
	['UF',    2, 'onibus',  1,  0,  0],
	['SP',    0, 'carro',  32, 91,  2],
	['SP',    1, 'carro',  50, 76,  4],
	['SP',    2, 'carro',  41, 78,  8],
	['SP',    0, 'onibus',  3,  1,  0],
	['SP',    1, 'onibus',  1,  3,  0],
	['SP',    2, 'onibus',  4,  1,  0]
]

experimental_df = pd.DataFrame(experimental_data, columns=['entrada', 'intervalo', 'veiculo', 'saida-morro', 'saida-UF', 'saida-SP'])
experimental_df = experimental_df.melt(id_vars=['entrada', 'intervalo', 'veiculo'], value_vars=['saida-morro', 'saida-UF', 'saida-SP'], var_name='saida', value_name='contagem')
experimental_df['saida'] = experimental_df['saida'].str.replace('saida-', '')
experimental_df = experimental_df[['entrada', 'saida', 'intervalo', 'veiculo', 'contagem']]
experimental_df = experimental_df.sort_values(by=['entrada', 'saida', 'intervalo', 'veiculo'])

experimental_df

Unnamed: 0,entrada,saida,intervalo,veiculo,contagem
48,SP,SP,0,carro,2
51,SP,SP,0,onibus,0
49,SP,SP,1,carro,4
52,SP,SP,1,onibus,0
50,SP,SP,2,carro,8
53,SP,SP,2,onibus,0
30,SP,UF,0,carro,91
33,SP,UF,0,onibus,1
31,SP,UF,1,carro,76
34,SP,UF,1,onibus,3


vehicles: 398
time: 899.0
0.44271412680756395


In [53]:
# all experimental df where saida == 'morro' and sum of contagem
experimental_df[experimental_df['saida'] == 'morro']['contagem'].sum() / 1800

0.21555555555555556