#Table of Contents
* [1. El uso de Python como apoyo al pesaje de vehículos de pesados en movimiento (WIM)](#1.-El-uso-de-Python-como-apoyo-al-pesaje-de-vehículos-de-pesados-en-movimiento-%28WIM%29)
* [2. Descripción del proyecto](#2.-Descripción-del-proyecto)
* [3. Adquisición de datos](#3.-Adquisición-de-datos)
	* [3.1 Uso de datos sintéticos](#3.1-Uso-de-datos-sintéticos)
* [4. Almacenamiento y flujo de lo datos](#4.-Almacenamiento-y-flujo-de-lo-datos)
* [5. Procesamiento digital de señal](#5.-Procesamiento-digital-de-señal)
	* [5.1 Corrección de baseline](#5.1-Corrección-de-baseline)
	* [5.2 Filtrado de señal](#5.2-Filtrado-de-señal)
	* [5.3 Detección de picos](#5.3-Detección-de-picos)
	* [5.4 Recorte de la curva de la señal para el cálculo de peso](#5.4-Recorte-de-la-curva-de-la-señal-para-el-cálculo-de-peso)
* [6. Cálculos](#6.-Cálculos)
	* [6.1 Velocidad](#6.1-Velocidad)
	* [6.2 Distáncia entre ejes](#6.2-Distáncia-entre-ejes)
	* [6.3 Pesos](#6.3-Pesos)
* [7. Clasificación de vehículos](#7.-Clasificación-de-vehículos)
* [8. Calibración de los cálculos de pesaje](#8.-Calibración-de-los-cálculos-de-pesaje)
* [9. Reconocimiento automático de matrículas vehículares](#9.-Reconocimiento-automático-de-matrículas-vehículares)
* [10. Conclusión](#10.-Conclusión)


<!--bibtex

@TechReport{tech:optimization-vehicle-classification,
  Title                    = {Optimization Vehicle Classification},
  Author                   = {van Boxel, DW and van Lieshout, RA},
  Institution              = {Ministerie van Verkeer en Waterstaat - Directoraat-Generaal Rijkswaterstaat - Dienst Weg- en Waterbouwkunde (DWW)},
  Year                     = {2003},

  Owner                    = {xmn},
  Timestamp                = {2014.10.22}
}

@Article{pattern-recogntion-of-strings,
  Title                    = {Pattern recognition of strings with substitutions, insertions, deletions and generalized transpositions},
  Author                   = {Oommen, B John and Loke, Richard KS},
  Journal                  = {Pattern Recognition},
  Year                     = {1997},
  Number                   = {5},
  Pages                    = {789--800},
  Volume                   = {30},

  Publisher                = {Elsevier}
}

@article{vanweigh,
  title={Weigh-in-Motion--Categorising vehicles},
  author={van Boxel, DW and van Lieshout, RA and van Doorn, RA}
}

@misc{kistler2004installation,
  title={Installation Instructions: Lineas{\textregistered} Sensors for Weigh-in-Motion Type 9195E},
  author={Kistler Instrumente, AG},
  year={2004},
  publisher={Kistler Instrumente AG, Switzerland}
}

@article{helmus2013nmrglue,
  title={Nmrglue: an open source Python package for the analysis of multidimensional NMR data},
  author={Helmus, Jonathan J and Jaroniec, Christopher P},
  journal={Journal of biomolecular NMR},
  volume={55},
  number={4},
  pages={355--367},
  year={2013},
  publisher={Springer}
}

@article{billauer2008peakdet,
  title={peakdet: Peak detection using MATLAB},
  author={Billauer, Eli},
  journal={Eli Billauer’s home page},
  year={2008}
}

-->

<!-- %%javascript
IPython.load_extensions('calico-document-tools'); -->

# 1. El uso de Python como apoyo al pesaje de vehículos de pesados en movimiento (WIM)

Muchos accidentes en carreteras son causados, directamente o indirectamente, por vehículos pesados conducidos con sobrepeso. Estos damnifican más el pavimento y también sufren más efectos dinámicos durante las curvas.

Para inhibir el exceso de peso de los vehículos pesados, es necesario fiscalizar estas infracciones y, cuando necesario, aplicar las medidas establecidas por ley, como multas y aprehensiones. Un método que está siendo investigado en muchas partes del mundo es el pesaje en movimiento. Este método tiene como ventajas la economía en espacio físico y operación, ya que sus sensores son implantados en la propia carretera, y no implica en atrasos directos en el flujo de la vía, pues puede pesar los camiones transitando en alta velocidad.

En este trabajo será presentado las tecnologías utilizadas en el proyecto desarrollado en el laboratorio de transportes (**LabTrans**) de la Universidade Federal de Santa Catarina (**UFSC**). El trabajo aquí presentado está basado en este proyecto, pero desarrollado con carácter educativo.

El lenguaje Python es potenciado por las innumerables librerías de apoyo que le proporciona un mejor desempeño (a veces muy cerca de lenguajes como C y Java) y mayor comodidad para manipular los datos (como en el lenguaje R).

Las librerías principales utilizadas en este proyecto fueron: **numpy, scipy, pandas, sqlalchemy, statsmodels, numba, scikit-learn, pydaqmx, bokeh**.


# 2. Descripción del proyecto


Un sistema computacional de pesaje de vehículos en movimiento está compuesto, básicamente, de:
- Adquisición de señal de los sensores de peso en la vía);
- Segmentación de señal (para recortar la señal respectiva al camión medido);
- Tratamiento de señales;
- Cálculos (velocidad, número de ejes, grupos de ejes, distancia entre ejes, peso total, peso por ejes, peso por grupo de ejes, largo);
- Clasificación del vehículo;
- Calibración;
- Reconocimiento de matrículas vehiculares;
- Detección de infracción;

El sistema debe ser rápido y robusto para procesar todas estas informaciones en el menor tiempo posible. Python no es un lenguaje reconocido por tener un alto desempeño, por eso, es necesario utilizar librerías y métodos para potenciar su capacidad de procesamiento.

Con base en los resultados del pesaje, clasificación y reconocimiento de la matrícula vehicular es posible saber si el vehículo cometió alguna infracción y, en caso positivo, es posible vincular la infracción a la identificación del vehículo infractor.

In [1]:
from bokeh import plotting as plt
from bokeh import charts
from scipy import signal
from scipy.signal import argrelextrema
from collections import defaultdict

import numpy as np
import pandas as pd
import numba as nb
import sqlalchemy
import psycopg2
import os
import sys
import datetime

# local
sys.path.insert(0, os.path.dirname(os.path.dirname(os.getcwd())))

from pywim.lib.daq.generic import (
    gen_synthetic_analog_data, gen_synthetic_digital_data
)

try:
    import PyDAQmx as pydaq
except NotImplementedError:
    print('Usando DAQ genérico')
    import pywim.lib.daq.generic as pydaq

# bokeh
plt.output_notebook()

Usando DAQ genérico


# 3. Adquisición de datos

La adquisición de datos fue hecha através de placas de adquisición DAQmx de la empresa National Instruments (**NI**). Para comunicar con estas fue utilizada la librería PyDAQmx, un wrap hecho en Python para los controladores del hardware fornecidos por la empresa. Esta librería es una interfaz completa para los controladores NIDAQmx ANSI C e importa todas las funciones del controlador e importa todas las constantes predefinidas. Como resultado, la librería retorna un objeto "numpy.array".

Después de adquirir la señal de los sensores, el sistema la almacena en un buffer circular en memoria que, dentro un proceso paralelo, es analisada en busca de una señal completa de un vehículo (segmento). Este proceso fue construído de manera muy simple, donde el programa espera la señal desde un bucle inductivo y, cuando accionado, segmenta la señal con valores respectivos a los 3 segundos siguientes.

In [2]:
task = pydaq.Task()

samples_per_channel = 1000
number_of_channels = 1

task.CfgSampClkTiming()
total_samples = pydaq.int32()
data_size = samples_per_channel * number_of_channels
data = np.zeros((data_size,), dtype=np.float64)

task.StartTask()

data = task.ReadAnalogF64(
    samples_per_channel,
    10.0,
    pydaq.DAQmx_Val_GroupByChannel,
    data,
    data_size,
    pydaq.byref(total_samples),
    None
)

p = plt.figure(title='DAQ', width=600, height=300)
p.line(np.linspace(0, 3, 15000), data, legend='sensor 1')
plt.show(p)

## 3.1 Uso de datos sintéticos

In [3]:
df = pd.DataFrame()

sample_rate = 5000
total_seconds = 3.0

# analog channel 1
df['a1'] = gen_synthetic_analog_data(
    sample_rate=sample_rate, total_seconds=total_seconds, 
    time_delay=0.7, noise_p=10
)

# analog channel 2
df['a2'] = gen_synthetic_analog_data(
    sample_rate=sample_rate, total_seconds=total_seconds, 
    time_delay=1.0, noise_p=10
)

# digital loop
df['d1'] = gen_synthetic_digital_data(
    sample_rate=sample_rate, total_seconds=total_seconds, 
    time_delay=0.8
)

# ploteo
p = charts.Line(
    df, title="Datos de los sensores", 
    xlabel='Segundos (s)', ylabel='Tensión (V)', 
    width=700, height=400, legend=True
)
plt.show(p)

# 4. Almacenamiento y flujo de lo datos

Después de segmentados, los datos brutos son almacenados en la base de datos. Eso posibilita cambiar los métodos de cálculos o parámetros de calibración, posibilitando analisar los métodos utilizados.

En todos los métodos y funciones de cálculos en el sistema, el tipo patrón para los conjuntos de datos es el *pandas.DataFrame*. Este es utilizado desde el momento de la lectura en la base de datos, en conjunto con sqlalchemy, hasta en los cálculos, ploteos y grabación en base de datos o en archivos CSV. El *pandas.DataFrame* fornece mecanismos para manipulación de datos muy parecidos a los utilizados en el lenguaje R.

In [4]:
# Connect to the database
DATABASE = {
    'host': 'localhost',
    'database': 'pywim',
    'port': '5432',
    'user': 'pywim',
    'password': 'pywim'
}

conn = psycopg2.connect(**DATABASE)

engine = sqlalchemy.create_engine(
    'postgresql+psycopg2://',
    creator=lambda: conn
)

In [5]:
# creates acquisition data
cur = conn.cursor()
cur.execute(
    'INSERT INTO wim.acquisition (id, date_time) ' +
    'VALUES (DEFAULT, %s) RETURNING id', (datetime.datetime.now(),)
)

acq_id = cur.fetchone()[0]

conn.commit()
cur.close()

df_data = df.copy()
df_data['acquisition'] = acq_id
df_data['time_seconds'] = df_data.index
df_data.rename(
    columns={
        'a1': 'sensor1', 'a2': 'sensor2', 'd1': 'inductive_loop'
    }, inplace=True
)

df_data.to_sql(
    'acquisition_data', con=engine, 
    schema='wim', if_exists='append', index=False
)

conn.commit()

In [6]:
# select acquisition data from database
df_data = pd.read_sql_query(
    '''
    SELECT * FROM wim.acquisition_data
    WHERE acquisition=%s
    ''' % acq_id, con=engine,
    index_col='time_seconds'
)

df_data.drop('acquisition', axis=1, inplace=True)

# ploteo
p = charts.Line(
    df_data[['sensor1', 'sensor2', 'inductive_loop']], 
    title="Datos de los sensores", 
    xlabel='Segundos (s)', ylabel='Tensión (V)', 
    width=700, height=400, legend=True
)
plt.show(p)

# 5. Procesamiento digital de señal

Para la realización de los cálculos, la señal necesita ser tradada y, para eso, es necesario aplicar un filtrado de señal y corrección de *baseline*. Para la aplicación del filtrado, en el ejemplo, será utilizado la recomendación de <a name="ref-1"/>[(KistlerInstrumente, 2004)](#cite-kistler2004installation), la fabricante de los sensores *Lineas*: filtrado del tipo pasa baja de órden 1, a 600 Hz.

## 5.1 Corrección de baseline

Para hacer la corrección de *baseline* pode ser utilizado el método que sea más apropiado para las características eléctricas de la señal del sensor. En librería *nmrglue* <a name="ref-2"/>[(Helmus and Jaroniec, 2013)](#cite-helmus2013nmrglue) tiene el módulo *proc_bl* que tiene muchas funciones que pueden ayudar a hacer la corrección de *baseline*. En el ejemplo abajo, la corrección será hecha subtrayendo de la señal el valor mínimo encontrado en los primeros 100 puntos de la señal.

In [7]:
df_filt = df.copy()

for s in df_filt.keys():
    df_filt[s] -= df_filt[s][:100].min()
    
# ploteo
p = charts.Line(
    df_filt, title="Datos de los sensores", 
    xlabel='Segundos (s)', ylabel='Tensión (V)', 
    width=700, height=400, legend=True
)
plt.show(p)

## 5.2 Filtrado de señal

El filtrado utilizado será de tipo basa baja, de órden 1, con la frecuencia de corte de 600Hz. Para eso, fue utilizado los métodos filtfilt y butterworth de la librería scipy.

In [8]:
order = 1
freq = 600  # Mz
lower_cut = freq/sample_rate

b, a = signal.butter(order, lower_cut)

df_filt['a1'] = signal.filtfilt(b, a, df_filt['a1'])
df_filt['a2'] = signal.filtfilt(b, a, df_filt['a2'])

# ploteo
p = charts.Line(
    df_filt, title="Datos de los sensores", 
    xlabel='Segundos (s)', ylabel='Tensión (V)', 
    width=700, height=400, legend=True
)
plt.show(p)

## 5.3 Detección de picos

El método de detección de picos a ser utilizados debe llevar en cuenta las características de la señal. En <a name="ref-3"/>[(Billauer, 2008)](#cite-billauer2008peakdet) se puede encontrar un método muy bueno para encontrar las máximas y mínimas locales. Para los datos de ejemplo, será utilizado el módulo *argrelextrema* de *scipy* y un *threshold* de 1 (volt), para evitar los ruídos de la señal.

In [40]:
peaks = {}
_tmp = df_filt['a1'].values.copy()
_tmp[_tmp < 1] = 0.0
peaks['a1'] = argrelextrema(_tmp, np.greater, order=100)[0]


_tmp = df_filt['a2'].values.copy()
_tmp[_tmp < 1] = 0.0
peaks['a2'] = argrelextrema(_tmp, np.greater, order=100)[0]

In [67]:
df_peaks = pd.DataFrame()
df_peaks['peak_a1'] = np.zeros(df_filt.shape[0])
df_peaks['peak_a2'] = np.zeros(df_filt.shape[0])

df_peaks['peak_a1'][peaks['a1']] = 10
df_peaks['peak_a2'][peaks['a2']] = 10

df_peaks.index = df_filt.index

# ploteo
p = charts.Line(
    pd.concat((df_filt, df_peaks)), title="Datos de los sensores", 
    xlabel='Segundos (s)', ylabel='Tensión (V)', 
    width=700, height=400, legend=True
)

plt.show(p)

## 5.4 Recorte de la curva de la señal para el cálculo de peso

Para el recorte de la curva para el cálculo de peso para los sensores *Lineas* de *Kistler*, puede ser utilizado el concepto descripto en <a name="ref-4"/>[(KistlerInstrumente, 2004)](#cite-kistler2004installation). La figura abajo ilustra cómo debe ser hecho el recorte.

<figure>
  <img src="https://github.com/xmnfw/pywim/blob/master/docs/img/kistler-cut-signal-area.png?raw=true" alt="Recorte del área de la señal"/>
  <center><figcaption>Recorte del área de la señal <a name="ref-4"/>[(KistlerInstrumente, 2004)](#cite-kistler2004installation)</figcaption></center>
</figure>

Para hacerlo con los datos de ejemplo, puede ser adoptado un threshold de 0,2 y un $\Delta{t}$ de 20. Para facilitar el entendimiento, el corte será hecho desde 400 puntos antes del pico hasta 400 puntos después del pico.

In [74]:
sensor_areas = defaultdict(list)
ps = []
for s in ['a1', 'a2']:
    for i, peak in enumerate(peaks[s]):
        sensor_areas[s].append((
            df_filt[s].iloc[peak-400:peak+400],
            df_filt[s].index[peak-400:peak+400]
        ))

        ps.append(
            charts.Line(
                *sensor_areas[s][i], title='Curva %s (%s)' % (i+1, s), 
                width=200, height=200
            )
        )

grid = plt.GridPlot(children=[ps])

plt.show(grid)

# 6. Cálculos

Los cálculos

## 6.1 Velocidad

## 6.2 Distáncia entre ejes

## 6.3 Pesos

# 7. Clasificación de vehículos

Em método utilizado para la clasificación vehicular fue basado en los trabajos de <a name="ref-5"/>[(vanBoxel and vanLieshout, 2003)](#cite-tech:optimization-vehicle-classification) y <a name="ref-6"/>[(Oommen and Loke, 1997)](#cite-pattern-recogntion-of-strings)

En este método, es utilizado un conjunto de *layouts* de referencias, definido por un conjunto de símbolos, que representa el diseño del vehículo, como puede ser visto en la figura abajo.

<figure>
  <img src="https://github.com/xmnfw/pywim/blob/master/docs/img/dww-layout.png?raw=true" alt="Ejemplos de layout de vehículos"/>
  <center><figcaption>Ejemplo de *layouts* de la representación de clases de vehículos pesados <a name="ref-7"/>[(vanBoxel and vanLieshout, 2003)](#cite-tech:optimization-vehicle-classification)</figcaption></center>
</figure>

Para clasificar el vehículo, el sistema crea un *layout* para el vehículo medido, lo compara con *layouts* de referencias y clasifica el vehículo que con el *layout* de referencia que resulta más próximo.

Este método presentava muy bajo desempeño con el lenguaje Python. Para solucionar esto, fue utilizada la librería numba, llegando a ser cerca de 100 veces más rápido. Fue necesária una adaptación en el algoritmo donde, ante de hacer las comparaciones, el *layout* del veículo y el *layout* de la clase de referencia son convertidos en números, así la función de comparación puede ser marcada para ser compilada en modo **nopython**. Cuanto más cerca de 0 más cerca el layout del vehículo está del *layout* de referencia.

In [24]:
from pywim.lib.vehicular_classification import dww
from pywim.lib.vehicular_classification import dww_nb

layout = dww.layout_to_int(dww.layout((7, 2, 0.5, 2)))
layout_ref = dww.layout_to_int('-O----O-O----O-')

z = np.zeros((len(layout), len(layout_ref)), dtype=int)

%time dww.D(layout, layout_ref, z)
%time resultado = dww_nb.D(layout, layout_ref, z)

print(resultado)

CPU times: user 1.92 ms, sys: 0 ns, total: 1.92 ms
Wall time: 1.65 ms
CPU times: user 0 ns, sys: 0 ns, total: 0 ns
Wall time: 33.1 µs
0


# 8. Calibración de los cálculos de pesaje

La calibración períodicas en sistemas de pesaje es muy importante para mantener un bajo margen de errores de los pesos calculados. Para apoyar esta etapa fue utilizado el método de regresión lineal por mínimos cuadrados (OLS) de la librería "statsmodels" que, por ejemplo, posibilita saber informaciones como el coeficiente de determinación (R²) resultante de la regresión lineal. La librería scikit-learn también fue utilizada en esta etapa con finalidad de apoyo en la análisis de los resultados. Através de los datos de peso calculados para cada sensor (en el tramo reservado para los sensores piezoeléctrico cuarzo fueron instaladas 16 líneas de sensores), fueron eligidos algunos modelos matemáticos en scikit-learn para predecir el valor del peso bruto total (el sistema calcula através de media ponderada). Através de esta librería, es posible medir y evaluar los resultados de los modelos y, posteriormente, compararlos entre sí.

# 9. Reconocimiento automático de matrículas vehículares

El reconocimiento de matrículas vehiculares fue realizado através de una cámara ALPR, de la empresa ARH. Con finalidad de medir la eficiencia de los resultados, fueron probadas algunas librerías libres para el tema. Uno de los materiales más interesantes encontrados a respecto fue el trabajo del investigador K.M. Sajjad (Automatic License Plate Recognition using Python and OpenCV) que fornece informaciones y ejemplos de cómo hacer el reconocimiento de matrículas vehículares utilizando el lenguaje Python.

<IPython.core.display.Javascript object>

# 10. Conclusión

#References

<a name="cite-kistler2004installation"/><sup>[^](#ref-1) [^](#ref-4) </sup>Kistler Instrumente, AG. 2004. _Installation Instructions: Lineas\textregistered Sensors for Weigh-in-Motion Type 9195E_.

<a name="cite-helmus2013nmrglue"/><sup>[^](#ref-2) </sup>Helmus, Jonathan J and Jaroniec, Christopher P. 2013. _Nmrglue: an open source Python package for the analysis of multidimensional NMR data_.

<a name="cite-billauer2008peakdet"/><sup>[^](#ref-3) </sup>Billauer, Eli. 2008. _peakdet: Peak detection using MATLAB_.

<a name="cite-tech:optimization-vehicle-classification"/><sup>[^](#ref-5) [^](#ref-7) </sup>van Boxel, DW and van Lieshout, RA. 2003. _Optimization Vehicle Classification_.

<a name="cite-pattern-recogntion-of-strings"/><sup>[^](#ref-6) </sup>Oommen, B John and Loke, Richard KS. 1997. _Pattern recognition of strings with substitutions, insertions, deletions and generalized transpositions_.

