# Identificación de sistemas dinámicos

## Objetivo del problema de identificación.

El objetivo de la Identificación de Sistemas (IS) consiste en construir modelos matemáticos de sistemas dinámicos a partir de datos experimentales. En la actualidad, la IS es importante en áreas como control automático, procesamiento de señales, física, economía, medicina, ecología, sismología, biología, entre otros.

Gauss y Legendre fueron los primeros en introducir el método de mínimos cuadrados (LS) para predecir el movimiento de los planetas y cometas a partir de miediciones de telescopios. En consecuencia, diversos trabajos se realizaron sobre problemas de estimación de parámetros.

Existen diferentes clases de modelos. Por ejemplo, modelos lineales deterministicos en tiempo discreto en representación de espacio de estados así como de la forma entrada-salida. También hay representaciones de sistemas a partir de modelos lineales estocásticos de tiempo discreto. Estos modelos pueden ser vistos como sigue:

* Filtros dinámicos lineales que permitan la generación, análisis y clasificación de señales aleatorias. Por ejemplo, autorregresivas (AR), modelos promedio (MA) y modelos ARMA.
* Modelos lineales con ruido aditivo aleatorio que son capaces de representar ruido, perturbaciones externas y errores de modelado. Por ejemplo, ARX, ARMAX y modelos ARARX.

En la práctica, es común encontrar dos clases de modelos para representar sistemas del mundo real; los modelos no lineales (NL) y los modelos lineales de parámetros variables (LPV). 

Los modelos LPV son ideales para modelar sistemas lineales de tiempo variable (LTV) así como representar sistemas no lineales linealizados sobre una trayectoria $p(t)$. Este tipo de modelos pueden ser vistos como descripciones intermedias entre modelos lineales invariantes en el tiempo (LTI) y modelos no lineales variantes en el tiempo.

Por otro lado, los modelos NL son muy utilizados para describir fenómenos o procesos complejos por ejemplo: procesos bioquímicos en columnas de destilación, plantad hidráulicas, sistemas fisiológicos, vibraciones en estructuras, por mencionar algunos.

Los modelos NL orientados a bloques están compuestos por subsistemas dinámicos LTI y subsistemas estáticos NL donde la parte lineal son generalmente representaciones en funciones de transferencia, espacio de estados o I/O mientras que la parte NL pueden ser con memoria o sin memoria.

El proceso para realizar la identificación de sistemas, según {cite:t}`ljung1998system` consisten en seis pasos:

1. **Diseño del experimento.** Elección de la señal de excitación, periodo de muestreo, sensores para las señales de entrada y salida.
2. **Mediciones de entrada y salida.** 
3. **Elección de la estructura del modelo.**
4. **Determinación de la estructura de los parámetros.** Criterio de información de {cite:t}`akaike1974new` (AIC) y el criterio de longitud de descripción mínima de {cite:t}`rissanen1978modeling`.
5. **Estimación paramétrica del modelo.**
6. **Validación del modelo.** Medir el desempeño del modelo obtenido para representar los datos experimentales.

La elección de los algoritmos para la estimación de parámetros depende de dos factores:

1. La función costo a ser minimizada.
2. El algoritmo de optimización para encontrar la solución óptima.

De los métodos más utilizados para la estimación paramétrica podemos encontrar:

* Método de mínimos cuadrados ponderado (WLS).
    * Estimador Gauss-Markov.
    * Mejor estimador lineal sin sesgo (BLUE).
* Método de mínimos cuadrados generalizado (GLS).
* Método de mínimos cuadrados extendido (ELS).
* Método de mínimos cuadrados total (TLS).
* Método de máxima verosimilitud (ML).
* Método de máximo a posteriori (MAP).
* Método de estimación de la mínima de la media del error al cuadrado (MMSE).
* Método de estimación M de Huber.
* Método de variable instrumental (IV).
* Método de subespacio como el algoritmo MUSIC (MUltiple SIgnal Classification).

## Variables aleatorias

Asuma que el valor verdadero de una cantidad de datos es 20, donde el conjunto de datos está dado como sigue:

|     1    |     2    |     3    |     4    |     5    |     6    |     7    |
|:--------:|:--------:|:--------:|:--------:|:--------:|:--------:|:--------:|
| 20.13443 | 19.83828 | 20.01702 | 19.99835 | 19.94526 | 20.01415 | 19.96707 |

En términos estadísticos, se puede decir que los datos anteriormente mostrados son generados por una *variable aleatoria* $X$ donde

````{prf:definition} Variable aleatoria
 :label: variable-aleatoria
 Una variable aleatoria es una variable que tiene un valor numérico único, determinado por casualidad, para cada resultado de un procedimiento. 
````

Suponga un sistema simple como un dado en el cual necesitamos conocer la probabilidad de obtener un "3" al lanzar el dado. La probabilidad de obtener este valor es 1/6 o bien, 16.7%. En estadística, podemos escribir esto como

$$
 P(X_{1} = 3) = \frac{1}{6},
$$

donde $P$ es una función de probabilidad que representa la probabilidad del "evento" $X_{1} = 3$ como un número entre $0$ y $1$. Para tal efecto, definimos

:::{prf:definition} Eventos y espacio muestral
 :label: eventos-espacio
 * Un *evento* es cualquier colección de resultados o resultados de un procedimiento.
 * Un *evento simple" es un resultado o un evento que no se puede dividir en componentes más simples.
 * El *espacio muestral* para un procedimiento se conforma de todos los eventos simples posibles.
:::


• 

## Representación de sistemas dinámicos en forma lineal con respecto a los parámetros.
## Métodos de estimación de parámetros.
## Diseño de experimentos para la identificación paramétrica.

L