# Regresión simbólica para sistemas compartimentales

### Enrique Martínez González

## 1 Descripción del problema:

El objetivo de este trabajo es dado un conjunto de puntos de la forma (ti, yi), y un grafo que describa una dinámica poblacional (SIR, SEIR, etc), determinar automáticamente el sistema de ecuaciones diferenciales ordinarias que mejor describe el conjunto de datos, que se ajuste a la dinámica poblacional dada, y que además, sea lineal en los parámetros.

A continuación se describirá brevemente qué significa que la ecuación diferencial sea lineal en los parámetros, que se ajuste a una dinámica poblacional dada, y que mejor describa los datos

### 1.1 Función lineal con respecto a los parámetros

Que el sistema sea lineal en los parámetros significa que cada componente de la parte derecha de la ecuación diferencial es una función de la forma:

    f_j(t,y) = a1 * g1(t,y) + a2 * g2(t,y) + …  + an * gn(t,y)

donde los ai son parámetros y todas las funciones gi(t,y) son funciones que dependen de la variable t, de la variable y, pero no dependen de ningún parámetro.  Un ejemplo de sistema que cumple esta características es el sistema SIR:

    S’ = - a*I*S
    I’ = a*I*S - b*I
    R’ = b*I

En este caso, se tiene que la función

    f_S (t,S,I,R) = a1 * g_s1 (t,S,I,R)

donde:

    g_s1(t,S,I,R) = -I*S.

La parte de derecha de la segunda ecuación (I’ = a\*I\*S - b*I) sería:

    f_I (t,S,I,R) = b1 * g_I1 (t,S,I,R) + b2 * g_I2 (t,S,I,R)

donde:
    
    g_I1(t,S,I,R) = I*S, y g_I2(t,S,I,R) = -I.

La parte de derecha de la tercera ecuación (R’ = b*I) sería:

    f_R (t,S,I,R) = b1 * g_R1 (t,S,I,R)

donde:
    
    g_R1(t,S,I,R) = I.

En este caso, se cumple además, que algunos de los parámetros presentes en varias de las ecuaciones son los mismos, pero eso no es un requisito para que sea lineal con respecto a las parámetros.

### 1.2 Sistema de ecuaciones diferenciales acorde a una dinámica poblacional

Para explicar qué significa que un sistema de ecuaciones diferenciales se ajuste al grafo de una dinámica poblacional dada, es necesario comenzar por definir qué es un grafo de dinámica poblacional.

Un ejemplo de grafo de dinámica poblacional pudiera ser:

    S –> I –> R

donde las letras serían los nodos y las flechas serían las aristas.

En un grafo de dinámica poblacional, los nodos representan los posibles compartimentos en que se puede particionar la población. En el caso del ejemplo, se está usando la notación “estándar” para Susceptibles (S), Infectados (I) y Recuperados (R).

En un grafo de dinámica poblacional, las aristas representan cómo los individuos pueden pasar de un compartimento a otro.  En el caso del ejemplo los individuos que están en el compartimiento S solo pueden pasar al compartimento I, los de I solo pueden pasar a R y que los que llegan a R no pasan a ningún otro compartimento.

Un ejemplo de sistema que sigue esta dinámica pudiera ser:

    S’ = - a*I*S 
    I’ = a*I*S - b*I 
    R’ = b*I

que es el modelo SIR clásico.

Pero ese no tiene por qué ser el único sistema que se ajusta a esa dinámica poblacional.  Otro ejemplo puede ser:

    S’ = - a*I*S - b*S*R 
    I’ = a*I*S + b*S*R - c*S
    R’ = c*S.

En este caso, los susceptibles pasan a Infectados “de dos formas distintas”, de manera proporcional a I\*S y también proporcional a S\*R.

Que un sistema de ecuaciones diferenciales se ajuste a un grafo de dinámica poblacional significa que:

Para cada arista del grafo que tenga la forma (A, B), donde A y B son compartimentos, en la parte derecha de la ecuación correspondiente a A existe un término g_A(t,Y) que tiene signo negativo y en la parte derecha de la ecuación correspondiente a B aparece `exáctamente el mismo término` g_A(t,y) pero con signo positivo.  Eso significa que “las personas que pasan de A a B” lo hacen de acuerdo a ese término.

A continuación se muestra un ejemplo de un sistema de ecuaciones diferenciales que no se ajusta al modelo compartimental S –> I –> R:

    S’ = - a*I*S - b*S*R
    I’ = a*I*S - c*S
    R’ = b*S*R + c*S.

Este sistema no se ajusta al modelo S –> I –> R porque el término b\*S\*R que aparece en la parte derecha de la ecuación correspondiente a S, aparece con signo positivo en la parte derecha de la ecuación correspondiente a R.  Eso significa que hay personas que pasan del compartimento S al compartimento R, y eso no está permitido de acuerdo con la dinámica poblacional.

Otro ejemplo de ecuación que no corresponde a esa dinámica pudiera ser:

    S’ = - a*I*S - b*S*R
    I’ = a*I*S - c*S
    R’ = c*S.

En este caso, el problema es que el término -b*S*R que aparece en la ecuación de S no aparece en ninguna otra ecuación, y eso significa que esas personas estaban en el compartimento de susceptibles y luego desaparecieron.  Esto no suele pasar en los modelos compartimentales.  Incluso en el caso en el que en la vida real las personas sí puedan “desaparecer”, lo que se hace es crear compartimentos para esos desaparecidos, que incluso se pueden crear compartimentos para los distintos motivos de las desapariciones. Por ejemplo, puede ser muerte o emigración. El significado del compartimiento no importa demasiado, lo que importa es que se especifica qué se hace con los individuos que salen de un compartimento.

Entonces, llegado, este punto, está claro qué significa que el sistema sea lineal en los parámetros y qué significa que esté acorde a un grafo de dinámica poblacional dado. Solo quedaría precisar a qué se referiere con que mejor describa los datos.

### 1.3 Sistema de ecuaciones diferenciales que mejor describa los datos

Dado un conjunto de puntos de la forma (ti, yi) y un sistema de ecuaciones diferenciales y’ = f(t,y), se puede tener un indicador de cuán bien describe ese sistema describe esos datos.

Si decimos que y(ti) es la solución de la ecuación diferencial evaluada en el punto ti, entonces un indicador de cuán bien ese sistema describe los datos pudiera ser el valor L:

    L = (y(t1) - y1)^2 + (y(t2) - y2)^2 + …  + (y(tn) - yn)^2

Esto es una suma de cuadrados, que se puede escribir con una sumatoria, aunque se expresa la versión explícita.

Cuando se usa un valor como L en el que se considera la suma de cuadrados de las diferencias, se dice que estamos en presencia de un problema de mínimos cuadrados, porque lo que se quiere es minimizar esa suma de cuadrados.

Entonces, buscar el sistema de ecuaciones diferenciales que mejor describe los datos, se reduce a buscar el sistema de ecuaciones diferenciales que haga que el valor de L (la suma de cuadrados) sea lo más pequeño posible.

Pero, aquí no interesa cualquier sistema de ecuaciones diferenciales: interesa los que sean lineales con respecto a los parámetros y que además estén acorde a una dinámica poblacional predefinida.

En las próximas secciones se describirán los siguientes pasos:

- Cómo se pueden representar todos los posibles sistemas de ecuaciones diferenciales lineales en los parámetros
- Cómo se puede “buscar” el mejor de ellos para describir los datos
- Cómo garantizar que el sistema esté acorde a una dinámica poblacional predeterminada


## 2 Propuesta de solución

En la sección anterior definimos los términos necesarios para entender el problema que consiste en:

Dado un conjunto de puntos de la forma (ti,yi) y un grafo que representa una dinámica poblacional G, encontrar un sistema de ecuaciones diferenciales que esté acorde a la dinámica poblacional G y que mejor describa los datos (en el sentido de los mínimos cuadrados).

En esta sección se tratarán varios elementos: regresión simbólica y de algoritmos genéticos.  Para usar un algoritmo genético es necesario definir cuáles son las posibles soluciones y para esas soluciones definir en qué consiste el cruzamiento, la mutación y cómo se puede saber cuán buena es una solución dada.

### 2.1 Regresión simbólica

La regresión simbólica es un tipo de regresión que busca dentro de un espacio de expresiones matemáticas el modelo que mejor se ajuste a un conjunto de datos dados. En esta ningún modelo en particular es utilizado en el comienzo, en su lugar se generan expresiones que se forman de manera aleatoria combinando operaciones matemáticas, funciones analíticas, constantes y variables. Usualmente un conjunto de estas son especificadas por una persona pero este no es un requerimiento para el uso de esta técnica. Normalmente la regresión simbólica para funciones matemáticas es atacado con una variedad de métodos, uno de ellos es la recombinación de ecuaciones usando algorítmos evolutivos (por ejemplo, un algoritmo genético).

Al no requerir una especificación a priori de un modelo, la regresión simbólica no se ve afectada por el sesgo humano o las brechas desconocidas en el conocimiento del dominio. Intenta descubrir las relaciones intrínsecas del conjunto de datos, al permitir que los patrones en los propios datos revelen los modelos apropiados, en lugar de imponer una estructura de modelo que se considere matemáticamente manejable desde una perspectiva humana. La función de ajuste que impulsa la evolución de los modelos tiene en cuenta no solo las métricas de error (para garantizar que los modelos predigan los datos con precisión), sino también medidas especiales de complejidad, lo que garantiza que los modelos resultantes revelen la estructura subyacente de los datos en un manera que sea comprensible desde una perspectiva humana. Esto facilita el razonamiento y favorece las probabilidades de obtener información sobre el sistema de generación de datos.

Se ha demostrado que la regresión simbólica es un problema NP-difícil, en el sentido de que no siempre se puede encontrar la mejor expresión matemática posible para ajustarse a un conjunto de datos dado en tiempo polinomial.

### 2.2 Algoritmos genéticos

En ciencias de la computación un algorítmo genético es una metaheurística inspirada en el proceso natural de selección. Estos usualmente son utilizados para generar soluciones de alta calidad en problemas de optimización y búsqueda haciendo uso de los conocimientos de la biología, utilizando las acciones de mutación, cruzamiento y selección para modificar una población de individuos con el objetivo de obtener la solución deseada.

Para usar un algoritmo genético es necesario definir varios elementos:

- Cuáles son las posibles soluciones
- Cómo aplicar un operador de cruzamiento
- Cómo aplicar un operador de mutación
- Cómo determinar cuán buena es una solución
- Cómo determinar qué soluciones pasan a las próximas generaciones

Nuestro problema consiste en determinar el sistema de ecuaciones diferenciales que mejor se ajuste a un conjunto de datos y que además esté acorde a un grafo de dinámica poblacional y que sean lineales en los parámetros.

Con esto en mente, nuestras soluciones serían los posibles sistemas de ecuaciones lineales que cumplan con esas características.

Aunque por ahora, solo vamos a explicar cómo podemos resolver este problema si solo consideramos que estamos buscando sistemas de ecuaciones diferenciales que sean lineales en los parámetros y no vamos a exigir que sigan una dinámica poblacional dada.

Esto lo vamos a hacer así por dos motivos.  El primero es que ese problema ya está resuelto, y aquí solo tendríamos que describir lo que ya está hecho.  El segundo es que una vez que se comprenda lo que ya está hecho, es muy fácil adaptarlo para que solamente se consideren sistemas de ecuaciones diferenciales que sigan una dinámica poblacional dada.

Por eso, en las próximas secciones vamos a describir: cómo representar las soluciones, cómo hacer cruzamientos y mutaciones, y cómo determinar cuán buena es una solución.

#### 2.2.1 Cómo representar una solución

Como queremos resolver el problema de regresión simbólica en EDOs lineales en los parámetros, eso significa que estamos buscando una ecuación diferencial (lineal en los parámetros) que mejor ajuste los datos. Para ello, lo primero es decidir cómo representar los posibles sistemas.

Antes de empezar a dar ideas fijemos algunas ideas.

Una vez que tengamos los datos (ti, yi), tenemos algunas informaciones relevantes. Por ejemplo, si cada elemento de los datos es de la forma

    (ti, y1i, y2i, y3i)

Entonces tenemos la certeza de que el sistema tiene tres ecuaciones, y que estamos buscando una expresión de la forma:

    y1’ = f1(t, y1, y2, y3)
    y2’ = f2(t, y1, y2, y3)
    y3’ = f3(t, y1, y2, y3)

Ahora solo nos faltaría determinar cómo representar f1, f2 y f3.

Pero, a partir de los datos podemos decir que nuestras soluciones candidatas serían una lista de tres elementos, donde en la posición i está codificada la función fi(t,y1,y2,y3).

Por ejemplo, en el sistema SIR:

    S’ = - a*I*S
    I’ = a*I*S - b*I 
    R’ = b*I

La lista estaría formada por

    [-a*I*S, a*I*S - b*I, b*I]

La pregunta es entonces cómo codificar cada uno de los elementos de la función.

Se sabe que una expresión aritmética (como cada una de las funciones) se puede representar mediante un árbol, donde los nodos interiores son operadores y las hojas son variables.  Esa pudiera ser una forma de representar cada uno de los elementos: en cada posición de la lista tendríamos un árbol que representa a la parte derecha de la ecuación diferencial.

Sin embargo, no es la mejor opción posible, porque aquí nos interesan sistemas de ecuaciones diferenciales que sean lineales con respecto a los parámetros.

Eso quiere decir que cada una de las funciones fi son de la forma:

    fi (t, y1, y2, y3) = a1 * g1(t, y1, y2, y3) + a2 * g1(t, y1, y2, y3) + … + ak * gk(t, y1, y2, y3)

donde cada una de las funciones gi(t,y1,y2,y3) son funciones que no dependen de los parámetros.

Como se había planteado, en el caso del sistema SIR se tiene que:

    f_S (t,S,I,R) = a1 * g_s1 (t,S,I,R)

donde 

    g_s1(t,S,I,R) = -I*S

    f_I (t,S,I,R) = b1 * g_I1 (t,S,I,R) + b2 * g_I2 (t,S,I,R)

donde:

    g_I1(t,S,I,R) = I*S

y 
    g_I2(t,S,I,R) = -I.

    f_R (t,S,I,R) = b1 * g_R1 (t,S,I,R)
   
donde: 

    g_R1(t,S,I,R) = I.

Como cada una de las las partes derechas de la ecuación diferencial son una suma de funciones, cada una de ellas se puede representar como una lista, donde en la posición i de la lista estaría la función que acompaña al parámetro ai en la suma de parámetros y funciones.

Para seguir con el ejemplo del SIR, la lista asociada a la función f_S sería:

    [-I*S]

porque es una lista formada por un único elemento.

La lista correspondiente a la función f_I sería:

    [I*S, -I]

y la lista correspondiente a la función f_R sería:

    [I]

Por lo tanto, el sistema SIR se puede reprenstar como una lista de listas que tendría la forma:

    [ [-I*S], [I*S, -I], [I] ]

Lo único que faltaría por precisar es que cada uno de los elementos de las listas sí sería un árbol, y con eso ya tenemos perfectamente codificada una solución.

A partir de esa lista de listas se puede reconstruir las funciones f_S, f_I y f_R, y con esas funciones y los datos se pueden calcular los valores de los coeficientes, como se describe en la siguiente sección.

#### 2.2.2 Cómo determinar el costo de una solución

Se define el costo de una solución como la sumatoria de la diferencia al cuadrado de los datos evaluados en el sistema analizado con los datos objtivos. Está claro que esta sumatoria mientras más pequeña sea es mejor, dado que si es 0 es que hemos encontrado un sistema que ajusta perfectamente a los datos presentes. Resaltar que a esta sumatoria se le agrega un factor de peso que este aumenta con respecto al tamaño del sistema obtenido garantizando que el sistema tienda a ser lo más pequeño posible.

El sistema presenta parámetros que son constantes que no conocemos su valor, y se necesitan para poder evaluar un dato en la solución. Para esto se puede crear por cada ecuación del sistema, un sistema de ecuaciones de la forma Ax=B en el que el vector de incógnitas x sean los parámetros, A sean las expresiones que acompañan a cada parámetro evaluadas en el datos analizados, y B sea el dato objetivo.

Por ejemplo, la segunda ecuación del sistema SIR es:

    f_I (t,S,I,R) = b1 * g_I1 (t,S,I,R) + b2 * g_I2 (t,S,I,R)

donde:

    g_I1(t,S,I,R) = I*S

y 
    g_I2(t,S,I,R) = -I.

y supongamos que tenemos de entrada los datos

    f_I(0, 1, 2, 3) = 4
    f_I(5, 6, 7, 8) = 9

entonces se puede encontrar los valores de b1 y b2 que mejor ajusten esa ecuación con los datos planteados formando el sistema de ecuaciones

    b1 * g_I1(0, 1, 2, 3) + b2 * g_I2(0, 1, 2, 3) = 4
    b1 * g_I1(5, 6, 7, 8) + b2 * g_I2(5, 6, 7, 8) = 9

De esta forma se encuentran los mejores parámetros para cada ecuación del sistema y se obtiene finalmente un sistema que ya puede ser evaluado.

#### 2.2.3 Cómo hacer un cruzamiento

Un cruzamiento es una operación que toma características de dos individuos de la población y retorna un nuevo individuo que posee caráterísticas de ambos padres. Para esto se decide primeramente que sitio se desea cruzar, cuando se plantea sitio se refiere a qué parte del sistema se desea cruzar, por ejemplo se podría cruzar a nivel de la lista de las ecuaciones, o a nivel de las expresiones que se encuentran en uno de los términos de una de las ecuaciones del sistema. Es importante que se tenga en cuenta esta organización de los individuos por niveles. En donde la raiz es una lista de ecuaciones, el segundo nivel sería la sumatoria de términos y el tercer nivel sería las expresiones pertenecientes a cada término.

En dependencia del sitio que se desee cruzar, se toma un nodo correspondiente a cada padre y se intercambian de posición. En el caso de la implementación presente se retorna el resultado de la sustitución del nodo seleccionado en el padre 2, dentro del padre 1. Resaltar que la elección del sitio a cruzar se realiza de manera aleatoria. Si se decide cruzar en algún nivel distinto de la raiz, se toman nodos de la misma ecuación del sistema de ambos padres.

#### 2.2.4 Cómo hacer una mutación

Una mutación es una operación que toma un individuo y genera uno nuevo a partir de este pero con características cambiadas, aunque sigue teniendo similaridad con el individuo inicial. Para esto se realiza un recorrido aleatorio de los distintos niveles antes mencionados escogiendo uno de estos para realizar una modificación en el, esta modificación es distinta en dependencia de su altura en la representación del individuo en forma de árbol.

Se tienen varios parámetros para la elección de la probabilidad de la operación de modificación que se desea realizar. En el caso de la implementación presente a pesar de que existen funciones para mutar cada nivel del árbol, siempre se debería llamar a la función encargada de mutar el sistema, ya que esta es la que retornará el nuevo individuo ya modificado.

#### 2.2.5 Cómo determinar las soluciones que pasan a la siguiente generación

Dada una población en una generación, se toma un conjunto de individuos de esta y se muta, y se toma otro subconjunto de individuos y se cruzan entre ellos. Todos estos individuos son seleccionados de forma aleatoria. Este nuevo subconjunto formado por la población inicial de la generación, los individuos resultantes de la mutación y los individuos resultantes de los cruzamientos tienen que ser filtrados para tomar una cantidad inicial a la población inicial presente en la generación con el objetivo de poder repetir este proceso múltiples veces para poder realizar numerosas generaciones. Para poder filtrar este subconjunto se toman los individuos que mejor puntuaciones obtuvieron con respecto a los datos iniciales, o sea, se toman los sistemas que mejor ajustan a los datos.

#### 2.2.6 Resumen e inconvenientes

Con esta forma de representar las posibles soluciones (lista de listas), y usando cruzamientos y mutaciones, es posible obtener, a partir de las soluciones que ya existen, nuevas soluciones, calcular los valores de los parámetros y determinar cuán buenas son cada una de ellas.

El inconveniente que tiene es que incluso si tenemos una solución que represente un sistema de ecuaciones diferenciales que esté acorde a una dinámica poblacional dada, cuando se apliquen los cruzamientos o las mutaciones no hay garantía de que lo que se obtenga también esté acorde a esa dinámica poblacional.

En la siguiente sección se propone cómo codificar un sistema de forma que siempre se pueda garantizar que corresponda a una dinámica poblacional dada.

## 3 Propuesta de solución con dinámica poblacional

Ahora la situación que tenemos es la siguiente: tenemos un conjunto de datos de la forma (ti, yi), donde yi es un vector, y además, tenemos un grafo que representa una dinámica poblacional.

Para ilustrar la propuesta vamos a asumir que tenemos la siguiente dinámica:

    C1 –> C2 –> C3

En este caso estamos usando el nombre genérico de Ci, para hacer referencia al compartimento i. Cada compartimento corresponde con uno de los datos en el vector yi.  En este caso, cada vector yi tendría 3 elementos.

En C1 estaría la función que corresponde a la primera componente de yi, en C2 el correspondiente a la segunda y en general, en Ci estaría la función correspondiente al i-ésimo elemento en yi.

Regresemos al caso del ejemplo:

    C1 –> C2 –> C3

Esto significa que los individuos que están en el compartimento 1 pasan al 2, y que los que están en el 2 pasan al 3.

Eso significa que en la ecuación diferencial correspondiente a C1 tiene que haber un término con signo negativo que aparezca con signo positivo en la parte derecha de C2. Y algo similar ocurre con C2 y C3.

La idea es que a partir del grafo de la dinámica poblacional es posible codificar un sistema de ecuaciones diferenciales (lineales en los parámetros) que siga esa dinámica, y que además, también será una lista de listas. En la próxima sección se describe cómo hacer esto.


### 3.1 Cómo representar una solución

La idea para esta nueva representación se deduce del hecho que el sistema de EDOs que sigue una dinámica poblacional se puede representar directamente en el grafo de la dinámica.  Por ejemplo, tomemos el caso del SIR, que tiene esta dinámica poblacional:

    S –> I –> R

y que tiene como sistema:

    S’ = - a*I*S
    I’ = a*I*S - b*I
    R’ = b*I.

De la dinámica poblacional se sabe que hay individuos que pasan de S a I, y de I a R. Por lo tanto, en las ecuaciones correspondientes a S y a I hay un término que se repite y que solo cambia su signo. En este caso es a\*I\*S. Algo similar ocurre con los que pasan de I a R, que lo hacen de acuerdo con la expresión b*I, que es la que aparece en las dos ecuaciones son signo contrario.

Como estamos asumiendo que el modelo es lineal en los parámetros, en realidad la expresión que determina cómo se pasa de S a I es solo S*I, y la que pasa de I a R sería I. La a y la b en estos casos son solo los parámetros que acompañan a esas expresiones.

Entonces, la idea para codificar ecuaciones diferenciales que siempre se correspondan con una dinámica poblacional dada consiste en, en vez de tener codificada la ecuación diferencial mediante una lista de listas, como hicimos antes, lo que vamos a hacer es especificar (sobre el grafo de la dinámica poblacional) las expresiones con las que se pasa de un compartimento al otro.

En el caso del SIR sería decir que el término con el que se pasa de S a I es S*I; y que el término con el que se pasa de I a R es I.

O sea, escrito de manera más formal sería:

    (S,I): I*S
    (I,R): I

Donde (A,B) es el arco que conecta a los compartimentos A y B.

Ahora solo necesitamos tener tantas listas como arcos haya en el grafo de la dinámica compartimental. En el caso del SIR serían solamente dos listas, una para (S,I) y otra para (I,R).

Y ahora, en cada posición de esas listas, tendríamos los elementos que describen cómo se pasa de un compartimento a otro.

O sea, en el caso del SIR, la solución sería:

    [I*S, I]

donde el primer elemento corresponde al arco (S,I) y el segundo a (I,R).

Y a partir de esa solución es posible construir el sistema de ecuaciones diferenciales de la siguiente forma.

Sea gAB(t,y) expresión correspondiente al arco (A,B). Como el arco (A,B) representa a los que salen de A y llegan a B, en la parte derecha de la ecuación de A hay que agregar gAB(t,y) con signo negativo, y en la parte derecha de la ecuación correspondiente a B hay que agregarlo con signo positivo. Quedando:

    A’ = - a* gAB(t,y)

    B’ = a* gAB(t,y)

Cada vez que un nodo N aparezca en un arco (como inicio o como final) se le agrega a la parte derecha de la ecuación diferencial correspondiente a ese nodo, el término correspondiente.

Por ejemplo, si en en el grafo de la dinámica poblacional hay un nodo (A,C) y que tiene como expresión correspondiente gAC(t,y), entonces, a la parte derecha de A se le agrega el término gAC(t,y) con signo negativo, y entonces la ecuación para A quedaría:

    A’ = - a * gAB(t,y) - b * gAC(t,y)

y además, a la de C se le agregaría gAC con signo positivo.

    C’ = b * gAC(t,y)

Además, cada vez que se agrega la expresión a las dos ecuaciones de los nodos que intervienen en la arista, se les agrega con el mismo parámetro.

Representar las posibles soluciones de esta forma tiene varias ventajas:

- Siempre se tiene la garantía de que es un sistema compartimental.
- Al representarlo mediante una lista de listas de árboles se pueden aplicar los operadores de cruzamiento y mutación que ya se encuentran implementados
- A partir de esta representación, se puede obtener la lista de listas que representa al sistema de ecuaciones diferenciales y con este se pueden determinar los valores de los parámetros, usando lo que ya existe.

O sea, que a partir de un grafo compartimental como

    S –> I –> R

y una lista de lista de expresiones como:

    [[I*S], [I]]

Se puede obtener la lista de listas:

    [ [-I*S], [I*S, -I], [I] ]

que representa al sistema SIR clásico, y a partir de esta lista se puede determinar el valor de los parámetros, y por lo tanto, el costo de la función, y por lo tanto, se pudiera usar el algoritmo genético que ya existe.
