Printer Friendly

ALGUNOS ASPECTOS MATEMATICOS DE LOS SISTEMAS DE CONTROL LINEALES A TRAVES DE UN PROBLEMA DE OPTIMIZACION.

SOME MATHEMATICAL ASPECTS OF LINEAL CONTROL SYSTEMS THROUGH AN OPTIMIZATION PROBLEM

ALGUNS ASPECTOS MATEMATICOS DOS SISTEMAS DE CONTROLE LINEARES ATRAVES DE UM PROBLEMA DE OPTIMIZACAO

Sea X una ecuacion diferencial sobre un conjunto de estados M de dimension n y que modela un sistema fisico, quimico, aeroespacial, biologico, el funcionamiento de un organo humano, la dosificacion de farmacos en quimioterapia, el volumen de un bosque de pinos, una dieta alimenticia, el volumen semanal de peces en un vivero, una matriz energetica, la dinamica de un movil 1-dimensional, etc. Podemos pensar esta ecuacion diferencial como un conjunto de flechas 'definidas sobre M' (campo de vectores), cuyas direcciones determinan las unicas posibilidades de movimiento de la dinamica. Dada una condicion inicial [x.sub.0] [[elemento de]] M, la unica solucion posible x(t) de dicha ecuacion partiendo de x0 debe satisfacer la siguiente propiedad: para cada tiempo t, el vector tangente x(t) a la curva en el estado x(t) debe coincidir con la direccion pre-establecida por X en x(t). Un sistema de control sobre M puede modificar el comportamiento del campo de vectores X de acuerdo a diferentes estrategias denominados controles, que el sistema permite considerar. Desde un punto de vista de la geometria diferencial, un sistema de control [suma] = (M,D) puede ser establecido como una familia de campos de vectores D definidos sobre M y que intervienen sobre las direcciones de X. Los elementos de D provienen de una familia de ecuaciones diferenciales controladas

[??](t) = X(x(t))+[[suma].sup.p.sub.j=1][u.sub.j](t)[Y.sup.j](x(t))

donde X es el campo a controlar, los campos de vectores [Y.sup.j], j=1, ..., p son definidos sobre el espacio de estados M y ponderados por la familia de controles admisibles U = [L.sup.1.sub.loc] (R, [OMEGA][subconjunto] [R.sup.p]), de funciones localmente integrables a valores en el conjunto [OMEGA] cerrado, convexo con 0 [[elemento de]] int[OMEGA]. El espacio de estados M debe ser de una naturaleza tal que permita asegurar la existencia y unicidad de cada ecuacion diferencial en D; esto es, para cada control u [[elemento de]] U y para cada condicion inicial [x.sub.0]. Entonces, M debe ser una variedad diferenciable.

Dado un sistema [SIGMA] surgen de manera natural varios problemas matematicos interesantes y de compleja solucion. El primero de ellos es: sea [x.sub.0] un estado inicial de M, e y [elemento de] M arbitrario, ?existe una combinacion de estrategias del sistema de tal modo que el estado [x.sub.0] pueda ser transferido al estado y en el sentido natural del tiempo, o sea, en un tiempo t[mayor que o igual a]0 En caso de una respuesta afirmativa, se dice que y es accesible desde [x.sub.0] via [SIGMA]. Un sistema [SIGMA] se dice controlable, si dados dos estados arbitrarios de M, cada uno de ellos es accesible desde el otro via [SIGMA]. Obviamente, no todos los sistemas son controlables. En realidad, la propiedad de controlabilidad es muy dificil de obtener y sobre todo de caracterizar. Por ejemplo, para problemas de aplicacion en donde interviene la energia calorica X, se sabe de la segunda ley de la termodinamica que X fluye solo en la direccion de decrecimiento de la temperatura. Se trata entonces de encontrar e imponer condiciones topologicas, analiticas y sobre todo algebraicas sobre M y D que permitan decidir si un cierto sistema es controlable o no.

Un sistema de control con observacion es definido por la data [[suma].sup.0]= (M, D, h, [R.sup.s]), con h: M [flecha diestra] [R.sup.s] diferenciable y s<n= dim(M).

Estudiamos aqui el problema de observabilidad. Esto es, la posibilidad de determinar el comportamiento del sistema sobre M a traves de una informacion parcial que entrega la funcion de observacion h, con una economia del orden de n-s variables. Como veremos, hay ciertas funciones de observacion h que permiten recuperar la informacion completa del sistema, en cuanto que otras no lo hacen.

Consideremos el siguiente problema de optimizacion: Detener un tren en una estacion en tiempo minimo. Surgen aspectos matematicos interesantes de considerar: ?existe solucion? Y si existe, ?como encontrar la estrategia optima? Ademas, ?sera posible computar esta solucion solo a traves de h?

En Ledzewicz y Shattler (2006) se estudia el siguiente problema: Controlar las dosis de quimioterapia para minimizar los danos colaterales, que es modelado como sistema de control bilineal.

La solucion de los problemas de optimizacion mencionados depende fuertemente del Principio del Maximo de Pontryagin. Los esfuerzos del Instituto Steklov, plasmados en una serie de publicaciones, culminaron con el libro Mathematical Theory of Optimal Processes (Pontryagin et al, 1961), que es considerado un standard de la teoria del control optimal hasta los dias de hoy y fue galardonado con el Premio Lenin. Los alcances de la teoria desarrollada en este libro han tenido repercusiones gigantescas. Inicialmente las aplicaciones fueron dirigidas al campo militar. Sin embargo, a poco andar estas tecnicas de optimizacion se tornaron importantes en la aeronautica y en una gran gama de aplicaciones industriales, siendo una muestra concreta de como la disciplina matematica ayuda a la sociedad a construir futuro.

El presente trabajo persigue dar a conocer ciertas tecnicas matematicas entre la comunidad cientifica de la region, a traves de la exposicion y desarrollo de un problema especifico cuya solucion se obtiene aplicando los metodos matematicos referidos, y que pudieran ser replicadas dentro de las distintas disciplinas de interes. Tras una breve motivacion que describe los problemas de aplicacion mencionados y el rol de la teoria de los sistemas de control, se estudian las propiedad de controlabilidad y observabilidad para la clase de los sistemas de control lineales sobre espacios euclideanos. Luego se da una breve descripcion del Principio del Maximo de Pontryagin (PMP), para terminar con la solucion del problema del tren. En la lista de referencias se incluyen trabajos que pudieran servir de guia al lector interesado, incluyendo contribuciones de nuestro grupo de investigacion.

Motivacion

La publicacion de Pontryagin et al. (1961) representa un clasico de la literatura matematica sovietica. Ademas del inmenso caudal de investigacion cientifica que ha generado el PMP, ha sido una fuente de aplicacion en una gran variedad de disciplinas. El lector interesado puede apreciar el poder de este resultado en un numero relevante de problemas que se resuelven con este principio (Dubins, 1957; Shell, 1968; Axelby, 1973; Gustavsson, 1975; Leitmann, 1982; Sussmann y Willems, 1997; Subbaram, 2002; Shattler y Ledzewicz, 2006, 2012; Pesch y Plail, 2009, 2012). En concreto, la aplicacion de este principio genera en muchos casos una receta, un algoritmo preciso para sintetizar el control optimal, permitiendo su implementacion como veremos en el caso del tren.

Tiempo minimo para alcanzar un objetivo y el sistema de control asociado

Imagine el lector que dirige un tren por una linea ferrea y necesita detenerlo en la proxima estacion en tiempo minimo. Considere el caso ideal sin roce de una linea ferrea recta y la estacion como siendo su origen. Denote por x(t) la distancia del tren a la estacion en el instante t. De acuerdo a ley fundamental de Newton, la fuerza del sistema viene dada por F= ma. En este estudio cualitativo, podemos considerar m = 1. Obtenemos un sistema de ecuaciones [expresion matematica irreproducible], controladas por los diferentes tipos de aceleracion y freno a(t) que denotamos por u(t). Cada funcion de control del sistema.

u: [0, [T.sub.u]] [flecha diestra] [OMEGA] = [-1.1] [subconjunto] R

se asume localmente integrable. Aqui y es la velocidad del tren y 1 representa su velocidad maxima normalizada.

Para este problema la solucion optima existe y es posible computar en forma precisa la estrategia que determina la trayectoria de tiempo minimo del movil. Mostraremos ademas que si se conoce la funcion de distancias a la estacion de una cierta estrategia, es posible computar explicitamente la funcion de velocidades asociada a esta estrategia. Sin embargo, la reciproca no es valida. O sea, no es posible recuperar las distancias si solo se conocen las velocidades involucradas. Este problema sera tratado en detalles en la ultima seccion de este trabajo.

Minimizar danos colaterales en el tratamiento de la quimioterapia

A pesar de que no sera expuesto aqui en detalle, el problema tratado por Ledzewicz y Schattler (2002a, b; 2006) en relacion a la quimioterapia en cancer es descrito para mostrar como la teoria de control aparece de manera natural en problemas de aplicacion relevantes y por que, ademas, cabria ser desarrollado con algun detalle en un trabajo futuro. Los autores proponen un sistema bilineal n-dimensional compartimental del tipo

[??](t) = (A + [[suma].sup.p.sub.j=1][u.sub.j](t)[N.sub.j](t))N(t) con N(0) = [N.sub.0]

Las componentes N(t) del estado N= ([N.sub.1], [N.sub.2], ..., [N.sub.p]) en el instante t, denotan el numero promedio de celulas cancerosas en el compartimiento respectivo. Los controles son considerados funciones Lebesgue medibles y representan los diferentes tipos de dosis posibles de combinar con las drogas consideradas en el tratamiento. Para cada j= 1, 2, ..., p, el control [u.sub.j] [elemento de] [[[alfa].sub.j], [[beta].sub.j]] [subconjunto] [0, [infinito]) es acotado. Las matrices A y [N.sub.j] describen la transicion de entrada y salida del flujo de celulas entre los diferentes compartimentos. Se asume que para cada control u la matriz A + [[suma].sup.p.sub.j=1] [u.sub.j][N.sub.j](t) posee solo entradas negativas en la diagonal y entradas positivas fuera de la diagonal. Con esta hipotesis, se asegura que el primer ortante de Rn es positivamente invariante por el flujo del sistema. Esto es, si N0 es una condicion inicial en el primer ortante, para cada control u la solucion N(u, t, [N.sub.0]) del sistema bilineal permanecera alli. El funcional a optimizar es

j(u) = rN (T) + [[integral].sup.T.sub.0] (qN (t) + su (t)) dt.

Los vectores filas r, q, s [elemento de] [R.sup.n] son considerados pesos tales que [r.sub.i]>0, [q.sub.i] [mayor que o igual a] 0, [S.sub.i] [mayor que o igual a] 0 y tal como antes u= (u1, u2, ., [u.sub.p]) dosifica la cantidad de cada droga. Incluir el peso promedio qN en la integral permite que la cantidad de celulas no crezca mas alla de una cantidad aceptable. El termino 'su' mide el efecto colateral de agentes que participen como bloqueadores o reclutadores de celulas latentes.

Obviamente, el objetivo central es que al termino de la terapia se obtenga el menor numero de celulas cancerosas y con el menor dano colateral posible. Este y varios problemas de este tipo pueden ser resueltos a traves del PMP, sobre el cual se dan para otras referencias mas adelante.

El rol de la teoria de los sistemas de control

Los problemas de motivacion propuestos pueden resolverse a traves de la teoria de los sistemas de control. Para enfrentar un problema de optimizacion, se debe ser capaz de determinar variables de estado y direcciones de control realmente significativas que, por una parte, permitan definir un modelo que represente la situacion de manera genuina, y que por otra, la estructura matematica del modelo sea posible de manejar con las tecnicas existentes. O desde un punto de vista de la investigacion matematica, avanzar la teoria en la disciplina para enfrentar de mejor manera los problemas de aplicacion. Entonces, es importante tener acceso a referencias de resultados matematicos teoricos que se adapten al problema. Por este motivo, en este trabajo ampliamos el espectro de referencias incluyendo trabajos sobre sistemas de control que no seran estudiados aqui, como los sistemas bilineales sobre espacios euclideanos, e invariantes y lineales sobre grupos de Lie.

Si un estado y es accesible desde x, significa que existe al menos un control u y un tiempo t>0, que transfiere x a y a traves de una trayectoria del sistema en tiempo positivo. El conjunto de accesibilidad desde x es constituido por todos los elementos accesibles desde x. El sistema se dice controlable desde x si el conjunto de accesibilidad desde x coincide con la variedad de estados. El sistema se dice controlable si es controlable desde cada estado del sistema. La propiedad de 'controlabilidad' juega un papel esencial en la teoria. Evidentemente, la forma de transferir x a y no es necesariamente unica, ni por el control, ni por el tiempo (el lector puede imaginar muchas maneras distintas de transferir el tren al origen, o muchas maneras de dosificar un tratamiento medico). Surge entonces la idea de 'optimalidad': de entre todas la trayectorias que transfieren x a y, ?cual es la que minimiza el gasto de energia?, ?cual de ellas es la que optimiza cierta ganancia?, ?cual de ellas optimiza un cierto funcional J?

Adicionalmente, si el sistema posee una funcion de observacion h, ?es el sistema observable? Esto es, ?es posible reconstruir estados y trayectorias del sistema con la informacion que entrega h, con un numero menor de variables? Si un sistema no satisface esta ultima propiedad, ?es posible caracterizar las clases de equivalencia de los estados 'inobservables'?, ?es posible construir un nuevo sistema que se comporte como el inicial y que sea observable?, ?localmente observable?

La teoria de los sistemas de control estudia en forma sistematica las estructuras matematicas subyacentes a cada uno de estos problemas y muchos otros desde hace al menos 70 anos. Existen clases de sistemas con caracteristicas analiticas, topologicas, algebraicas y diferenciales propias, sobre las cuales hay una extensa literatura. Vease, por ejemplo, Dubins, 1957; Brockett, 1972; Jurdjevic y Sussmann, 1972; Hermann y Krener, 1977; Wonham, 1979; Jurdjevic y Kupka, 1981; Hilger et al., 1985; Ayala, 1994; Jurdjevic V, 1997a, b; Ayala y Tirao, 1999; Colonius y Kliemann, 2000; Ayala y San Martin, 2001; Jouan, 2010, 2011; Ayala y Da Silva, 2016, 2017; Ayala y Jouan, 2016; Ayala et al., 2014, 2017.

Sistemas de Control Lineales sobre Espacios Euclideanos. Controlabilidad

El estudio cualitativo de la clase de los sistemas de control lineales proviene de la necesidad de redirigir el comportamiento dinamico determinado por una ecuacion diferencial inducida por una matriz A real de orden n. Este control se realiza a traves de una matriz B de orden n x p denominada matriz de costo, y cuyas columnas determinan p campos de vectores constantes [b.sub.j] que intervienen sobre A. En forma precisa,

Definicion C1. Un sistema de control lineal [SIGMA] sobre el espacio euclideano [R.sup.n]= {x= ([x.sub.1], [x.sub.2], ..., [x.sub.n]): [x.sub.j] [elemento de] R, i= 1, ..., n}, es determinado por la dinamica [??](t)= Ax(t) + Bu(t), x [elemento de] [R.sup.n], u [elemento de] U.

En este contexto, U = [L.sup.1.sub.loc] (R, [OMEGA], [subconjunto] [R.sup.p]) es la familia de controles admisibles, en donde [OMEGA] es un conjunto cerrado, convexo con 0 [elemento de] int([OMEGA]).

Dada una condicion inicial [x.sub.0] [elemento de] [R.sup.n] y un control u [elemento de] U, la solucion del sistema existe y viene dada por la formula de variacion de parametros (Wonham, 1979):

x([x.sub.0], u,t) = [e.sup.tA]([x.sub.0] + [[integral].sup.t.sub.0][e.sup.-[tau]A] B u([tau])d[tau])

Definicion C2

Un estado y [SIGMA] [R.sup.n] se dice accesible desde x a traves de [SIGMA] en T unidades de tiempo (en exactamente T unidades de tiempo), si existen u [[elemento de]] U, t [elemento de] [0,T] tales que x(x,u,t)= y, (x(x,u,T)= y), respectivamente. Los conjuntos de accesibilidad desde x en T unidades de tiempo y en exactamente T unidades de tiempo, se denotan por S(x,T) y E(x,T) respectivamente. El conjunto de accesiblidad de Z desde x es definido como S(x)= [U.sub.T[mayor que o igual a]0]S(x,T). El sistema se dice controlable desde x si S(x)= [R.sup.n]. [SIGMA] se dice controlable si es controlable desde cada estado del sistema.

Denote <A, B> el menor subespacio A-invariante de [R.sup.n] que contiene la imagen de B.

Teorema C1

Sea [SIGMA] un sistema de control lineal irrestricto ([OMEGA] =[R.sup.p]). Son equivalentes [SIGMA] es controlable desde cada x [elemento de] [R.sup.n] [??] Existe x [elemento de] [R.sup.n] tal que [SIGMA] es controlable desde x [??] [SIGMA] es controlable desde el origen [??] si T>0, S(0,T)= [R.sup.n] [??] si T>0, E(0,T) = [R.sup.n] [??] [R.sup.n] = <A, B>. Para una demostracion, vease Wonham, 1979, o Ayala y Zegarra, 2001.

Observacion. Podemos describir <A, B> explicitamente. Sean [b.sub.1], [b.sub.2], ..., [b.sub.p] las columnas de B. Entonces,

<A, B> = {[A.sup.k] [b.sub.j]= 1, 2, ..., p, k= 0, 1, 2, ...}.

Debido al Teorema de Calley-Hamilton, no es necesario computar [A.sup.k][b.sub.j] para k[mayor que o igual a]n. En efecto, para cada k[mayor que o igual a]n, [A.sup.k] es combinacion lineal de las potencias anteriores. Asi,

<A, B>={[A.sup.k][b.sub.j]: j= 1,2, ., p, k= 0,1,2, ., n-1}.

Teorema C2 (de Kalman; Wonham, 1979). Sea [SIGMA] un sistema de control lineal irrestricto. Entonces, [SIGMA] es controlable o rango (B AB .... [A.sup.n-1]B)= n.

Un sistema de control lineal [SIGMA] se dice restricto, si [OMEGA] es compacto, convexo y contiene el origen en su interior. Denote por cl(K) la clausura de un conjunto K.

Definicion C3 (Colonius y Kliemann, 2000). Sea [SIGMA] un sistema de control lineal restricto. Un conjunto no vacio C [subconjunto] [R.sup.n] se dice un 'conjunto de control' de [SIGMA] si 1) para cada x [elemento de] C existe u [elemento de] U tal que x([x.sub.0], u, t) [elemento de] C para todo t[mayor que o igual a]0; 2) para cada x [elemento de] C, C [subconjunto] cl(S(x)); y 3) C es maximal con respecto a las propiedades 1 y 2.

Antes de enunciar el siguiente resultado, recordamos algunas nociones basicas de estabilidad. Una matriz A es hiperbolica si su espectro Spec(A) no posee autovalores con parte real 0. Por otro lado, si Spec(A) posee solo autovalores con parte real negativa, entonces A es asintoticamente estable. En otras palabras, para cada x e Rn, [lim.sub.t[flecha diestra] [infinito]][e.sup.[tau]A]x [flecha diestra] 0. O al equilibrio en el largo plazo.

Teorema C4. Sea [SIGMA] un sistema de control lineal restricto sobre [R.sup.n]. Suponga que la condicion de Kalman esta satisfecha. En estas condiciones, existe un unico conjunto de control C con interior no vacio conteniendo el origen 0. Explicitamente, el conjunto de control viene dado por C= cl(S(0)) [interseccion] S_(0), donde S_(0) es el conjunto de estados que pueden ser transferidos al origen en tiempo no negativo. Ademas, de la forma del conjunto de control se deduce lo siguiente.

Teorema C5. Sea [SIGMA] un sistema de control lineal restricto sobre [R.sup.n]. Suponga que la condicion de Kalman esta satisfecha. Entonces, 1) C es limitado [??] A es un operador hiperbolico; 2) C es invariante si A es asintoticamente estable y en este caso C= cl(S(0)); y 3) C= [R.sup.n] [??] Spec(A) [interseccion] R= {0}.

Observamos que el item 3) es una condicion de controlabilidad para sistemas restrictos. Aplicaremos este resultado al problema del tren. Este teorema tiene una extension para los sistemas lineales sobre grupos de Lie (Ayala y Da Silva, 2017).

Sistemas de Control Lineales sobre Espacios Euclideanos. Observabilidad

Dada una observacion parcial de un sistema sobre un intervalo de tiempo finito, ?es posible determinar totalmente el comportamiento del sistema durante ese periodo de tiempo a partir de esta informacion? La importancia de este concepto es teorica y practica. Para sistemas generales la observabilidad local se relaciona con la integracion de familias de formas diferenciales (Ayala et al., 2001). La observabilidad global esta intimamente relacionada con la generalizacion obtenida en Sussmann (1975) de un teorema profundo de la teoria de Lie, el teorema del subgrupo cerrado de Cartan. Desde el punto de vista de las aplicaciones, esta propiedad permite reconstruir la dinamica de estados del sistema a traves de una funcion de observacion con una economia al reducir el numero de variables. Introducimos a continuacion el concepto de sistema con funcion de observacion.

Definicion O1. Un sistema de control lineal con observacion [[suma].sup.o] es determinado por [??] (t) = Ax(t) + Bu(t), x [[elemento de]] [R.sup.n], u [[elemento de]] U, donde h: [R.sup.n] [flecha diestra] [R.sup.s] es una transformacion lineal cuya matriz en las bases canonicas denotamos por C.

Si F: [R.sup.n] [flecha diestra] [R.sup.s] es una transformacion lineal, el kernel y la imagen de F son subespacios Ker(F)= {x [elemento de] [R.sup.n]: F(x)= 0} [subconjunto] [R.sup.n], e Im(F)= {y [elemento de] [R.sup.s][existe en] x [elemento de] [R.sup.n] con y = F(x)} [subconjunto] [R.sup.s].

Introducimos ahora el concepto de 'inobservabilidad', que permite descomponer el espacio de estados en clases de equivalencia, las que contienen toda la informacion de aquellos elementos que no pueden ser distinguidos entre si por h a traves de la dinamica del sistema para tiempos no negativos.

Definicion O2. Dos estados [x.sub.0], [x.sub.1] [elemento de] [R.sup.n] se dicen indistinguibles por [[suma].sup.o] si [x.sub.1] - [x.sub.0] [elemento de] Ker(C([e.sup.tA])), [atane a todos] t [mayor que o igual a]0.

Observacion. El hecho que la funcion de observacion C no distingue los estados [x.sub.0] y [x.sub.1] a traves de la dinamica del sistema se traduce en que para cada u [elemento de] U y t>0

[expresion matematica irreproducible]

de donde se deduce de inmediato la definicion de 'indistinguibilidad'.

De la propia Definicion O2 se deduce el siguiente resultado.

Teorema O1. Sea [[suma].sup.o] un sistema lineal con observacion. Entonces, 1) I es una relacion de equivalencia; y 2) Si I(x) denota la clase de equivalencia de x por la relacion I, se obtiene: a) I(0) = [[interseccion].sub.t [mayor que o igual a]0] Ker ([Ce.sup.tA]); b) I(x)= x + I(0); y c) si O es la matriz transpuesta de (C Ca ... [CA.sup.n-1]): [SIGMA] es observable [??] dim (O)= n.

Una prueba del Teorema O1 se encuentra en Wonham (1979). Aplicaremos este resultado al problema del tren con dos funciones: distancia y velocidad.

Principio del Maximo de Pontryagin

Los ejemplos de la seccion anterior y las referencias alli incluidas muestran la necesidad de estudiar estructuralmente ciertos modelos matematicos que representan problemas especificos en diferentes disciplinas, planteando una serie de preguntas relevantes e importantes de responder. Por ejemplo, en el problema del tren ?es posible alcanzar el origen desde cualquier estado inicial? O en el problema de la quimioterapia, si [epsilon]>0 representa un numero de preferencia pequeno ?es posible dosificar el tratamiento con dano colateral menor que [epsilon]?

Considere una familia de ecuaciones diferenciales controladas y una condicion inicial x en un espacio de estados M. Nos preguntamos por la naturaleza matematica del conjunto de los estados S(x), que pueden ser alcanzados desde x siguiendo todas las posibles estrategias del sistema en tiempo no negativo, y tambien por el conjunto G(x) construido como S(x), pero considerando tiempos en la recta real R. ?Tienen estos conjuntos interior no vacio?, ?son subvariedades regulares del espacio de estados?, ?bajo que condiciones alguno de ellos podria coincidir con M? Si M posee alguna estructura matematica especial, ?bajo que condiciones estos conjuntos podrian heredar dicha estructura? Para la naturaleza de G(x) sugerimos la lectura de Sussmann (1973), donde se establece un primer resultado fundamental: el

Teorema de Orbitas de Sussmann, que reduce el espacio de estados a un ambiente menor en donde la propiedad de controlabilidad del sistema tiene perfecto sentido. Sobre cada orbita el sistema es transitivo. En forma precisa, dados dos estados arbitrarios de la orbita, cada uno de ellos puede ser alcanzado desde el otro a traves de soluciones del sistema utilizando tanto tiempos positivos como negativos. Este resultado no es otra cosa que la extension del Teorema de Frobenius para distribuciones regulares, a distribuciones con singularidades (Warner, 1971).

En particular, estamos interesados en la deformacion de los conjuntos de accesibilidad del sistema a traves del tiempo. Denote por d la metrica euclideana usual y por [d.sup.H] la metrica de Hausdorff definida sobre conjuntos compactos P, Q [subconjunto] [R.sup.n] por [d.sup.H](P, Q) = max {[d.sub.1], [d.sub.2]}, donde [d.sub.1] = [max.sub.x[[elemento de]]Q] [min.sub.x[[elemento de]]Q], d (x, y).

En Pontryagin et al. (1961) los autores prueban el siguiente resultado fundamental para la teoria de sistemas de control:

Teorema P1. Sea [SIGMA] un sistema de control lineal restricto sobre el espacio euclideano [R.sup.n]. Para cada x [elemento de] [R.sup.n] y T>0, el conjunto de accesibilidad desde el estado inicial x hasta el tiempo

[expresion matematica irreproducible]

es compacto, convexo y se deforma continuamente con la metrica de Hausdorff.

Este teorema es solo parte de la version geometrica del PMP, pero es 'suficiente para nuestros propositos'. Es importante destacar que para el computo del control optimal es necesario considerar el levantamiento hamiltoniano del sistema y la estructura simplectica del fibrado cotangente de la variedad de estados (Jurdjevic, 1997), asunto que escapa del horizonte de estas notas. En realidad, tenemos la esperanza de que la vision geometrica que vamos a entregar de este principio no deje duda alguna sobre el control optimal que debe ser considerado, al menos en el ejemplo del tren.

El principio de maximo sobre variedades diferenciables (Jurdjevic, 1997a) es un resultado poderoso en la solucion de problemas concretos en una enorme gama de disciplinas. Vease Jurdjevic (1997a, b) para aplicaciones de la mecanica, Lee et al. (1982) para el control de vehiculos, Leitmann (1982) y Subbaram (2002) para el control de sistemas espaciales, y Shell (1968) para problemas en economia.

Dado un estado inicial x, un subconjunto compacto y convexo [OMEGA] con 0 [elemento de] int([OMEGA]), las propiedades de la aplicacion multivaluada S(x): t[flecha diestra] S(x,t) enunciadas en el Teorema P1 constituyen el pilar geometrico del principio, al menos para problemas de tiempo optimo. En efecto, estas propiedades permiten sintetizar el control optimal. En primer lugar, cada conjunto de accesibilidad S(x,t) es compacto. Podemos aplicar entonces la metrica de Hausdorff [d.sub.H] para tiempos t sobre un intervalo y concluir segun el teorema que S(x,t) se deforma continuamente con t. Asi, dado [epsilon]>0, existe un [delta]>0 tal que d(t,s)<[delta] se traduce en que [d.sub.H] (S(x,t), S(x,s))<[epsilon].

En otras palabras, si [t.sup.*] es el tiempo asociado al control optimal [u.sup.*] que transfiere el estado inicial x al estado deseado x([t.sup.*], x, [u.sup.*]) en tiempo optimo, entonces x([t.sup.*], x, [u.sup.*]), debe pertenecer a la frontera de S(x, [t.sup.*])! De otra manera, o x([t.sup.*], x, [u.sup.*]) estaria fuera de ese conjunto de accesibilidad, o entonces seria un punto interior de S(x, [t.sup.*]), contradiciendo la supuesta optimalidad. En efecto, debido a la deformacion continua de los conjuntos de accesibilidad, seria posible alcanzar el estado x([t.sup.*], x, [u.sup.*]), en un tiempo levemente menor! Podemos concluir que el estado deseado debe pertenecer a la frontera del conjunto de accesibilidad, esto es x([t.sup.*], x, u) [[elemento de]] [derivada parcial] S (x, [t.sup.*]).

Como S(x, [t.sup.*]) es un conjunto convexo, la version geometrica del Teorema de Hahn Banach (Brezis, 1984), asegura que existe un hiperplano H= H([t.sup.*]) que pasa por x([t.sup.*], x, [u.sup.*]) y que deja al conjunto de accesibilidad S(x, [t.sup.*]) de un mismo lado de H. Entonces, existe un covector [expresion matematica irreproducible]ortogonal, a H de tal forma que [expresion matematica irreproducible], para cada [xi] [elemento de] S(x, [t.sup.*]).

Mejor aun, el maximo se alcanza y es igual a zero exactamente en x([t.sup.*], x, [u.sup.*]), que corresponde al origen del referencial. En efecto, con excepcion del estado deseado, el angulo que se produce entre [expresion matematica irreproducible], y cada vector en S(x, [t.sup.*]) en el nuevo referencial es mayor a 90 grados,

Debido al Principio de Optimalidad de Belman (Bellman, 1957), cada estado intermedio x([t.sub.0], x, [u.sup.*]) de la trayectoria optimal x(t, x, [u.sup.*])) con t [elemento de] [0, [t.sup.*]], debe ser un punto optimal de cada curva que separa, para el mismo problema optimal pero con estados iniciales y finales descritos por los extremos. Esto es, entre [0, [t.sub.0] ] y [[t.sub.0], [t.sup.*]]. Como [t.sub.0] es arbitrario, existe un grupo a 1-parametro de co-vectores {[[eta].sub.t]: 0 [menor que o igual a] t [menor que o igual a] [t.sup.*]}, objeto que es uno de los principales ingredientes del PMP, que en muchas situaciones permite sintetizar en forma explicita la estrategia optimal y resolver el problema.

El Ejemplo del Tren. Controlabilidad, Solucion Optimal y Observabilidad

Problema optimal: Detener un tren en una estacion en tiempo minimo. Este problema se puede modelar a traves del sistema de control lineal

[expresion matematica irreproducible]

representando las ecuaciones de manera estructurada como en la Definicion C1, con funciones de control u: [0,Tu] [flecha diestra] [OMEGA] = [-1.1] [subconjunto] R, y en donde y(t) es la velocidad del tren en el instante t. Como siempre, U es la clase de funciones localmente integrables garantizando existencia y unicidad de la solucion para a cada estado inicial ([x.sub.0], [y.sub.0]) y para cada u [elemento de] U. Obviamente, este sistema es restricto.

Controlabilidad

Geometricamente, el problema de accesibilidad se traduce entonces en transferir el tren desde el estado inicial ([x.sub.0], [y.sub.0]) al origen (0, 0) del plano. Si por ejemplo [y.sub.0]>0, se entiende que al pasar por [x.sub.0] el tren se mueve con velocidad [y.sub.0] en la direccion de la estacion. Si [y.sub.0]<0 el tren se mueve en la direccion contraria a la estacion, situacion que es perfectamente posible, si por ejemplo, han llamado al conductor a volver a la estacion de origen.

Antes de iniciar la busqueda de una solucion optima es necesario saber si el sistema de control lineal restricto es controlable. Segun el Teorema C5, necesitamos calcular el rango de la matriz de Kalman y el espectro de A. Un computo inmediato muestra que rango(B AB) = rango [expresion matematica irreproducible].

Entonces, el sistema restricto es controlable. En particular, cualquier condicion inicial puede ser trasladada al origen y el problema de optimal tiene perfecto sentido.

Optimalidad

El lector puede facilmente imaginar que existen muchas formas distintas de transferir la condicion inicial al origen. Sin embargo, desde el punto de vista de optimizacion, se necesita encontrar un control optimal que [u.sup.*] transporte ([x.sub.0], [y.sub.0]) al origen en tiempo minimo. Es importante destacar que las transferencias entre estados no se realizan a traves de curvas arbitrarias; si no, solo a traves de aquellas que satisfacen las ecuaciones diferenciales asociadas al sistema de control [SIGMA]. De acuerdo al PMP, las unicas estrategias optimas posibles para nuestro problema se encuentran en la frontera del conjunto de los estados accesibles. Esta informacion crucial, trasladada a las funciones de control se reduce a dos posibilidades a considerar: o bienu(t) es constante e igual a 1, o bien u(t) es constante e igual a -1.

Obviamente, el traspaso de esta informacion desde la frontera [derivada parcial]S(x, t) a la frontera [derivada parcial][-1,1] no es inmediato. En realidad, se deduce de las ecuaciones diferenciales parciales asociadas al sistema hamiltoniano del PMP, que como hemos dicho, escapa al horizonte de estas notas.

El mismo principio establece que una combinacion adecuada de estos dos controles entrega la curva optimal con un maximo de n-1 cambios de control. En este caso, n= 2, de modo que a lo mas se necesita un cambio: de u= 1 a u= -1 o reciprocamente.

Observese que este principio reduce a priori y de manera notable la busqueda de una solucion optima desde un universo infinito de posibilidades contenidas en el conjunto de dimension infinita [L.sup.1.sub.loc] (R,[OMEGA] = [-1.1]), a una combinacion reducida de controles constantes por pedazos. Con esta informacion ?como obtener la solucion optima? En primer lugar, debemos computar las soluciones de las dinamicas asociadas a los controles bangbang. Para u= 1, obtenemos la ecuacion Diferencial [expresion matematica irreproducible], cuyas soluciones son parabolas centradas en el eje y abriendose hacia la derecha, o sea, convexas respecto del eje y. Por otra parte, para el control u= -1 se obtiene el sistema [expresion matematica irreproducible], cuyas soluciones son parabolas centradas en el eje y, abriendose hacia la izquierda, esto es, concavas respecto del eje y. De entre estas dos familias de curvas, existen dos trayectorias que son esenciales, aquellas que nos trasladan al origen. Denote por [u.sub._] la interseccion de la curva que nos traslada al origen con control u= -1, con el semiplano y>0. Denote por [u.sub._] la interseccion de la curva que nos traslada al origen con control u= 1, con el semiplano y<0. Entonces, la concatenacion (union) a traves del origen de las semi-curvas u+ con u+ que denotamos por a, es una curva continua que divide el plano en dos componentes conexas: [([R.sup.2]).sup.-] y [([R.sup.2]).sup.+], a la izquierda y a la derecha de la curva a, respectivamente.

Considere, por ejemplo, un estado inicial ([x.sub.0], [y.sub.0]) [elemento de] [([R.sup.2]).sup.-] con [y.sub.0]>0. Entonces, usted se dirige hacia la estacion con una velocidad [y.sub.0] desde una distancia [x.sub.0]. Segun el principio debera acelerar al maximo siguiendo la trayectoria optimal determinada por el control u= 1. Geometricamente, Ud. viajara por la unica parabola que pasa por ([x.sub.0], [y.sub.0]) para la ecuacion diferencial determinada por u= 1, y que se dirige al encuentro de la semi-parabola [u.sub._]. En el punto de interseccion de ambas parabolas Ud. debe cambiar de estrategia y se trasladara al origen en tiempo minimo via [u.sub._]. En otras palabras, siguiendo la estrategia optimal, Ud. acelerara al maximo durante un periodo de tiempo para despues frenar al maximo durante otro periodo de tiempo. ?Como saber en que momento cambiar de estrategia? Esto es equivalente a preguntar ?como calcular el punto en donde debo pasar de la aceleracion al freno? Bueno, el principio entrega esta informacion de manera automatica. En realidad las curvas [u.sub._] y [u.sub.+] son conocidas, y dada cualquier condicion inicial del plano las trayectorias de los sistemas con u= 1 y con u= -1 tambien. Cualquier ordenador entrega de inmediato el punto de interseccion. La proyeccion sobre el eje x de ese punto de interseccion informa al maquinista exactamente donde aplicar, en este caso, el freno.

Invitamos al lector a analizar la estrategia optimal para ([x.sub.0], [y.sub.0]) [elemento de] [([R.sup.2]).sup.+] con [y.sub.0]>0. Observese que podria darse el caso de que el tren viniera con alta velocidad y encontrarse muy cerca de la estacion.

Observabilidad

En esta seccion analizamos el ejemplo del tren con dos funciones de observacion: las proyecciones coordenadas. Mas arriba estudiamos condiciones algebraicas para determinar la propiedad de observabilidad para la clase de los sistemas lineales de control sobre espacios euclidianos.

Considerese el sistema de control lineal restricto [[suma].sup.O1] con funcion de observacion

[expresion matematica irreproducible].

[h.sub.1]: [R.sup.2] [flecha diestra] R tal que [h.sub.1] (x, y)= x.

De acuerdo al Teorema O1 debemos computar el rango de la matriz traspuesta de O. En este caso C= (1 0) y CA= (0 1). De modo que O! posee rango maximo y el sistema es observable. En concreto, esto significa que para determinar cualquier trayectoria del sistema solo es necesario conocer su proyeccion sobre el eje x. En otras palabras, conociendo las distancias podemos conocer las velocidades. Sin embargo, la reciproca no es valida.

En efecto, considerese el sistema anterior pero con funcion de observacion proyeccion en la segunda variable [h.sub.2]: [R.sup.2] [flecha diestra] R. En este caso el rango de [O.sub.1] es 1 y el sistema no es observable. Es interesante observar que dados dos puntos p y q arbitrarios del plano pero con la misma altura, el sistema no permite distinguirlos a traves de los controles bangbang. En realidad, cada control de este tipo entrega una familia de 'parabolas paralelas' centradas en el eje y. De modo que al proyectar simultaneamente las soluciones con condicion inicial p y con condicion inicial q sobre el eje y, estas coinciden para cada tiempo positivo (y negativo!). De modo que el sistema no puede ser observable. La clase de inobservabilidad del origen es I(0,0)= eje x. De acuerdo al Teorema O1, la clase de inobservabilidad de cada estado del plano ([x.sub.0], [y.sub.0]) [elemento de] [R.sup.2] viene dada por I([x.sub.0], [y.sub.0])= ([x.sub.0], [y.sub.0]) + eje x.

Comentario relativo a la extension de los resultados mencionados

En Ayala y Tirao (1999) se introdujo la clase de los sistemas de control lineales sobre grupos de Lie, donde cada estado del sistema es una matriz. En Ayala et al., 2017) fue demostrado que para esta clase de sistemas los conjuntos de accesibilidad tambien se deforman continuamente con la metrica de Hausdorff. En Ayala y Jouan (2016) se establecio la estructura simplectica asociada a esta clase de sistemas para obtener una version especifica del Principio del Maximo de Pontryagin. Finalmente, en Ayala et al. (2001) se obtuvieron las mismas propiedades de observabilidad descritas en el Teorema O1 para la clase mencionada y en Ayala y Hacibekiroglu (1997) se establecieron condiciones algebraicas y topologicas, caracterizando la observabilidad local.

Recibido: 27/02/2017. Aceptado: 28/08/2017.

REFERENCIAS

Axelby GS (1973) Round-table discussion on the relevance of control theory. Automatica 9: 279-281.

Ayala V (1994) Controllability of nilpotent systems. Banach Center

Publ. Polish Acad. Sci. 32: 35-46.

Ayala V, Da Silva A (2016) A semigroup associated to a linear control system on a Lie group. Syst. Control Lett. 98(Dec): 33-36.

Ayala V, Da Silva A (2017) Control sets of linear systems on Lie groups. Nonlin. Differ. Eq. Appl. 24:8c. Springer. DOI 10.1007/s000 30-017-0430-5.

Ayala V, Hacibekiroglu A (1997) Local observability of invariant dynamics on compact Lie groups with square integrable output map functions. Comput. Math. Applic. 34(12): 61-70.

Ayala V, Jouan P (2016) Almost Riemannian structures and linear control systems on Lie groups. S1AM J. Contr. Optimiz. 54(5): 2919-2947.

Ayala V, Kawan C (2014) Topological conjugacy of real projective flows. J. Lond. Math. Soc. 90: 49-66.

Ayala V, San Martin L (2001) Controllability properties of a class of control systems on Lie groups. Lect. Not. Contr. Inf. Sci. 258: 83-92.

Ayala V, Tirao J (1999) Linear control systems on Lie groups and controllability. Amer. Math. Soc. Ser. Symp. Pure Math. 64: 47-64.

Ayala V, Zegarra R (2001) Controllabilidad de sistemas lineales sobre grupos de matrices, Cubo J. Math. 3:x171-212.

Ayala V, Kizil E, Hacibekiroglu A (2001) Observability of general linear pairs. Comput. Math. Applic. 39: 35-43.

Ayala V, Rodriguez J, San Martin L (2009) Optimality on homogeneous space. An example on the real projective line. SIAM J. Contr. Optimiz. 29: 1515-1528.

Ayala V, San Martin L, Ribeiro V (2014) Controllability on Sl(2,C) with restricted controls. SIAM J. Contr. Optimiz. 52: 2548-2567.

Ayala V, Da Silva A, Roman-Flores H (2017) Continuity of reachable sets of restricted affine control systems. Chaos Solit. Fract. 94: 37-43.

Bellman RE (1957) Dynamic Programming. Princeton University Press, Princeton, NJ, EEUU. Republished (2003) Dover, ISBN 0-486-42809-5.

Brezis H (1984) Analisis Funcional: Teoria y Aplicaciones. Theorem 1.6 (p. 5). Alianza. Madrid, Espana. 233 pp.

Brockett R (1972) System theory on groups and coset spaces. SIAM J. Contr. 10: 265-284.

Colonius F, Kliemann W (2000) The Dynamics of Control. Birkhauser. Definition 3.1.2 (p. 48). Boston, MA, EEUU.

Dubins L (1957) On curves of minimal lengths with a constraint on average curvature and with prescribed initial and terminal positions and tangents. Amer. J. Math. 19: 497-516.

Gustavsson I (1975) Survey of application of identification in chemical and physical processes. Automatica 11: 3-24.

Hermann R, Krener A (1977) Non-linear controllability and observability. IEEE Trans. Autom. Contr. AC-22(5): 728-740.

Hilger KH, Hofmann JD, Lawson L (1985) Controllability of systems on a nilpotent Lie group. Contrib. Algeb. Geom. 20: 185-190.

Jouan P (2010) Equivalence of control systems with linear systems on Lie groups and homogeneous spaces. ESAIM: Contr. Optimiz. Calc. Variat. 16: 956-973.

Jouan P (2011) Controllability of linear systems on Lie group. J. Dynam. Contr. Syst. 17: 591-616.

Jurdjevic V (1997a) Geometric Control Theory. Cambridge University Press. Nueva York, EEUU. 354 pp.

Jurdjevic V (1997b) Optimal control problems on Lie groups: crossroads between geometry and mechanics. En Jakubczyk B, Respondek W (Eds.) Geometry of Feedback and Optimal Control. Decker. Nueva York, EEUU. pp. 257-303.

Jurdjevic V, Kupka I (1981) Control systems on semi-simple Lie groups and their homogeneous spaces. Ann. Inst. Fourier 31(4): 151-179.

Jurdjevic V, Sussmann H (1972) Control systems on Lie groups. J. Diff. Eq. 12: 313-329.

Ledzewicz U, Schattler H (2002a) Optimal bangbang controls for a 2-compartment model in cancer chemotherapy. J. Optimiz. Theory Applic. 114: 609-637.

Ledzewicz U, Schattler H (2002b) Analysis of a cell-cycle specific model for cancer chemotherapy. J. Biol. Syst. 10: 183-206.

Ledzewicz U, Shattler H (2006) Optimal control for a bilinear model with recruiting agent in cancer chemotherapy. Proc. MTNS. Kyoto, Japan. pp. 478-484.

Lee DH, Milroy IP, Tyler K (1982) Application of Pontryagin's Maximum Principle to the semi-automatic control of rail vehicles. 2nd

Conf. Control Eng. 1982: Merging of Technology and Theory to Solve Industrial Automation Problems. Institution of Engineers. Barton, Australia. pp. 233-236.

Leitmann G (1962) Optimization Techniques with Application to Aerospace Systems. Academic Press. Londres, RU. pp. 389-445

Pesch HJ, Plail M (2009) The Maximum Principle of Optimal Control: A history of ingenious ideas and missed opportunities. Contr. Cybern. 38(4A): 973-995.

Pesch HJ, Plail M (2012) The Cold War and the Maximum Principle of Optimal Control Docum. Math. (Extra Vol): 331-343.

Pontryagin LS, Boltyanskii VG, Gamkrelidze RV, Mishchenko EF (1961) Matematicheskaya Teoriya Optimal'nykh Prozessov. Fizmatgiz, Moscow. Trad. inglesa (1962): The Mathematical Theory of Optimal Processes. Wiley. Nueva York, EEUU. 360 pp.

Shattler H, Ledzewicz U (2006) Drug resistence in cancer chemoteraphy as an optimal con trol problem. Discr. Cont. Dyn. Syst. Ser. B 6: 129-150.

Schattler H, Ledzewicz U (2012) Geometric Optimal Control. Theory Methods and Examples. Interdisciplinary Applied Mathematics 38. Springer. 640 pp.

Shell K (1968) Applications of Pontryagin's Maximum Principle to economics. Lect. Not. Operat. Res. Math. Econ. 10/11: 241-292.

Subbaram D (2002) Optimal Control Systems. CRC. Boca Raton, FL, EEUU. pp. 315-360.

Sussmann H (1973) Orbits of families of vector fields and integrability of distributions. Trans. Amer. Math. Soc. 180: 171-188.

Sussmann H (1975) A generalization of the closed subgroup theorem to quotients of arbitrary manifolds. J. Diff. Geom. 10: 151-166.

Sussmann H, Willems C (1997) 300 Years of Optimal Control: From the Brachystochrone to the Maximum Principle. IEEE Contr. Syst. (June): 32-44.

Warner FW (1983) Foundations of Differentiable Manifolds and Lie Groups. Graduate Texts in Mathematics. Vol. 94. 41 pp. Springer. 276 pp

Wonham WM (1979) Linear Multivariable Control: aA Geometric Approach. Applications of Mathematics. Vol. 10. Springer. 326 pp.

VICTOR AYALA y HERIBERTO ROMAN-FLORES

Victor Ayala. Ph.D., Universidade Estadual de Campinas (UNICAMP), Brasil. Profesor, Universidad de Tarapaca, Chile. Direccion: Instituto de Alta Investigacion, Universidad de Tarapaca, Casilla 7D, Antofagasta 1520, Arica, Chile. e-mail: vayala@ucn.cl

Heriberto Roman-Flores. Ph.D. UNICAMP, Brasil. Profesor, Universidad de Tarapaca, Chile.
COPYRIGHT 2017 Interciencia Association
No portion of this article can be reproduced without the express written permission from the copyright holder.
Copyright 2017 Gale, Cengage Learning. All rights reserved.

 
Article Details
Printer friendly Cite/link Email Feedback
Author:Ayala, Victor; Roman-Flores, Heriberto
Publication:Interciencia
Date:Sep 1, 2017
Words:7899
Previous Article:LOS ARBITROS, HEROES OCULTOS DE INTERCIENCIA.
Next Article:EVALUACION DE LA ECUACION DE INFILTRACION DE GREEN Y AMPT EN ALGUNOS SUELOS AGRICOLAS DE MEXICO, USANDO INFORMACION DEL USDA Y UN METODO MODIFICADO...
Topics:

Terms of use | Privacy policy | Copyright © 2018 Farlex, Inc. | Feedback | For webmasters