164
VA "Mr,,. \ r 3 ESCUELA TÉCNICA SUPERIOR DE INGENIEROS AERONÁUTICOS Manuel Abejón Adame z - SISTEMAS ADAPTIVOS DE DECISIÓN EN CONTROL AUTOMÁTICO - UNM-ilÜDAD POLITÉCNICA DE MADRID £ T. S. S. AERONÁUTICOS 8 ' 8 L ¡ O T E C A ÍÍCJ -1 * , r , "»A f Ví> •;' :>(-c-'H^\u )fr5.52.5 f-í- í.kitvi.t^'.Aa *.552'.'í h:tt.\AR)H* .ÍO&J) . .ABÉ, >JlS>. j fc I i ÍONSÜLTA EN BIBLIOTECA Tesis doctoral dirigida por el Dr. Ings D. Julio González Bernaldo de Quirós, catedráti- co de la E.T.S.I. Aeronáuticos ESCt DE B 1 ELA TEGN'iO.A S!;f'tR!0R lfJGtNlíl.GS i-WiYYY'o Qr$qy?>\ E3 L 1 O Y Y C A -1971 - INSTITUTO POLITÉCNICO DE MADRID

-II-oa.upm.es/969/1/MANUEL_ABEJON_ADAMEZ.pdf · 2014. 9. 22. · -II-nuestros compañeros y amigos más próximos, cuyo empeño en verla concluida ha sido quizás mayor que el propio;

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

  • V A "Mr,,. \ r3

    ESCUELA TÉCNICA SUPERIOR DE INGENIEROS AERONÁUTICOS

    Manue l Abe jón Adamez

    - SISTEMAS ADAPTIVOS DE DECISIÓN EN CONTROL AUTOMÁTICO -

    UNM-ilÜDAD POLITÉCNICA DE MADRID £ T. S. S. AERONÁUTICOS

    8 ' 8 L ¡ O T E C A ÍÍCJ - 1* Cí,r,"»AfVí>

    •;' :>(-c-'H^\u )fr5.52.5 f-í- í.kitvi.t̂ '.Aa *.552'.'í

    h:tt.\AR)H* .ÍO&J) . .ABÉ, >JlS>. j fc

    I i

    ÍONSÜLTA EN BIBLIOTECA

    Tesis doctoral dirigida por el Dr. Ings D. Julio González Bernaldo de Quirós, catedráti-co de la E.T.S.I. Aeronáuticos

    ESCt DE

    B 1

    ELA TEGN'iO.A S!;f'tR!0R lfJGtNlíl.GS i-WiYYY'o

    Qr$qy?>\ E3 L 1 O Y Y C A

    -1971 -

    INSTITUTO POLITÉCNICO DE MADRID

  • -1 -

    Antes de entrar en el tema ob;^to d§ este traba-

    jo queremos cumplir el gratísimo deber ce manifestar nues-

    tro agradecimiento a las personas sin cu3-a colaboración, -

    más o menos directa, no nos hubiera side posible llevarlo

    a cabo.

    En primer lugar al Profesor Gcn.zález Berna]do de

    Quirós -maestro, compañero y amigo- al cue el autor debe no

    sólo la inestimable dirección de esta tenis, sino su propia

    iniciación en la Automática9 durante sus estudios de Inge-

    niería Aeronáutica, y su posterior formealón en dicho cam-

    po.

    También a todos aquellos profesores de nuestra -

    Escuela y de la Facultad de Ciencias de Madrid -demasiados

    para que les podamos citar sin incurrir en lamentables rmi

    siones- que contribuyeron a nuestra formación matemática y,

    sobre todo, a nuestra capacidad de aplicarla.

    Igualmente hemos de reconocer la deuda de grati-

    tud que tenemos contraída con todas las personas que estu-

    dian y trabajan en la Escuela Técnica Superior de Ingenie-

    ros Aeronáuticos por cosas tan intangibles, pero tan impor

    tantea, come el "ambiente de trabajo" y el "clima humano" -

    que nos han rodeado. Es ésta especialmente importante con

    el limo. Sr. Director, D. Manuel Avello Ugalde 0 cuyo alien

    to para la realización de esta tesis ha sido constante; con

  • - I I -

    nuestros compañeros y amigos más próximos, cuyo empeño en

    verla concluida ha sido quizás mayor que el propio; y, en

    di tino pero principal lugar, con nuestros alumnos, sin -

    los que nuestra labor carecería de sentido.

    Queremos finalmente agradecer a los Sres. Sánchez

    Vállez y Sánchez Gómez -competentísimos funcionarios y bue

    nos amigos nuestros- su meritoria labor de mecanografía y

    su pulcra delineación respectivamente.

    Madrid, Enero de 1971

    Manuel Abejón

  • Í N D I C E

    INTRODUCCIÓN 1

    P r i m e r a P a r t e

    -ELEMENTOS DE TEORÍA DE LA DECISIÓN

    Y APLICACIONES AL CONTROL ADAPTIVO

    INTRODUCCIÓN A LA TEORÍA DE LA DECISIÓN 9

    PROCESOS DE DECISIÓN NO SECUENCIALES

    EN CONTROL ADAPTIVO 23

    PROGESOS DE DECISIÓN SECUENCIALES EN

    CONTROL ADAPTIVO . .. . 34

    Segunda Parte

    -CONTROL ADAPTIVO CON DISPOSITIVOS DE DECISIÓN

    SISTEMAS DE CONTROL ADAPTIVO CON

    DISPOSITIVOS DECISORIOS 59

    UN CASO DE SISTEMA ADAPTIVO DE DECISIÓN ..... 93

    CONCLUSIONES 134

    Apéndices

    RESUMEN DE DEFINICIONES Y TEOREMAS

    DE TEORÍA DE LA DECISIÓN 140

    UNAS NOTAS SOBRE LA ECUACIÓN DE FOKKER-PLANCK 144

    UN COMENTARIO CRITICO 155

    =ooOoo=

  • 0. INTRODUCCI ON

    Suaario

    0 . 1 . OBJETO

    0 . 2 . BREVE DESCRIPCIÓN

    0 . 3 . OBSERVACIONES SOBRE FINES Y MÉTODOS

  • - 2~

    O. I N T R O P Ü C C I ON

    0 . 1 . OBJETO.

    En el presente trabajo se trata de estudiar -sin

    ninguna pretensión de exhaustividad- algunas cuestiones re

    lativas a la aplicación de la Teoría de la Decisión Esta—

    dística al Control Adaptivo. En especial se llega a la ola

    boración de una regla de decisión original válida para sis

    temas no lineales de control adaptivo y se hace aplicación

    de la misma a un supuesto práctico.

    Como es sabido el control automático -utilizando

    las técnicas de análisis lineal y la idea clave de realimen

    tación- se desarrolló sobremanera9 tanto en el aspecto toó*

    rico como en el tecnológico 9 durante la década de los 40 y

    primeros años 50. Al filo del medio siglo la complejidad -

    de los procesos a controlar y la progresiva sofisticación

    de la propia teoría -sin contar con la creciente importan-

    cia de las técnicas digitales, la influencia de la investí

    gación aeroespacial, etc.- condujeron al estudio de siste-

    mas no lineales crecientemente complejos, sistemas de mués

    treo, etc., hasta llegar a los sistemas adaptivos que han

    ocupado destacadamente el estudio de los especialistas du-

    rante estos últimos años.

    El control adaptivo consiste simplemente en dis-

    poner de controladores cuyas características sean suscepti

  • - 3 -

    bles de variar automáticamente, adaptándose a los cambios

    de configuración del sistema a controlar, de las entradas

    al mismo, de las perturbaciones, etc. . El "quid" de la —

    cuestión está en la consecución de dispositivos que sean -

    capaces de medir u observar dichos cambios, calcular a par

    tir de los mismos, y de los criterios de optimización pre-

    establecidos, los valores ideales de las características -

    instantáneas del controlador y ajustar las reales a ellas.

    Por lo tanto un punto esencial es el de la observación de

    los parámetros del sistema a controlar, cosa que resulta -

    imposible de hacer en plan determinista, en la mayoría de

    las situaciones reales, por la presencia de ruidoa

    Por la razón apuntada es necesario utilizar cri-

    terios que permitan -a falta de determinaciones exactas- la

    consecución de estimaciones, lo más realistas posibles, de

    los parámetros del sistema. Aquí es donde aparece la Teoría

    de la Decisión.

    La Teoría de la Decisión, como veremos más adelan

    te, permite con una base estadística apropiada hacer tales

    estimaciones con -un riesgo mínimo. Nuestro trabajo consis-

    tirá en mostrar cómo se consiguen tales resultados, en es-

    pecial para los sistemas de tipo no lineal no suficientemen

    te estudiados aún en este aspecto.

    La Teoría de la Decisión que adquiere un "status"

    de prestigio con la obra de Wald "Statistical Decisión Pune

  • -4-

    tions,! (1950) ha sido aplicado durante la década de los 50

    a numerosos problemas de teoría y práctica de las comunica

    ciones; en los años 60 tales aplicaciones alcanzaron a los

    problemas de control9 en cuya tarea se sigue actualmente .

    La presente es9 pues9 una aportación más a tal línea de in

    vestigación*

    0.2. BREVE DESCRIPCIÓN.

    Aparte de esta introducción y de unos apéndices

    finales9 la tesis está dividida en dos partes; en una pri-

    mera se hace una exposición de ideas elementales con el fin

    de aclarar y dotar de una base al contenido más original -

    de la segunda parte. Cada una de ellas está formada por —

    tres capítulos.

    En el primero se dan los conceptos fundamentales

    de teoría de la decisión y sus aplicaciones a los proble—

    mas de comunicación y control.

    En el segundo se tratan los métodos no secuencia

    les.

    En el tercero -y fundament dí> la primera párte-

    se trata de los métodos secuenciales9 que se aplicarán en

    los que siguen a los sistemas adaptivos? algunos resulta—

    dos, aunque básicamente conocidos9 han sido modificados9 -

    ampliados y adaptados con al fin de aplicarlos al control

    adaptivo de sistemas no linéales9 alternativa no binaria y

  • - 5 -

    ruido no gaussiano0

    El capítulo cuarto (ya en la segunda parte) es -

    el fundamental del trabajo por su amplitud y por contener

    resultados inéditos. En particular se obtiene en él una re

    gla de decisión aplicable a sistemas no lineales con ruido,

    basándose en una sustitución de la ley de probabilidad real

    por una aproximación multinomialo

    El capítulo quinto so dedica íntegramente a apla-

    car dicha regla a un supuesto práctico.

    El último capítulo -el sexto- contiene un breve

    resumen y una lista do conclusiones.

    Se han añadido tres apéndices al final, cuyos —

    respectivos finos son los siguientess el A, dar una lista

    de definiciones y teoremas de Teoría de la Decisión? el B,

    resumir unas ideas sobre la ecuación de Fokker-Planck de -

    los procosos markovianos y la solución de Caughey para el

    caso estacionario 5 y el C9 dar unas notas críticas sobre -

    la monografía de Y. Sawaragi, YG Sunahara y T„ Nakamizo, -

    advirtiendo do algunos errores que contiene.

    0.3. OBSERVACIONES SOBRE EINES Y MÉTODOS.

    Antes de terminar la introducción del presente -

    trabajo es preciso hacer algunos comentarios y observacio-

    nes sobre los finos perseguidos en el mismo y los métodos

    utilizados.

  • - 6 -

    En primer lugar hay que señalar que no hemos pro

    tendido escribir una monografía completa sobre el toma, si

    no exclusivamente comunicar algunas contribuciones al mis-

    mo. Por lo tanto os inútil buscar muchos resultados ya co-

    nocidos o cuestiones que son objeto actualmente de invosti

    gacióna El lector que esto interosado on los mismos deberá

    acudir a las referencias que damos o, mejor? a los números

    recientes de las revistas do la especialidad.

    Esa misma falta intencional do oxhaustividad lie

    va consigo aparejada, on algunos pasajes do la primera par

    te, un cierto asistematismo por omisión de resultados, --

    pruebas o datos no absolutamente imprescindibles para com-

    prender nuestra contribución concreta. No creemos que sea

    ello un inconveniente, ya que debe quedar bien claro que -

    los tres primeros capítulos no tienen mayor interés por sí

    mismos y sólo cumplen los dos finos siguientes % 12. Dar al

    gunos resultados y fórmulas de -un modo directamente utili-

    zable para nuestras investigaciones°9 y 22. Hacer relativa-

    mente legible el trabajo sin un exceso de prerrequisitos.

    En cuanto al método seguido hemos de puntiializar

    que está mucho más cerca del utilizado por los ingenieros

    de control y los estadísticos -un tanto heurístico y prag

    mático- que del riguroso y teórico de los matemáticos —

    (aunque ello haya violentado a veces los escrúpulos, más -

    matemáticos que ingenieriles, del autor). El motivo es '-

  • dobles por -una par te , t r a t a r se de cuestiones de aplicación

    tdcnica (objeto de una t e s i s doctoral en ingenier ía ) ; por

    otra refer i rse a problemas en los que un exceso de formali

    zación y r igor no añade nuchas ventajas, ya que son sucia—

    nente concretos y susceptibles de conprobación enpír ica. -

    Nos parecen a este respecto nuy oportunas unas palabras —

    (que oitárenos con c ie r ta l iber tad) del Profesor Sixto Ríos

    señalancTo que de las t r e s etapas por l as que atraviesa t o -

    da natenatización de un fenóneno reals conceptualización ,

    razonaniento lógico-deductivo y desconceptualización se —

    presta , indebidáñente, nás atención a la nenos inportante

    y ñas sencil la que es la in temedia . Siguiendo tan au to r i -

    zado consejo hemos procurado huir de ese extremo sin caer,

    naturalmente, en el opuesto.

  • PRIMERA PARTE

    ELEMENTOS DE TEORÍA DE LA DECISIÓN

    Y APLICACIONES AL CONTROL ADAPTIVO

  • 1. INTRODUCCIÓN A LA TEORÍA DE LA DECISIÓN

    S u rna r i o

    1 . 1 . GENERALIDADES.

    1.2. DESCRIPCIÓN DE UN PROCESO DE DECISIÓN.

    1.3. FORMULACIÓN GENERAL.

    1.4. SOLUCIÓN BAYESIANA.

    1.5. CASO BINARIO.

    NOTAS Y REFERENCIAS.

  • - 1 0 -

    1. INTRODUCCIÓN A LA TEORÍA DE LA DECISIÓN

    1,1. GENERALIDADESo

    Vamos9 en este primer capítulo, a dar un breve -

    resumen de las ideas básicas de la Teoría de la Decisión y

    de sus aplicaciones a los problemas de comunicación y con-

    trol. Estos últimos se reducirán al de la detección bina—

    ria.

    En un proceso de decisión se trata (si se nos per

    mite una definición aproximativa) da estimar una situación

    imperfectamente conocida por su aleatoriedad intrínseca o

    por falta de información? valorar las posibles consecuen—

    cias de las decisiones que se adopten en función de tal ejs

    timación y adoptar la política o estrategia óptima. Natu—

    raímente se considerará una política óptima cuando para ca

    da caso nos dé la decisión óptima, es decir la que maximi-

    za o minimiza una cierta función criterio9 preestablecida

    de acuerdo con el plantel de objetivos que se tengan.

    Los primeros estudios de procesos de decisión -

    aparecieron en el campo do la Teoría de la Estimación esta

    dística por obra de Neyman y Pearson. Posteriormente Wald

    creó toda una Teoría de la Decisión con amplias aplicacio-

    nes en diversas ramas de .".a Estadística y la Investigación

    Operativa.

    Las aplicaciones de dicha Teoría se han prolonga

  • -11 -

    do después a los problemas de comunicación y en el decenio

    último a los de control.

    1.2. DESCRIPCIÓN DE ÜN PROCESO DE DECISIÓN.

    Tenemos una situación definida por un parámetro

    © . Suponemos que éste puede tomar la gama discreta de va

    lores ©*.,...., © n con las probabilidades "a priori" -

    Pi==p(©*)# En un caso concreto © puede ser el valor de

    un parámetro de una distribución estadística, la posición

    de un blanco buscado por un radar, el contenido de un men-

    saje, el valor de una característica dinámica de un siste-

    ma de control, etc.5 la ?(©.?) representa, en tal caso,

    las probabilidades estimadas "a priori" de que el valor de

    © sea precisamente © . .

    Si © estuviera dado determinísticamente bastaría

    una observación empírica para conocer su valor real (con -

    el nivel de precisión permitido por el sistema de medida)-

    pero si, como sucede en los casos aludidos, su valor real

    es alterado por la presencia de perturbaciones o "ruido" -

    aleatorios, es necesario estimar el valor del mismo a par-

    (1) La descripción se hace para el caso de © discreto por comodidad, pero no hay problema en considerar el caso continuo (así lo haremos en la sección siguiente al dar una formulación general).

  • - 1 2 -

    tir del valor observado.

    Imaginemos que los valores muéstrales posibles -

    son 91 9. . . . $©m . Para cada valor real © . existe, una proba

    bilidad condicional p. . =p(9- (9*.) de que se obtenga el -i J j i

    valor observado 9̂ (estas probabilidades podrían calcular-

    le 9 naturalmente, si se conoce la ley de probabilidad con-

    junta o$ lo que es lo mismo, si se conoce el tipo de ruido).

    En el supuesto discreto las P-ĵ formarán una matriz de di-

    mensiones n xm .

    A la vista del valor observado y de las correspon

    dientes probabilidades Pj_ y P• . pueden tomarse las distin

    tas decisiones de aceptar la hipótesis de que el valor real * i' =fe c e

    de ©"" es 9 , ? ( , , , ,©~ que designaremos & - . , . . . a ,

  • -13-

    1.3. FORMULACIÓN GENERALa

    Vamos ahora a formalizar matemáticamente lo di—

    cho en la sección anterior, cuando describimos de un modo

    somero un proceso de decisión.

    Vamos a suponer que tratamos de estimar la fun—

    ción de t, 9*(t). Como es natural sus verdaderos valores -

    no nos son accesibles porque son perturbados por un cierto

    ruido n(t), de forma que los valores observados correspon-

    den a ©(t). En principio puede suponerse que la superposi-

    ( 1 ) ción del ruido a l a seña l es ad i t i va v J

    ©(t) = ©*(t) + n ( t )

    lo que nos pe rmi t i rá e s t a b l e c e r r e l ac iones en t re l a s l eyes

    de probabi l idad respect ivasc

    Tomaremos -una muestra de © de n v a l o r e s , ©.* ,

    ©2?.. • • * 9 n , en l o s i n s t a n t e s t - , . * . v , t , y formaremos -

    con e l l o s e l vec tor de l a s observaciones 8= ( 9 1 , . . i # 1 6 r l ) •

    Este se corresponde con e l formado por l o s va lores r e a l e s

    ©*(t.j) =©* , . . . . . , ©*(tn) =©* , es dec i r con O* = ( .©*, . . . . .

    ©* )

    (1) Dicha h i p ó t e s i s no es gene ra l , n i s iqu ie ra r e a l i s t a en muchos casos o Esto no obsta a l a va l idez del razonamien to que s igue .

  • - 1 4 -

    En nuestra primitiva descripción, tomar una deci

    sión era simplemente dar como valor real un determinado ©*!

    y se la designaba por

  • P C Í , " ? * ) = P d ( ¿ ( "©) P ( © , © * ) =

    = p a ( 5 | ©) p ( 9 | © * ) s(9*) (1.2)

    siendo s ^ / ^ . «*,

    p (9 , 9 ) Densidad de probabi l idad conjunta de 9 a5

    p¿( S j 9) Densidad de probabi l idad condicionada

    de tonar £ cuando se ha observado 9 #

    p(©|© ) Densidad de probabi l idad condicionada

    de observar 9 cuando e l va lo r r e a l es

    9 ~ .

    /"^¿\ s(9 ) Probabi l idad ,fa pr ior i 1 1 de que e l va lo r

    r e a l sea 9 .

    Como es lógico, el conocimiento de las anteriores

    funciones de densidad presupone el conocimiento de las ca-

    racterísticas estadísticas de la señal y el ruido, salvo -

    pn(£|9) que 9 naturalmente, es la que queremos determinar.

    Por otra parte conviene señalar que, en algunos casos, di-

    chas densidades se convertirán en distribuciones tipo "del

    ta de Dirae" o, lo que es lo mismo, se tratará de probabi-

    lidades discretas.

    Con la ayuda de (1.2) la expresión (1.1) se oon-

    vierte en la siguientes

  • - 1 6 -

    R ( s , p a ) =

    = / / J L ( 9 * , S) p d ( ? / 0 ) p(©("©*) s(9**)d9* cl91 ..M. dcTj — d¿n E v E o E d ( 1 . 3 )

    (E , E 0 y E¿ son l o s e s p a c i o s do l a s e ñ a l , de l a s o b s e r v a -

    c i o n e s y de l a s d e c i s i o n e s ) .

    A ' E [L(9 , Ǥ ) J l o hemos des ignado por R(s 9 p d )

    y l e l l amaremos , s i g u i e n d o l a t e r m i n o l o g í a de Wald, r i e s g o

    medio. Depende, supues t a dada de antemano L(9 ? c> ) * ¿le l a s

    p r o b a b i l i d a d e s ,!a p r i o r i M s ( 9 ) y de p d (o>)9 ) .

    Si se de f ine un f ? r iesgo c o n d i c i o n a l " 1 (9 , P-J

    c orno

    1(3* , Pd) =

    L("9*9

  • - 1 7 -

    R(s9pd)= Z L±3 p i k p d ( f j K ) s i

    i , j , k

    K©i* ,P d ) = 2 Li j P i k P d ^ o l ^ k ) ^ -8 )

    Se t r a t a 9 pues, de monimizar e l r iesgo e l ig iendo —*» « •

    l a P¿(

  • -18-

    1.5. CASO BINARIO.

    El problema de la detección binaria es suficien-

    temente conocido, pero vamos a dar una ligera ojeada al -—

    mismo que nos servirá de introducción.

    Suponemos que en el espacio de las señales hay -

    dos subconjuntos posibless el correspondiente al mensaje -

    nulo y el del mensaje no nulo con las probabilidades respec)

    tivas Q y P (naturalmente P + Q=1) y que la función do

    densidad del mensaje no nulo es S- (O ) . Por lo tanto la -

    (1)

    densidad s e r á v ' } i

    S(9**) = P S ^ ? * ) +Q S (&*-o) (1.10)

    Supondremos que sólo hay dos hipótesis H y H-,

    correspondientes a admitir que no hay mensaje o que sí lo

    kay* y Por 1° tanto sólo son posibles las decisiones £Q y

    o-. . Entonces?

    P d ( l |e) = Pd(J0l ©) S (S-¿0) +Pd(á,l©5 § (é-3,) (1.11)

    Como es n a t u r a l se t i ene que s

    P d ^ o l ® > + P d ^ l ' ^ = 1

    La función de pérdida puede darse cornos

    (1) Las £ (•) son d i s t r i b u c i o n e s "de l ta de Dirac'1 .

  • -19-

    "* -* L(9* = o, §Q) = L ^ *] ,-fi± L(9 S = o, ^) = L12 i

    L(*©* ¿ o, $Q) = L21 L("0* ¿ o, ¿.f) = L 2 2 J

    (1.12)

    Llevando (1.10), (1.11) y (1.12) a la expresión

    del riesgo se tiene (llamando E v y Ev- a los subconjun-

    tos de E v correspondientes a señal nula y no nula)%

    R(s ,pd) = / Cp s1 &*) + Q ̂ (®* " o)] a©*..... de¿* x

    x /" P(T|i**) [Ll 1 Pd( í 0 | ©5 + L21 P d ( JQ | £j

    + L 1 2 p d ( < 5 1 | ©) •Í-L22pd(1 / S1 (©*) p(9*"( "?*) d © * , . . . . d9n*J d©1 . . . . „d9n

    'E0

    + PL,

    v

    *• / P a ^ i l " ^ rQL12p(©*Jo) +

    / S.,(©*) p(©'|'©*)d©*. d©^J d © r . . . . d©n 4-PL22 1 (1.14)

    Si introducimos l a s probabi l idades de los e r r o r e s

  • - 2 0 -

    de p r imera y segunda c l a s e

    £, = / p ( 9 | o ) Pd(

  • - 2 1 -

    Es decir

    R(s ,p d ) =QL 1 2 4-PL 2 2 4- / Vd(S0¡

    JB0

    T) P(Lo, -Loo) I -

    - Q Í L ^ - L ^ ) p(0 | O )

    siendo I =

    UVJ r e © o a ~ C l f e v

    ,7 * *x ^ *

    (1.17)

    *

    'EV

    p ( © | 0 * ) ' s 1 (9*) d©', d©^ (1.18)

    1

    A la v i s t a de (1.17) e l r i esgo será minino cuan-

    do se n in in ice l a i n t e g r a l del segundo miembro. Habrá dos

    casos?

    12) P(L2 1 - L 2 2 ) I - Q d ^ - L ^ ) p ( 9 | o ) > 0

    entonces debe se r P¿L^ol ®) = 0

    22) En caso c o n t r a r i o debe se r P^ít^oj ©) = 1

    Si fornanos l a l l anada "razón de ve ros imi l i tud

    genera l izada"

    A =

    y nácenoss

    p f .s.,(©*) p(G*|^*) d©*, d©n*

    Q p(© |o )

    y= _- l£J l - l l . L21 ~L22

    tendremos que l a reg la bayesiana será

    A )f escoger £^

  • NOTAS Y REFERENCIAS AL CAPITULO 1

    -La Teoría de la Decisión es principalmente crea

    ción de Wald^ las referencias básicas sons

    Wald, A.: "Basic ideas of a General Theory of

    Statistical Decisión Rules", Proc. Int. Cong. Math, , 1950

    (visión general e introductoria sobre la materia).

    Wald, A.s "Statistical Decisión Functions", Wi~

    loy, New York, 1950 (texto fundamental que recoge la labor

    del autor y otros matemáticos sobre la materia en los años

    anteriores).

    -La formulación de la Teoría de juegos se debe al

    genial Von Neunann (a partir de 1928)5 la primera obra de

    conjunto esz

    Von Neumann, J. y Morgenstern, 0.: "Theory of -

    Games and Economic Behavior", Princeton University Press,

    1941 (2S ed. , 1947).

    -Una obra didáctica sobre la materia es:

    McKinsey, J.: "Introduction to the Theory of Ga-

    nes% McGraw-Hill, New York, 1952. (ed. esp. en Aguilar).

    -Obras tratando conjuntamente Teoría de la Deci-

    sión y Teoría de juegos sons

    Blackwell, D.. y Girshick, M.A. t "Theory of Games

    and Statistical Decisions", Wiley, New York, 1954.

    Luce, R.D, y Raiffa, H. 1 "Ganes and decisions",

    Wiley, New York, 19 57.

  • - 2 3 -

    2. PROCESOS DE DECISIÓN NO SECUENCIALES EN CONTROL ADAPTIVO

    S un a r i o

    2.1. INTRODUCCIÓN.

    2.2. DETECCIÓN PARA UN CASO NO BINARIO. CALCULO

    DEL RIESGO.

    2.3. DETERMINACIÓN DE UNA REGLA BAYESIANA.

    2.4. APLICACIÓN A UN SISTEMA ADAPTIVO.

    NOTAS Y REFERENCIAS.

  • - 2 4 -

    2- PBCCESOS DE DECISIÓN NO SECUENCIALES EN CONTROL ADAPTIVO

    2.1. INTRODUCCIÓN.

    Hemos adelantado en la exposición hecha anterior

    mente que la Teoría de la Decisión permite resolver proble

    mas de Comunicación y Control sumamente interesantes. Sin

    embargo nos hemos limitado al caso de detección "binaria -

    con un sentido elemental y poco realista.

    En efectos en situaciones normales es frecuente

    que nos veamos en la necesidad de estimar el valor de para

    metros (características de sistemas dinámicos, factores am

    tiéntales, etc.) con un campo de variabilidad amplio. En -

    tales casos supondría una simplificación drástica el redu-

    cir dicha gama de valores a una opción binaria y es, por -

    lo tanto, lógico extender ésta a una serie de valores dis-

    cretos, suponiendo que durante intervalos de tiempo prees-

    tablecidos dicho parámetro permanece constante y cambia al

    pasar de uno a otro. Esta hipótesis será tanto más apropia

    da cuanto menor sea la máxima de las amplitudes de los in-

    tervalos y monos rápida la variación del parámetro conside

    rado.

    En una primera fase nos ocuparemos de procesos -

    de decisión no secuenciales, es decir de procesos tales que

    se toma una muestra de tamaño pre de te armiñado y se decide -

  • - 2 5 -

    en consecuencxa e

    2 . 2 . DETECCIÓN PARA UN CASO NO BINARIO, CALCULO DEL RIESGO,

    Supongamos que se t r a t a , de e s t i m a r e l v a l o r 9 * ( t )

    d e l parámet ro observado O(t ) = Q ^ ( t ) + n(fc) como hemos h e -

    cho anter iormentOo Dividamos e l campo de v a r i a b i l i d a d do l

    c i t a d o parámet ro en N i n t e r v a l o s Cj , Cp? * . . . * %«i?°N como

    se i n d i c a en l a f i g u r a 2,1

    e(t)

    o*(t)

    f °N

    e( t )

    ¿^©4(t)

    ^ - ^ < /

    \~^^7%?Q^ i ©V | 1

    r^\ *?T 1 c 2

    ¡ c1 i J ! l

    e n

    I mm

    t1 t2 n

    Figura 2 * 1

    Se trata9 pues, de sustituir el problema de deter

    minar exactamente 0*(t) por el de saber en qué intervalo -

    se encuentra.

    Tomemos n observaciones en los instantes t-j ,. .

    . o 9 tn y sean sus valores 9̂ ,. . .. 99 n . Formemos el vector

    1 '̂ n-

  • - 2 6 -

    siendo E0 e l espacio de l a s observaciones y n e l tamaño

    es tab lec ido "a p r i o r i " de l a muestra no secuenc ia l .

    Imaginemos que e l espacio n~dimensional E0 e s t á

    dividido en N subcon juntos L-, • .... ,L¡j cada uno en cor res—

    pondencia con los i n t e r v a l o s C J , . . , . , C J J del campo de va r i a

    b i l i dad de 9 * ( t ) . La h i p ó t e s i s % de que e l ©*(t) verdade-

    ro e s t á en C¿ so acepta cuando 9 6L^ . La decisión de acej3

    t a r HJL se designa por ¿¡. ( i = 19 2 , . . . , N) * Llamaremos

    Lj_.j =L(C¿, £•) a l a función no negat iva de pérdida por e l

    e r r o r de tomar l a decis ión o. cuando © ( t ) e s t á en Cj . -

    En es te caso e l espacio de decis iones se reduce a l conjun-

    to d i sc re to < 1 9 „ O . , N [ •

    El r iesgo medio serás

    R(?f s, pd) = 2 1 2 L ^ i / P d ^ j l0 ) L ( c i * f j ) dGi d e n x

    i=1 j = i -^Li

    x / p(©|C±) S±(©*) d©* (2.1)

    siendo? C±

    5*. Probabi l idad "a p r i o r i " de que ©*(t) €C¿ ,

    S^(9*) Densidad de probabi l idad de 9*(t) cuando

    ^ ( t jCCjL .

    p^(

  • - 2 7 -

    2 1 f± S i(9*) d0á == 1 f±^ O Si(9*) 2 0 V i

    i=1 Jo±

    N

    Por otra parto pCOJC^) os la probabilidad condi

    cional de que el vector observado sea Q cuando 0^(t)

  • - 2 8 -

    E l r i e s g o "a p o s t e r i o r i " s e r á en toncess

    -* JL - V.(9) r.(9) = X- ^i \¿ = "f—¿" (2.6)

    s iendo -*• -#• Vd(©) = 2 1 F± L13 q±(©) (2.7)

    i=1

    2-3- DETERMINACIÓN DE UNA REGLA BAYBSIANA.

    Apl icando e l teorema de Wald tendremos que: l a -

    cond ic ión n e c e s a r i a y s u f i c i e n t e partí que p ¿ sea l a s o l u -

    c ión b a y e s i a n a , dadas unas p r o b a b i l i d a d e s ,!a p r i o r i " , que

    minimiza e l a n t e r i o r r i e s g o e s que

    P d ( m i n r k ( 0 )

    Es d e c i r que p - . ( £ . )©) e s n u l a pa ra t odos l o s -

    v a l o r e s de j excep to paira uno que v a l e l a un idad y que e s

    e l c o r r e s p o n d i e n t e a l mínimo de r . (9) que (por l a fórmula J

    ( 2 . 6 ) ) c o i n c i d e con e l í n d i c e p a r a e l que se hace mínimo -

    V d ( 9 ) . E

    ópt ima)s

    V. (O). Es d e c i r (des ignando con -un a s t e r i s c o a l a d e c i s i ó n J

    d

    s iendo

    P d ( §,* \ ©) = 1 s i j = k ^ ( 2 . 8 )

    P

  • - 2 9 -

    Vk(9) = min V.(0)

    En resumen, tendremos que el riesgo mínimo vale

    N

    R(J, s, p*) =Y1 / ^i L^Ci^k) ̂ i ^ d91 ' d92 • i=1 «'IH

    d0,o

    o también R( s, P(f) » ^ j Vk(0) d O ^ , . .. . d9n

    Jk .-*> siendo k el índice que minimiza V.?(@) .

    2.4o APLICACIÓN A UN SISTEMA ADAPTIVO.

    Es posible c o n s t r u i r un d i spos i t i vo de decis ión

    que corresponda a l a a n t e r i o r reg la y u t i l i z a r l o en un s i s

    tema de con t ro l adaptivo del modo que indican l a s f i gu ras

    2.2 y 2.3 .

    Entrada

    Dispositivo de decisión

    K&~

  • - 3 0 -

    o(t) M u e s t r e d I I r

    O-;N

    |vy

  • - 3 1 -

    N

    * = ZL R(Ci,Pd)

    i=1

    R(c± , pd) = 0) q i(©) d01 . , d©n

    Volviendo a u t i l i z a r e l teorema de Wald t e n d r e -

    mos que en e s t e caso

    P * ( á . j l O) = 0 s i j / k

    s iendo k e l í n d i c e t a l que

    Vk(9) = min V,(9)

    k . 3

    pero en e s t e casos

    N N

    y e ) = SIFiii3- q i ( í = Z fi %(" - y3 4d(sj i=1 i=1

    es decir que el mínimo de V-(©) corresponde al máximo de J

    ? i q.i(&) ( l o c u a l e s l ó g i c o y r e p r e s e n t a a l a i d e a de ma~

    x i m i z a r l a p r o b a b i l i d a d de e r r o r n u l o ) .

    Por l o t a n t o , l lamando Xn-(©) = jT¡ Q.-?(©) Ia r o g l a

    de d e c i s i ó n quedas Adoptar

  • Es fácil para el caso de procesos gaussianos en-

    contrar formas simples de /L (©) que permiten dar reglas -d

    de decisión en formas cómodas; las omitimos dado que no es

    nuestro fin y pueden encontrarse en las referencias que se

    citan. Del mismo modo pueden resolverse problemas comple-—

    jos como el de la identificación de sistemas.

  • - 3 3 -

    NOTAS Y REFERENCIAS AL CAPITULO 2

    - A p l i c a c i o n e s de l a Teor ía do l a Dec i s ión a l o s

    problemas de comunicación pueden e n c o n t r a r s e en l a monumen

    t a l y e n c i c l o p é d i c a obra de Middle ton sobre l a t e o r í a e s t a

    d í s t i c a , de l a s comunicaciones (más de 1100 págs .5 r e f e r e n -

    c i a s abundan t í s imas a l o s t r a b a j o s o r i g i n a l e s , en inmensa

    p roporc ión d e l p rop io a u t o r ) .

    Midd le ton , D. 1 nAn I n t r o d u c t i o n t o S t a t i s t i c r a l

    communication Theory11, McGraw-Hill , New Yocpk, 1960 0

    -Una s u g e s t i v a i n i c i a c i ó n a l p a p e l de l a Teor í a

    de l a Dec i s ión en e l C o n t r o l Adapt ivo ( e s c r i t a cuando no se

    h a b í a t r a b a j a d o mucho en dicho s e n t i d o ) se puede l e e r ens

    T r u x a l , J . G . y P a d a l i n o , J . J . s "Dec is ión Theory" ,

    en l a obra c o l e c t i v a "Adaptive Con t ro l Systems" ( e d i t a d a -

    por Mishkin , E. y Braun, L . ) , McGraw-Hill , New York, 1961.

    - N u e s t r a d e s c r i p c i ó n s i g u e , en buena p a r t e , l a -

    monografía a l u d i d a en l a I n t r o d u c c i ó n s

    Sawaragi , Y , , Sunahara , Y. y N a k a m i z o , T . : " S t a -

    t i s t i c a l Dec i s ión Theory i n Adapt ive C o n t r o l Sys tems" , Aca-

    demic P r e s s , New York, 1967.

  • - 3 4 -

    3 . PROCESOS DE DECISIÓN SECÜENCIALES EN CONTROL ADAPTIVO

    S u n a r i o

    3 . 1 . INTRODUCCIÓN.

    3.2. RIESGO MEDIO EN UN PROCESO SECUENCIAL.

    3.3. SOLUCIÓN BAYESIANA.

    3.4. CASO BINARIO.

    3.5. MODIFICACIÓN PARA EL CASO DE MAS DE DOS ALTER-

    NATIVAS.

    3.6. APLICACIÓN A LOS SISTEMAS ADAPTIVOS.

    3.7. CALCULO DE LAS CONSTANTES.

    NOTAS Y REFERENCIAS.

  • -35-

    3- PROCESOS DE DECISIÓN SECUENCIALES EN CONTROL ADAPTIVO.

    3-1. INTRODUCCIÓN.

    En el capítulo anterior presentamos un sistema -

    adaptivo que incluía un elemento de decisión de tipo no se

    cuencial. En muchos casos una solución no secuencial es in

    viable -o es poco práctica- y es necesario recurrir a una

    de tipo secuencial9 en cuyo caso el tamaño de la muestra -

    (o, lo que es lo mismo, el tiempo total de observación) no

    se preestablece9 sino que queda indeterminado 5 es decir, -

    después de cada toma de datos se consideran las alternati-

    vas de aceptar una decisión final entre las varias posibles,

    o de continuar el proceso. Como es obvio este procedimien-

    to resulta lógicamente más correcto y económicamente más -

    razonable ya que se toma la muestra del tamaño necesario y

    suficiente para decidir con un nivel de seguridad acordado

    de antemano.

    3*2. RIESGO MEDIO EN UN PROCESO SECUENCIAL.

    Cuando estamos efectuando un proceso de detección

    secuencial el mdtodo a seguir es el siguiente.

    Al observar los n primeros valores del parame—

    tro ©̂ ,. o • 9 ©n que forman un vector ©n debe optarse entre

    las decisiones siguientes? aceptar la hipótesis H-j de que

  • - 3 6 -

    o. -P

    © ( t )€C- j (á =1*••• ,N) a l a que designaremos SA (decis ión

    f i n a l j ) , o l a de segui r observando v a l o r e s , a l a que de —

    signaremos por S (dec is ión de c o n t i n u a r ) .

    El vec tor

    Pd = P d ( Í } = t d ^ / l ° n ) f •••» P d ^ / l ^ J

    nos da l a regla de decis ión f i n a l ya que sus componentes -

    representan l a s probabi l idades de tomar l a s dec is iones — c f ' c f -^ £,. , ••• ,

  • P*^ l°l> = [ P ( ^ Í "01).---.P(^|cN-)]

    Entonces e l r i e s g o medio v a l d r á ;

    ao N N / / * f ^ - |

    RÍPÍ %) = Z E Z. / , / r k> ¿á (^)J *

    k=1 3=1 1=1 / E ^ ^C± L

    x p±(©*) p d ( ^ f ©fc) p C e ^ C ^ ) d©1 d©kd©* ( 3 . 2 ) Si se h a c e ;

    p.(©*) = ? . S ± (©*) = ? i í (©* -©i*) ( 3 . 3 )

    La e x p r e s i ó n d e l r i e s g o ( 3 . 2 ) puede p o n e r s e ;

    R( 5"» Pd) = H H/ ? k=1 ig=1 ^E k

    0 ± . ¿ l ( © f c ) X

    x P d ( ¿ í | ©fe) p(©kl C±) d9 1 0 d ^ (3-4)

    3 - 3 - SOLUCIÓN BAYESIANAo

    posic

    Llamemos 6 al conjunto de los puntos cuyo vector

    ición 5 = ( j£p ... •,

  • - 3 8 -

    que resultan aceptables, vamos a e legi r una que verifique

    Ly = 0 si i = ó

    L i ; j > O si i ¿ 3

    Definamos la función

    N

    3 = 1 hi

    Tenemos 9 pues, N funciones ^ . ( ^ ) de modo que

    a K ^ S v le corresponden N valores 7?. ( TjT) ,. . • , ̂ gL( ̂ ) •

    Nos es posible establecer una nueva función de forma que a

    cada vector ^ se le asigne el mínimo de los ^P. (jy ); es -

    decirs

    Para cada valor de

    dirá con alguna de las *2£(j§")« Entonces definimos el sub-

    conjunto V. O Q por la siguiente condición

    = muí i

    Se pueden probar fácilmente los dos siguientes -

    asertoss

    12) Todos los V- son convexos y cerrados, J

  • - 3 9 -

    2 )̂ Los Y^ son disjuntos dos a dos,

    Si se define el conjunto V como

    V = N

    1=1

    su complementario será

    N

    i=1 x

    Entonces se puede establecer la regla "bayesiana"

    de decisión correspondiente a las probabilidades "a priori , f

    dadas por 1? = ( ^ \ 9 • . . 9 "3?JJ) que sigue.

    R e g l a .

    1*- Si 3i "kal Q.ue 5̂ 1 = y €. Vi no se hacen ob-f 5*

    servaciones y se toma la decisión £ . j si ^ € V1 se hace

    una observación 9. = (©.,) y se calcula el vector de proba-

    bilidades ,!a posteriori" 2T2 = ( £ l p 9 . • . , *^TP) a Par*fcir de

    ^ y 01 (utilizando la fórmula de Bayes).

    2.- Para cualquier S^j- (n = 1 ,. . . , oo) se actúa

    análogamente; ew decir i si J - *^al «* o

    la decisión £ . , si ^nj.-iSV1 se toma la decisión ^ pa-

    ra lo que se hace una. nueva observación Q ± , se calcula

    ^ n x 2 a partir de y n + 1 y ©n+1 = (©-,,..., 9 n 4 1) .

    3 . - Se continúa hasta tomar una £ ¿¡ . J

    El paso de $*n a 2Tnj.-j aludido no es otra cosa -

  • - 4 0 -

    que el cálculo de las probabilidades "a posteriori", a par

    tir de las f,a priori11 y las condicionales, utilizando la -

    fórmula de Bayes. De un modo simple podríamos representar

    dicho paso por un producto de la matriz A(n) por el vector

    inicial 5 9 e s 3-ecir;

    £ + 1=A(n))T (3.5)

    La matriz A(n) es diagonal y tiene por compo-

    nentes

    a±2in) = ~ww^Tñ~r ^ i j ( 3-6 ) WCií)~# i

    cons i , j = 19, f , , N , n = 1 9 2 , . . • .

    ^ H Í l ° i ) - Í l ? i P(í|0i> i=1

    5JL -n símbolos de Kronecker

    Naturalmente S1 coincide con ^ .

    3.4. CASO BINARIO o

    En el caso de ser N = 2 se puede representar O

    fácilmente o Se trata del segmento de recta representado en

    la figura 3.1 .

    Se cumple que

  • -41 -

    Figura 3.1

    fe V2 => % > n2=> ^2 L21 > 5*1 L12

    Si llamamos ( ̂ , 5p) £ & al punto tal que

    r„ '12 * i

    J21 3f 2 4 ^ = 1

    Entonces podemos poner que

    ? € V1

    ? € V C

    J2 >1

    F2 * 1

    . 1

    r2

    "?r ^ o ^» ^ O

    *2 * 92

    Por se r L y Vg d i s jun tos y cerrados e x i s t i r á n

    sendas cons tan tes a y b que cumplan

    o < y < a < 1

    y t a l e s que

  • - 4 2 -

    wmmW

    Scv1 o é ?2<

    Por lo tan to la reg la dec i sor ia e s t ab lec ida en

    e l párrafo a n t e r i o r puede ponerse como sigue

    f Tomar $^ s i £^ n + . j < b

    Tomar c£2 s i -2T2 nj..j > a

    c w*

    Tomar ^ s i b

  • - 4 3 -

    Análogamente

    . _ _ ^ P(%JO 2 ) a ri

    Por l o t a n t o l a r e g l a d e c i s o r i a puede e s t a b l e c e r

    se (cuando n ü ) como;

    Tornar ¿^ s i A (9 n ) < B

    Tomar S 2 s i ^ (9 n ) > A

    Tomar A(© n ) > B

    Habiendo hecho

    a 'Sf. b S 1 A = — 1 - B = - -

    1 - a T 2 1 - b ? 2

    A (0 n ) = — . _ £ — £ - - (n = 1 , . . . . oo) PC^JC,)

    Es d e c i r s en e l caso b i n a r i o l a r e g l a b a y e s i a n a conduce a l

    " t e s t " de razón de v e r o s i m i l i t u d e s s e c u e n c i a l .

    Es obvio que p a r a e l v a l o r e x c e p c i o n a l y s i n i n -

    t e r é s r e a l n = o l a r e g l a e s f

    Tomar ¿^ s i ^o< b

    Tomar S 2 s^ 2 ^ a

    Tomar £ s i b < S < a

  • - 4 4 -

    3.5. MODIFICACIÓN PARA, EL CASO DE MAS DE DOS ALTERNATIVAS.

    Cuando el valor auténtico de 9*(t) tiene un cam

    po de variabilidad suficientemente amplio para que sea acón

    segable elegir un N superior a dos se hace necesario apli

    car la regla establecida en 3.3 . Ahora bien, la aplicación

    estricta de la misma se hace prohibitiva? en primer lugar

    por la complejidad matemática que puede entrañar la aparen

    temente simple pregunta de si J^^V. ; en segando tdrmii&o

    -aunque fundamental desde nuestra perspectiva actual- por

    la complicación técnica del correspondiente sistema adapti

    vo.

    Se trata-, pues, de ampliar, convenientemente mo-

    dificada, la regla del caso binario al muí ti dimensional*

    Si 9*(t) puede variar en (-oo, 4-QO) y si se ha -(1\

    dividido éste en los N intervalos siguientes^ ''

    CJSC-GD, 9*),_.,cD. sCoji-p ©*)f..-# cN5(©¿-if +OD)

    tendremos e l problema de c o n t r a s t a r l a h i p ó t e s i s

    E. t 9*(t) 6Cd (3 = 1 M . M N )

    .4.

    Ahora biens la hipótesis, H^, de que © (tJfiO^

    (1) Si el intervalo es acptado bastará sustituir -GD, +00 por los extremos del mismo? esta variación no altera nada de lo que digamos•

  • - 4 5 -

    puede considerarse cono la conjunción (o intersección) de

    las dos hipótesis más simples siguientes;

    H~ : 9*( t )>9*_ 1 ( 9 * = - C D )

    H * : 9 * ( t ) < 9 * ( 0 * = + QD)

    H, = H .+ n H r J J U

    Pero cualquiera de estas hipótesis puede ser con

    trastada utilizando el test secuencial de la razón de vero

    similitudes que establecimos en 3» 4 • Por otra parte es in

    mediato comprobar que no hay que estudiar las 2N hipótesis

    H. ,. . . , HN y H/ , • .. , HJJ' ya que EL y HN* son ciertas —

    siempre y, por otra parte9 la hipótesis H. es la complemen

    taria (o negación) de la H. 1 9 lo que denotaremos escri—

    hiendo

    Por todo lo dicho tendremos ques

    Para contrastar H.* deberemos hacer e l t e s t des j

    crito en 3.4 . Para ello vamos a introducir algunas peque-

    ñas modificaciones,

    a) La primera es afectar a las constantes A y B

    y a la razón de verosimilitudes A (©n) de un subíndice que

  • - 4 6 -

    exprese a qú¿ hipótesis Hj* nos roferinos.

    b) La segunda os. ut i l izar sus logaritmos on vez

    de ellas mismas (lo quo da expresiones las simples en los

    casos más corrientes); así tendremos

    log A-j f log" Bj 5 «A 3 ( °n) - l 0 S A j ( e n )

    Con estas notaciones la política a seguir es la

    siguiente

    •.' R e g l a t ,>••'•''

    • Aceptar Hj si log A^-j «* .A ̂ * (On) y logBjj>

    - •'• Seguir el muestre o si no se cumplen ambas des i -

    gualdades para ningún j = 1,.»•, N •

    Teóricamente puoden calcularse A* y B*¡ del mis

    mo modo seguido en 3f4, poro ello exigiría el conocimiento

    de las probabilidades ?,a priorií} de que 9^(t) estuviera -

    contenido en los intervalos correspondientes y además a la

    asignación de valores a la función de pérdida. Por ello se

    adoptará otro procedimiento quo describiremos en 3 #7 .

    Por su parte A-í(©n) es9 siguiendo la pauta mar

    cada en 3.4, el cociente de las probabilidades eondiciona-

    les de que se encuentre en el muestreo el vector 0n cuan-

    do el valor real 0 (t) está por encima de ©?* o por deba-

    jo (análogo a pertenecer a C2 ó G-j- en el caso binario) ; -

    en algunos casos puede c 0:1 si dorarse que ambas zonas quedan

  • - 47 -

    caracterizadas -oor dos valores 0... y ©_. 0 tales que

    a -* ^ -*• p(e£|0*o) AA%) = ios ^ (Q^)=iog —--jS--^-- (3.8)

    0 píá.oj;

    siendo p(© n|0^) ? con k=1 6 2? la densidad de probabili-

    dad condicional de que se observe Q cuando el valor au-

    téntico es 0^_ .

    E s t o puede s e r p l a u s i b l e cuando e l ?6ampo de va

    r i a c i ó n de 0 * ( t ) e s pequeño f r e n t e a l de n ( t ) y además / *-' i x

    l a razón s e ñ a l a r u i d o e s grande « E l i n t e r v a l o (94-i90n-o) se denomina zona de i n d i f e r e n c i a 0

    3 . 6 . APLICACIÓN A LOS SISTEMAS ADAPTIVOS.

    Si ^ o s encontramos con un c i e r t o s i s t ema (proce

    so d inámico , p l a n t a i n d u s t r i a l , e t c 0 ) 9 cuyas c a r a c t e r í s t i

    c a s dependen de un pa rámet ro © ( t ) ? y queremos c o n t r o l a r

    e l mismo de modo que l a r e s p u e s t a sea óp t ima , n o s encon—

    t r a r ^ o s con e l problema de que l o s d i s p o s i t i v o s de con—

    t r o l deberán t e n e r n a t u r a l e z a mudable pa ra i r s e " a d a p t a n -te

    do11 a l o s v a l o r e s que tome 9 ^ ( t ) . Si hacemos l a h i p ó t e s i s

    de que no e s n e c e s a r i o c o n s i d e r a r cambios c o n t i n u o s de -

    0 ( t ) s i n o que e s p o s i b l e c u a n t i f i o a r en íT v a l o r e s d i s c r e

    t o s su campo de v a r i a b i l i d a d y que a cada uno de e l l o s l e

    conviene un c i e r t o s i s t ema de c o n t r o l podremos a p l i c a r l a

    t e o r í a a n t e r i o r . E l r e s u l t a d o so esquemat iza en l a f i g u r a

  • adjunta

    - 4 8 -

    Entrada +

    Selector

    Calculador A,s B U Circuito

    Logioo

    r1

    Controladores adaptados a los distintos valores de

    o(t)

    •A^V

    J2_ ¿,

    Elemento conmutación

    Calculador

    3E ¡Medidas de i muestreo

    ~]

    _J

    Sistema a con t ro l a r

    R e a l i m e n t a c i o n

    ©*(t)

    Salida

    Fig. 3.2

    Si se supone el caso especial de que la señal y

    el ruido sean aditivos y dsto sea gaussiano (y aceptamos -

    la hipótesis apuntada al final de 3.5) tendremos que las

    densidades de probabilidad condicionales serán distribucio

    nes normales multidimensiónales con la media en el valor

  • - 4 9 -

    auténtico do la señal;

    P ( 9 n l e j 2) = " 7 G ( 3 * 9 )

    V(27T)n JM)

    l w ' * >> ' M - 1

    - e 2 V n

    \¡(27T)n |M)

    donde M y M""' son la matriz de correlación y su inversa.

    |M| es ol determinante do la misma.

    9^ el vector columna que tiene por componen-

    tes los valores muostrales0

    9.^ (k=1 ó 2) el vector cuyas n componentes

    son iguales a 9 ^ .

    (9n~9jk) el vector transpuesto del correspondiente

    Si las variables aleatorias ©,.,...,©n son indo

    pendientes 2

    M = cr i

    y se tiene que (3*8) en este caso quedas

    ¿ ^ i=1 ¿ 0 i=1

    (3.11)

  • - 5 0 -

    Que ope rando da:

    n A/V = 2 ( e * )

    2 - ( e * )2 W32 ^ j 1

    n

    ^ i=1 G i

    y finalmente

    Apn) 9 n > a.-^-j (n)

    s i e n d o ; — 1 n ©n = ^>~ 9. l a media m u e s t r a l de n o b s e r v a c i o

    n -j n o s

    a (n) - ° ~ l 0 g A 3 x ° 3 1 * ! 3 2 _

    * (n)

  • -51 -

    3.7. CALCULO DE LAS CONSTANTES,

    El número de observaciones que hay que hacer es

    una variable aleatoria. Por lo tanto podemos estudiar la

    probabilidad condicional de tomar la decisión final de -

    aceptar la hipótesis H-j de que 9 (t)€C-j cuando el valor

    real es 8, ó QTk (supuestos dos valores únicamente corres

    pondientes a las dos zonas C, y C2). Esta probabilidad

    la designaremos por L(0. ) (i = 1 ó 2) y su valor será

    L ( 9 Í ) = 5 T / p(en|e*) aor...., aon n=iJAi

    siendo J7. el subconjunto de E^ formado por los vectores

    9n tales que, según la regla adoptada, conducen a tomar -

    la decisión final H-j después de n observaciones.

    En el caso de regla bayesiana anteriormente des

    crita SL estará definido por

    (3.13)

    La probabilidad M©j_ ) puedo también ponerse en

    función de los errores 6.. y 6» de primer y segundo tipo

    !(©*) = 1 - £-, (3.14)

    !.(©*) = S 2 (3.15)

  • - 5 2 -

    Por o t ra p a r t e , como;

    © ^ / ^ z z ^ p ( ^ | 9 * ) : £ B p ( 9 > * )

    se tendrá ( integrando en Jl y sumando)

    L(©2*) ¡ ¿ S I (O*) (3.16)

    y por lo t an to

    2--;c:B (3.17)

    Análogamente s i llamamos L ' (9^ ) l a probabi l idad

    condicional de tomar l a decis ión f i n a l EU se tendrá

    OD

    '(©*) = 2 1 / P(^|©i*) d©- d 9 n /il¿

    y ahora

    9 € -a' B < JM~%- < A, V k

    (3.19)

    Pero, en es te caso ,

    L ' ( 9 * ) = 1 - A L ' ( 9 * ) (3.22)

    Es dec i r

  • -53 -

    1 - £2 - — ¿ - ^ A (3.23) £1

    Esto quiere decir que A y B deben tener unos va

    lores tales que verifiquen las desigualdades anteriores -

    respecto a las probabilidades de los errores de primero y

    segundo tipo* Ahora biens resulta que determinar directa-

    mente A y B obliga a una serie de cálculos, más o menos -

    laboriosos, basadow en las probabilidades ,!a priori" (mu-

    chas veces calculadas con hipótesis sólo relativamente —

    plausibles) y en el establecimiento arbitrario de los va-

    lores Lj_-j de la matriz de pago5 sin embargo es fácil y -

    lógico establecer do antemano los valores de S y £

    que nos dan los niveles de significación de nuestro test*

    El único problema es que A y B están relacionados con £..

    y S por medio de desigualdades y, por lo tanto, no so

    puede calcular un valor único exacto (lo cual, por otra -

    parte, no tiene sentido dado que depende de los valores -

    de Lj-- arbitrarios que establezcamos).

    Veamos cómo resolver la cuestión % en primer lu-

    gar vamos a suponer dados ^ y * ? y que A y B los ha-

    cemos

    B = £ — A = ¿

    1 - s a ' 1 1

    naturalmente que las probabilidades de los errores de pri

  • .:/ ' - 5 4 -

    mer y segundo t i p o entóneos no t ienen porqué c o i n c i d i r ~

    con £* y &9% s;\ l a s dersignamos por £* y £•* se t e n -

    drá

    B = - _ £ L . > _ | L - (3o24)

    1 - *? i - a ; A = -

  • - 5 5 -

    que sumadas miembro a miembro dan

    Por lo tantos eligiendo A y B por las fórmulas indicadas

    se tiene un nivel de probabilidad de error inferior o igual

    al prefijado.

    Puede probarse que el test termina siempre (con

    probabilidad la unidad) para algún valor finito de n .

    En el caso de que haya más de dos alternativas

    será necesario pasar de A, Bf &* y £~ a Aj, B-j, £j-. y -•

    £0. como en 3,6 .

  • -56-

    NOIAS Y REFERENCIAS AL CAPITULO 3

    -Los métodos secuenciales tienen ya una larga Jais

    toria en Estadística; un texto clásico sobre la materia es

    el libro de Wald (citado seguidamente) en el que se encuen

    tran importantes resultados matemáticos de interds en Esta

    dística y otros campos de la Teoría de Probabilidades.

    Wald, A.: "Sequential Analysis", Wiley, New York

    1947.

    -Una breve idea de los métodos secuenciales pue-

    de leerse en el libro del Pr. Sixto 3íos que citamos.

    Bí : 3. .: . "Métodos Estadísticos" (5S edición)

    Ed. del Castillo, Madrid, 1967.

    -Los conceptos básicos de Cálculo de Probabilida

    des y Estadística que manejamos (fórmula de Bayes, distri-

    buciones, etc.) pueden encontrarse en el libro que acabamos

    de citar, o ens

    Cramer, H.s "Mathematical Methods of Statistics"

    Princeton University Press, 1946 (utilizamos la traducción

    de Cansado, editada por Aguilar).

    -Existe una abundante literatura sobre las apli-

    caciones de los métodos secuenciales a los problemas de —

    transmisión, detección, ruido, etc.* Sobre las aplicaciones

    al control adaptivo puede verse la monografía, ya citadfc/ cía

    el capítulo anterior, de Sawaragi, Sunahara y Nakamizo.

  • ^ 5 7 -

    -Una discusión interesante y profunda sobre sis-

    temas adaptivos con dispositivos de decisión se puede leer

    en el trabajo que citamos a continuación, y en el que se -

    encuentran esquemas de sistemas análogos al propuesto en -

    la figura 3 i 2 .

    Hsu, J.C. y Meserve, W.E#: "Decision-making in

    adaptive control systems", IRÉ Irons, PGAC 7 (N° 1), 24» 1962.

    -Debemos señalar, al terminar la breve exposición

    que ha constituido esta primera parte introductoria de núes

    tro trabajo, que han quedado fuera do su ámbito numerosas

    cuestiones de interés fundamental pero que se apartaban do

    nuestro fin primordial% preparar la presentación de los re

    sultados concretos que son objeto do I próximo capítulo*

    (En las referencias citadas se puede obtener cumplida infor

    mación sobre los temas aquí eludidos).

  • - 5 8 -4

    SEGUNDA PARTE

    CONTROL /ÜDAPTIVO CON DISPOSITIVOS DE DECISIÓN

  • 4. SISTEMAS DE CONTROL ADAPTIVO CON DISPOSITIVOS DECISORIOS

    S uní a r i o

    4 . 1 . INTRODUCCIÓN.

    4.2. FILOSOFÍA DE LOS SISTEMAS ADAPTIVOS CON DISPOSI-

    TIVOS DE DECISIÓN.

    4.3. REGLA SECUENCIAL PARA SISTEMAS ADAPTIVOS.

    4.4. LEY MULTINOMIAL SUCEDÁNEA DE LA DISTRIBUCIÓN REAL.

    4.5. REGLA DE DECISIÓN BASADA EN LA LEY MULTINOMIAL.

    4.6. TAMAÑO MEDIO DE LA MUESTRA.

    4.7. ESQUEMA DE SISTEMA ADAPTIVO CON DISPOSITIVO DECI-

    SOR.

    4.8. RECAPITULACIÓN Y COMPLEMENTOS.

    NOTAS Y REFERENCIAS.

  • - 6 0 -

    4. SISTEM/iS DE CONTROL ADilPTIVO CON DISPOSITIVOS DECISORIOS.

    4.1. INTRODUCCIÓN.

    En las páginas anteriores horneo hecho un ligero

    "bosquejo de las ideas más elementales de la Teoría de la-

    Decisión y aludido a algunas de sus aplicaciones a los -

    problemas de control automático. Vamos c. continuación a -

    utilizar dichas ideas para obtener regir.3 de decisión —

    -plasmables en dispositivos tecnológicos físicamente reali

    zables- que permitan la construcción de sistemas adaptivos

    en supuestos más realistas que los usuales (no linealidad,

    ruido no gaussiano9 etc.).

    Como se ha señalado en el capítulo anterior cuan

    do el ruido es gaussiano es relativamente fácil dar expre

    siones explícitas9 y cómodamente manipulables, de las re-

    glas de decisión correspondientes. Por el contrario cuan-

    do el ruido no es gaussiano, o cuando el sistema no es li-

    neal (lo que9 como es sabido, provoca que aún con entradas

    gaussianas no lo sean las salidas), las formulaciones de

    las reglas decisorias son impracticables e incómodas* Por

    eso, después de una exposición general de la filosofía de

    los sistemas adaptivos con dispositivos de decisión, pasa

    remos a describir un método que permite la simplificación

    de tales reglas para los oasos no lineales y no gaussianos

  • •-61 -

    mediante la sustitución de la ley de probabilidad real

    por una distribución multinomial que la aproxime apropia-

    damente o

    También propondremos un modelo teórico generico

    de una posible configuración típica de sistema, lineal o

    no, con parámetros variables y sometidos a perturbaciones

    aleatorias, controlado mediante dispositivos adaptivos in

    cluyendo elementos para la toma de decisiones de forma se

    cuamcial.

    4.2. FILOSOFÍA DE LOS SISTEMAS ADAPTIVOS CON DISPOSITIVOS

    DE DECISIÓN.

    Hemos presentado -a título de ejemplos- en los

    capítulos anteriores algunos sistemas de control adaptivo

    con dispositivos de decisión. Vamos ahora a esbozar las -

    líneas generales de la filosofía a que obedecen.

    Como es sabido un sistema controlado automática

    mente no es otra cosa que un sistema dinámico, al que se

    han superpuesto una serie de dispositivos de forma que el

    conjunto tenga una salida que, en algún sentido preestable

    cido, sea óptima. El ejemplo más simple es el del sistema

    con un lazo de realimentación.

    Un sistema dinámico tal que sus entradas varíen

    dentro de una gama muy amplia de posibilidades, que esté

    sometido a muy diferentes tipos de perturbaciones o que -

  • - 6 2 -

    sus propias c a r a c t e r í s t i c a s cambien a lo la rgo del tiempo

    no puede se r regulado apropiadamente por un controlador -

    de configuración f i j a , sino que és t e debe cambiar do un -

    modo que se adapte a l a s var iac iones suf r idas por e l s i s -

    tema a c o n t r o l a r . Un sistema con con t ro l adaptivo es un -

    sistema dinámico, cuyas condiciones de funcionamiento evo

    lucionan con e l tiempo, a l que se ha conectado un conjun-

    to de d i spos i t i vos suscep t ib le de adaptarse a l cambio del

    sistema de forma que l a s a l i d a t o t a l sea óptima en todos

    l o s regímenes de funcionamiento,, El ejemplo más simple

    puede se r e l sistema con ion parámetro va r i ab le regulado -

    por un controlador con una c a r a c t e r í s t i c a que se puede cam

    b i a r mediante unos elementos que miden e l va lor del c i t a -

    do parámetro, ca lculan e l más apropiado de l a c a r a c t e r í s -

    t i c a y l a modifican en t a l sent ido ( f igura 4.1)

    Entrada +

    "* ĴT

    Calculador de K(C) y adaptador

    Valor de C| » II

    Cambio de K

    i.

    Medidor de C

    Controlador con K

    variable

    Medida de C

    Sistema a con trolar con C variable

    Salida

    Figura 4#1

  • -63-

    Las modalidades y posibilidades del control adajs

    tivo son innumerables. Veamos en qué supuestos puede hacer

    se intervenir el concepto de proceso de decisión, genera-

    lizando así algunos de los ejemplos vistos en capítulos -

    anteriores.

    Supongamos un sistema a controlar que tiene uno

    o varios parámetros característicos cambiantes con el tiom

    po ( o incluso que es cambiante la propia configuración),

    que se encuentra en un entorno mudable, o que varía el tí

    po de entradas, y que estos cambios no pueden conocerse -

    determinísticamenté porque las variables observadas son -

    funciones aleatorias del tiempo debido a la existencia de

    ruido. Entonces se hace necesario un control adaptivo del

    sistema; pero el dispositivo de adaptación debe incluir -

    un elemento que, mediante la oportuna regla, decida la con

    figuración óptima no en función de un conocimiento cierto

    de la situación y de un criterio de optimización dado, si

    no en función de óste y de una estimación de la realidad

    basada en la minimización de un riesgo medio en el senti-

    do de la Teoría de la Decisión.

    Ya hemos visto ejemplos en los capítulos 2 y 3,

    en los que se tenían distintos controladores (por ejemplo

    de funciones de transferencia í^,... ,Fn) adaptados para -

    conseguir respuesta óptima segiin fuera el valor de un pa-

    rámetro variable del sistema a controlar (que llamábamos

  • - 6 4 -

    9*) ;. l a ragla.^dacxsoria,, permi t ía "'elegir-con ~riasgo mínimo

    ' a l valer- del- parámatro y por tanta* -el_ dal^3imtrjaladDr--apro

    piadjcu-"

    * '" •--"--—' ~YanuQ3-aliQra a planteamos-. .una-si tuación "basiran—^

    i ^ - g a n a r a X ^ ^ de - v i s t a t a ó r i o o ŷ ^ii^,cianta—-^^

    ..mente operativa^.desda-.-un punto -de v i s t a - p r a c t i c a r .'•—---••• '^

    """""* -•••-••^ra.) Sea -un- sistema- a c o n t r o l a r - ^aractetó^ajdo^or •' i

    *,tai,-*--paráme1n7a-v^2?iahl&-* 9^( t ) cuyos va lo res - supondrertas ~**w-

    'di^scretizadas-en ¥ 2ronas? C^^^.^Cj^. - - (£s_lnmediato wqua~,, i

    la.J£ormu33xiií5n ea...la .misma, si...las.jsonas- G-̂ > .̂̂ ^TC^ -CÍL ^vesf ~

    .da- .corre sptm.dar-a^interva:Los de-, va loras de, 0^(t.)-—;sa"refier"

    ran a subecnjuntos caíalasquiera da m o s p a c l a . multidjjaan^-^^

    s l ona l cayos apuntos- fuesen, r e pre s e n t a t i v o s de- l a s .distin—-

    tas.astados...del_...sistema),- .._ . ^._^—^-^ ~ -'

    .„ ^ -,^....... , _i>) Se- -dispone de un con junte de iT 'Contro3aadaras^"

    ~-oy l a que e s l o misma, de un- con t ra lador da caa^acijerístár--

    -cas v a r i a b l e a - que pueden, dise re t i z a r s e * en- N "conjuntos-apro

    xiioadaman t e af ina s a c a d a uno de e s t o s cen t ro oidores" es--él

    apropiada- para--dar . respues ta óptima del- sj^stama conjuntToy ^"^

    sagrin~um- criiiariQ-- de proyecto apropiado^ - ' - " -- — - __

    '•""" '^"'-~-^ de l sistema a - con t ro l a r T- -

    o una magnitud derivada- (por e jer tpla l a • dasviacdLán.. o - ~sonal_ A

    . de ~ e r r o r )-^.no "son^axac t amen t e -. conoc i d a s ^ p or l a presencia--•-"' •

    de ru ido-y e~s necesar ia .^utdJá^ar un -elemento, dacjasarlo que'

    ^permitaJaacer -una, est imación de r iosgq mlnijn.0, .(lo qua.^su—

  • pone, n a t u r a l n e n t e , que se conocen o se imaginan l a s l e —

    yes p r o b a b i l í s t i c a s de l a s c a r a c t e r í s t i c a s c i t a d a s y d e l

    r u i d o ) .

    d) Hecha l a e s t i n a c i 6 n se e l i g e e l c o n t r o l a d o r

    apropiadoo

    Es obvio que problemas p a r t i c u l a r e s cono e l de

    l a i d e n t i f i c a c i ó n de p r o c e s o s , a j u s t e a d a p t i v o de p a r á n e -

    t r o s , e t c « 9 son c a s o s p a r t i c u l a r e s d e l esquema p l a n t e a d o ,

    4 . 3 . REGLA SECUENCIA! PARA SISTEMAS ADAPTIVOS.

    Vamos gá /p l i ca r a l modelo d e s c r i t o en l a s ecc ión

    a n t e r i o r l a r e g l a do d e c i s i ó n que dedujimos en e l c a p í t u -

    l o a n t e r i o r pa ra p r o c e s o s s e c u e n c i a l e s de d e c i s i ó n .

    Cono h i c i n o s en l a s ecc ión 3*5 d i v i d i r e n o s e l -

    i n t e r v a l o de v a r i a c i ó n de 9 ( t ) en N zonas C p # . . 0 , C j j •

    Por o t r a p a r t e c o n s i d e r á r o n o s cono magni tud observada no

    e l v a l o r p e r t u r b a d o ©(t) s i n o l a s e ñ a l de e r r o r d e l s i s -

    t e n a e ( t ) - d i f e r e n c i a de l a e n t r a d a x ( t ) y l a s a l i d a y ( t ) -

    de l a que i r e n o s hac iendo n e d i d a s s e e u e n c i a l n e n t e s e ( t ^ ) =

    = e . , . 0 . , e ^ n ^ = e n 9 # # ° # $ ^OTinDJ0L^0 l ° s s u c e s i v o s v e c t o

    r e s de l a s o b s e r v a c i o n e s

    con e l n f i n a l no p r o f i j a d o .

    Nues t ro p r o b l e n a e s e l e g i r e l c o n t r o l a d o r ó p t i -

  • -66-

    mo, que caracterizaremos por el valor de un parámetro a ,

    entre los N posibles, que corresponderán a los valores —

    a^,a2,.M,ajj adaptados según el criterio de proyecto -

    adecuado a los valores de 9^(t) comprendidos en Cj,..#.

    .., Ojq- . En cada instante e(t) depende, aparte de la en-

    trada y de las perturbaciones, de y del parámetro

    a^ del controlador conectado en ese instante.

    En tales circunstancias -y en la hipótesis de

    que sean conocidas, o razonablemente estimadas, las propio

    dades estadísticas del sistema- podremos aplicar el test

    de la razón de verosimilitudes que dedujimos en 3.5 . En

    primer lugar: a la probabilidad condicional de que el ve£

    tor observado en n etapas sea e cuando el valor — —

    9*(t)€Cj y el parámetro del controlador es a¿ le desig

    naremos por g(en ja^C-j) • Análogamente a lo hecho en 3*5.

    consideraremos las probabilidades p(e^ I ^ Í ^ ^ ) y

    p(enJa¿,Dj) en las que:

    Df. es el complementario de D-*

    Di = U Ck

    y por lo tanto (ver figura 4.2)s

    Ci = D.-fi D». ', 3 J 3-1

  • - 6 7 -

    D'. .0

    t

    D á-i

    Parámetro del sistema

    a controlar © (tj

    I" i 2 *

    C J

    I 4' "d-1 %

    h- CD

    Parámetro del con-

    trol ador óptimos a-

    Párametro del con-

    trolador óptimos a. A 3-1

    ?igura 4.2

    Con las anter iores notaciones la razón de vero-

    similitudes generalizada para e l caso binario equivalente

    del t e s t secuencial ess

    P( í i | a i? D , ; j ) Ai.i

  • - 6 8 -

    A i á = - — - ^ ¿ - ( 4 . 2 a )

    113

    Bii = -fJ— (4.2b)

    s i g n i f i c a n d o : e l p r imer s u b í n d i c e ( i en l a s fó rmulas ) e l

    e s t a d o a c t u a l d e l c o n t r o l a d o r ; e l segundo s u b í n d i c e ( j en

    l a s fó rmulas ) co r re sponde a l a h i p ó t e s i s a c o n t r a s t a r ; e l

    í n d i c e numérico 1 ó 2 a l u d e a l o s e r r o r e s de p r imera o se

    gunda c l a s e , cuyas p r o b a b i l i d a d e s r e s p e c t i v a s se des ignan

    ^ 1 i i y ^21 j * ^~ " b a i a a a o d G l a mues t ra v a r i a b l e e s n .

    Con d i c h a s n o t a c i o n e s l a r e g l a de d e c i s i ó n os -

    l a s i g u i e n t e .

    REGLA

    a) En una e t a p a n y cuando e l c o n t r o l a d o r oonec

    t a d o e s e l de pa rámet ro a^ .

    Si 3 j , l o g A . . ^ < J L l f j » 1 ( n ) 7 l o g B i á >

    > J f L . . (n ) se pone e l c o n t r o l a d o r de pa rámet ro a^ ( j pue

    de c o i n c i d i r con i ) .

    b) Si no hay ningún 3 t a l que se cumplan s imul

    táneamente l a s dos d e s i g u a l d a d e s a n t e r i o r e s se c o n t i n ú a -

    e l mues t reo pasando a e ± 1 .

    OBSERVACIÓN

    Se ha supues to que e l s i s t ema t i e n e un e lemento

  • - 6 9 -

    de memoria y que, por lo tanto, "sabe" el controlador que

    está conectado; esto es tecnológicamente muy simple de ~-

    conseguir (cualquier circuito multiestable puede servir a

    tal fin). Caso de que el sistema no tenga memoria sería -

    válida la anterior regla pero habría que hacer variar el

    índice del controlador también de 0 a N y buscar la pare-

    ja (ij) que cumpliera las desigualdades*

    En muchos casos será posible sustituir en la ex

    presión de «JL. .(n) los subconjuntos Dj y D1. por valores

    característicos de que llamaremos 0 ^ y 9-2 •

    En algunos casos es posible obtener expresiones

    de A. .(n) relativamente manejables; uno típico es el del

    sistema lineal con un parámetro 0*(t) variable y con en-

    trada aleatoria formada por ruido gaussiano (como es sabi

    do también lo será la salida y el error e(t) ). Cuando el

    sistema no sea lineal o el ruido no sea gaussiano raranen

    te será posible obtener una expresión de la razón de vero

    similitudes cómoda; per eso vamos a introducir una distri

    bución multinomial para sustituir a la auténtica en la -

    próxima sección.

    (1) Véase lo dicho en la sección 3.5 .

  • - 7 0 -

    4.4. LEY MULTINOMIAL SUCEDÁNEA DE LA DISTRIBUCIÓN REAL,

    So trata de obtener una distribución de probabi

    lidad que aproxime la distribución de la probabilidad con

    dicional p(en|a¿,D^) en los casos que asta sea inmaneja-

    ble -como sucede, por ejemplo, en la mayoría de los siste

    mas no lineales- o, inclusive, sólo se conozca una expre-

    sión aproximada*

    La distribución que vamos a utilizar es la mul-

    tinomial (o polinomial). Como es sabido se trata de una -

    distribución multidimensional de tipo discreto cuya dofir (1) nición y propiedades recordamos en las siguientes notasv lJ

    NOTAS SOBRE LA DISTRIBUCIÓN MULTINOMIAL.

    Sea una prueba aleatoria en la que pueden apare

    cer el conjunto completo de sucesos incompatibles: S-j,...

    . . , S^ de probabilidades P(S^) = p¿ tales que

    p( v Si) = z PÍ = i 1 i

    Si se hace l a exper iencia un número n de veces

    cabe preguntarse cuál e s l a probabi l idad de que se dó n^

    veces e l suceso S-, n^ veces e l Sp> e t c . (naturalmente -

    ¿ L n ^ ^ n ) , abs t racc ión hecha del orden en que se presenten .

    (1) Ver r e fe renc ias a l f i n a l de e s t e c a p í t u l o .

  • -71 -

    Un razonamiento elemental conduce a l a conclusión de que

    t a l probabi l idad es e l producto del número de permutacio-

    nes de n elementos en t re l o s que se r ep i t en n* , n2*••••* tt^

    por e l numero p . * . , . . Q p, LL >

    Queda a s í def inida una va r i ab le a l e a t o r i a , a s o -

    ciada a l a prueba repetida, que se denomina multinomial y

    qup*# é , > ''h)* donde I a *±

    representa e l ni5mei*o de veces que se presenta S^, t i ene -

    l a s igu ien te l ey de probabi l idad

    PC S1 - n1,,.. , J^ = nh) = ------------ P-J .•...p^

    1 h (4.3)

    Inmediatamente se comprueba (fórmula de Leibniz)

    que se trata de una distribución %

    yr—__u__ pf1 •.... p.ni1 = (Zl P± )n = 1

    *—** n l n, f ' n i

    (estando l a primera suma extendida a todos l o s casos posi

    b les de va lores p o s i t i v o s de n^ que sumen n ) .

    Como es evidente no es una d i s t r i buc ión de h di

    mensiones sino de h-1 ya ques

    h-1 nh ^ n - 2 1 ni

    i=1

    La función característica vale

  • - 7 2 -

    n ! r i | r / ( * • ! » • • • '"^h-i) ~ áíL - ' — ~ P-j Pjj

    n h i t 1 n l 4 • • • • ^ » «

    es decid

    XX Jt • f • o • « XXT_ -

    h-1

    ••«i e

    ith-1nh-1

    i t • / ( t 1 , . . . , t h _ 1 ) = (2I - P-j o "Up^)* (4.4)

    o también 7^(t^ , . . . i*^.^) -

    3=1

    1+ ZLte 1 d - l ) p . L 3=1 3.

    n (4.5)

    Fácilmente se deducen l o s momentos c e n t r a l e s

    E [Fj] - n pj

    E [(r-?3)2] = np (1-p)

    E '[(r-'y^cy-^J^-npjp^. (j^k)

    Volviendo a nuestra distribución p(en|a^,D.)

    veamos como puede ser sustituida en la expresión de la ra

    zón de verosimilitudes por una distribución multinomial #

    Bastará para ello.dividir el campo de variabilidad de o(t)

    (1) en li intervalos^ ' y sustituir la variable aleatoria — (e-j,... , on) por la (n^ , Ü2,.. M n^) representativa de la -

    (1) Puede hacerse que h y N sean iguales y los interva-los de variación de e(t) se correspondan con los de 0*(t) pero no es necesario ni tiene ningún sentido 03 pecial.

  • - 7 3 -

    repartición de los e ( t ) en los li intervalos citados»

    Llamando a los intervalos de e ( t ) , S- j , . , . , S^ y

    a las probabilidades %

    P [ e ( * ) € M a i > D ; j ] = ^ ( i j ) (4.6a)

    P [ o ( t ) € S k | a i , Dí; I ] = q.k(i,3) (4.6b)

    se tendrá que

    Pk( i»d) = / v(el&±,V.) de (4.7a)

    q k ( i , j ) = / p íefa^D' . ) de (4.7b) s k

    Las leyes nul t inoniales sus t i tu t ivas de l a s rea-

    les serán las siguientes?

    a) p(enJa i?D*-) se sus t i tu i rá por

    n! -_ - . n r ^h , . [q^i^JJ . . . . . Ĵq.-̂ (± , j)J (4.8)

    n1 ! , n h !

    b) p(en la i ,D^) se sus t i tu i rá por

    n! r -in1 r -i

    nh

    ^.—_ p 1 ( i , j ) J P h ^ ' J ' ü (4.9) n ^ ! , . . . , n h ! ^

    J L

    donde: ^

    H nk = h 1

  • - 7 4 -

    h

    h

    1

    Quedan por determinar los límites de los interna

    los Su,..#,S. • En principio podrían ser arbitrarios? sin

    embargo es lógico que se dimensionen segán algún criterio

    de optimizad ón matemático o económico o fijados por razo-

    nes tecnológicas .

    Por otra parte hay que indicar que el sistema de

    formación del vector observación ( e 1 f . . . , e ) es diferente

    del de (n-,,.. . , iO o 9 si se prefiere (n.. $. • . j * ^ . ) 9 ya que

    n^ es inmediatamente calculable 9 pues el primero se obtenía

    a través de una sucesión de medidas en los instantes

    t1 , t p , . . . , t , • . . mientras que para el segundo se debo -

    contar con un elemento no lineal que discretice la señal y (2)

    un sistema contadorN

    4.5. REGLA DE DECISIÓN BASADA EN LA LEY MULTINOMIAL,

    Vamos a transformar la regla de decisión obteni-

    da en la sección 4*3. introduciendo los resultados de la -

    (1) Ver más adelante la sección 4.8 •

    (2) Ver más adelante la sección 4.7 .

  • - 7 5 -

    sección 4 .4 , para l o cual vamos a obtener l a nueva expre—

    sión de . ^ . ( n ) .

    Ahora se rá ;

    JL±An) = log P ( n r . . . , n l l | a i , D ' ; . )

    p ( n 1 , . . . , n h | a l , D p (4.10)

    pero l a s probabi l idades multinomiales pueden s u s t i t u i r s e -

    por sus va lores (4.8) y (4 .9) quedando

    h h A±i(n) = ¿L n k l o g q k ( i , j ) - 2 ~ . n k l o g p k ( i , j ) (4.11)

    k=1 k=1

    pero, como ¿^nv = n , puede ponerse (4.11) a s í :

    £ L 1 q k ( i , a )

    k=i p k d , d )

    h-1

    k=1 log

    ^ ( i í j )

    Pn(i»a)

    y s impli f icando:

    A± i (n) = n log ~x - ± - — - - 4- > ~ ii log

    q.k(iȇ) PhC1^')

    p k ( i , j ) q . h ( i , j )

    (4.12)

    s i se desea puede ponerse de manif ies to que p ^ í i j j ) y -

    q^(±,d) e s tán l i gadas a l a s o t r a s probabi l idades

    h-1

    1^(1,0') = 1 - 2 Z Pfc^1»^ = 1 " P i -k=1

    (4.13a)

  • - 7 6 -

    h-1 q i l ( i>3) = 1 - ^ " " q k ( i , 3 ) = 1 - Q i j

    k=1

    Con lo que se t i ene defini t ivamente?

    (4.13b)

    A±¿(n) = n log 1 - P .

    h-1

    k=1

    id J

    1 - p - •

    L 1-QL-

    q.ic(i»d)

    p k( i»d) (4.14)

    Como vicios en la sección 4 . 3 , l a r eg la de deci—

    sión e s t a b l e c í a que: s i se cumplían simultáneamente l a s -

    dos desigualdades

    • 4 i , d - i ( n ) > l o g A i , ; H i

    y l i ; j ( n ) 4 l o g B i ; j

    se adoptaba l a decisión de conmutar e l cont ro lador de paró

    metro aj ; en caso de no e x i s t i r ningún j que l a s cumplie

    ra se seguía e l t e s t . Veamos ahora e l modo de t ransformar

    dichas desigualdades que ahora se expresarán:

  • - 7 7 -

    L I - P Ü J

    ±

    + • i d

    33.-1

    ^1,0-1 + * ^ - 1 .(4-18a) k=1 h -1

    E f i a k n k ^ b i ó + n f i j ( 4 ' l 8 b ) k=1

    Por l o t a n t o l a r e g l a de d e c i s i ó n s e c u e n c i a l con

    p r o b a b i l i d a d e s n u l t i n o m i a l e s puede e n u n c i a r s e a s í ;

    REGIA

    a ) Si cuando se t i e n e conmutado e l c o n t r o l a d o r -

    de pa rámet ro a¿ y se e s t á en l a e t a p a n d e l t e s t se oum-

  • píen simultáneamente, para algún j, las desigualdadesi

    h-1

    k=1

    h-1

    71 fijk nk < bij * n f i j fc=1

    teniendo f^^? ^ii> aij y bii l o s significados dados en —

    (4.17d), (4*17c), (4.17b) y (4.17a), se conmuta el contro-

    lador de parámetro a^ .

    b) En caso contrario se sigue el test pasando a

    la etapa n + 1 ,

    Es perfectamente válida la observación hecha en

    la sección 4.3 sobre el elemento de memoria del sistema.

    4.6. TAMAÑO MEDIO DE LA MUESTRA,

    Vamos ahora a ocuparnos de una cuestión que sólo

    se aludió en el capítulo 3 y que, sin embargo, es fundamen

    tal en todo proceso secuencials la del tamaño de la mues-

    tra.

    La justificación del análisis secuencial es do-

    bles por un lado, que pudiéramos llamar "técnico", se tra-

    ta de no prejuzgar el tamaño de la muestra sino de ir adajD

    tando éste al problema y a la cantidad de información que

    se vaya obteniendo5 de otra parte, que podría considerarse

  • -?9-

    cono "económica", se pretende que el tamaño de la muestra

    sea lo menor posible dados unos niveles de significación -

    preestablecidos (es obvio que con muestras muy grandes., so

    (1) tienen buenas estimaciones a costa de un gran precio) f

    Por lo tanto es necesario dar contestación a dos

    cuestiones básicass

    1) ¿Se puede estar seguro de que el test termina

    rá alguna vez?. 0, en otros términos, tiene respuesta afir

    mativa la preguntas ¿Existe un tamaño finito de la muestra

    tal que para él se llega siempre a una decisión?.

    2) El citado tamaño de la muestra es una varia-—

    ble aleatoria y no sólo nos interesa la certeza de que tie

    ne un máximo finito sino también cuál es su valor medio.

    Como es lógico no abordaremos aquí la problemati

    ca general que plantean ambas cuestiones pues la misma no

    es otra cosa que el tema básico del Análisis Secuencial. -

    Solo enunciaremos algunos resultados importantes que nos -

    permitirán resolver afirmativamente en nuestro problema ac

    tual ambos interrogantes.

    En primer lugar estableceremos algunos resulta—

    (1) Cuando se habla de "costo", "economía", etc., puedo dar sele una significación monetaria para concretar, pero la cuestión es más amplia 5 piénsese, por ejemplo, en -una misión espacial y en el factor tiempo del muestreo.

  • - 8 0 -

    dos de i n t e r é s s

    1) Las razones de ve ros imi l i tud forman una ífmar-

    t i n g a l a " ^ 1 ' (bajo condiciones bas tan te amplias sobre l a s -

    d i s t r i b u c i o n e s que ent ran en e l c o c i e n t e ) . Es dec i r que s i

    P n ( y 1 ? . . , , y n )

    donde q-̂ Cy-j ,-•.-. ,yn) y P n (y 1 $ • • • »yn) representan l a s po-

    s i b l e s probabi l idades de va r i ab le a l e a t o r i a ( y - j , . . . ,yn) , -

    se t i e n e que l a sucesión de va r i ab l e s a l e a t o r i a s

    es una mar t inga la .

    2) Un teorema de l a t e o r í a de mar t ingalas asegu-

    ra que, con probabi l idad 1, e x i s t e

    l l n *n = XQD n - > 00

    por otra parte -siempre que las dos distribuciones no sean

    iguales- dicho límite es inferior a la unidad y, en el oa-

    so de suponer las y^ independientes, por ejemplo, es nulo.

    3) La identidad de Wald (o teorema fundamental -

    (1) Véanse las Notas a este Capítulo.

  • - 8 1 -

    d e l a n á l i s i s s ecue r i c i a l ) se e x p r e s a ; n

    E <

    1

    [# MT = 1 (4 .19 )

    s i e n d o : z ima variable compleja

    Las ug variables aleatorias independientes con distribución coman.

    En particular la sucesión n

  • m ""^s.. V ŝj

    Si en la identidad de Wald se deriva respecto a

    z se tienes n

    I z Z u r e

    E < c# ) 2a [f (2)]U Z^-n $W [J(z)] J U 0

    haciendo z = o y simplificando quedas

    i—n

    E 2 1 u j - E(n) E (us) = O L 1

    es decir : E

    E(n) = GN E(us)

    (4.21)

    Podronos aplicar la fórmula a nuestro caso si ha

    ceños n tamaño final de la nuestra y si las u las identi

    ficanos con las razones de verosinilitud j]^ . Hay un peque

    ño inconveniente y os el de que al hacer nuestro test —

    9 (t)€Cj en realidad débenos contrastar dos hipótesis: -

    £*(t)€D!¡ ., y ©*(t)6Dj ; por lo tanto el tamaño final de

    la nuestra corresponderá al nayor de los dos de terminación

    de cada uno de los tests que lo conponen y nos encontrare-

    (1) Este resultado podría haberse obtenido por un razona niento directo (ver notas fin de capítulo).

  • - 8 3 -

    nos de hecho con dos casos binarios. Es decir, prinero en-

    contráronos

    (4.22)

    E l nune rador puede s e r c a l c u l a d o aproxima dáñente

    por l a s i g u i e n t e c o n s i d e r a c i ó n : supónganos que -A. -«(r) t o (1)

    na sienpre exactanentev ' los valores logiL-j y logB:^ 21 XJ J - j

    a l a c a b a r e l t e s t y , por l o t a n t o , ^ j j j ^ ( r ) t i e n e s i e n p r e

    t a l e s v a l o r e s con l a s p r o b a b i l i d a d e s r e s p e c t i v a s ^ - j i j 7

    1- ^ - J Í ^ ( s i cono suponenos 9 ( t ) 6 D - ) y e n t o n c e s ;

    1 « ( 1 - £ 1 J L . ) l o g B i ; j 4- £ r i . l ogA-y (4 .23 )

    Por o t r a p a r t e e l denominador e s en n u e s t r o caso

    de r e g l a d e r i v a d a de l a l e y n u l t i n o n i a l

    E [A ± 3 (n)] = lo

    h-1

    + j ~ - : P t ( i f d ) IOS k=1

    cr 1 - Q j j -

    - 1 - p i ^

    ; x

    \

    [~ 1 - p i j OfeCifá)"]

    i H 1 - Q i á P k ( i f ó ) J

    (4.24)

    (1) Lo c u a l no p a s a r á r e a l n e n t e pero s í se t e n d r á que s u -p e r a r á poco t a l e s v a l o r e s .

  • - 8 4 -

    ya que las p^Ci/j) Son l a s esperanzas matemáticas de l a s

    frecuencias.

    Por lo tantos

    log Pjj .dfd) l o g L Í - Q i i Pk(i,D)J

    (4.25)

    Por consideraciones completamente análogas ten—

    dríamos que

    ?2ili-D l0iBix¿zi * (1 ~ ia-úztl l0f Aizi-1 *

    Y por lo tantos

    r E kla^cj » SUP4E [n^a^D.,] , E [^a^D'^] (4.27)

    Conviene señalar que E [nIa¿,C-;J depende, natu

    raímente9 de la situación rea l (zona de 9* y controlador

    conectado) de los niveles de probabilidad de los errores . j -

    pero también está influido por la descomposición en i n t e r -

  • -85-

    valos que se haya hecho en el campo de variabilidad de e(t)

    -a través de los valores de p^Ci^j), qk(i,;j), etc.- y haoe . (1)

    la elección de estos un problema delicado para el proyectov ;

    En cuanto a la influencia de los errores es fácil

    ver de quá orden es. Pensemos por un instante que todos los

    errores ^-JÍJ» 211 ^»3 variando de 1 a N) son iguales a

    £ y que, por consiguiente, todas las JLy y B̂ -? son igua

    les a A y B j además

    1 • - 6 • _ 1

    € B

    y resulta que las dos expresiones de los numeradores'coin-

    ciden en valor absoluto con (1 -2 £ ) logA que, con & pe-

    queño, es aproximadamente del orden de (1-2 6 ) log |£ | .

    Es decir que, con las demás variables fijas, el número de

    etapas del test secuencial crece con el logaritmo de la -

    probabilidad del error preestablecido.

    4.7• ESQUEMA DE SISTEMA ADAPTIVO CON DISPOSITIVO DEOISOR.

    Las ideas expuestas anteriormente nos van a per-

    mitir dar un modelo de un sistema de control adaptivo con

    (1) Ver, más adelante9 sección 4.8 .

  • -86-

    elementos de decisión.

    Sea un sistema a controlar con un parámetro v a -

    riable ©*(t) y con un controlador con una característica

    adaptable, a, de tal modo que dsta se elige a lo largo del

    tiempo de modo que mantenga, a pesar de los cambios de —

    9*(t), la salida optimizada, según algún criterio estable-

    cido "a priori», y todo ello en presencia de perturbaciones

    aleatorias.

    r- Dispositivos adaptivos

    Perturba' cíones— I

    i

    x(t) *i o(t)

    Muestreador *n Calculador

    Comparador

    Decisor

    l

    Controlador conj "*"[ a regulable

    Sistema a con-trolar con G* variable

    *-y(t).

    Figura 4.3

    La figura 4.3 nos muestra esquemáticamente su mo

    do de funcionamiento. Si queremos detallar más y, sobre to

    do, introducir las variantes que hemos desarrollado a par-

    tir de la regla multinomial nos será necesario pasar al —

    diagrama en bloques más preciso de la figura 4.4 donde, en

  • "7

    H Contador n

    Memoria constan t e s y programa

    r fcn Contador n 1

    \^A "^O^f

    n ,

    Contador n. •h-1

    i n. -̂ w h-1

    * -

    Calculador i a c tua l

    -H l,,, b1 b ? j ^ S/í °°i

    "n

    Memoria i

    i ac tua l

    L

  • - 8 8 -

    tro otras peculiaridades se destacans el carácter digital

    de la característica adaptable a ; la forma de obtener la

    ley multinomial sustitutiva de la real? cómo aplicar la re

    gla decisoria resultante, etc. .

    4.8. RECAPITULACIÓN Y COMPLEMENTOS.

    Solo nos queda, antes de pasar a la aplicación -

    de las técnicas descritas, hacer unos comentarios comple—

    mentarios. Pero antes vamos a recapitular brevemente sobre

    lo dicho.

    a) Hemos establecido con las fórmulas (4#1) y -

    (4.2) y la regla de la sección 4.3 un proceso de decisión

    secuencial para sistemas adaptivos.

    b) En la sección 4.4 hemos calculado una ley muí

    tinomial aproximada a la distribución real.

    c) En la sección 4.5, especialmente en las expre

    siones (4.15) a (4.18), hemos sentado las bases de la r e —

    gla de decisión que usaremos más adelante.

    d) En la fórmula (4.27) hemos dado -una expresión

    del tamaño medio de la muestra en el proceso de decisión.

    Aún nos queda señalar que un punto sumamente im-

    portante es el de la elección de los intervalos Sk en e(t)

    para la formación de la distribución multinomialo Deben ele

    girse de modo que la aproximación sea razonable (por ejem-

    plo no deben contener masas de probabilidad muy desiguales.

  • -89-

    y tener un número suficientemente amplio) % por otra parto

    pueden escogerse, en algunos casos, de forma que se dismi-

    nuya el tamaño medio de la muestra^ ' •

    Tambidn es interesante recordar que algunas veces

    podrán sustituirse los conjuntos D-j D1. por valores carao

    i * terísticos que denominaremos O y ©.0*

    (1) Ver notas.

  • - 9 0 -

    NOTAS Y REFERENCIAS AL CAPITULO 4

    -Se debe s e ñ a l a r l a ampl i ac ión de p e r s p e c t i v a s -

    que se ha e f e c t u a d o , t a l vez s i n s u f i c i e n t e é n f a s i s , a l sus

    t i t u i r l a medida de ©(t) por e l de c u a l q u i e r magnitud c a r a £

    t e r í s t i c a d e l e s t a d o d e l s i s t e m a , por ejemplos l a s a l i d a o

    l a s e ñ a l de e r r o r . Así puede imag ina r se que l a s per turbaci^o

    n e s "entran f f en e l s i s t ema de c u a l q u i e r manera en vez de -

    suponer un " r u i d o " p e r t u r b a d o r únicamente de

    -Conviene i n s i s t i r en l a problema t i c i dad de un -

    conocimiento e x a c t o de l a s p r o b a b i l i d a d e s "a p r i o r i " y tam

    b i e n , como e s n a t u r a l , de l a p o s i b i l i d a d de c o n t a r con i n -

    formación r u f i c i e n t e do l a s p r o p i e d a d e s e s t a d í s t i c a s d e l ~

    ruidoo

    -Además, .de l o s l i b r o s g e n e r a l e s de Cá lcu lo de Pr£

    b a b i l i d a d e s y E s t a d í s t i c a , c i t a d o s a n t e r i o r m e n t e , se han -

    u t i l i z a d o - p a r a a l g u n a s c u e s t i o n e s s u s c i t a d a s en é s t e - en

    t r e o t r o s l o s s i g u i e n t e s §

    F e l l e r , W.: "An I n t r o d u c t i o n t o P r o b a b i l i t y -

    Thoory and i t s A p p l i c a t i o n s " , Wi ley , New York, I ( 2 § e d . ) ,

    1957, I I , 1966.

    Breiman, L . : " P r o b a b i l i t y " , Addison-Wesley, Rea-

    d ing , 1968.

    -La i d e a de u s a r v a r i a b l e s de B e r n o u i l l i en a p l i

    c a c i o n e s c i b e r n é t i c a s de l a T e o r í a de l a Dec i s ión e s de —

  • - 9 1 -

    Blasbalg, H#; "The R