Giovani Guimaraes Rodrigues

Embed Size (px)

Citation preview

  • Giovani Guimares Rodrigues

    Identificao de Sistemas DinmicosNo-Lineares Utilizando Modelos

    NARMAX Polinomiais Aplicao aSistemas Reais

    Dissertao submetida banca examinadoradesignada pelo Colegiado do Programa de Ps-Graduao em Engenharia Eltrica daUniversidade Federal de Minas Gerais, comoparte dos requisitos necessrios obteno dograu de Mestre em Engenharia Eltrica.

    Programa de Ps-Graduao em Engenharia EltricaCentro de Pesquisa e Desenvolvimento em Engenharia Eltrica

    Universidade Federal de Minas Gerais

  • " uma experincia como nenhuma outra que eu possa descrever,a melhor coisa que pode acontecer a um cientista, compreenderque alguma coisa que ocorreu em sua mente correspondeexatamente a alguma coisa que acontece na natureza. surpreendente, todas as vezes que acontece. Ficamos espantadoscom o fato de que um construto de nossa prpria mente possarealmente materializar-se no mundo real que existe l fora. Umgrande choque e uma alegria muito grande".

    Leo Kadanoff1

    1 Extrado de Gleick (1989).

  • Resumo i

    Resumo

    A motivao desse trabalho investigar a aplicao das tcnicas de identificao desistemas dinmicos no-lineares utilizando modelos NARMAX polinomiais. Estesmodelos so estruturas paramtricas do tipo entrada-sada capazes de representar umaampla classe de sistemas no-lineares.

    O procedimento de identificao de modelos no-lineares paramtricos pode ser divididoem cinco etapas. Estas cinco etapas so apresentadas e analisadas no mbito daidentificao de modelos no-lineares caixa-preta.

    A seleo de estrutura a etapa crucial da identificao de modelos no-lineares. Poresse motivo, ela analisada em maior profundidade. Os conceitos de agrupamentos determos e de coeficientes de agrupamentos so utilizados para derivar um procedimentoauxiliar de seleo de estrutura de modelos no-lineares polinomiais. Este procedimentopode ser bastante eficaz em situaes onde as tcnicas usuais de seleo de estruturafalham.

    Em seguida, so apresentados dois conjuntos de rotinas computacionais para aidentificao de modelos NARMAX polinomiais. O primeiro conjunto de rotinasimplementa as cinco etapas do procedimento de identificao. O segundo conjunto derotinas implementa ferramentas teis para a anlise e a visualizao dos modelosidentificados. Estas rotinas so utilizadas para identificar modelos NARMAX polinomiaisnesse trabalho.

    Finalmente, o procedimento de identificao de modelos NARMAX utilizado paraconstruir modelos matemticos para alguns sistemas no-lineares reais. Os sistemas aserem modelados so um forno eltrico sem estrutura de isolamento trmico e o circuitocatico de Chua. Os regimes dinmicos destes sistemas no podem ser reproduzidos pormodelos lineares convencionais. Portanto, a identificao dos mesmos constitui um bomteste para avaliar a qualidade dos modelos NARMAX polinomiais na representao desistemas no-lineares reais.

  • Abstract ii

    Abstract

    The main motivation of this work is to investigate the use of techniques to identify non-linear dynamical systems using NARMAX polynomial models. Such models areparametric input-output structures able to represent dynamic behavior of a wide class ofnon-linear systems.

    The identification of non-linear parametric models can be divided in five stages. Thesefive stages are introduced and analyzed in the scope of non-linear black-box modelidentification.

    Model structure selection is the crucial stage of non-linear model identification. So, it isanalyzed more deeply. The concepts of term clusters and cluster coefficients are used toderive an auxiliar procedure to select terms of non-linear polynomial models. Thisprocedure can work efficiently in situations where the other techniques of structureselection fail.

    Two sets of computational routines are described. The first set implements the fivestages of the identification procedure of NARMAX polynomial models. The second setimplements useful tools for analysis and visualization of identified models. These routinesare used to identify NARMAX polynomial models in this work.

    Finally, the identification procedure of NARMAX polynomial models is used to buildmathematical models for some real non-linear systems. The systems that will be modeledare an electrical furnace without thermal insulation and Chua's circuit. The dynamicalbehavior of these systems can not be described by conventional linear models. So, theidentification of such systems constitutes a good test to evaluate the quality ofNARMAX polynomial models in the representation of real non-linear systems.

  • Agradecimentos iii

    Agradecimentos

    Eu gostaria de agradecer aos meus pais Roberto e Glaura e s minhas irms Adriana eElinan pela pacincia e pelo apoio irrestrito durante a realizao desse trabalho.

    Eu gostaria de agradecer ao professor Luis Aguirre pela orientao acadmica atuante epela amizade durante a convivncia diria.

    Um agradecimento especial dedicado a Eduardo Mendes pelas sugestes e peloinestimvel auxlio com simulaes e rotinas computacionais. Outro agradecimentoespecial dedicado aos professores Ivan Lopes, Wallace Boaventura e Porfrio Cortizopela atenciosa assessoria durante os procedimentos de aquisio de dados.

    Eu gostaria de agradecer a Ansio Braga e aos professores Ronaldo Pena e Fbio Jotapelas valiosas crticas e sugestes durante a elaborao desse trabalho.

    Eu tambm gostaria de agradecer aos alunos de iniciao cientfica lvaro Souza,Leonardo Torres e Ubiratan Freitas pelo auxlio em coletas de dados, em simulaes e naedio de algumas figuras para esse trabalho.

    Os amigos do Laboratrio de Controle de Processos Industriais (LCPI) e Centro dePesquisa e Desenvolvimento em Engenharia Eltrica (CPDEE) garantiram a finalizaodesse trabalho com atitudes e palavras de apoio.

    O apoio financeiro da Coordenao de Aperfeioamento de Pessoal de Nvel Superior(CAPES) e da Pr-Reitoria de Pesquisa (PRPq) dessa Universidade foram de vitalimportncia.

  • ndice Analtico iv

    ndice Analtico

    Resumo.......................................................................................................................... i

    Abstract ........................................................................................................................ ii

    Agradecimentos............................................................................................................ iii

    Nomenclatura............................................................................................................... vi

    Captulo 11. Consideraes sobre a Modelagem de Sistemas ......................................................... 1

    1.1 Introduo........................................................................................................... 11.2 Alguns Conceitos Bsicos da Teoria de Sistemas ................................................. 21.3 Modelagem Matemtica de Sistemas Dinmicos................................................... 41.4 Aspectos da Identificao de Sistemas ................................................................. 51.5 Apresentao do Trabalho ................................................................................... 6

    Captulo 22. Identificao de Sistemas No-Lineares ..................................................................... 9

    2.1 Introduo........................................................................................................... 92.2 Identificao de Sistemas ..................................................................................... 9

    2.2.1 Experimentao do Sistema.......................................................................... 102.2.2 Deteco de No-Linearidades ..................................................................... 102.2.3 Escolha da Representao e de Estruturas .................................................... 122.2.4 Deteco de Estrutura .................................................................................. 142.2.5 Estimao de Parmetros.............................................................................. 15 Implementaes Ortogonais do Algoritmo de Mnimos Quadrados............... 182.2.6 Critrios de Informao................................................................................ 202.2.7 Deteco de Estrutura Utilizando o ERR...................................................... 212.2.8 Validao de Modelos .................................................................................. 22

    2.3 Tcnicas de Reconstruo de Espao de Estados ............................................... 242.4 Comentrios Finais ............................................................................................ 26

    Captulo 33. Seleo de Estrutura de Modelos No-Lineares: Agrupamentos de Termos e

    Coeficientes de Agrupamentos ................................................................................. 283.1 Introduo......................................................................................................... 283.2 Agrupamentos de Termos e Coeficientes dos Agrupamentos.............................. 28

    3.2.1 Agrupamentos Esprios em Modelos Polinomiais No-Lineares ................... 313.3 Agrupamentos de Termos e Pontos Fixos .......................................................... 33

  • ndice Analtico v

    3.3.1 Pontos Fixos: Nmero e Localizao............................................................ 333.3.2 Estabilidade dos Pontos Fixos ...................................................................... 353.3.3 Simetria dos Pontos Fixos ............................................................................ 36

    3.4 Escolha do Tempo de Atraso ou Perodo de Amostragem utilizando Funes deCorrelao No-Lineares.................................................................................... 37

    3.4.1 Escolha do Perodo de Amostragem Ts ........................................................ 383.5 Comentrios Finais ............................................................................................ 40

    Captulo 44. Ambiente Computacional para Identificao de Sistemas No-Lineares.................... 41

    4.1 Introduo......................................................................................................... 414.2 Descrio das Rotinas de Identificao............................................................... 414.3 Anlise das Rotinas de Identificao................................................................... 464.4 Comentrios Finais ............................................................................................ 48

    Captulo 55. Modelagem No-Linear de um Forno Eltrico ......................................................... 50

    5.1 Introduo......................................................................................................... 505.2 Descrio do Sistema......................................................................................... 505.3 Representao da Dinmica No-Linear do Forno Eltrico................................. 51

    5.3.1 Aquisio de Dados...................................................................................... 515.3.2 Deteco de No-Linearidades ..................................................................... 565.3.3 Deteco de Estrutura e Estimao de Parmetros........................................ 565.3.4 Deteco de Estrutura Utilizando ERR e Agrupamentos de Termos ............. 595.3.5 Validao dos Modelos Identificados............................................................ 62

    5.4 Anlise de Tendncia em Dados de Sistemas Dinmicos..................................... 685.5 Comentrios Finais ............................................................................................ 69

    Captulo 66. Modelagem No-Linear do Circuito de Chua........................................................... 72

    6.1 Introduo......................................................................................................... 726.2 Descrio do Sistema......................................................................................... 726.3 Representao da Dinmica No-Linear do Circuito de Chua............................. 75

    6.3.1 Aquisio de Dados...................................................................................... 756.3.2 Deteco de Estrutura e Estimao de Parmetros........................................ 806.3.3 Deteco de Estrutura Utilizando ERR e Agrupamentos de Termos ............. 836.3.4 Validao dos Modelos Identificados............................................................ 85

    6.4 Comentrios Finais ............................................................................................ 92

    Concluso. .................................................................................................................. 94

    Apndice AA. Glossrio sobre Sistemas Dinmicos No-Lineares.................................................. 96

    A.1 Introduo ........................................................................................................ 96A.2 Glossrio .......................................................................................................... 96

    Referncias Bibliogrficas.......................................................................................... 106

  • Nomenclatura vi

    Nomenclatura

    Conjuntos Numricos

    Z Conjunto dos nmeros inteiros.

    Z+ Conjunto dos nmeros inteiros positivos.

    N Conjunto dos nmeros naturais.

    R Conjunto dos nmeros reais.

    Variveis

    A Matriz auxiliar, no procedimento de Gram-Schmidt, para estimaoortogonal de parmetros.

    C() Funo de correlao utilizada no clculo da dimenso de correlao deum atrator.

    ci,j Coeficiente do termo x(t) de um modelo NARMAX polinomial (definiode agrupamento de termos).

    DC Dimenso de correlao do atrator de um sistema dinmico no-linear.

    Df Matriz Jacobiana de um sistema dinmico no-linear.

    DL Dimenso de Lyapunov de um sistema dinmico no-linear.

    d Tempo de retardo de um sistema ou tempo morto.

    de Dimenso do "embedding" de um sistema dinmico.

    e(t) Rudo ou perturbaes em um sistema dinmico.

    Fl() Funo no-linear genrica.

    f() Funo matemtica genrica (definida no contexto da citao).

    f Frequncia de um dado sinal.

    g() Funo de observao utilizada na construo de "embeddings".

    g Parmetro do modelo ortogonalizado, no procedimento de Gram-Schmidt.

    g Estimativa do parmetro g.

    h() Funo de sada de um sistema dinmico.

  • Nomenclatura vii

    JN() ndice de desempenho ou funo de custo.

    k Intervalo de predio.

    l Grau de no-linearidade de um mapeamento no-linear polinomial.

    M Mapa de Poincar de um sistema dinmico no-linear.

    m Ordem dos termos x(t) de um modelo NARMAX polinomial.

    N Comprimento do registro de dados disponveis.

    n Ordem de um sistema dinmico.

    ne Atraso mximo nos termos em e(t), em modelos discretos.

    np Nmero de termos de processo em um modelo NARMAX polinomial.

    ny Atraso mximo nos termos em y(t), em modelos discretos.

    n Nmero de termos de rudo em um modelo NARMAX polinomial.

    n Nmero de termos em um modelo NARMAX polinomial.

    P Matriz dos regressores de um modelo NARMAX polinomial.

    PTP Matriz de informao.

    p(t) Regressor de um modelo NARMAX polinomial representado naconfigurao preditor de "um-passo-a-frente".

    p Ponto fixo de um sistema dinmico.

    Q Matriz ortogonal (decomposio QR).

    Q Matriz ortogonal aumentada (decomposio QR).

    R Matriz triangular superior (decomposio QR).

    r Dimenso do atrator de um sistema dinmico.

    Ts Perodo de amostragem de um dado sinal.

    t Tempo ou nmero de amostras no caso discreto.

    u(t) Sinal medido de entrada de um sistema.

    v(t) Varivel instrumental.

    W Matriz de regressores ortogonais.

    w(t) Regressor ortogonal.

    c Frequncia de corte (normalizada) de um filtro.

    X Campo vetorial no-linear.

    x(t) Termo de um modelo NARMAX polinomial.

    x Vetor de variveis de estado de um sistema dinmico.

  • Nomenclatura viii

    Y Vetor de sadas.

    y(t) Sinal medido de sada de um sistema.

    ( )y t Sada do preditor de "um-passo-a-frente".

    y(t) Vetor de coordenadas de atraso.

    y1, y2 Vetores auxiliares na estimao ortogonal de parmetros pelo mtodo datransformao de Householder.

    y Ponto fixo de um modelo NARMAX polinomial.

    z Autovalor de um sistema discreto ou discretizado.

    Autovalor da matriz Jacobiana de um modelo NARMAX polinomial.

    Seo de Poincar de um sistema dinmico no-linear.

    t Passo de integrao numrica.

    () Funo delta de Dirac.1 Maior expoente de Lyapunov de um sistema dinmico no-linear.

    { } i in=1 Espectro de expoentes de Lyapunov de um sistema dinmico no-linear.

    b Parmetro de bifurcao de um sistema dinmico.

    Vetor de parmetros de um modelo NARMAX polinomial.

    Parmetro nominal de um sistema dinmico representado por um modeloNARMAX.

    Parmetro de um modelo NARMAX, estimado pelo mtodo dos mnimosquadrados.

    Vetor de resduos de modelagem em um modelo NARMAX polinomial.

    (t) Resduo de identificao.i Coeficiente de um agrupamento de termos em um modelo NARMAX

    polinomial.

    Tempo de atraso na definio das coordenadas de atraso.

    m Valor mnimo entre y e y2 , .

    y Tempo em que ocorre o primeiro mnimo da auto-correlao linear de umsinal.

    y2 ,

    Tempo em que ocorre o primeiro mnimo da auto-correlao no-linear

    de um sinal.

    y y1 1 ( ) Funo auto-correlao do sinal y1(t).

  • Nomenclatura ix

    y y1 2 ( ) Funo correlao cruzada dos sinais y1(t) e y2(t).

    ( , )x t Fluxo da dinmica de um dado sistema.

    Agrupamento de termos em um modelo NARMAX polinomial.

    Operadores

    E{} Esperana matemtica.

    Var{y(t)} Varincia de y(t).

    . Norma genrica.

    2Norma euclidiana.

    . Valor absoluto de um nmero.

    [ ] T Transposio de vetor ou matriz.

    Unio de conjuntos.

    Siglas

    ARMAX Modelo (linear) auto-regressivo, de mdia mvel e entrada externa("Auto-regressive, moving-average with exogenous input model").

    ERR Taxa de reduo do erro ("Error reduction ratio").

    FFT Transformada rpida de Fourier ("Fast Fourier transform").

    FPE Erro de predio final ("Final prediction error").

    NAR Modelo no-linear auto-regressivo ("Non-linear auto-regressive model").

    NARMA Modelo no-linear auto-regressivo, de mdia mvel ("Non-linear auto-regressive, moving average model").

    NARMAX Modelo no-linear auto-regressivo, de mdia mvel e entrada externa("Non-linear auto-regressive, moving average with exogenous inputmodel").

    NARX Modelo no-linear auto-regressivo com entrada externa ("Non-linearauto-regressive moving average with exogenous input").

    NTC Elemento sensor de temperatura ("Negative thermal coefficient").

    PID Controle "Proporcional-Integral-Derivativo".

    PRBS Sinal binrio pseudo-aleatrio ("Pseudo random binary signal").

    RAM Memria de acesso aleatrio ("Random access memory").

    RBF Funo de base radial ("Radial basis function").

  • Nomenclatura x

    SNR Relao sinal/rudo ("Signal/noise ratio").

    Marca registrada ("Trade mark").

  • Consideraes sobre a Modelagem de Sistemas 1

    Captulo 1

    1. Consideraes sobre a Modelagem deSistemas

    1.1 Introduo

    A modelagem de sistemas uma tarefa de vital importncia para o desenvolvimento dacincia e da tecnologia. A evoluo do conhecimento cientfico ao longo dos sculosbaseou-se na construo e na anlise de modelos para os sistemas em estudo. Taismodelos procuravam reproduzir padres de comportamento observados na natureza. Amodelagem permitiu estudar sistemas minsculos, como o tomo, e sistemas imensos,como o nosso sistema solar.

    Existem tipos distintos de modelos para representar o comportamento de sistemas. Nocotidiano, natural utilizar modelos mentais para desempenhar determinadas tarefas.Estes modelos indicam a sequncia adequada de aes para atingir um dado objetivo. Osmodelos mentais podem ser extremamente complexos e so construdos a partir daexperincia diria das pessoas. A habilidade de dirigir um veculo, por exemplo, geradapelo processamento de um modelo mental. Um outro tipo de representao para sistemas o modelo grfico. Nesse caso, o comportamento do sistema descrito por tabelasnumricas ou curvas de desempenho. Um exemplo de modelo grfico a curvacaracterstica tensocorrente de um dispositivo eletrnico. Por fim, a estrutura maisutilizada para representar o comportamento de sistemas o modelo matemtico. Ummodelo matemtico constitudo por um conjunto de equaes diferenciais (tempocontnuo) ou equaes de diferenas (tempo discreto) que descrevem a variaotemporal e/ou espacial das variveis de interesse no sistema. O grau de detalhamentoutilizado na construo de um modelo matemtico depender da aplicao visada.Klamkin (1987) descreve a modelagem matemtica de uma ampla classe de sistemasreais.

    O levantamento e a formulao matemtica de todos os fenmenos que afetam ocomportamento de um dado sistema uma tarefa extremamente complexa, para nodizer impossvel. Dessa maneira, um modelo nunca reproduz exatamente ocomportamento do sistema original. Os bons modelos para a representao de sistemasem estudo sero aqueles que descrevem os fenmenos de interesse com umaconsidervel exatido.

    A modelagem de sistemas possui uma especial importncia na soluo de problemasfsicos e de engenharia. Atravs do modelo matemtico, pode-se analisar e predizer ocomportamento de um sistema, sob diversas condies de operao, e ajustar o

  • Captulo 1 2

    desempenho do mesmo, caso ele no se mostre satisfatrio. O modelo deve ser capaz derefletir o comportamento do sistema original da melhor maneira possvel, pois em casocontrrio todos os esforos posteriores para anlise do modelo e controle do sistemasero pouco eficientes.

    Esse captulo pretende descrever e analisar os principais mtodos utilizados para derivarmodelos matemticos para sistemas em estudo. Estes mtodos so a modelagem pelafsica do processo e a identificao de sistemas (lineares ou no-lineares). O objetivo docaptulo estabelecer a importncia da identificao no cenrio da modelagem desistemas.

    1.2 Alguns Conceitos Bsicos da Teoria de Sistemas

    Essa seo apresenta e discute alguns conceitos da teoria de sistemas que foramutilizados ao longo do captulo e da dissertao. As definies formais destes conceitospodem ser encontradas em (Kalman et al., 1969; Casti, 1977).

    Um sistema monovarivel se e somente se ele possui uma nica entrada e uma nicasada. Por outro lado, um sistema multivarivel se e somente se ele possui mais de umaentrada e/ou mais de uma sada. As variveis u(t) e y(t) representam os sinais de entradae de sada de um sistema, respectivamente. Quando o sistema do tipo multivarivel,u(t) e y(t) so vetores cujas componentes representam as diversas entradas e sadas dosistema.

    Um sistema classificado como dinmico quando o valor atual de sua sada y(t) dependedo valor atual da entrada u(t) aplicada e tambm da evoluo temporal da entrada e dasada. Um sistema classificado como esttico quando o valor atual de sua sada y(t)depende apenas do valor atual da entrada u(t) aplicada.

    A sada y(t) de um sistema dinmico depende da histria passada do sistema. Por essemotivo, os sistemas dinmicos tambm so conhecidos como sistemas com memria. Ocomportamento de um sistema dinmico pode ser descrito matematicamente por umconjunto de equaes diferenciais (tempo contnuo) ou equaes de diferenas (tempodiscreto). Por sua vez, um sistema esttico pode ser representado por um conjunto deequaes algbricas. Nesse contexto, os sistemas estticos podem ser consideradossistemas dinmicos com memria nula. As medies do sinal de sada de um sistemadinmico cujas entradas externas no so medidas (ou observadas) constituem uma srietemporal.

    O conhecimento da entrada u(t) aplicada e das condies iniciais de um sistema dinmicodeterminstico determina unicamente a sua sada y(t). Entretanto, o conhecimento daentrada u(t) e das condies iniciais no suficiente para determinar unicamente a saday(t) de um sistema estocstico. A descrio completa de um sistema estocstico exige aespecificao das caractersticas estatsticas dos sinais aleatrios que afetam o seucomportamento. Estes sinais aleatrios podem ser modelados por estruturas conhecidascomo processos estocsticos (Davis e Vinter, 1985; Papoulis, 1991).

  • Consideraes sobre a Modelagem de Sistemas 3

    Considere o sistema representado pelas equaes dinmicas:

    d

    d

    x

    tf x u t v t= +( , , ) ( ) ,

    ( 1.1 )y h x u t e t= +( , , ) ( ) ,

    ( 1.2 )onde x o vetor de estados do sistema e f, h so funes vetoriais genricas. v(t) umprocesso estocstico que representa o rudo dinmico que atua sobre o sistema e e(t) um processo estocstico que modela o rudo de observao (medio). As variveis v(t)e e(t) devem ser omitidas na representao de um sistema dinmico completamentedeterminstico (no afetado por sinais estocsticos de qualquer natureza).

    A equao ( 1.1 ) denominada equao de estados do sistema, enquanto que ( 1.2 ) asua equao de sada. A soluo simultnea do conjunto de equaes diferenciais ( 1.1 )determina o fluxo da dinmica do sistema. O fluxo da dinmica do sistema descrito por( 1.1 ) e ( 1.2 ) pode ser representado como = ( , , ( ), ( ), ( ))t t x t u t v t0 0 , onde x t( )0 oestado inicial do sistema (no tempo t 0 ) e u(t) a entrada aplicada. Obviamente, estefluxo depende tambm da dinmica do rudo v(t) que atua sobre o sistema.

    Um sistema dinmico determinstico dito invariante no tempo (ou estacionrio) se esomente se ele satisfaz as seguintes relaes:

    ( , , ( ), ( )) ( , , ( ), ( )), , ( )t t x t u t t t x t u t t x t n0 0 0 0 0= + + + R R e ; h x u t h x u t( , , ) ( , , ),= + R .Um sistema determinstico que no satisfaz estas relaes dito variante no tempo.

    A funo de sada h( ) de um sistema dinmico invariante no tempo independe do tempoabsoluto t. De acordo com esse conceito, um sistema com parmetros variantes deverser classificado como variante no tempo. Obviamente, os procedimentos de modelagem eanlise se tornam mais complexos quando o sistema em estudo do tipo variante notempo (Ljung, 1987). Os sistemas estudados nesse trabalho apresentam comportamentodinmico invariante no tempo.

    Um sistema dinmico autnomo quando as suas equaes dinmicas no dependemexplicitamente do tempo t. Nesse caso, as equaes ( 1.1 ) e ( 1.2 ) podem ser reescritascomo:

    d

    d

    x

    tf x u v t= +( , ) ( ) ,

    ( 1.3 )y h x u e t= +( , ) ( ).

    ( 1.4 )As equaes dinmicas de um sistema no-autnomo dependem explicitamente dotempo t, como em ( 1.1 ) e ( 1.2 ).

  • Captulo 1 4

    Os conceitos descritos nessa seo tambm podem ser apresentados a partir dasequaes entrada-sada de um sistema dinmico. Entretanto, estas equaes entrada-sada podem ser reescritas na forma de equaes de estado utilizando substituies devariveis adequadas1. Por esse motivo, as verses entrada-sada dos conceitos analisadosno sero apresentadas nesse texto.

    1.3 Modelagem Matemtica de Sistemas Dinmicos

    Duas abordagens possveis para a modelagem matemtica de sistemas dinmicos so:

    modelagem pela fsica do processo (Doebelin, 1980; Klamkin, 1987); identificao de sistemas (Box e Jenkins, 1976; Ljung, 1987).

    A modelagem matemtica baseada na fsica do processo exige o conhecimento das leistericas e empricas que regem o comportamento dinmico do sistema em estudo. Autilizao desta abordagem permite derivar modelos que descrevem a dinmica internado sistema, alm da relao entrada-sada.

    A construo de modelos pela fsica do processo pode ser bastante complicada quando osistema a ser modelado grande e complexo. Nesse caso, as interaes entre as variveisenvolvidas ficam bastante complexas e torna-se difcil descrev-las matematicamente.Uma alternativa para minimizar esse problema utilizar a abordagem de identificao desistemas para derivar modelos matemticos.

    A identificao de sistemas uma tcnica que permite construir modelos matemticospara sistemas dinmicos a partir de dados medidos. Os modelos gerados pelaidentificao de sistemas podem ser utilizados para inferir propriedades dinmicas eestatsticas do sistema original.

    Um sistema dinmico pode ser analisado no domnio do tempo e/ou no domnio dafrequncia. Por esse motivo, a identificao deve ser capaz de derivar modelos (linearesou no-lineares) que descrevam o comportamento do sistema original no domnio dotempo (equaes diferenciais) ou domnio da frequncia (resposta em frequncia),conforme o enfoque desejado.

    Os mtodos desenvolvidos para a identificao de sistemas podem ser divididos em trsgrupos (Ljung, 1987):

    mtodos paramtricos; mtodos no-paramtricos; mtodos do domnio da frequncia.

    1 Uma equao entrada-sada pode ser transformada em equao de estados escolhendo a sada dosistema e as suas derivadas como variveis de estado. Esta escolha de variveis de estado gera umarepresentao dinmica na forma companheira (Chen, 1984).

  • Consideraes sobre a Modelagem de Sistemas 5

    Os mtodos ditos paramtricos utilizam estruturas matemticas parametrizadas paradescrever o comportamento dinmico original no domnio do tempo. Os parmetrosdestas estruturas matemticas so ajustados por algoritmos de estimao a partir dosdados medidos (Ljung, 1987). Os mtodos ditos no-paramtricos tambm gerammodelos no domnio do tempo. Nesse caso, o comportamento dinmico do sistema determinado atravs de funes de correlao calculadas sobre os dados disponveis. Porfim, os mtodos do domnio da frequncia geram modelos representados neste domnio.Estes mtodos utilizam a transformada de Fourier (Hougen, 1972) para calcular aresposta em frequncia dos sistemas analisados.

    Os estatsticos G. Box e G. Jenkins foram pioneiros na identificao de modelosparamtricos (Box e Jenkins, 1976). Eles apresentaram uma estrutura genrica e concisacapaz de modelar uma ampla classe de sistemas dinmicos. Os modelos de Box e Jenkinsforam utilizados para representar sistemas econmicos, biolgicos, fsicos, entre outros.Alguns pesquisadores da rea de sistemas de controle interessaram-se pela identificaode sistemas na dcada de 60 e procuraram utiliz-la na anlise, predio e controle desistemas industriais reais (Astrm e Bohlin, 1965; Astrm e Eykhoff, 1971; Goodwin ePayne, 1977; Sderstrm et al., 1978; Zervos et al., 1988).

    A identificao de sistemas foi inicialmente utilizada para desenvolver modelosmatemticos lineares para os sistemas em estudo (Box e Jenkins, 1976). Entretanto, ossistemas reais so no-lineares e a representao linear de um sistema no-linear limitada. Um modelo linear descreve a dinmica de um sistema no-linear apenas navizinhana de um ponto de operao (linearizao do sistema original). Alm disso, osmodelos lineares no so capazes de reproduzir uma gama de comportamentosdinmicos observados na natureza. Destacam-se entre esses comportamentos os regimesbilineares, os ciclos limite, as bifurcaes e o caos (Fiedler-Ferrara e Prado, 1994).Apesar destas limitaes, os modelos lineares identificados foram amplamente utilizados,pois os principais mtodos de projeto, anlise e controle da poca assumiam a linearidadedos sistemas (Hougen, 1972). Essa suposio decorria das restries tericas ecomputacionais vigentes, aliadas vantajosa facilidade de manipular modelos lineares.Mesmo utilizando representaes lineares para sistemas no-lineares, a teoria de sistemasprogrediu bastante nas trs ltimas dcadas (Astrm, 1994).

    O interesse pela identificao de modelos no-lineares paramtricos surgiu no incio dadcada de 80. Em grande parte, este interesse foi motivado pelo desenvolvimento deferramentas matemticas e computacionais que simplificavam a obteno e manipulaode tais modelos. Atualmente, o crescente interesse pelo assunto refletido pelo elevadonmero de trabalhos publicados em revistas especializadas (como ser visto no captulo2). Obviamente, o desenvolvimento da teoria de identificao de modelos no-linearesdever motivar a elaborao de novos mtodos (algoritmos) para a anlise e controle dossistemas modelados (Seborg, 1994).

    1.4 Aspectos da Identificao de Sistemas

    Os dados utilizados para identificar modelos dinmicos so denominados dados deidentificao. Os dados de identificao so gerados por medies da resposta y(t) do

  • Captulo 1 6

    sistema alimentado por uma entrada u(t) pr-especificada. O sinal de entrada u(t) devepossuir espectro suficientemente amplo em amplitude e frequncia para excursionar osistema pelos regimes dinmicos de interesse. Os dados de identificao de sistemasdinmicos autnomos constituem sries temporais.

    Os modelos matemticos gerados pela identificao de sistemas podem ser divididos emduas classes:

    modelos entrada-sada; modelos em espao de estados.

    Os modelos entrada-sada descrevem a resposta y(t) do sistema em funo da entradau(t) aplicada. Entretanto, estes modelos no permitem analisar o comportamento devariveis internas do sistema.

    As tcnicas de identificao de sistemas tambm podem ser utilizadas para derivarmodelos matemticos em espaos de estados. Estes modelos permitem analisar ocomportamento de variveis internas do sistema, alm da sada y(t), em uma dada regiode operao. As variveis de estado destes modelos podem possuir ou no significadofsico real.

    A escolha da estrutura a ser utilizada para representar os regimes dinmicos descritospelos dados um problema crucial na identificao de sistemas. Este problema pode sersuavizado pela utilizao de propriedades do sistema conhecidas "a priori" na seleo daestrutura do modelo que dever represent-lo. Os modelos matemticos gerados pelaidentificao de sistemas podem ser classificados em trs grupos de acordo com o nvelde conhecimento "a priori" utilizado na seleo de sua estrutura (Ljung, 1987):

    modelos caixa-branca ("white-box"); modelos caixa-cinza ("grey-box"); modelos caixa-preta ("black-box").

    Os modelos caixa-branca tm suas estruturas completamente ajustadas a partir deinformaes conhecidas "a priori". Nesse caso, a forma da funo matemtica quedescreve o comportamento dinmico do sistema original pr-conhecida. Os modeloscaixa-cinza so identificados utilizando algum conhecimento "a priori" para simplificaros algoritmos de seleo de estrutura. Por fim, a identificao dos modelos caixa-pretano utiliza informaes conhecidas "a priori". A estrutura destes modelos ajustadadentro de famlias de representaes conhecidas por apresentar boa flexibilidade namodelagem de sistemas (Ljung, 1987; Ljung, 1995).

    1.5 Apresentao do Trabalho

    O objetivo principal desse trabalho descrever o procedimento de identificao desistemas dinmicos no-lineares utilizando modelos NARMAX polinomiais.

  • Consideraes sobre a Modelagem de Sistemas 7

    Os modelos NARMAX polinomiais so estruturas paramtricas entrada-sada capazes derepresentar o comportamento de uma ampla classe de sistemas dinmicos no-linearesreais (Leontaritis e Billings, 1985a, 1985b; Billings e Chen, 1989).

    O procedimento de identificao de modelos paramtricos no-lineares pode ser divididoem cinco etapas: (i) aquisio de dados do sistema que se deseja modelar; (ii) aplicaode testes para deteco de no-linearidades nos dados medidos; (iii) seleo da estruturado modelo que dever representar a dinmica original; (iv) estimao dos parmetros daestrutura selecionada; (v) validao do modelo identificado. O captulo 2 descreve eanalisa as cinco etapas do procedimento de identificao de modelos NARMAXpolinomiais (modelos caixa-preta) com base na literatura correlata.

    O captulo 3 analisa a etapa crucial da identificao de sistemas no-lineares: a seleo daestrutura dos modelos. Modelos no-lineares sobreparametrizados tendem a apresentarregimes dinmicos esprios; isto , regimes dinmicos no apresentados pelo sistemaoriginal. O captulo revisa um procedimento auxiliar de seleo de estrutura de modelosNARMAX polinomiais. Este procedimento utiliza os conceitos de agrupamentos determos e coeficientes de agrupamentos para selecionar o conjunto de termos importantespara reproduzir a dinmica do sistema. Em seguida, os termos de modelos NARMAXpolinomiais podem ser escolhidos dentro deste conjunto utilizando tcnicas usuais deseleo de estrutura.

    Os conceitos de agrupamentos de termos e de coeficientes de agrupamentos tambmpodem ser empregados na anlise da autoestrutura e da estabilidade e simetria dospontos fixos de modelos NARMAX polinomiais. Em alguns casos, esta anlise poderser utilizada na validao de modelos identificados. Por fim, o captulo 3 descreve eanalisa uma tcnica para a determinao do perodo de amostragem de um sinal a partirde algumas funes de correlao. Tais ferramentas foram utilizadas para determinar osperodos de amostragem adequados para os sinais de interesse nessa dissertao.

    O captulo 4 descreve dois conjuntos de rotinas computacionais codificadas para aidentificao de modelos NARMAX polinomiais. O primeiro conjunto de rotinasimplementa as diversas etapas do procedimento de identificao de modelos NARMAXpolinomiais. O segundo conjunto de rotinas implementa algoritmos utilizados na anlise ena visualizao dos modelos identificados. Estes dois conjuntos de rotinas foramutilizados para identificar todos os modelos apresentados nesse trabalho. Ainda nocaptulo 4, so analisadas as vantagens e desvantagens da codificao das rotinas deidentificao em algumas linguagens de programao de alto-nvel adequadas aoprocessamento matemtico numrico.

    Os captulos 5 e 6 mostram a aplicao das tcnicas de identificao de modelosNARMAX polinomiais modelagem de sistemas dinmicos no-lineares reais. Aidentificao dos modelos apresentados nestes captulos seguiu todas as etapas descritasnos captulos 2 e 3.

    O captulo 5 analisa a identificao no-linear de um forno eltrico sem estrutura deisolamento trmico e que apresenta dinmica bilinear (Rodrigues et al., 1996). O forno

  • Captulo 1 8

    eltrico utilizado nesse trabalho uma das plantas piloto disponveis no Laboratrio deControle de Processos Industriais (LCPI) da Universidade Federal de Minas Gerais(Abreu, 1993). O comportamento bilinear evidencia-se pela existncia de constantes detempo de subida (aquecimento) e de descida (resfriamento) distintas. Alm disso, omecanismo de transferncia de calor por radiao trmica que se processa no interior doforno altamente no-linear. Dessa maneira, o comportamento dinmico do fornoeltrico no pode ser bem representado por modelos lineares (mesmo quando estesmodelos so obtidos em estreitas faixas de operao). Por este motivo, a identificao doforno eltrico constitui um bom teste para avaliar a qualidade dos modelos NARMAXpolinomiais na representao de sistemas no-lineares reais.

    O captulo 6 descreve a modelagem no-linear do circuito catico de Chua (Aguirre,Rodrigues e Mendes, 1996). O circuito de Chua apresenta uma topologia bastantesimples. Ele constitudo por alguns componentes passivos lineares e um componenteno-linear denominado diodo de Chua. O diodo de Chua possui uma curva caractersticacorrentetenso linear por partes. A variao de um potencimetro do circuito permitealterar o comportamento dinmico apresentado pelo sistema. Os dois regimes dinmicosmodelados neste captulo so aqueles representados pelos atratores caticos de duplavolta e em espiral. Aguirre e Billings (1994b) identificaram modelos NARMAXpolinomiais para o circuito de Chua utilizando dados de simulao das equaesdinmicas do sistema. O objetivo desse trabalho identificar modelos NARMAXpolinomiais para o circuito de Chua utilizando dados reais. Estes dados so geradosdurante a operao de um prottipo do circuito montado e testado no LCPI (Torres eAguirre, 1995b).

    Aps os seis captulos descritos, so apresentadas as concluses desse trabalho ealgumas propostas para a sua continuao. Por fim, o apndice A apresenta um glossriosobre sistemas dinmicos no-lineares. Este glossrio descreve alguns conceitos da teoriade sistemas dinmicos no-lineares utilizados na elaborao da dissertao.

  • Identificao de Sistemas No-Lineares 9

    Captulo 2

    2. Identificao de Sistemas No-Lineares

    2.1 Introduo

    Historicamente, o procedimento de identificao foi desenvolvido assumindo alinearidade dos sistemas dinmicos em estudo. Isso ocorreu devido a restries tericas ecomputacionais vigentes. Entretanto, os sistemas reais so no-lineares e a representaolinear limitada em algumas aplicaes. A utilizao de modelos lineares impede queuma gama de comportamentos dinmicos apresentados pelos sistemas reais sejareproduzida. Entre os regimes dinmicos no-modelados por estruturas lineares, pode-sedestacar os ciclos limite, as bifurcaes, as dinmicas quasi-peridicas e o caos1.

    Nas duas ltimas dcadas, um grande nmero de pesquisadores tem se dedicado soluo do problema de identificao de sistemas dinmicos no-lineares (Billings, 1980;Leontaritis e Billings, 1985a, 1985b; Korenberg et al., 1988; Billings et al., 1989; Chenet al., 1989; Haber e Unbehauen, 1990; Aguirre, 1994a; Billings e Zhu, 1994; Johansen,1994; Ljung, 1994; Prl e Karim, 1994; Aguirre e Billings, 1995a, 1995b, 1995c;Aguirre e Mendes, 1996).

    O objetivo desse captulo apresentar uma reviso dos principais tpicos relacionados identificao de sistemas no-lineares, baseando-se para isso em algoritmos descritos naliteratura. Uma breve reviso da teoria de sistemas dinmicos no-lineares apresentadano apndice A, onde so explicados os principais conceitos e algoritmos relacionados.

    2.2 Identificao de Sistemas

    O problema de identificao de sistemas pode ser dividido em cinco etapas principais(Ljung, 1987):

    Obteno de dados de experimentao do sistema que se deseja modelar; Aplicao de testes aos dados obtidos para deteco de no-linearidades; Escolha da estrutura que ser utilizada para representar o modelo; Estimao dos parmetros do modelo; Validao do modelo obtido.

    O procedimento descrito acima empregado na identificao tanto de sistemas linearesquanto sistemas no-lineares. As principais diferenas se devem maneira como cada

    1A descrio de tais regimes dinmicos pode ser encontrada, por exemplo, em Fiedler-Ferrara e Prado(1994, Parte II) e no apndice A dessa dissertao.

  • Captulo 2 10

    passo implementado, conforme ser descrito nas subsees seguintes.

    2.2.1 Experimentao do Sistema

    Nessa etapa do processo de identificao, o sistema deve ser experimentado atravs daaplicao de entradas pr-determinadas e da observao das sadas correspondentes (oudas variveis de estado observveis). Os dados assim obtidos sero utilizados nadeteco de no-linearidades e no ajuste dos parmetros do modelo escolhido.

    As entradas a serem utilizadas para excitar o sistema devem ser projetadas para satisfazerum conjunto de propriedades (Billings, 1980; Billings e Voon, 1983; Billings e Voon,1986) que garantiro a adequabilidade dos dados obtidos. Deseja-se, em princpio, queos sinais de entrada tenham um espectro de frequncias adequado para excitar a dinmicado sistema (no caso de sistemas no-lineares, isto requer que os efeitos no-linearessejam excitados por tais sinais e assim estejam presentes nos dados). Em sistemas no-lineares, nos quais variaes da amplitude do sinal de entrada podem provocar mudanasqualitativas no comportamento do mesmo, necessrio projetar um perfil de amplitudespara os sinais de teste (Aguirre e Billings, 1995a).

    Certas classes de representaes de sistemas no-lineares podem gerar modelos sensveisao sinal de entrada. Este tipo de modelo depende de parmetros do sinal de testeaplicado ao sistema (mdia e varincia, por exemplo) e s ser vlido para a excitaoconsiderada. Um exemplo desse fenmeno apresentado e discutido em Billings e Voon(1983, 1984).

    Na prtica, os sinais mais utilizados para excitar os sistemas so ondas quadradas, sinaisbinrios pseudo-aleatrios, PRBS (Leontaritis e Billings, 1987), e rudo branco (pseudo-aleatrio), que tm um espectro de frequncias relativamente largo.

    Os dados obtidos na experimentao do sistema devem ser processados por filtros passa-baixas, a fim de que o falseamento dos sinais amostrados seja evitado. O espectro defrequncias de um sinal adequadamente amostrado corresponde ao espectro do sinaloriginal no intervalo 1 2 1 2( ) ( )T f Ts s e se repete com "perodo" 1 Ts , onde Ts operodo de amostragem escolhido. As componentes de altas frequncias que estejamsuperpostas ao sinal original iro aparecer como componentes de baixas frequncias nosinal amostrado, distorcendo o espectro de frequncias deste. A distoro do espectro defrequncias do sinal amostrado implica em perda de informaes a respeito do sinaloriginal. Assim, deve-se garantir que a frequncia de amostragem seja maior que o dobroda maior frequncia do sinal original para evitar o falseamento do sinal amostrado(Shannon, 1949).

    2.2.2 Deteco de No-Linearidades

    Todos os sistemas reais so, em ltima instncia, no-lineares. No entanto, a no-linearidade apresentada por alguns bem suave, permitindo que a utilizao de modeloslinearizados (em torno de um ponto de operao) seja satisfatria. Quando isso no

  • Identificao de Sistemas No-Lineares 11

    acontece, essencial empregar um modelo no-linear para melhor descrever a dinmicado sistema.

    Os dados obtidos na experimentao do sistema podem ser processados por algoritmosde deteco de no-lineridades no ensejo de verificar se existem interaes no-linearesque devam ser modeladas (Billings e Voon, 1983; Haber, 1985; Haber e Unbehauen,1990). Estes testes verificam se os dados do sistema satisfazem (dentro de limites pr-estabelecidos) certas propriedades caractersticas de sistemas lineares. Adotar-se- ummodelo no-linear para o sistema quando tais propriedades no forem verificadas.

    Os algoritmos mais utilizados na deteco de no-linearidades so (Haber, 1985):

    teste no domnio do tempo; mtodo da correlao cruzada no-linear; mtodo da autocorrelao de ordem elevada.

    Neste trabalho, o teste de deteco de no-linearidades apresentado em (Billings e Voon,1983; Billings e Voon, 1986) ser utilizado para detectar a presena de interaes no-lineares em conjuntos de dados. Considere o sistema dinmico descrito pela equaodiscreta:

    y t f y t y t n u t d u t d n

    e t e t n e t

    y u

    e

    ( ) ( ( ), ), , ( ), ( ), ,

    ), , ( )) ( ),

    = +

    +

    1 1 , ( ,

    ( 1

    ( 2.1 )onde y(t), u(t) e e(t) so sada, entrada e rudo do sistema, respectivamente, com atrasosmximos representados por ny, nu, ne. d representa o retardo ou tempo morto do sistemae f uma funo matemtica genrica. O perodo de amostragem Ts foi normalizadopara gerar uma representao simples e concisa. Os autores mostraram que a relao:

    y y

    E y t E y t y t E y t, , ( ) {( ( ) { ( )})( ( ) { ( )})}22 2 0 = =

    ( 2.2 ) vlida se e somente se o sistema ( 2.1 ) for linear2. Um intervalo de confianaprobabilstico delimita a regio onde a funo de correlao ( 2.2 ) deve permanecer para

    ser considerada nula. Os limites do intervalo de confiana de 95 % so: 1,96 N ,onde N o comprimento do registro de dados disponveis (Billings e Voon, 1983;Billings e Voon, 1986).

    A funo de correlao ( 2.2 ) pode ser estimada utilizando os dados de identificaodisponveis. O sistema que gerou os dados dever ser representado por uma modelo no-linear quando a correlao calculada no permanece dentro do intervalo de confiana.

    2O sinal u(t) deve satisfazer algumas propriedades para que o resultado apresentado seja vlido (Billingse Voon, 1983). No entanto, sinais de entrada usuais (senides, sinais gaussianos, PRBS) possuem taispropriedades. O rudo e(t) e a entrada u(t) so supostos independentes (no-correlacionados).

  • Captulo 2 12

    2.2.3 Escolha da Representao e de Estruturas

    Na modelagem, uma importante questo a escolha da estrutura que dever representaro comportamento de um sistema dinmico. Esta questo se torna ainda mais importanteno caso de sistemas no-lineares devido grande diversidade de no-linearidadesdistintas.

    A estrutura escolhida deve ser suficientemente complexa para representar uma grandeclasse de no-linearidades possveis, sem que isto torne invivel sua manipulaomatemtica. Algumas representaes utilizadas na modelagem de sistemas no-linearesso:

    redes neurais (Elsner, 1992); funes de base radial, RBFs (Casdagli, 1989); sries de Volterra (Billings, 1980); "wavelets" (Strang, 1989); funes racionais e funes polinomiais (Billings e Chen, 1989; Haber e Unbenhauen,

    1990; Casdagli et al., 1992).

    Essas estruturas permitem, em muitos casos, descrever a dinmica do sistema de formaglobal.

    Uma alternativa a utilizao de representaes locais. Nestas, o espao de estados dosistema dividido em vizinhanas, nas quais a dinmica aproximada por ummapeamento linear. A descrio global pode ser obtida a partir da interpolao dessesmodelos locais (Foss e Johansen, 1992; Johansen, 1994; Foss et al., 1994), emdetrimento da simplicidade, da facilidade de anlise do modelo e do tempo deprocessamento computacional.

    Neste trabalho, sero utilizadas as estruturas "no-lineares auto-regressivas com mdiamvel e entrada exgena" ("non-linear auto-regressive with moving average andexogenous inputs", NARMAX) (Leontaritis e Billings, 1985a; Leontaritis e Billings,1985b), que constituem uma representao natural para uma grande classe de sistemasno-lineares (Billings e Chen, 1989).

    A estrutura de um modelo NARMAX com perodo de amostragem normalizado (Leontaritis e Billings, 1985a; Leontaritis e Billings, 1985b; Billings e Chen, 1989):

    y t F y t y t y t n u t d u t d

    u t d n e t e t e t n e t

    ly

    u e

    ( ) [ ( ), ( ), , ( ), ( ), ( ), ,

    ( ), ( ), ( ), , ( )] ( ) ,

    =

    + +

    1 2 1

    1 1 2

    ( 2.3 )onde t=1,...,N. F l uma funo no-linear qualquer. y(t), u(t), e(t) so sada, entrada erudo (aditivo) do sistema, cujos atrasos mximos so representados por ny, nu, ne3. drepresenta o retardo ou tempo morto do sistema. 3Existem procedimentos estatsticos que permitem estimar os atrasos ny, nu, ne a partir dos dados deoperao do sistema (Davis e Vinter, 1985, captulo 4; Granger e Lin, 1994).

  • Identificao de Sistemas No-Lineares 13

    A forma da funo F l normalmente no conhecida "a priori". Assim, a dinmica dosistema deve ser reconstruda utilizando-se uma aproximao para representar F l.Possveis aproximaes so: modelos polinomiais, racionais e "output-affine" (Billings eChen, 1989).

    Um modelo no-linear polinomial de grau l apresenta a seguinte estrutura (Billings eChen, 1989):

    y t x t x t x t

    x t x t e t

    i ii

    n

    i i i ii i

    n

    i

    n

    i i i ii i

    n

    i

    n

    l l

    l l

    ( ) ( ) ( ) ( )

    ( ) ( ) ( ) ,

    = + + + +

    +

    = ==

    ==

    01 1

    1

    1 1

    1

    1 2 1 2

    2 11

    1 1

    11

    ( 2.4 )onde

    x t y t x t y t x t u t d

    x t e t x t e t n n n n n

    n

    n n n e y u e

    y

    y u

    1 2 1

    1

    1 2

    1

    ( ) ( ) , ( ) ( ) , , ( ) ( ) , ,

    ( ) ( ) , , ( ) ( ). .

    = = =

    = = = + +

    +

    + +

    Os 's so os parmetros que devem ser estimados para que a estrutura escolhida para omodelo se ajuste janela de dados utilizada na estimao. desejvel que o modelotambm reproduza a dinmica do sistema e no somente se ajuste aos dados deestimao (Aguirre e Billings, 1994a).

    A utilizao de modelos polinomiais apresenta algumas vantagens bvias sobre as outrasrepresentaes. possvel obter modelos NARMAX polinomiais que ajustem os dadosde identificao com boa exatido desde que estes dados no apresentem variaesabruptas (nessa situao, o sinal utilizado na obteno dos modelos apresenta taxa devariao elevada em curtos espaos de tempo)4. Alm disso, um modelo NARMAXpolinomial se transforma em uma representao linear quando o ponto de operao dosistema mantido aproximadamente fixo (linearizao do modelo) (Billings e Chen,1989). Outra vantagem da representao polinomial a facilidade com que a informaoanaltica sobre a dinmica do modelo pode ser obtida. Essa caracterstica ser discutidaem detalhes no prximo captulo.

    As funes no-lineares polinomiais so lineares nos parmetros, o que permite autilizao de algoritmos de estimao de parmetros para sistemas lineares. Essesalgoritmos de estimao so fceis de implementar, convergem rapidamente e j foramestudados em um vasto nmero de artigos (Davis e Vinter, 1985, captulo 4; Korenberget al., 1988; Chen et al., 1989, Astrm e Wittenmark, 1990, captulo 13).

    4 Nesse caso, as representaes mais adequadas parecem ser os modelos racionais e os output-affine(Billings e Chen, 1989).

  • Captulo 2 14

    2.2.4 Deteco de Estrutura

    O nmero de termos possveis em modelos polinomiais cresce bastante com o aumentodo grau de no-linearidade l e da ordem ny do modelo. Como pode ser visto na equao( 2.4 ), o nmero de termos tambm depende de nu e ne. De fato, esse nmero pode serdeterminado atravs da seguinte expresso (Korenberg et al., 1988):

    n M = + 1 ,( 2.5 )

    onde n o nmero de termos (de processo e de rudo) no modelo e

    ,

    , 0

    M n

    nn n n n i

    in

    ii

    l

    ii y u e

    =

    =

    + + + =

    =

    1

    1 1 1( )

    .

    O valor de n pode se tornar impraticavelmente grande para modelos polinomiais.Entretanto, o problema aqui no to crtico quanto no caso das sries de Volterra oumodelos de Wiener, onde o nmero de termos pode facilmente chegar a 1010 parasistemas relativamente simples (Billings, 1980). A unio de todos os termos passveis deserem includos em um modelo polinomial denominado conjunto de termos candidatos.

    Na tentativa de melhor explicar os dados de identificao do sistema, os modelos tendema se tornar excessivamente complexos. A utilizao desses modelos na prtica torna-seinvivel, pois muito tempo e esforo computacional sero necessrios para implementar aestimao de parmetros, simular o modelo e predizer o comportamento do sistema.Alm disso, modelos no-lineares sobreparametrizados tendem a apresentar regimesdinmicos esprios; ou seja, regimes dinmicos no apresentados pelo sistema original(Aguirre e Billings, 1995a).

    Embora o nmero de termos possveis em modelos polinomiais seja muito elevado,apenas um pequeno nmero deles suficiente para aproximar a dinmica do processo, namaioria dos casos. Garantindo que os termos importantes no modelo possam sercorretamente encontrados, representaes concisas podem ser obtidas para uma grandediversidade de sistemas no-lineares. O procedimento de encontrar os termos a seremincludos no modelo denominado deteco de estrutura.

    Existem alguns algoritmos para implementar a deteco de estrutura de modelos no-lineares. O uso de algoritmos genticos para deteco de termos em modelos NARMAXfoi investigado por Fonseca et al. (1993). Cada modelo possvel foi codificado como umindivduo com uma cadeia de genes, onde cada gene indica um termo constituinte domodelo. Atravs do uso de tcnicas evolutivas, foi selecionado o indivduo mais forte; ouseja, o melhor modelo. Outro mtodo utilizado para a deteco de estrutura de modelosno-lineares o "zeroing-and-refitting" (Kadtke et al., 1993). Neste mtodo, considera-se um modelo inicial com todos os termos possveis. Todos os parmetros deste modeloque apresentarem valor absoluto menor que uma tolerncia (previamente ajustada) sozerados; ou seja, seus respectivos termos so eliminados do modelo. Os termos cujos

  • Identificao de Sistemas No-Lineares 15

    parmetros no foram zerados constituem o novo modelo. Os parmetros desse novomodelo so, ento, reestimados. O procedimento descrito acima pode ser repetido umnmero definido de vezes ou at que nenhum termo possa mais ser eliminado, gerandoassim o modelo final.

    A taxa de reduo do erro ("error reduction ratio" ou ERR) um outro critrio utilizadona deteco de estrutura de modelos NARMAX polinomiais (Korenberg et al., 1988;Billings et al., 1989; Chen et al., 1989). O ERR de cada termo candidato um nmeroque indica a melhoria obtida na representao do sistema atravs da sua incluso nomodelo. Um algoritmo de deteco de estrutura baseado no ERR ser descrito aps aapresentao do algoritmo de estimao de parmetros.

    2.2.5 Estimao de Parmetros

    Determinada a estrutura de um modelo, deve-se estimar seus parmetros para aproximaro comportamento dinmico apresentado pelo sistema. Isto normalmente feito (no casode modelos polinomiais) aplicando-se tcnicas de mnimos quadrados5 aos dados obtidosem experimentao.

    A estrutura apresentada em ( 2.4 ) pode ser representada como:

    y t p t e ti ii

    n

    ( ) ( ) ( ) ,= +=

    1

    ( 2.6 )onde os regressores do modelo, pi(t), correspondem aos diferentes termos no polinmioe os i so os respectivos parmetros.

    A equao ( 2.6 ) pode ser escrita na forma do erro de predio:

    y t p t ti ii

    n

    ( ) ( ) ( ) ,= +=

    1

    ( 2.7 )onde o chapu sobre as variveis faz referncia valores estimados e o resduo deidentificao (t,) definido como:

    ( , ) ( ) ( , )t y t y t= ,( 2.8 )

    ( , ) ( ) y t p ti ii

    n

    =

    =

    1

    .

    ( 2.9 )

    O vetor de resduos {(t), t=1,...,N} representa os erros de modelagem, o rudo aditivodo sistema e incertezas de ordem qualquer. A equao ( 2.9 ) denominada preditor de"um-passo-a-frente" e ( )y t a predio de "um-passo-a-frente" de y(t).

    5 Outras alternativas possveis so indicadas em Billings e Voon (1984).

  • Captulo 2 16

    Os parmetros i do modelo devem ser escolhidos, dentro de um espao de busca, demodo a minimizar um ndice de desempenho pr-estabelecido. Considerar-se- o ndicede desempenho (Astrm e Wittenmark, 1990, captulo 13; Jota, 1994):

    JN

    f tNt

    N

    ( ) ( ( , )) , ==

    11

    ( 2.10 )

    onde () uma funo matemtica genrica.

    Os parmetros estimados sero diferentes para cada considerada. Utilizando ()= T ,tem-se o chamado mtodo dos mnimos quadrados. Nesse caso, ( 2.10 ) transforma-seem:

    JN

    t tNT

    t

    N

    ( ) ( , ) ( , ) , ==

    11

    ( 2.11 )que dever ser minimizado para determinar o conjunto de parmetros correspondente6.

    O vetor de parmetros estimados ser omitido na representao dos resduos deidentificao e da sada predita do modelo, no texto que se segue, para simplificao denotao. Representando a equao ( 2.7 ) em notao matricial:

    Y P= + , ( 2.12 )

    onde

    [ ][ ]

    Y y y y N

    N

    T

    T

    =

    =

    ( ) ( ) ( )

    ( ) ( ) ( )

    1 2

    1 2

    ,

    P

    p p p

    p p p

    p N p N p N

    n

    n

    n

    =

    1 2

    1 2

    1 2

    1 1 1

    2 2 2

    ( ) ( ) ( )

    ( ) ( ) ( )

    ( ) ( ) ( )

    ,

    [ ] = 1 2 n T ,e T indica transposio da matriz ou vetor. A matriz P denominada matriz deregressores do modelo e indica o vetor de parmetros nominal.

    A soluo do problema de mnimos quadrados conhecida e dada por (Golub e VanLoan, 1989):

    6 possvel dar pesos diferentes aos resduos (1),...,(N), no mtodo dos mnimos quadrados, mudando-se adequadamente a funo de custo a ser minimizada (Davis e Vinter, 1985, captulo 4).

  • Identificao de Sistemas No-Lineares 17

    ( ) LS T TP P P Y= 1 .( 2.13 )

    As matrizes Y e P foram definidas em ( 2.12 ). A matriz PTP denominada matriz deinformao. Esta matriz simtrica e positiva definida quando P tem posto pleno decolunas7. Entretanto, ela pode perder essas propriedades em casos de mal-condicionamento numrico grave.

    A equao ( 2.13 ) denominada equao normal. A soluo LS existe e nica desdeque PTP seja no-singular. Para que isso seja verificado, a matriz P deve ter posto plenode colunas. Nessa situao, as colunas de P so linearmente independentes e formamuma base num espao vetorial gerado por P (espao imagem de P). Quando Y nopertence ao espao vetorial descrito pelas colunas de P (como ir acontecer na quasetotalidade dos casos), os dados do sistema no podero ser completamente explicados

    pelos regressores. Nesse caso, P LS representar a projeo ortogonal de Y no espao

    imagem de P e os resduos da estimao (t) sero mnimos e ortogonais a tal espao(Golub e Van Loan, 1989).

    A estimativa obtida dita no-polarizada se o vetor de resduos {(t), t=1,...,N} forbranco e no apresentar correlao com os regressores; isto (Davis e Vinter, 1985,captulo 4; Korenberg et al., 1988):

    E LS{ } = ,

    ( 2.14 )

    onde E representa esperana matemtica e o vetor nominal de parmetros. Quandoisso no acontece, os resduos apresentam alguma dinmica que no foi devidamenteexplicada pelo modelo. Novos termos devem ser includos no mesmo para que asestimativas se tornem no-polarizadas e toda a dinmica dos dados seja absorvida pelomodelo8.

    Existem mtodos de estimao de parmetros que garantem a obteno de estimativasno-polarizadas mesmo quando o rudo e(t) do sistema for no-branco e no estiverdevidamente modelado. Um desses mtodos o da varivel instrumental (Billings eVoon, 1984; Davis e Vinter, 1985, captulo 4; Jota, 1994), no qual definida uma novavarivel aleatria v(t) que apresenta correlao com os regressores do modelo e no-correlacionada com e(t). Essa nova varivel ser, ento, utilizada na estimao, no lugar

    7 A matriz de informao PTP simtrica e positiva semidefinida quando a matriz de regressores P notem posto pleno de colunas.8Um cuidado especial deve ser tomado com os termos em rudo, no modelo. Na prtica, modela-se orudo apenas para evitar a polarizao dos parmetros. Obtido o modelo, despreza-se a parte estocsticae considera-se apenas a parte determinstica para simulao e anlise (Aguirre, 1994a).Em algumas aplicaes tais como predio a curto prazo, filtragem e controle adaptativo, entre outras,tanto a parte estocstica quanto a parte determinstica do modelo so utilizadas (Jota, 1994; Aguirre eBillings, 1995b; Aguirre et al., 1996).

  • Captulo 2 18

    dos regressores antigos9.

    Implementaes Ortogonais do Algoritmo de Mnimos Quadrados

    Quando P mal-condicionada, a formao da matriz PTP torna-se sujeita a problemasnumricos (propagao de erros, preciso insuficiente nos clculos) que podem afetar aestabilidade do algoritmo de mnimos quadrados (Chen et al., 1989). Nesse caso, asoluo da equao normal atravs da expresso ( 2.13 ) torna-se invivel. Mal-condicionamento numrico acontece quando as colunas de regressores na matriz P soaltamente correlacionadas entre si.

    Uma alternativa para aliviar tal problema a ortogonalizao da matriz P. Nestasituao, as colunas de P sero no-correlacionadas e formaro uma base ortogonal parao espao vetorial soluo de P . Alguns algoritmos utilizados na soluo do problemade mnimos quadrados ortogonais so o procedimento de Gram-Schmidt (clssico emodificado) e o mtodo da transformao de Householder.

    Descrever-se-, em seguida, o mtodo da transformao de Householder (Chen et al.,1989), o qual ser utilizado na estimao ortogonal de parmetros neste trabalho (videcaptulo 4).

    Se a matriz P tiver posto pleno de colunas, ela pode ser decomposta em:

    P QR= ,( 2.15)

    onde Q N n R uma matriz ortonormal (QTQ=I) e R n n R uma matriz triangularsuperior.

    Criando a matriz aumentada Q , obtm-se:

    Q Q q qn N= +[ | ] ... , 1( 2.16 )

    P QR

    =

    0 ,

    ( 2.17 )

    onde Q tem dimenso NN. As novas colunas acrescentadas a Q podem ser quaisquer,

    desde que Q tenha posto pleno de colunas.

    Aplicando Q T a Y (vetor de sadas do sistema):

    9O mtodo da Varivel Instrumental para sistemas no-lineares pode ser invivel ou bastante complexoe, portanto, pouco utilizado (Billings e Voon, 1984; Billings e Voon, 1986).

  • Identificao de Sistemas No-Lineares 19

    Q Yy

    yT

    =

    1

    2

    ,

    ( 2.18 )

    onde y1 e y2 tm dimenso n1 e (N-n)1, respectivamente.

    Assim:

    Y P Q Y P y R yT = = + 2 2 1 2 2 2

    ( ) ,

    ( 2.19 )

    onde .2indica norma euclidiana.

    A estimativa dos parmetros pode ser obtida solucionando-se o sistema linear triangular(usando substituio reversa, por exemplo):

    R y = 1.( 2.20 )

    A fatorao QR da matriz P pode ser implementada utilizando-se transformaes deHouseholder devidamente projetadas para tanto (Chen et al., 1989; Golub e Van Loan,1989).

    O procedimento de Gram-Schmidt ser descrito a seguir, pois ele constitui uma outraopo para implementar a ortogonalizao do conjunto de regressores do algoritmo demnimos quadrados, a qual bastante utilizada na literatura (Korenberg et al., 1988;Billings et al., 1989; Chen et al., 1989).

    No procedimento de Gram-Schmidt, a matriz P decomposta no produto de duasmatrizes, uma ortogonal e a outra triangular superior, como na fatorao deHouseholder. A forma de implementar tal decomposio o que diferencia os doismtodos.

    Considere:

    P WA= ,( 2.21 )

    onde A uma matriz triangular superior com a diagonal unitria, de dimenso nn e W uma matriz ortogonal (WTW=D, sendo D uma matriz diagonal), de dimenso Nn, aser construda a partir dos dados de operao.

    Da equao ( 2.12 ):

    Y P A A= + .( )1 ( 2.22 )

    Define-se:

  • Captulo 2 20

    W PA= 1 ,( 2.23 )

    g A= ,( 2.24 )

    Y Wg= + ,( 2.25 )

    onde as colunas de W constituem os novos regressores (ditos ortogonais) do problema eg o vetor de parmetros para este conjunto de regressores.

    A soluo do problema de mnimos quadrados ortogonais ( 2.25 ) (Korenberg et al.,1988; Billings et al., 1989; Chen et al., 1989):

    .g D W YT= 1 ( 2.26 )

    Determinado g atravs de ( 2.26 ), os parmetros do modelo original podem ser obtidossegundo ( 2.24 )10.

    2.2.6 Critrios de Informao

    Na literatura de identificao de sistemas, existem procedimentos que permitem estimar aordem de modelos dinmicos a partir de dados, utilizando algum critrio de otimizao.Entre tais mtodos, destacam-se o critrio de informao de Akaike, AIC (Akaike,1974), o critrio de informao de Bayes, BIC (Kashyap, 1977), o critrio de informaode Schwarz (Crutchfield e McNamara, 1987) e a "entropia do modelo" (Mees, 1993).

    O mtodo mais utilizado para estimar o nmero de termos que devem ser includos emmodelos dinmicos o critrio de informao de Akaike (1974). De acordo com ocritrio de Akaike, o nmero timo de termos em um modelo deve minimizar a seguintefuno de custo:

    J N Var t n= +log( { ( )}) 2 p ,( 2.27 )

    onde N o comprimento dos registros de dados e np o nmero de termos de processono modelo. A funo de custo de Akaike estabelece um compromisso entre a qualidadedo ajuste aos dados de identificao (quantificada pelo primeiro termo) e a procura porrepresentaes parcimoniosas (quantificada pelo segundo termo). O critrio de Akaike eoutros critrios de informao (de Gooijer et al., 1985) foram desenvolvidos no contextode sistemas lineares. Contudo, tais critrios fornecem resultados consistentes para muitossistemas no-lineares (Aguirre, 1994b).

    O nmero de termos determinado a partir do critrio de Akaike minimiza a varincia dosresduos de identificao em uma estrutura fixa (a qual foi previamente ajustada atravs 10 Chen et al. (1989) apresentam ainda um algoritmo de estimao ortogonal baseado na decomposioem valores singulares da matriz de regressores P. Este algoritmo pode ser utilizado para solucionar oproblema de mnimos quadrados em casos onde a matriz de regressores P no tem posto pleno decolunas e a matriz PTP singular.

  • Identificao de Sistemas No-Lineares 21

    de um critrio de seleo de estrutura qualquer). Entretanto, no se pode afirmar que ummodelo selecionado pelo critrio de informao seja capaz de reproduzir as propriedadesdinmicas do sistema original (Aguirre e Billings, 1994a). Aguirre (1994b) mostra queos critrios de informao nem sempre selecionam os modelos com melhorespropriedades dinmicas, embora geralmente se aproximem deles. O critrio de Akaikeno determina o "melhor" modelo, mas delimita a regio de busca no espao deestruturas de modelos.

    2.2.7 Deteco de Estrutura Utilizando o ERR

    Utilizando ( 2.25 ) e considerando E t{ ( )} = 0 , define-se a varincia do erro demodelagem (t) como:

    Var tN N

    Y Y g w wNT

    NT

    i iT

    ii

    n

    { ( )} lim lim = =

    =

    1 1 2

    1

    ,

    ( 2.28 )onde gi indica os elementos do vetor de parmetros g e wi indica os regressoresortogonais (colunas da matriz W).

    Supondo que nenhum termo fosse includo no modelo, a varincia de (t) seria igual aoerro quadrtico mdio da sada y(t). A cada novo termo colocado no modelo, a varincia

    de (t) decrescida de um fator 1 2N g w wi iT i( ) , onde wi indica o termo includo e gi oseu respectivo parmetro. A reduo no valor da varincia pode ser normalizada comrelao ao erro quadrtico mdio do sinal de sada. Assim, o ERR de cada termo definido formalmente como:

    [ ]ERRg w w

    Y Yi ni

    i iT

    iT

    = 2

    , 1 .

    ( 2.29 )

    O ERR indica a poro da varincia da sada explicada pela incluso de um novo termono modelo. Ele pode ser utilizado na deteco de estrutura de modelos polinomiais.Escolhe-se o nmero de termos desejados para o modelo e considerar-se-o aqueles quepossurem os maiores valores de ERR.

    O valor do ERR depende da posio em que o termo considerado includo no modelo.Em (Billings et al., 1989) apresentado um esquema de deteco de estrutura, baseadono ERR, que visa contornar esse defeito. No algoritmo, denominado "regresso-direta",todos os regressores pi(t) so considerados na determinao de cada wi(t), sendoescolhido aquele que apresentar o maior valor de ERR naquela posio.

    Nos algoritmos descritos nesta seo, a estimao de parmetros feita de maneira "off-line". A estimao pode ser tambm implementada "on-line". Nesse caso, o vetor deparmetros inicializado e recalculado segundo uma expresso recursiva a cada intervalode amostragem, quando um novo registro de entrada e sada do sistema obtido.

  • Captulo 2 22

    Existem algoritmos para deteco de estrutura e estimao de parmetros "on-line",tambm baseados na ortogonalizao da matriz de regressores do modelo (Billings et al.,1994). No entanto, tais algoritmos so sensivelmente mais complexos do que aquelesdisponveis para a deteco "off-line" e sua utilidade prtica ainda precisa serestabelecida.

    Os algoritmos de estimao "on-line" so utilizados quando o sistema que est sendomodelado variante no tempo. Nessa situao, os parmetros precisam sercontinuamente estimados e mudanas refletidas nos dados do sistema devem ser capazesde forar a atualizao destes parmetros. Para que isso acontea, os algoritmos "on-line" utilizam um fator de esquecimento, geralmente exponencial, que privilegia os dadosmais recentes em detrimento dos mais antigos. A estimao "on-line" tambm utilizadano projeto de controladores adaptativos. Prl e Karim (1994) apresentam umcontrolador preditivo adaptativo baseado em modelos NARX polinomiais, com detecode estrutura "off-line" e estimao "on-line".

    2.2.8 Validao de Modelos

    A ausncia de algum termo importante pode provocar a polarizao dos parmetrosestimados. Dessa maneira, torna-se necessrio submeter o modelo obtido a alguns testesque devero avaliar sua adequabilidade em representar o sistema original.

    Uma das vertentes da validao de modelos dinmicos prev o uso de funes decorrelao para detectar alguma possvel dinmica no-modelada nos resduos.Tratando-se de sistemas lineares, deve ser verificado se os resduos (t) so brancos eno-correlacionados com a entrada. Esta verificao pode ser feita calculando-se asfunes auto-correlao dos resduos e correlao cruzada dos resduos com a entrada(Box e Jenkins, 1976; Ljung, 1987). Tratando-se de sistemas no-lineares, esses testesno so suficientes pois eles falham em detectar termos cruzados de rudo, entre outros(Billings e Voon, 1983; Billings e Voon, 1986).

    Na validao de modelos no-lineares, devem ser verificadas as seguintes identidades(Billings e Voon, 1983; Billings e Voon, 1986; Billings e Zhu, 1994):

    ( ) { ( ) ( )} ( )1 1 1= =E t t ,( 2.30 )

    u E t u t( ) { ( ) ( )} ,1 1 10= = ( 2.31 )

    u E t t u t( ) { ( ) ( ) ( )} ,1 1 1 11 0= + = ( 2.32 )

    u

    E u t E u t t2 12 2

    1 10, ( ) {( ( ) { ( )}) ( )} , = = ( 2.33 )

    u

    E u t E u t t2 2 12 2 2

    1 10, ( ) {( ( ) { ( )}) ( )} , = = ( 2.34 )

  • Identificao de Sistemas No-Lineares 23

    , , ( ) {( ( ) { ( )})( ( ) { ( )})} (1 1 1= =E t E t t E t ) ( 2.35 )

    , , ( ) {( ( ) { ( )})( ( ) { ( )})} ,2 1 2 1 2 10= = E t E t t E t ( 2.36 )

    2 2 1 2 2 2 1 2 1, , ( ) {( ( ) { ( )})( ( ) { ( )})} ( )= =E t E t t E t( 2.37 )

    ( ) , ,

    ( ) {( ( ) ( ) { ( ) ( )})( ( ) { ( )})} (y

    E y t t E y t t t E t 2 1 2 1 2 1= = ) ( 2.38 )

    ( ), ,

    ( ) {( ( ) ( ) { ( ) ( )})( ( ) { ( )})} ,y u

    E y t t E y t t u t E u t 2 1 2 1 2 10= = ( 2.39 )

    onde ( 1) a funo delta de Dirac e o apstrofe indica que a mdia foi subtrada dossinais.

    Baseado no comprimento do registro de dados disponveis, N, definido um intervaloprobabilstico de 95 % de confiana, dentro do qual as funes de correlao devem semanter para serem consideradas nulas. Os limites do intervalo de confiana de 95 % so:

    1,96 N (Billings e Voon, 1983; Billings e Voon, 1986).

    O procedimento de validao descrito acima garante apenas que no existem correlaesno-modeladas nos resduos de identificao. A validao assim implementada denominada estatstica, pois baseia-se em critrios estatsticos. No entanto, os modelosvalidados podem no apresentar o mesmo comportamento dinmico que os sistemasoriginais (Aguirre e Billings, 1994a; Aguirre e Billings, 1995a).

    A validao dinmica deve verificar se um modelo apresenta caractersticas dinmicassemelhantes quelas do sistema que est sendo identificado. Algumas propriedadesdinmicas que podem ser utilizadas para validar modelos so (Aguirre e Billings, 1994a):

    expoentes de Lyapunov (expoentes de Lyapunov positivos quantificam asensibilidade do sistema s condies iniciais);

    mapas e sees de Poincar; dimenso de correlao; diagramas de bifurcao (indicam mudanas qualitativas no comportamento do

    sistema medida que um determinado parmetro do sistema variado).

    Os invariantes dinmicos acima citados descrevem aspectos qualitativos ou quantitativosda dinmica do sistema. Segundo Aguirre e Billings (1994a), os diagramas de bifurcaoso mais adequados na validao por serem mais sensveis mudanas na estrutura domodelo. Estes diagramas que podem ser obtidos via simulao do modelo.

    Parameswaran e Raol (1994) propuseram um algoritmo para obteno do modelo dosresduos de estimao. Esse procedimento pode ser utilizado na validao estatstica demodelos. Por sua vez, Brown et al. (1994) descrevem uma tcnica de validao baseadano princpio da sincronizao de sistemas dinmicos.

  • Captulo 2 24

    2.3 Tcnicas de Reconstruo de Espao de Estados

    Uma importante ferramenta na anlise e na predio de sries temporais a tcnica dereconstruo de espaos de estados. Esta tcnica de reconstruo ser descrita eanalisada nessa seo, pois ela constitui uma alternativa para a representao de sistemasdinmicos no-lineares. Alm disso, ela guarda muitas semelhanas com a identificaode modelos no-lineares, assunto pesquisado nessa dissertao.

    Um "embedding" um espao topologicamente equivalente ao espao de estados de umdado sistema dinmico11. Este "embedding" pode ser gerado a partir de sries temporaisque descrevem a dinmica do sistema (Casdagli et al., 1992). Os principais invariantesdinmicos do sistema original podem ser estimados sobre a dinmica reconstruda no"embedding", pois os dois espaos so equivalentes no sentido topolgico.

    Normalmente, no se sabe "a priori" quantas e quais so as variveis de estado de umsistema dinmico. Esse fato dificulta a construo de "embeddings" para o sistema. Almdisso, dispe-se, quase sempre, de medies de uma nica varivel do processo (sada ououtra grandeza observvel). Assim, dever ser definido um conjunto de coordenadas queservir como base para a reconstruo do espao de estados original. O conjunto decoordenadas ser escolhido de acordo com o tipo de dados disponveis e deve apresentaralguma relao com o processo em estudo. Breeden e Packard (1994) discutem umavariedade de coordenadas de reconstruo.

    O sistema de coordenadas mais utilizado na construo de "embeddings" baseado nascoordenadas de atraso. Define-se o vetor de coordenadas de atraso como:

    [ ]y( ) ( ) ( ) ( ( ) ) ,t y t y t y t de= 1 T ( 2.40 )

    onde o tempo de atraso e de a dimenso do "embedding".

    A escolha do tempo de atraso de vital importncia na construo do "embedding"(Casdagli et al., 1992; Aguirre, 1995a). Se ele for muito grande, a distncia entre osdados considerados na formao do vetor de atraso grande e eles podero no sersuficientes para reproduzir a dinmica do sistema em estudo. Por outro lado, se ele forpequeno demais, as coordenadas escolhidas sero altamente correlacionadas. Nesse caso,podero aparecer problemas de mal-condicionamento numrico, o que ir gerarreconstrues pobres.

    Floris Takens props e demonstrou alguns teoremas sobre a reconstruo de espaos deestados de sistemas dinmicos no-lineares (Takens, 1980). Uma verso de um destesteoremas apresentada a seguir.

    11 Dois espaos vetoriais so topologicamente equivalentes quando as propriedades mtricas definidassobre eles so idnticas. Nesse caso, a razo entre distncias medidas nos dois espaos uniforme,limitada e diferente de zero (Fiedler-Ferrara e Prado, 1994).

  • Identificao de Sistemas No-Lineares 25

    Teorema de Takens (1980):Seja M uma variedade compacta de dimenso r. Considere ainda pares (X, g), onde X um campo vetorial suave (classe C2) e g uma funo suave sobre M. Assim, X g

    rM, : +R 2 1 definido por:

    X g rx g x g x g x, ,( ) { ( ), ( ( )), , ( ( ))}= 1 2 um "embedding", onde t x( ) o fluxo gerado por X.

    O campo vetorial X descreve a dinmica do sistema original em equao de estados(onde x o vetor de estados). r indica a dimenso do atrator do sistema descrito pelocampo X, enquanto que g() uma funo de observao. De acordo com o teorema, um"embedding" deste sistema pode ser construdo utilizando coordenadas de atrasoescolhidas de tal maneira que d re > +2 1 12. Nesse caso, existe um mapeamento suave ftal que:

    y t k f t( ) ( ( )) ,+ = y ( 2.41 )

    onde y(t) representa a dinmica reconstruda no "embedding", y a varivel de sada dosistema original e k o intervalo de predio considerado ( k N).

    O resultado de Takens garante que a srie temporal de uma nica varivel bastar para areconstruo quando a dimenso do "embedding" for escolhida suficientemente grande(Ma, 1980; Takens, 1980; Sauer et al., 1991).

    Os resultados de Takens foram estabelecidos considerando-se dados infinitos e semrudo. Como os dados reais no se encaixam nessa situao, devero ser analisadas quaisas consequncias da utilizao dos mesmos no processo de reconstruo. Em (Casdagliet al., 1992) feito um estudo da amplificao do rudo presente nos dados, no processode reconstruo.

    O processo de obteno do mapeamento semelhante identificao de sistemas13.Em um primeiro passo, deve ser escolhida a estrutura que ser utilizada para representaro mapeamento . Neste trabalho, sero utilizados modelos polinomiais (globais), cujosparmetros podem ser ajustados atravs de um algoritmo de mnimos quadradosortogonais. A representao obtida para deve passar ainda por um procedimento devalidao dinmica.

    Um cuidado importante a ser tomado na obteno do mapeamento o ajuste corretodo modelo de rudo na estrutura escolhida para reproduzir a dinmica do sistema. Damesma maneira que na identificao de modelos NARMAX polinomiais, um modeloincorreto de rudo pode levar polarizao dos parmetros estimados.

    12 Nesse caso, a funo de observao g() mapeia o vetor de estados original na sada do sistema.13 Um modelo NARMAX polinomial para sries temporais pode ser visto como um caso especial domapeamento suave , onde a dimenso da reconstruo (de) feita igual ordem do sistema (ny) e otempo de atraso () feito igual ao perodo de amostragem (Ts).

  • Captulo 2 26

    O mapeamento poder ser utilizado na implementao da anlise, predio e controledo sistema original (Crutchfield e McNamara, 1987; Casdagli, 1989; Sauer et al., 1991;Casdagli, 1992; Casdagli et al., 1992; Breeden e Packard, 1994).

    2.4 Comentrios Finais

    Neste captulo, foram revisados os principais passos da identificao de sistemasdinmicos no-lineares. O processo de obteno de modelos no-lineares , em essncia,semelhante identificao de sistemas lineares (problema este conhecido na literatura).Os dois procedimentos so diferenciados pela maneira que cada etapa do processo implementada.

    O projeto de excitaes para coleta de dados de sistemas no-lineares deve levar emconsiderao que tais sistemas podem apresentar comportamentos dinmicos distintos,de acordo com a regio de operao considerada.

    Os algoritmos de deteco de no-linearidades tm como funo informar o grau de no-linearidade apresentado nos dados de experimentao do sistema. De acordo com aindicao destes algoritmos, ser feita a opo entre a utilizao de um modelo linear ouum modelo no-linear. Assim, os dados de experimentao devem refletir ocomportamento do sistema em todas as suas faixas de operao. Sempre que possvel, desejvel utilizar modelos lineares, pois estes so mais simples e fceis de seremanalisados e controlados.

    A grande dificuldade verificada na modelagem no-linear a escolha da estrutura a serutilizada para representar a dinmica do sistema em estudo. Essa estrutura deve sersuficientemente complexa para permitir a representao de uma ampla classe de no-linearidades, garantindo-se que os modelos obtidos sejam passveis de manipulaocomputacional posterior.

    Nesse trabalho, utilizaram-se modelos NARMAX polinomiais para representar adinmica de sistemas no-lineares. Os algoritmos de identificao devem ser capazes deselecionar os termos do modelo que so necessrios para reproduzir o comportamentodinmico refletido nos dados de experimentao. A sobreparametrizao de modelosno-lineares polinomiais faz com que estes apresentem dinmicas no contidas nosdados. A estimao de parmetros dever ajustar a estrutura escolhida para representar osistema original. Por fim, os modelos obtidos devem passar por testes que iro avaliar asua capacidade em ajustar os dados de identificao e reproduzir a dinmica apresentadapelo sistema.

    Uma outra estrutura bastante utilizada na representao de sistemas no-lineares a redeneural. As redes neurais tm estruturas muito flexveis que podem ajustar dados detreinamento com considervel exatido. A derivao de modelos dinmicos na forma deredes neurais tambm pode ser subdividida nas cinco etapas do procedimento deidentificao descrito nesse captulo. A seleo de estrutura de redes neurais consiste emdeterminar:

  • Identificao de Sistemas No-Lineares 27

    o nmero de neurnios em cada uma das camadas da rede; o nmero de camadas de entrada, de camadas escondidas e de camadas de sada; a interconexo entre os neurnios da rede.

    Os modelos em redes neurais tambm apresentam regimes dinmicos esprios quandosobreparametrizados. Mais uma vez, o procedimento de seleo de estrutura de vitalimportncia na derivao de modelos matemticos (Narendra e Parthasarathy, 1990).Destaca-se que as redes so estruturas no-lineares nos pesos (ou parmetros), o queexige a utilizao de algoritmos mais complexos para a estimao dos mesmos sobre osdados de treinamento. Um algoritmo muito utilizado para estimar pesos de uma redeneural o