View
1
Download
0
Category
Preview:
Citation preview
Universidade Federal de Minas Gerais
Escola de Engenharia
Programa de Pos-Graduacao em Engenharia Eletrica
Laboratorio de Modelagem, Analise e Controle de Sistemas Nao-Lineares
Estimacao de Estados e Parametros de umPendulo Duplo Caotico
Dissertacao submetida a banca examinadora
designada pelo Colegiado do Programa de
Pos-Graduacao em Engenharia Eletrica da
Universidade Federal de Minas Gerais, como
parte dos requisitos necessarios a obtencao
do grau de Mestre em Engenharia Eletrica
Edson Frederico de Aguiar Rezende
Orientadores:Prof. Bruno Otavio Soares Teixeira, Dr. (UFMG)
Prof. Leonardo Antonio Borges Torres, Dr. (UFMG)
Belo Horizonte, Julho de 2011
i
Para tres grandes mulheres...
Polyane, minha amada,
Ana Maria, mae,
e Valeria, irma.
Resumo
A analise de sistemas dinamicos que apresentam comportamento caotico e um assunto
que atrai o interesse de muitos pesquisadores. Estudos relacionados a identificacao de sistemas
e a estimacao de estados sao importantes para que a dinamica de tais sistemas sejam bem
caracterizadas sob varios aspectos. Alem disso, estudos dessa natureza tornam-se desafiadores
principalmente por nao existir uma metodologia otima que possa ser aplicada a toda a classe
de sistemas caoticos.
Neste trabalho, investiga-se o pendulo duplo caotico existente no laboratorio de
Modelagem Analise e Controle de Sistemas Nao-Lineares do Departamento de Engenharia
Eletronica da Universidade Federal de Minas Gerais. Aplica-se uma ferramenta de filtragem
para sistemas nao lineares, chamada filtro de Kalman unscented, a fim de se obter estimativas
dos estados e de alguns parametros desse sistema de forma simultanea.
Sao conduzidos testes utilizando-se dados simulados e experimentais em que o desem-
penho do filtro e avaliado tanto para a estimacao so dos estados do modelo quanto para o caso
da estimacao conjunta de estados e parametros. Variando-se diversas condicoes do processo
de filtragem, como o tipo de medicoes e a esparcidade das medicoes, procura-se obter conhe-
cimento dos pontos fortes e fracos da ferramenta escolhida e em quais condicoes ela melhor se
adapta.
iii
Abstract
The analysis of dynamical systems that exhibit chaotic behavior is a subject that has
been attracting interests of many researchers. Studies related to system identification and
state estimation are important in order to achive a good characterization of the dynamics of
such systems on many aspects. Moreover, this kind of studies became challenging, essentially,
because there is no such an unified methodology to be applied to the whole class of chaotic
systems.
In this work, the chaotic double pendulum platform available at the laboratory of
Modeling, Analisys and Control of Nonlinear Systems from the Electronics Engineering De-
partment of the Federal University of Minas Gerais is investigated. We aim at applying
a nonlinear systems filtering tool, called unscented Kalman filter, to obtain simultaneously
state and some parameters estimates for this system simultaneously.
Experiments using simulated and experimental data are carried. The filter’s perfor-
mance is verified for the case of state estimation as well as for the case of joint state-and-
parameter estimation. Several conditions concerning the filtering process, such as the type of
measured states and measurement sparsity, are tested and the filters strengths and weaknesses
are studied for this application.
v
Agradecimentos
Cumprir este trabalho foi uma tarefa difıcil, porem, de muito valor pessoal. Acredito
que os estudos de base cientıfica ajudam o homem a perceber melhor outras belezas da vida.
Estudar sobre dinamicas nao-lineares, em especial, o caos, muitas vezes me levou a reparar
que nossas vidas estao organizadas sobre essas bases. A imagem que temos de nos mesmos e
do proximo seriam como os modelos matematicos. Muitas vezes usamos esses modelos para
prever uma proxima atitude ou para estimar pensamentos e desejos nossos ou alheios.
Pequenos erros na vida podem nos conduzir a caminhos muito diferentes. Mas com
este trabalho aprendi que, se quisermos manter proximos do nosso estado ideal para o qual
fomos projetados, proximos da nossa alma, proximos daquilo que Deus sonhou para nos,
mesmo que tenhamos um modelo sobre nos mesmos imperfeito, por meio de uma apropriada
assimilacao de dados, podemos conseguir isso. E existem fontes de dados que nos ajudam. A
Bıblia, nossos amigos, nossa historia e a beleza da natureza.
Gostaria muito de agradecer a Deus pelo dom da vida! Agradeco aos meus orienta-
dores, professores Bruno Teixeira e Leonardo Torres, pela compreensao e pelos ensinamentos.
Alem disso, agradeco ao Leo por ter me dado boas vindas ao mestrado ajudando-me a de-
senvolver a proposta de trabalho. E, em especial ao Bruno, com o qual me mantive mais
proximo, por exigir que eu melhorasse a escrita do texto e pela paciencia em ver meus erros.
Agradeco a um dos membros da banca de defesa, o professor Luıs Aguirre, por me
apoiar em um dos momentos mais difıceis do mestrado quando achei que iria desistir. Nao so
pelo apoio mas tambem pelas conversas de cunho espiritual.
Agradeco a minha famılia, minha mae, Ana Maria, minha irma, Valeria, e minha
docura, Polyane, que precisou suportar meus momentos de estresse e de abdicacao de afazeres
domesticos como arrumar o quarto, tirar o monte de artigos e livros da mesa, fazer a barba e
lavar o carro. Obrigado pelo apoio de voces! Agradeco ao meu tio, Antonio, pelas oracoes.
Agradeco, tambem, a Coordenacao de Aperfeicoamento de Pesquisa de Nıvel Superior
vii
viii
(CAPES), pela concessao de bolsa de mestrado, e a Fundacao de Amparo a Pesquisa de Minas
Gerais (FAPEMIG), pelo apoio financeiro.
Conteudo
Lista de Tabelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii
Lista de Figuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix
1 Introducao 1
1.1 Motivacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Relevancia e Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Estrutura da Dissertacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2 Estimacao de Estados de Sistemas Nao-Lineares 7
2.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Formulacao do Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3 Filtro de Kalman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.4 Estimadores de Estado para Sistemas Nao-Lineares . . . . . . . . . . . . . . . . 11
2.4.1 Filtro de Kalman Estendido . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4.2 Filtro de Kalman Unscented . . . . . . . . . . . . . . . . . . . . . . . . 12
2.5 Estimacao de Estados com Restricoes para Sistemas Nao-Lineares . . . . . . . 14
2.5.1 Filtro de Kalman Unscented com Restricoes de Intervalo . . . . . . . . . 15
2.6 Estimacao Conjunta de Estados e Parametros . . . . . . . . . . . . . . . . . . . 16
3 Descricao do Sistema 21
3.1 Plataforma Experimental do Pendulo Duplo . . . . . . . . . . . . . . . . . . . . 21
3.1.1 O Aparato Mecanico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.1.2 Subsistema de Medicao . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.1.3 Subsistema de Acionamento . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.1.4 Subsistema de Interface e Coleta de Dados . . . . . . . . . . . . . . . . 26
3.2 Modelagem Fenomenologica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
ix
x
3.2.1 Modelagem sem Forcas . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2.2 Modelagem com Forcas . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2.3 Modelagem Completa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3 Caracterizacao Dinamica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3.1 O Caos e a Imprevisibilidade . . . . . . . . . . . . . . . . . . . . . . . . 41
4 Medicao dos Angulos do Pendulo usando Processamento de Imagens 45
4.1 Definicao do Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2 Parametrizacao de Imagens Digitais . . . . . . . . . . . . . . . . . . . . . . . . 47
4.3 Metodos de Processamento de Imagem . . . . . . . . . . . . . . . . . . . . . . . 51
4.3.1 Realce da Imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.3.2 Segmentacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.4 Algoritmo de Processamento de Imagem Implementado . . . . . . . . . . . . . 58
5 Questoes Praticas de Implementacao 61
5.1 Verificacoes Experimentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5.1.1 Analise Estatica e Dinamica do Sensor de Velocidade Angular . . . . . . 62
5.1.2 Obtencao de Estimativas Iniciais para os Coeficientes de Atrito . . . . . 65
5.2 Consideracoes Praticas de Implementacao dos Algoritmos de Filtragem de Kal-
man . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.2.1 Utilizando Estimadores de Tempo Discreto para Estimar Estados de um
Sistema Modelado por Equacoes Diferenciais . . . . . . . . . . . . . . . 66
5.2.2 Multiplas Taxas de Amostragem . . . . . . . . . . . . . . . . . . . . . . 68
5.2.3 Restricao Intervalar na Posicao Angular . . . . . . . . . . . . . . . . . . 69
5.2.4 Simetria da Matriz de Covariancia . . . . . . . . . . . . . . . . . . . . . 71
5.3 Avaliacao de Desempenho de Estimadores de Estado . . . . . . . . . . . . . . . 73
5.4 Sintonia de Estimadores de Estado . . . . . . . . . . . . . . . . . . . . . . . . . 76
6 Resultados 83
6.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6.2 Resultados Simulados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
6.2.1 Efeito dos Tipos de Medicoes . . . . . . . . . . . . . . . . . . . . . . . . 86
6.2.2 Efeito do Nıvel de Ruıdo . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
6.2.3 Efeito da Taxa de Amostragem . . . . . . . . . . . . . . . . . . . . . . . 90
xi
6.2.4 Estimacao Conjunta de Estados e Parametros . . . . . . . . . . . . . . . 93
6.3 Resultados Experimentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
6.3.1 Estimacao de Estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
6.3.2 Estimacao Conjunta de Estados e Parametros . . . . . . . . . . . . . . . 104
7 Conclusoes e Propostas de Continuidade 111
7.1 Discussao e Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
7.2 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
Referencias Bibliograficas 115
Lista de Tabelas
3.1 Caracterısticas gerais da camera DR2-03S2M/C-EX-CS . . . . . . . . . . . . . 25
3.2 Resumo do funcionamento do sistema de acionamento . . . . . . . . . . . . . . 26
3.3 Parametros do modelo do pendulo duplo . . . . . . . . . . . . . . . . . . . . . . 38
5.1 Parametros do modelo de simulacao e predicao do Pendulo Duplo utilizados
nos testes simulados e experimentais . . . . . . . . . . . . . . . . . . . . . . . . 72
6.1 Sumario das condicoes possıveis de serem variadas nos testes . . . . . . . . . . 86
6.2 Media do ındice RMSE para uma simulacao Monte-Carlo com 5 realizacoes
para estimacao conjunta de estados e parametros do pendulo duplo caotico
para quatro casos diferentes de nıvel de ruıdo nas observacoes . . . . . . . . . . 98
6.3 Media do ındice RMSE para uma simulacao Monte-Carlo com 5 realizacoes
para estimacao conjunta de estados e parametros do pendulo duplo caotico
para quatro casos diferentes de nıvel de ruıdo nas observacoes . . . . . . . . . . 99
xiii
Lista de Figuras
1.1 Visao geral da proposta de trabalho . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Diagrama do algoritmo computacional desenvolvido . . . . . . . . . . . . . . . 6
3.1 Representacao da bancada de estudos . . . . . . . . . . . . . . . . . . . . . . . 22
3.2 O aparato mecanico do pendulo duplo . . . . . . . . . . . . . . . . . . . . . . . 23
3.3 Camera digital utilizada no sistema de medicao baseado em visao computacional 25
3.4 Sensor de limiar, S2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.5 Interface grafica para aquisicao da velocidade angular da haste 1 . . . . . . . . 27
3.6 Ilustracao da montagem do aparato que contem a camera que faz a filmagem
do movimento do pendulo duplo caotico . . . . . . . . . . . . . . . . . . . . . . 28
3.7 Arquivos gerados pelo sistema de sincronismo de dados experimentais . . . . . 29
3.8 Diagrama esquematico do pendulo duplo experimental para o caso conservativo 31
3.9 Diagrama de corpo livre das hastes do pendulo duplo . . . . . . . . . . . . . . . 36
3.10 Simulacao livre do modelo do pendulo duplo . . . . . . . . . . . . . . . . . . . . 39
3.11 Retrato de fases da haste 1 com dados simulados . . . . . . . . . . . . . . . . . 41
3.12 Retrato de fases da haste 2 com dados simulados . . . . . . . . . . . . . . . . . 41
3.13 Mostra da sensibilidade a condicoes iniciais exibida pelo modelo do pendulo duplo 42
4.1 Imagem amostrada de um vıdeo produzido pela camera digital utilizada para
o sensoriamento do movimento das hastes do pendulo duplo . . . . . . . . . . . 46
4.2 Representacao da imagem digital como uma matriz . . . . . . . . . . . . . . . . 48
4.3 Ilustracao hipotetica de um processo de formacao de imagem digital a partir
da imagem natural de um objeto . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.4 Componentes da percepcao visual segundo os modelos de cor HSI e RGB . . . 50
4.5 Formacao de uma imagem no modelo de cor RGB . . . . . . . . . . . . . . . . 50
4.6 Etapas de realce da imagem do pendulo duplo . . . . . . . . . . . . . . . . . . . 53
xv
xvi
4.7 Histogramas antes e pos filtragem da imagem digital do pendulo duplo . . . . . 54
4.8 Histogramas antes e pos realce de contraste da imagem digital do pendulo duplo 55
4.9 Decomposicao de imagem nas camadas I1, I2 e I3 . . . . . . . . . . . . . . . . 56
4.10 Superfıcie gerada pela intensidade da componente I2 avaliada em cada ponto
da imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.11 Imagem segmentada por meio de uma funcao de limiar . . . . . . . . . . . . . . 57
4.12 Superfıcie de similaridade gerada pelo calculo da distancia euclidiana no espaco
I1I2I3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.13 Superfıcie de similaridade segmentada por uma funcao de limiar . . . . . . . . 58
4.14 Fluxograma do algoritmo de processamento de imagens . . . . . . . . . . . . . 59
4.15 Serie temporal experimental produzida pelo algoritmo de processamento de
imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.1 Series temporais da velocidade angular da haste 1 . . . . . . . . . . . . . . . . . 62
5.2 Retrato de fases construıdos com dados das medicoes, amostradas em 25 ms,
da velocidade angular e da posicao angular da haste 1 . . . . . . . . . . . . . . 64
5.3 Series temporais da velocidade angular da haste 1 . . . . . . . . . . . . . . . . . 64
5.4 Oscilacoes amortecidas, sem excitacao, do experimento realizado com a haste 1 65
5.5 Oscilacoes amortecidas, sem excitacao, do experimento realizado com a haste 2 66
5.6 Representacao da disponibilidade de medicoes do pendulo duplo, pelos sensores,
ao longo do tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.7 Esquema do estimador utilizado para tratar o caso de multiplas frequencias de
amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.8 Estados do pendulo duplo estimados pelo UKF em um caso em que apenas a
velocidade angular da haste 1 e medida, sem ruıdo, e nao e feita a conversao
nas estimativas dos estados das posicoes angulares para a faixa [−180, + 180] 70
5.9 Estimativas da posicao angular da haste 2 do pendulo duplo medindo-se apenas
a velocidade angular da haste 1, sem ruıdo . . . . . . . . . . . . . . . . . . . . . 71
5.10 Aproximacao da PDF nao-Gaussiana por PDFs Gaussianas . . . . . . . . . . . 75
5.11 Caso ideal de estimacao de estados do pendulo simples nao linear utilizando o
UKF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
xvii
5.12 Caso de estimacao de estados do pendulo simples nao linear utilizando o UKF
em que a matriz de covariancia do ruıdo de processo e conhecida e a matriz de
covariancia do ruıdo de medicao corresponde a 0,001 Rk . . . . . . . . . . . . . 80
5.13 Caso de estimacao de estados do pendulo simples nao linear utilizando o UKF
em que a matriz de covariancia do ruıdo de medicao e conhecida e a matriz de
covariancia do ruıdo de processo corresponde a 0,001 Qk−1 . . . . . . . . . . . . 81
5.14 Caso de estimacao de estados do pendulo simples nao linear utilizando o UKF
em que as matrizes de covariancia dos ruıdos de medicao e de processo sao
desconhecidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
6.1 Comparacao do erro de estimacao dos estados θ1,θ1,θ2 e θ2 estimados pelo
UFK-π e IUKF. E medida apenas a velocidade angular da haste 1 com ruıdo
tal que SNRθ1≈ 26dB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
6.2 Efeito da inclusao da medicao das posicoes angulares para os estimadores . . . 88
6.3 Comparacao do ındice RMSE da estimacao dos estados do pendulo duplo, ao
se utilizar o UKF-π, para sete casos diferentes de configuracao do vetor de
medicao yk. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
6.4 Comparacao do ındice RMSE da estimacao dos estados do pendulo duplo, ao se
utilizar o IUKF, para sete casos diferentes de configuracao do vetor de medicao
yk. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
6.5 Erro da estimacao do estado nao medido, θ2, resultado da estimacao do filtro
UKF-π para dois nıveis diferentes de ruıdo nos dados da posicao angular . . . . 91
6.6 Erro da estimacao do estado nao medido, θ2, resultado da estimacao do filtro
IUKF para dois nıveis diferentes de ruıdo nos dados da posicao angular . . . . 91
6.7 Medias do ındice RMSE normalizado para uma simulacao Monte-Carlo com 20
realizacoes para estimacao dos estados do pendulo duplo caotico a partir da
medicao de θ1, θ1 e θ2 sob diferentes nıveis de ruıdo. . . . . . . . . . . . . . . . 92
6.8 Medias do ındice RMSE normalizados para uma simulacao Monte-Carlo com
20 realizacoes para estimacao dos estados do pendulo duplo caotico a partir da
medicao de θ1 e θ2 sob diferentes nıveis de ruıdo . . . . . . . . . . . . . . . . . 92
6.9 Erro da estimacao do estado nao medido, θ2, resultado da estimacao do filtro
UKF-π para duas taxas diferentes de aquisicao de dados da posicao angular . . 93
xviii
6.10 Erro da estimacao do estado nao medido, θ2, resultado da estimacao do filtro
IUKF para duas taxas diferentes de aquisicao de dados da posicao angular . . . 94
6.11 Medias do ındice RMSE normalizado para uma simulacao Monte-Carlo com 20
realizacoes para estimacao dos estados do pendulo duplo caotico a partir da
medicao de θ1, θ1 e θ2 sob diferentes taxas de amostragem. . . . . . . . . . . . 94
6.12 Medias do ındice RMSE normalizado para uma simulacao Monte-Carlo com 20
realizacoes para estimacao dos estados do pendulo duplo caotico a partir da
medicao de θ1 e θ2 sob diferentes taxas de amostragem. . . . . . . . . . . . . . 95
6.13 Resultado, do UKF-π, para estimacao conjunta de estados e parametros, com
dados simulados, medindo-se as posicoes angulares a uma taxa de 20 Hz e ruıdo
com desvio padrao σθ = 2 . A velocidade angular da haste 1 e medida . . . . . 96
6.14 Resultado, do IUKF, para estimacao conjunta de estados e parametros, com
dados simulados, medindo-se as posicoes angulares a uma taxa de 20 Hz e ruıdo
com desvio padrao σθ = 2 . A velocidade angular da haste 1 e medida . . . . . 97
6.15 Erro de estimacao dos dois parametros estimados, b1 e b2 e do estado nao
medido, θ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
6.16 Diagramas de estimacao dos coeficientes de atrito viscoso, b1 e b2, das juntas do
pendulo duplo, para diferentes relacoes sinal-ruıdo das medicoes das posicoes
angulares. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
6.17 Diagramas de estimacao dos coeficientes de atrito viscoso, b1 e b2, das juntas
do pendulo duplo, para diferentes taxas de aquisicao das posicoes angulares. . . 100
6.18 Resultado, do UKF-π, para o teste de rastrear mudanca no parametro b2 do
sistema. Sao utilizados dados simulados, medindo-se as posicoes angulares a
uma taxa de 20 Hz e ruıdo com desvio padrao σθ = 2 . A velocidade angular
da haste 1 e medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
6.19 Resultado, do UKF-π, para o teste de rastrear mudanca no parametro b2 do
sistema. Sao utilizados dados simulados, medindo-se as posicoes angulares a
uma taxa de 20 Hz e ruıdo com desvio padrao σθ = 2 . A velocidade angular
da haste 1 e medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
6.20 Comparacao do sinal de inovacao do UFK-π e IUKF para o caso experimental
de estimacao de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
6.21 Retrato de fases da haste 1 e da haste 2 construıdo com os estados estimados
pelo IUKF a partir de dados experimentais coletados do pendulo duplo . . . . . 105
xix
6.22 Estimativas das velocidades angulares, dadas pelo UKF-π a partir de dados
experimentais sob duas condicoes . . . . . . . . . . . . . . . . . . . . . . . . . . 106
6.23 Estimativas das velocidades angulares, dadas pelo IUKF a partir de dados
experimentais sib duas condicoes . . . . . . . . . . . . . . . . . . . . . . . . . . 106
6.24 Resultado, do UKF-π, para estimacao conjunta de estados e parametros, com
dados experimentais, medindo-se, alem da velocidade angular da haste 1, as
posicoes angulares a uma taxa de 40 Hz . . . . . . . . . . . . . . . . . . . . . . 107
6.25 Resultado, do IUKF, para estimacao conjunta de estados e parametros, com
dados experimentais, medindo-se, alem da velocidade angular da haste 1, as
posicoes angulares a uma taxa de 40 Hz . . . . . . . . . . . . . . . . . . . . . . 108
6.26 Comparacao do sinal de inovacao do UFK-π e IUKF para o caso experimental
de estimacao conjunta de estados e parametros . . . . . . . . . . . . . . . . . . 109
Lista de Sımbolos e Abreviacoes
Sımbolos
N: conjunto de numeros inteiros nao negativos;
Z: conjunto de numeros inteiros;
R: conjunto de numeros reais;
∈: e um elemento de;
,: igual por definicao;
0n×m: matriz de zeros n×m;
1n×m: matriz unitaria n×m;
In: matriz identidade n× n;
AT: transposta de A;
A−1: inversa de A;
A1/2: raız quadrada de Cholesky de A;
A(i,j): elemento (i,j) de A;
E[·]: esperanca matematica;
σx: desvio padrao da variavel aleatoria x;
f : modelo de processo, ou modelo dinamico, nao-linear;
h: mapa de medicao, ou modelo de observacao, nao-linear;
k: ındice de tempo-discreto;
xk: vetor de estados;
yk: vetor de observacoes ou vetor de saıdas medidas;
wk−1: vetor de ruıdo de processo;
νk: vetor de ruıdo de medicao;
xxi
xxii
Ak−1,Ck: matrizes do modelo linear em espaco de estados;
Ak−1,Ck: Jacobianas do modelo linear em espaco de estados;
Qk−1: matriz de covariancia do ruıdo de processo;
Rk: matriz de covariancia do ruıdo de medicao;
xk|k−1: estimativa de estado na predicao;
xk|k: estimativa de estado na assimilacao de dados;
xk−1|k−1:
ρ(x|y): funcao densidade de probabilidade condicional de x dado y;
ρ(xk|y1, · · · , yk): densidade de estado a posteriori ;
P xxk|k−1: matriz de covariancia do erro de predicao;
P xxk|k: matriz de covariancia do erro de assimilacao de dados;
P yyk|k−1: matriz de covariancia de inovacao;
P xyk|k−1: matriz de covariancia cruzada;
Kk: ganho de Kalman no instante k;
X|,‖|‖: j-esima coluna da matriz de pontos sigma X‖|‖;
γ(m),γ(c): vetor de pesos para o calculo da estimativa de estado e covariancia do erro;
ΨUT: funcao da transformacao unscented que produz X‖|‖, γ(m) e γ(c);
Abreviacoes
KF: Filtro de Kalman;
EKF: Filtro de Kalman Estendido;
EKF2: Filtro de Kalman Estendido de 2 Ordem;
CKF: Filtro de Kalman Cubature;
UKF: Filtro de Kalman Unscented ;
IUKF: Filtro de Kalman Unscented com Restricoes de Intervalo;
PDF: Funcao Densidade de Probabilidade;
RMSE: Raız do Erro Medio Quadratico;
UT: Transformada Unscented ;
MAP: Maxima a Posteriori;
ML: Maxima Verossimilhanca;
MEV: Mınima Variancia;
Capıtulo 1
Introducao
“Como sempre acontece no sertao,os profetas da chuva foram os primeiros a ler o mau pressagio nas
sutilezas da propria natureza: formigas que em pleno mes de marco nao mudam formigueiro para
longe das margens de rios e acudes, aranhas que insistem em tecer fios rentes ao solo, rolinhas que ao
por os ovos trocam o galho mais alto da arvore por ninhos junto ao chao. Para a sabedoria matuta,
sinais inconfundıveis da destida.”
Lira Neto, em Padre Cıcero
1.1 Motivacao
O estudo do caos tem seu inıcio no final do seculo XIX, por Poincare, e uma das
primeiras publicacoes sobre o assunto foi feita por Edward Lorenz, ja na decada de 1960.
Lorenz trabalhava na tentativa de prever as condicoes meteorologicas para um perıodo de
tempo nao muito curto quando, ao truncar o valor da condicao inicial da sua simulacao,
percebeu que os resultados saıram completamente diferentes. De fato, tal sensibilidade e a
caracterıstica prima dos sistemas, posteriormente chamados, caoticos (Monteiro, 2006).
Investigar as propriedades dos sistemas caoticos e seus potenciais de aplicacao em
varios ramos da engenharia, como controle, comunicacao e processamento de sinais, e algo de
interesse para comunidades matematicas, fısicas e de engenharia (Richard, 1992).
O ponto de partida para tais estudos e a analise das series temporais geradas pelos
sistemas caoticos (Xiaolin e Guangrui, 1998). Segundo Abarbanel e colaboradores (1993), na
analise de dados de sistemas caoticos, tendo uma unica serie temporal observada do sistema,
surgem quatro tarefas importantes: (1) construir modelos (identificacao de sistemas), (2)
reconstruir o espaco de fases (ou espaco de estados), (3) separar o sinal do ruıdo (reducao
de ruıdo) e (4) classificar o sinal (calculo de invariantes dinamicos). Essas analises requerem
metodos nao-lineares de processamento de sinais.
2 1 Introducao
Tanto para a modelagem quanto para a reconstrucao do espaco de fases e para o
calculo dos invariantes dinamicos, a reducao de ruıdo desempenha um papel essencial (Grass-
berger et al., 1993; Aguirre e Billings, 1995). A escolha do metodo para reducao de ruıdo
tambem e um fator decisivo. Por exemplo, a dimensao de Lyapunov calculada a partir de
series temporais ruidosas pode ficar comprometida se for utilizado o filtro linear de resposta ao
impulso infinita (Salapaka et al., 1997). Grassberger e colaboradores (1993) revisam metodos
de reducao de ruıdo baseados em coordenadas de atraso. Schreiber (1993) propoe um metodo
de reducao de ruıdo, para series temporais curtas, de baixo consumo de tempo de execucao e
memoria. Ele tambem baseia-se em coordenadas de atraso e faz uma observacao de que tanto
valores passados quanto futuros das coordenadas sao utilizados. Alternativamente, a reducao
de ruıdo pode ser feita por algum metodo de filtragem, que, por outro lado, nao requer o
uso de dados futuros. Aguirre e Billings (1995) utilizam um filtro nao-linear, baseado em um
modelo de predicao, para auxiliar no problema de identificacao de modelos a partir de dados
obtidos de um sistema caotico. Walker e Mess (1996) apresentam uma solucao para a reducao
de ruıdo de sistemas caoticos baseado no filtro de Kalman, que tambem utiliza um modelo de
predicao.
A vantagem da filtragem baseada em modelo e que ela pode, em muitos casos, resolver,
simultanteamente, o problema de identificacao de sistema e o da filtragem do ruıdo da serie
observada e o desafio se torna ainda maior quando nao e possıvel medir todos os componentes
de estado do modelo (Aguirre et al., 2005; Sitz et al., 2002; Voss et al., 2004).
Um cuidado com os metodos de filtragem para sistemas nao-lineares e que muitos deles
foram derivados de outros que trabalham muito bem para sistemas lineares. Por isso, ao serem
aplicados a sistemas fortemente nao-lineares, podem nao produzir resultados satisfatorios,
tornando o desafio maior ainda (Evensen, 1997).
Um metodo que tem demonstrado muito potencial como estimador, simultaneo, de
estados e parametros de sistemas nao-lineares e o filtro de Kalman unscented (UKF) (Sitz
et al., 2004; Merwe et al., 2004). Motivado pelos resultados promissores do UKF para sis-
temas nao-lineares, pretende-se, neste trabalho, responder a seguinte questao levantada por
So e colaboradores (1994) no inıcio do seu trabalho: “...digamos que se tenha um sistema
mecanico consistindo de alavancas interconectadas, engrenagens, molas, etc., e esse sistema
esta comportando caoticamente sobre um atrator de dimensao nao tao alta. E possıvel deduzir
a posicao de todas as partes do sistema a partir da observacao da serie temporal da posicao
de apenas uma das alavancas?”.
1.2 Relevancia e Justificativa 3
No caso deste trabalho, o sistema mecanico e o pendulo duplo da plataforma experi-
mental localizada no laboratorio de Modelagem Analise e Controle de Sistemas Nao-Lineares
(MACSIN) da UFMG.
1.2 Relevancia e Justificativa
Desde a verificacao de Lorenz, mencionada na Secao 1.1, o comportamento caotico
de sistemas fısicos tem sido extensivamente analisado (de Paula et al., 2006). Um exemplo
de sistema fısico que pode exibir comportamento caotico e tem atraıdo bastante atencao dos
pesquisadores, instigando tanto estudos tecnologicos quanto cientıficos, e o pendulo nao-linear.
A analise de bifurcacao e do caos em um pendulo nao-linear experimental ja foi relatada em
alguns estudos (de Paula et al., 2006). Alias, o interesse no estudo do pendulo e antigo e,
durante a historia das ciencias naturais, muitos estudos foram empenhados analisando a sua
dinamica (Awrejcewicz et al., 2007), principalmente com relacao a fenomenos oscilatorios.
O pendulo e uma construcao mecanica simples que esta associada com a medicao de
tempo, dispositivos de estabilizacao, aplicacoes de balıstica (de Paula et al., 2006). Pode-
se utiliza-lo, tambem, para modelar o comportamento de bracos roboticos flexıveis (pendulo
duplo) (Kiyoumarsi et al., 2007) e tambem o sistema de eixo-de-manivelas do pistao de um
motor de combustao monocilındrico (pendulo triplo) (Awrejcewicz et al., 2007). Alem disso,
o pendulo serve como modelo de teste na area de controle automatico (Liu e Hu, 2010).
O Laboratorio MACSIN da UFMG possui uma plataforma experimental de um pen-
dulo duplo que foi construıda por Firmo (2007) durante a realizacao de seu trabalho de
mestrado. Utilizando apenas a informacao de uma variavel de estado, a saber, a velocidade
angular da haste acoplada ao motor, Firmo (2007) tambem caracterizou a dinamica desse
pendulo, calculando alguns invariantes dinamicos a fim de mostrar que o aparato mecanico e
capaz de exibir comportamento caotico.
A fim de se disponibilizar um conjunto maior de dados da plataforma experimental
do pendulo duplo do Laboratorio MACSIN, da UFMG, este trabalho propoe-se a implementar
um estimador recursivo de estados e parametros empregando a metodologia da filtragem de
Kalman unscented.
A vantagem de se ter estimativas de todos os estados do sistema e que, como mostra
Letellier e colaboradores (2006), determinadas variaveis de estado apresentam maior grau
informativo sobre a dinamica de um sistema considerado do que outras. Com isso, pretende-
4 1 Introducao
se aumentar a possibilidades de estudos sobre a dinamica caotica do mesmo, estudos de
modelagem e de controle. Alem disso, como apontado na Secao 1.1, por meio da filtragem
reduz-se o ruıdo das series observadas melhorando a estimacao das invariantes dinamicas de um
sistema. Portanto, uma outra relevancia deste trabalho e que os resultados apresentados no
trabalho de Firmo (2007) podem ser refeitos a partir das series temporais filtradas fornecidas
pelo algoritmo desenvolvido neste trabalho a fim de se obter resultados mais precisos.
Um outro aspecto importante deste trabalho e a possibilidade de se estimar parame-
tros do sistema ao mesmo tempo em que se estimam os seus estados, o que recebe o nome de
estimacao conjunta. A estimacao conjunta e um tema de muita importancia e o seu uso traz
benefıcios em diversos tipos de aplicacoes. Uma delas e o manipulador robotico, para o qual,
a estimacao conjunta promove aumento do grau de agilidade e adaptabilidade do sistema a
condicoes de incerteza (Blauer e Belanger, 1987). Parametros tıpicos de serem estimados em
manipuladore roboticos sao os coeficientes de atrito nas juntas dos bracos. Considerando a
analogia que se pode fazer entre o pendulo duplo com as estruturas dos manipuladores roboti-
cos, e de interesse deste trabalho utilizar o mecanismo da estimacao conjunta para estimar
os coeficientes de atrito das juntas do pendulo, fazendo-se, assim, merecimento a analogia
pretendida. Com relacao a estimacao de parametros, sabe-se ainda que, em particular, os
coeficientes de atrito sao valores positivos. Para incorporar esse tipo de conhecimento a priori
na estimacao pode-se utilizar uma versao do UKF para casos com restricoes nas estimativas,
por exemplo, o UKF Intervalar(IUKF).
Por ultimo, destaca-se, neste trabalho, a utilizacao de uma camera digital como sensor
das posicoes angulares das hastes do pendulo. Cameras de vıdeos digitais sao os sensores mais
comuns utilizados em robos autonomos devido a fatores como custo, confiabilidade e facilidade
de uso (Smith e Singh, 2006). E com a utilizacao desse sensor, inclui-se um numero maior de
medicoes do sistema, ao inves de ter-se apenas a medicao da velocidade angular da primeira
haste do pendulo. Isto possibilita o aumento da confianca das estimativas produzidas pelo
filtro.
1.3 Objetivos
Os objetivos deste trabalho sao:
⋄ Implementar computacionalmente os algoritmos UKF e IUKF para a estimacao conjunta
de estados e parametros,
1.3 Objetivos 5
⋄ Realizar uma implementacao que seja possıvel receber medicoes de fontes sensoras com
taxas de amostragem diferentes,
⋄ Desenvolver um sensor para as posicoes angulares das hastes do pendulo duplo baseado
em visao computacional,
⋄ Testar os filtros implementados para a estimacao conjunta de estados e parametros do
pendulo duplo com dados simulados e experimentais,
⋄ Verificar a viabilidade de se utilizar as medicoes das posicoes angulares providas pelo
sensor baseado em visao computacional,
⋄ Verificar o desempenho dos filtros.
A Figura 1.1 ilustra a proposta do trabalho. Medicoes coletadas do pendulo duplo
sao armazenadas em um registro. Em seguida, um algorimto computacional processa as
informacoes coletadas produzindo estimativas dos estados do sistema, estimativas de certos
parametros do sistema e, tambem, uma versao filtrada das medicoes coletadas1.
Sistema
Caótico
Registro
Algoritmo
Computacional
off-line
medições filtradas
registro dos estados do sistema
parâmetros físicos estimados
(coeficientes de atrito)
medições
características,
propriedades?
sob qual
critério??
Figura 1.1: Visao geral da proposta deste trabalho. Um algoritmo computacional processa dadoscoletados de um pendulo caotico. Tal processamento e avaliado segundo criterios de de-sempenho.
Essas estimativas sao obtidas sob o paradigma da filtragem Bayesiana por meio do
filtro de Kalman unscented (UKF). Como mostra a Figura 1.2, o UKF assimila dados de
fontes de informacoes diferentes, recebidas do modelo de predicao e dos sensores, promovendo
uma solucao sub-otima para o problema da estimacao.
1Observe, no entanto, que os filtros recursivos usados permitem a aplicacao em sistemas de tempo-real,dependendo do hardware utilizado e do software implementado.
6 1 Introducao
informação
de sensor analógico
amostrado
(série temporal)
informações
visual da câmera digital
(vídeo "stream")
Processamento
de Imagem
Estimador
UKF
modelo
(Ts)
(Tpa)
(série temporal)
medições filtradas
registro dos estados do sistema
parâmetros físicos estimados
(coeficientes de atrito)
registro
Algoritmo Computacional offlinecaracterísticas
do sinal?
Figura 1.2: Diagrama do algoritmo computacional desenvolvido. Os principais blocos sao o do esti-mador e o do processamento de imagem. O estimador, baseado em modelo, recebe duasseries temporais com taxas de amostragem diferentes.
1.4 Estrutura da Dissertacao
Esta dissertacao esta organizada da seguinte maneira. No Capıtulo 2, sao conhecidas
as formulacoes matematicas dos problemas de estimacao de estados e estimacao conjunta
de estados e parametros para sistemas nao lineares. O filtro de Kalman unscented, que e o
estimador escolhido para a proposta de trabalho, e apresentado, apos uma breve revisao do
filtro de Kalman para sistemas lineares.
No Capıtulo 3, apresenta-se os componentes principais da plataforma experimental
estudada e e derivado o modelo de Lagrange para o pendulo duplo dessa plataforma. Uma
breve discussao sobre a caracterıstica caotica do pendulo e feita no final do capıtulo.
No Capıtulo 4 o desenvolvimento do sensor baseado em visao computacional, utilizado
para prover medicoes das posicoes angulares do pendulo, e apresentado.
Questoes preliminares, importantes para o caso em estudo, tais como, verificacoes ex-
perimentais e aspectos praticos da implementacao dos algoritmos, sao levantadas no Capıtulo
5.
O Capıtulo 6 e dedicado aos resultados de testes, sob diversas condicoes, de estimacao
de estados e parametros conduzidos com dados simulados e experimentais. Valida-se a escolha
do filtro de Kalman unscented como um estimador adequado para a plataforma estudada.
E, por fim, no Capıtulo 7 sao apresentados os comentarios finais sobre o trabalho e
sugestoes de trabalhos futuros.
Capıtulo 2
Estimacao de Estados de Sistemas Nao-Lineares
“Durante um dos primeiros testes de bomba atomica, Enrico Fermi supostamente deixou cair um
pouco de sobras de papel enquanto a onda de choque passava e estimou a forca da explosao a partir do
movimento das sobras enquanto elas caiam.”
Lawrence Weinstein e John A. Adam,[ Weinstein e Adam (2008), pagina xiv ]
“Nao ha lei contra combinar ideias...nos nao temos uma boa teoria quantitativa que nos diga quando
o EKF (ou qualquer outro tipo de aproximacao) funcionaria bem em uma dada aplicacao. Essa
lacuna e uma situacao escandalosa que se estende por mais de quatro decadas depois da invencao do
filtro de Kalman”
Fred Daum (2005)
2.1 Introducao
Neste capıtulo, na Secao 2.2, e apresentada a formulacao matematica do problema
de estimacao de estados para sistemas nao-lineares autonomos. Em seguida, sao apresentadas
algumas ferramentas matematicas recursivas que resolvem esse problema de maneira sub-
otima. Inicia-se, na Secao 2.3, a revisao pelo filtro de Kalman (KF) que, apesar de nao tratar
o caso nao-linear, produz a solucao otima para o caso linear e Gaussiano e introduz o conceito
de dividir a solucao do problema em duas etapas: predicao e correcao. O KF tornou-se a base
para o desenvolvimento de algoritmos nao-lineares tambem estudados neste capıtulo, a saber:
o filtro de Kalman estendido (EKF) (Secao 2.4.1) e o fitro de Kalman unscented (UKF) (Secao
2.4.2). Enquanto o primeiro baseia-se numa aproximacao linear do modelo do sistema para
propagar a media e covariancia do vetor de estados, o segundo baseia-se em um procedimento
numerico para aproximar a media e covariancia do vetor de estados apos o mesmo sofrer a
transformacao nao-linear do modelo do sistema. Na Secao 2.5, apresenta-se uma versao do
8 2 Estimacao de Estados de Sistemas Nao-Lineares
algoritmo do filtro de Kalman unscented, o filtro IUKF, que trata o caso em que os estados
a serem estimados devem obedecer a uma restricao intervalar. Em seguida, na Secao 2.6,
mostra-se como e possıvel utilizar um estimador de estados para estimar, conjuntamente,
parametros do sistema.
2.2 Formulacao do Problema
Considere o seguinte sistema dinamico nao-linear autonomo de tempo discreto:
xk = f(xk−1, k − 1) + wk−1, (2.1)
yk = h(xk, k) + νk, (2.2)
em que f : Rn × Z → Rn e o modelo de processo, xk ∈ R
n e o vetor de estados e yk ∈Rm e o vetor de saıdas medidas. Alem disso, os termos aditivos wk−1 e νk tem natureza
estocastica e representam incertezas no modelo de processo e na precisao das variaveis medidas,
respectivamente. Neste trabalho, por simplicidade, assume-se que ambos tenham distribuicao
Gaussiana com media nula e matrizes de covariancia Qk−1 e Rk, respectivamente, e que sejam
sequencias mutuamente independentes.
Com base no modelo do sistema dado pelas equacoes (2.1)-(2.2), o problema de esti-
macao de estados e o de estimar o vetor de estados xk, segundo algum criterio de optimalidade,
dado um conjunto de observacoes do vetor yk e o proprio modelo. Alem disso, o problema
de estimacao recebe tres classificacoes dependendo da disponibilidade (ou do uso) de infor-
macoes passadas, presentes ou futuras das medicoes yk com relacao ao instante k em que se
calcula uma estimativa para xk. Se para o calculo dessa estimativa forem utilizadas apenas
informacoes passadas, classifica-se o problema de estimacao como um problema de predicao.
Porem, se a observacao no instante k tambem for utilizada, tem-se um problema de filtragem.
E, caso se tenham informacoes antes e apos o instante k considerado, tem-se um problema
de suavizacao. Nesta dissertacao, e tratado o problema de filtragem. Assim, denota-se por
xk|k ∈ Rn a estimativa de estado realizada pelo filtro.
Sob o paradigma da filtragem Bayesiana1, a solucao completa do problema de fil-
tragem e dada pela funcao de densidade de probabilidade (PDF) condicional ρ(xk|y1, · · · , yk),tambem chamada de densidade de estado a posteriori, que e a densidade de probabilidade
do vetor de estados xk modificada pelo conhecimento das medicoes passadas y1, · · · , yk−1 e
2.3 Filtro de Kalman 9
presente yk (Teixeira, 2008; Arasaratnam e Haykin, 2009). Segundo o criterio do maximo
a posteriori (MAP: do ingles, maximum a posteriori), a estimativa otima xk|k e escolhida
de forma a maximizar ρ(xk|y1, · · · , yk). Outros criterios, por exemplo, envolvem encontrar a
maxima verossimilhanca (ML: do ingles, maximum likelihood) (Dempster et al., 1977; Meng
e Rubin, 1993; Papadopoulos e Wornell, 1995; Ziman et al., 2005; Bagchi e ten Brummel-
huis, 1990) ou minimizar a variancia do erro de estimacao (MEV: do ingles, minimum error
variance) (Rhodes, 1971; Zhai et al., 2004; Drake, 1996).
A solucao Bayesiana ainda promove uma forma de tratar o problema de filtragem de
forma recursiva, na qual a densidade de estado a posteriori no instante (k − 1) e atualizada
com o recebimento de uma medicao y no instante k. Essa atualizacao e feita em duas etapas:
predicao e correcao. O desenvolvimento matematico dessas duas etapas utilizam o modelo do
sistema dado pelas equacoes (2.1)-(2.2) e a regra de Bayes, como pode ser visto em (Teixeira,
2008; Arasaratnam e Haykin, 2009).
Entretanto, resolver as equacoes da solucao Bayesiana pode se tornar impraticavel
devido a presenca de integrais multi-dimensionais (Jazwinski, 1970; Arasaratnam e Haykin,
2009). Uma das excecoes e o caso de sistemas lineares com incertezas Gaussianas. A solucao
para este caso foi estudada por Kalman (1960) e deu origem ao filtro de Kalman (KF) que e
revisado a seguir.
2.3 Filtro de Kalman
Supondo um caso ideal em que o modelo do sistema seja completamente conhecido e
descrito por (2.1)-(2.2) e que nao ha ruıdo, e ainda, que a condicao inicial x0 seja exatamente
conhecida, o problema de estimacao seria simplesmente resolvido pela simulacao livre do
modelo f . A motivacao para o desenvolvimento do filtro de Kalman vem das incertezas
presentes em casos praticos, a saber: erro na estimativa inicial e os ruıdos de processo wk−1
e de observacao νk.
O filtro de Kalman (KF) considera um modelo linear
xk = Ak−1xk−1 + wk−1, (2.3)
yk = Ckxk + νk, (2.4)
1Outras abordagens para solucionar o problema de filtragem nao linear sao apresentadas por Davis (1981)e Gertner (1978)
10 2 Estimacao de Estados de Sistemas Nao-Lineares
em que Ak−1 ∈ Rn×n e Ck ∈ R
m×n sao conhecidas. Para o caso linear, assumindo que x0,
wk−1 e νk sejam Gaussianos, a PDF das variaveis xk e yk tambem sao Gaussianas. E bem
conhecido que isso simplifica o tratamento do problema uma vez que as variaveis aleatorias
Gaussianas sao descritas por dois momentos apenas: a media e a covariancia (Maybeck, 1979).
Tanto pelo criterio de mınima variancia (MV) como pelo criterio de maximo a posteri-
ori (MAP), a melhor estimativa de xk e a media da PDF ρ(xk|y1, · · · , yk). Para recursivamente
calcular a estimativa de estado xk|k, o KF utiliza uma etapa de predicao na qual o modelo
dinamico do sistema e usado para propagar a estimativa a priori xk−1|k−1 e a covariancia
associada P xxk−1|k−1 , E
[
(xk−1 − xk−1|k−1)(xk−1 − xk−1|k−1)T]
, e, em seguida, uma etapa de
assimilacao de dados na qual a informacao das medicoes yk e assimilada pelas estimativas
produzindo a estimativa a posteriori xk|k cuja covariancia e P xxk|k.
A etapa de predicao do KF e dada por
xk|k−1 = Ak−1xk−1|k−1, (2.5)
P xxk|k−1 = Ak−1P
xxk|k−1A
Tk−1 +Qk−1, (2.6)
yk|k−1 = Ckxk|k−1, (2.7)
P yyk|k−1 = CkP
xxk|k−1C
Tk +Rk, (2.8)
P xyk|k−1 = P xx
k|k−1CTk , (2.9)
em que P xxk|k−1 , E
[
(xk − xk|k−1)(xk − xk|k−1)T]
, P yyk|k−1 , E
[
(yk − yk|k−1)(yk − yk|k−1)T]
e
P xyk|k−1 , E
[
(xk − xk|k−1)(yk − yk|k−1)T]
. A etapa de assimilacao de dados e dada por
Kk = P xyk|k−1(P
yyk|k−1)
−1, (2.10)
xk|k = xk|k−1 +Kk(yk − yk|k−1), (2.11)
P xxk|k = P xx
k|k−1 −KkPyyk|k−1K
Tk , (2.12)
em que Kk ∈ Rn×m e a matriz do ganho de Kalman. A notacao xk|l indica uma estimativa
de xk no tempo k baseada em informacao disponıvel ate e incluindo o tempo l. Alem disso,
xj,k|k e o j-esimo elemento do vetor xk|k, enquanto P xx(i,j),k|k e o elemento (i,j) da matriz P xx
k|k.
2.4 Estimadores de Estado para Sistemas Nao-Lineares 11
2.4 Estimadores de Estado para Sistemas Nao-Lineares
Em contrapartida ao caso linear em que existe uma solucao otima dada pelo KF que
minimiza a variancia do erro de estimacao, para o caso nao-linear, existem estimadores oti-
mos apenas para casos particulares (Daum, 2005). Como se sabe, o criterio para a solucao
exata do problema de estimacao e a representacao exata da PDF condicional ρ(xk|yk, · · · ,y1).Para sistemas nao-lineares, tal PDF necessita, a princıpio, de um conjunto infinito de parame-
tros para ser representada, o que implicaria infinitos parametros para serem atualizados (ou
propagados) pelo estimador. Nesse caso, busca-se um estimador que melhor se aproxima, por
exemplo, da solucao teorica de mınima variancia. Ha metodos que exploram aproximacoes
por meio da linearizacao do modelo em torno da estimativa corrente, como o caso do fil-
tro de Kalman estendido (EKF) (Simon, 2006; Anderson e Moore, 1979; Jazwinski, 1970),
e outros que trabalham com aproximacoes da distribuicao de probabilidade como o filtro de
partıculas (Djuric et al., 2003; Abdallah et al., 2008; Doucet et al., 2000), o aproximador por
soma de gaussiana (Alspach e Sorenson, 1972), e o filtro de Kalman unscented (UKF)(Julier e
Uhlmann, 1997; Merwe et al., 2004; Sitz et al., 2004; Teixeira, 2008). A seguir, metodologias
para o caso nao-linear sao apresentadas.
2.4.1 Filtro de Kalman Estendido
O EKF e proposto segundo a abordagem de aproximacao das funcoes f e h que
descrevem o sistema dinamico em estudo. Assume-se que tais funcoes sejam diferenciaveis,
o que significa que elas possuem expansao em serie de Taylor. No entanto, existem metodos
alternativos para sistemas com dinamicas nao-diferenciaveis, causadas, por exemplo, pela
ocorrencia da funcao absoluto (Chandrasekar et al., 2007).
O princıpio basico do EKF e, a cada passo k, expandir as funcoes nao-lineares f e h
em torno da estimativa atual e truncar a serie apos o primeiro termo. Fazendo isso, obtem-se
a etapa de predicao do EKF que e dada por
xk|k−1 = f(xk−1|k−1, k − 1), (2.13)
P xxk|k−1 = Ak−1P
xxk|k−1A
Tk−1 +Qk−1, (2.14)
yk|k−1 = h(xk|k−1,k), (2.15)
P yyk|k−1 = CkP
xxk|k−1C
Tk +Rk, (2.16)
P xyk|k−1 = P xx
k|k−1CTk , (2.17)
12 2 Estimacao de Estados de Sistemas Nao-Lineares
em que as matrizes Jacobianas de f e h sao avaliadas nas estimativas de estado mais recentes
como
Ak−1 ,∂f
∂xk−1
∣
∣
∣
∣
xk−1|k−1,k−1
, (2.18)
Ck ,∂h
∂xk
∣
∣
∣
∣
xk|k−1,k
, (2.19)
(2.20)
ao passo que a etapa de assimilacao e dada por (2.10)-(2.12).
Uma alternativa ao EKF, conhecida como filtro de segunda ordem (EKF2), e apresen-
tada por Richard (1992) e Norgaard e colaboradores (2000), e truncar o primeiro e segundo
termo da expansao em serie de Taylor das funcoes f e h.
2.4.2 Filtro de Kalman Unscented
O cerne do desenvolvimento do UKF e a transformacao unscented (UT) (Julier e
Uhlmann, 1997; Julier et al., 2000). A UT aproxima a media y ∈ Rm e covariancia P yy ∈
Rm×m do vetor de variaveis aleatorias y obtido da transformacao nao-linear y = h(x), na
qual x ∈ Rn e um vetor de variaveis aleatorias com media x e covariancia P xx ∈ R
n×n, am-
bas assumidamente conhecidas. Essa transformacao nao faz uso de metodos de linearizacao
analıticos ou numericos. Ela esta baseada na escolha determinıstica de um conjunto repre-
sentativo de 2n + 1 pontos Xj ∈ Rn, j = 0, · · · ,2n, chamados de pontos sigma, os quais, por
definicao, satisfazem
2n∑
j=0
γ(m)j Xj = x (2.21)
2n∑
j=0
γ(c)j [Xj − x][Xj − x]T = P xx (2.22)
com os pesos γ , [γ0 γ1 · · · γ2n] ∈ R2n+1, tais que
∑2nj=0 γj = 1, dados por
γ(m)0 ,
λ
n+ λ, γ
(c)0 ,
λ
(n+ λ)+ 1− α2 + β, (2.23)
γ(m)j = γ
(c)j ,
1
2(n+ λ), j = 1, · · · ,2n, (2.24)
2.4 Estimadores de Estado para Sistemas Nao-Lineares 13
em que λ , α2(n+ κ)− n, κ e β sao parametros de escala. Se x tem distribuicao Gaussiana,
β = 2 e o valor otimo. Ja α determina a dispersao dos pontos sigmas ao redor da media xk.
A matriz de pontos-sigmas X , [X0 X1 · · · X2n] ∈ Rn×2n+1 e escolhida como
X = x11×(2n+1) +√n+ λ[0n×1 (P xx)1/2 − (P xx)1/2], (2.25)
em que (P xx)1/2 e a raiz quadrada de Cholesky de P xx. Por simplicidade de notacao, as
equacoes (2.23)-(2.25) sao condensadas na funcao ΨUT dada por
[γ(m),γ(c),X ] , ΨUT(x,Pxx,n,λ). (2.26)
Propagando cada ponto sigma por meio de h, tem-se
Yj = h(Xj), j = 0, · · · ,2n, (2.27)
tal que a media e covariancia de y sao aproximadas por
y =2n∑
j=0
γ(m)j Yj (2.28)
P yy =2n∑
j=0
γ(c)j [Yj − y][Yj − y]
T. (2.29)
Para se chegar as equacoes do filtro UKF, utiliza-se (2.28) para obter aproximacoes
para xk|k−1 e yk|k−1, que no KF sao dadas por (2.5) e (2.7), e para produzir aproximacoes para
P xxk|k−1, P
yyk|k−1 e P xy
k|k−1, que no KF sao dadas respectivamente por (2.6),(2.8)-(2.9), utiliza-se
(2.29).
Assim, a etapa de predicao do UKF e dada por (Simon, 2006)
[γ(m),γ(c),Xk−1|k−1] = ΨUT(xk−1|k−1,Pxxk−1|k−1,n,λ), (2.30)
Xj,k|k−1 = f(Xj,k−1|k−1,k − 1), j = 0, · · · ,2n, (2.31)
xk|k−1 =2n∑
j=0
γ(m)j Xj,k|k−1, (2.32)
P xxk|k−1 =
2n∑
j=0
γ(c)j [Xj,k|k−1 − xk|k−1][Xj,k|k−1 − xk|k−1]
T+Qk−1, (2.33)
Xk|k−1 = ΨUT(xk|k−1,Pxxk|k−1), (2.34)
14 2 Estimacao de Estados de Sistemas Nao-Lineares
Yj,k|k−1 = h(Xj,k|k−1,k), j = 0, · · · ,2n, (2.35)
yk|k−1 =2n∑
j=0
γ(m)j Yj,k|k−1, (2.36)
P yyk|k−1 =
2n∑
j=0
γ(c)j [Yj,k|k−1 − yk|k−1][Yj,k|k−1 − yk|k−1]
T+Rk, (2.37)
P xyk|k−1 =
2n∑
j=0
γ(c)j [Xj,k|k−1 − xk|k−1][Yj,k|k−1 − yk|k−1]
T. (2.38)
Observe que em (2.34), os pontos sigma sao regenerados, e, como os pesos γ(m) e γ(c), a
princıpio, nao mudam, nao e necessario passar os argumentos n e λ para a funcao ΨUT. Esse
passo pode ser omitido se os ruıdos wk−1 e νk forem incluıdos no vetor de estados, eliminando,
assim, Qk−1 e Rk das equacoes (2.33) e (2.37), respectivamente, como se ve em (Simon, 2006)
e (Teixeira, 2008). A etapa de assimilacao de dados do UKF e semelhante a do KF e e dada
por (2.10)-(2.12).
Arasaratnam e Haykin (2009) apresentam o UKF sob maior rigor teorico resultando
no que eles nomeiam de filtro de Kalman cubature (CKF). O CKF e um caso especial do UKF
quando o parametro λ dos pontos sigma e igualado a zero.
2.5 Estimacao de Estados com Restricoes para Sistemas Nao-
Lineares
Quando o vetor de estados a ser estimado deve obedecer a algum tipo de restricao, o
problema de estimacao, descrito na Secao 2.2, se transforma em um problema de estimacao
com restricao. Tal restricao e considerada uma informacao a priori.
Um caso de restricao e aquele no qual o vetor de estados deve satisfazer, para todo
k ≥ 0, a desigualdade intervalar do tipo
dk ≤ xk ≤ ek, (2.39)
em que dk ∈ Rn e ek ∈ R
n sao assumidamente conhecidos e, para j = 1, · · · ,n, dj,k < ej,k.
Alem disso, se xj,k e ilimitado a esquerda, dj,k = −∞, e, se xj,k e ilimitado a direita, ej,k = ∞.
Retomando o criterio da maxima a posteriori da abordagem de filtragem Bayesiana,
mencionada na Secao 2.2, o problema de estimacao de estados com restricao intervalar e o de
maximizar ρ(xk|y1, · · · , yk) sujeito a (2.39).
2.5 Estimacao de Estados com Restricoes para Sistemas Nao-Lineares 15
Na secao seguinte, e revisto o algoritmo do filtro de Kalman unscented intervalar
(IUKF), que e um dos algoritmos baseados no UKF que trata esse problema de forma sub-
otima. Referencias de estudo para o IUKF e outros algoritmos sao os trabalhos de Teixeira e
colaboradores (2010, 2009); Teixeira (2008).
2.5.1 Filtro de Kalman Unscented com Restricoes de Intervalo
O IUKF surge da abordagem de projecao dos pontos sigma na hipersuperfıcie definida
pelas restricoes de desigualdade (Teixeira et al., 2010). Ao inves da transformacao unscented,
apresentada na Secao 2.4.2, o IUKF utiliza a transformacao unscented com restricoes inter-
valares (ICUT), na etapa de predicao, para reforcar (2.39).
A ICUT gera pontos sigma que satisfazem
dk ≤ Xj,k ≤ ek, j = 0, · · · ,2n. (2.40)
Diferentemente de (2.25), Xj,k e escolhido como
Xk = xk11×(2n+1) + [0n×1 ζ1,kcol1[(Pxxk )1/2] · · · ζn,kcoln[(P xx
k )1/2]
−ζn+1,kcoln+1[(Pxxk )1/2] · · · − ζ2n,kcol2n[(P
xxk )1/2]] (2.41)
em que, para i = 1, · · · ,n e j = 1, · · · ,2n,
ζj,k , min(colj(Θ)), (2.42)
Θ(i,j) ,
√n+ λ, se S(i,j) = 0
min
(√n+ λ,
ei,k−xi,k
S(i,j)
)
, se S(i,j) > 0
min
(√n+ λ,
di,k−xi,k
S(i,j)
)
, se S(i,j) < 0
(2.43)
S ,
[
(P xxk )1/2 − (P xx
k )1/2]
(2.44)
com vetor de pesos γk ∈ R2n+1, para j = 1, · · · ,2n,
γ0,k , bk, γj,k , akζj,k + bk, j = 1, · · · ,2n (2.45)
16 2 Estimacao de Estados de Sistemas Nao-Lineares
que satisfazem∑2n
j=0 γj,k = 1, em que
ak ,2λ− 1
2(n+ λ)(∑2n
j=1 ζj,k − (2n+ 1)√n+ λ)
, (2.46)
bk ,1
2(n+ λ)− 2λ− 1
2(√n+ λ)(
∑2nj=1 ζj,k − (2n+ 1)
√n+ λ)
, (2.47)
Por simplicidade, as equacoes (2.41)-(2.47) sao condensadas na funcao ΨICUT dada por
[γk,Xk] = ΨICUT(xk,Pxxk ,dk,ek,n,λ), (2.48)
A etapa de predicao do IUKF (Teixeira et al., 2009) e dada por
[γk−1,Xk−1|k−1] = ΨICUT(xk,Pxxk ,dk,ek,n,λ), (2.49)
Xj,k|k−1 = f(Xj,k−1|k−1,k − 1), j = 0, · · · ,2n, (2.50)
xk|k−1 =
2n∑
j=0
γ(m)j Xj,k|k−1, (2.51)
P xxk|k−1 =
2n∑
j=0
γ(c)j [Xj,k|k−1 − xk|k−1][Xj,k|k−1 − xk|k−1]
T+Qk−1, (2.52)
Xk|k−1 = ΨICUT(xk,Pxxk ,dk,ek,n,λ), (2.53)
Yj,k|k−1 = h(Xj,k|k−1,k), j = 0, · · · ,2n, (2.54)
yk|k−1 =2n∑
j=0
γ(m)j Yj,k|k−1, (2.55)
P yyk|k−1 =
2n∑
j=0
γ(c)j [Yj,k|k−1 − yk|k−1][Yj,k|k−1 − yk|k−1]
T+Rk, (2.56)
P xyk|k−1 =
2n∑
j=0
γ(c)j [Xj,k|k−1 − xk|k−1][Yj,k|k−1 − yk|k−1]
T. (2.57)
A etapa de assimilacao de dados do IUKF e dada por (2.10)-(2.12), semelhantemente
ao UKF e ao KF.
2.6 Estimacao Conjunta de Estados e Parametros
O problema formulado na Secao 2.2 considera que os parametros do modelo f sao
conhecidos. Entretanto, em muitos casos, parte desses parametros sao desconhecidos e, ainda,
2.6 Estimacao Conjunta de Estados e Parametros 17
nao podem ser medidos, por isso, precisam ser estimados a partir de medicoes indiretas. Exem-
plos da importancia da estimacao de parametros (Soroush, 1998) sao vistas na monitoracao
do coeficiente global de transferencia de calor e a taxa reacao-calor em reatores quımicos alta-
mente exotermicos; parametros de superfıcie em uma tarefa executada por um manipulador
robotico (Blauer e Belanger, 1987); forcas no pneu de um veıculo (Ray, 1995); parametros de
elasticidade e ativacao em sistemas biomecanicos (Moireau et al., 2008).
Para reformular o problema de estimacao de estados, incluindo tambem parametros
a serem estimados, a equacao (2.1) deve ser substituıda por
xk = f(xk−1, pk−1, k − 1) + wk−1, (2.58)
pk = pk−1 + wpk−1. (2.59)
em que, a equacao (2.59), introduzida na formulacao do problema, corresponde ao modelo de
evolucao dos parametros, expressa por meio de um processo random walk, pk ∈ Rnp e o vetor
de parametros a ser estimado e wpk ∈ R
np corresponde a ruıdo branco, Gaussiano, de media
nula, com matriz de covariancia Qpk−1 ∈ R
np×np .
Neste trabalho, e discutido como os parametros podem ser estimados via estimadores
recusivos de estados, como os apresentados nas Secoes 2.3 e 2.4. O estimador recursivo
permite, ainda, a obtencao de estimacao online dos parametros, ou seja, novas estimativas de
parametros sao produzidas “imediatamente” apos a apresentacao de um vetor de observacoes
(Togneri e Deng, 2003). Como apontado por Soroush (1998), existem outros metodos para a
estimacao online de parametros, a saber:
⋄ metodos baseados na estrutura “predicao-erro”;
⋄ estimacao de parametros via otimizacao online (Xiaolin e Guangrui, 1998);
⋄ estimacao de parametros via inversao de modelo;
⋄ estimacao de parametros via balanco de massa-energia (metodos calorimetricos).
Alem disso, os estimadores recursivos de estados podem ser empregados em duas
abordagens possıveis: a dual (Nelson e Stear, 1976; Wan et al., 1999) e a conjunta (Moireau
et al., 2008; Cox, 1964; Voss et al., 2004; Blauer e Belanger, 1987). Em ambas, os estados
e parametros do modelo sao estimados simultaneamente. A diferenca esta no fato de que a
abordagem dual requer que a representacao em espaco de estados do modelo de processo e
18 2 Estimacao de Estados de Sistemas Nao-Lineares
do modelo de evolucao dos parametros seja separada, enquanto que, na abordagem conjunta,
um vetor de estados conjunto concatena o vetor formado puramente de estados e o vetor
de parametros formando uma unica representacao em espaco de estados (Wan et al., 1999).
Pela configuracao da abordagem dual, e possıvel utilizar dois tipos diferentes de filtro para a
solucao do problema: um para estimar os parametros a partir dos estados atuais (por exemplo,
o KF), e o segundo para estimar os estados com os parametros previamente estimados (por
exemplo, o UKF). Por outro lado, na abordagem conjunta, um unico filtro e utilizado para
ambas as tarefas.
A abordagem adotada neste trabalho e a conjunta, e, para desenvolve-la, consideram-
se os parametros como se fossem estados “virtuais” e define-se uma versao conjunta do vetor
de estados como xk , [xTk pT
k ]T em que xk ∈ R
n, n = n+np. Com isso, a equacao, em espaco
de estados, de xk e dada por
xk = f(xk−1, pk−1, k − 1) + wk−1, (2.60)
em que
f(xk−1,pk−1, k − 1) ,
f(xk−1,pk−1, k − 1)
pk−1
e wk−1 ,
wk−1
wpk−1
, (2.61)
e o ruıdo de processo wk−1 possui matriz de covariancia conjunta
Qk−1 ,
Qk−1 0n×np
0np×n Qpk−1
. (2.62)
A matriz de covariancia do erro da equacao de estados tambem e estendida para
Pk|k ,
P xxk|k P xp
k|k
P pxk|k P pp
k|k
, (2.63)
em que P ppk|k e a covariancia do erro de estimacao dos parametros. Observe que a abordagem
dual modela os acoplamentos entre a dinamica do processo e dos parametros por meio de P xpk|k.
Mulder e colaboradores (1999) alertam para o procedimento de se adicionar parame-
tros desconhecidos. Segundo os autores, deve-se tomar cuidado em nao se adicionar muitos
2.6 Estimacao Conjunta de Estados e Parametros 19
parametros, com o risco de se conduzir a componentes nao-reconstrutıveis no vetor de estados
aumentados. Quando um parametro e modelado como uma constante, a covariancia do filtro
de Kalman para esse parametro convergira para zero e isso provocara a convergencia da matriz
de ganho, K, para zero tambem, e, depois de um certo perıodo de tempo, o filtro comecara a
ignorar as observacoes. O autor recomenda adicionar-se algum ruıdo artificial pela utilizacao
do modelo de Markov ao inves de um parametro constante, desde que, dessa forma, tanto
a matriz de covariancia quanto o ganho nao convirjam a zero. A equacao de evolucao dos
parametros, (2.59), pode ser considerada um tipo de modelo de Markov.
Capıtulo 3
Descricao do Sistema
“Nao errei em meus calculos; todos esses sofrimentos nao foram em vao. Senti, afinal, que estava
livre. A correia pendia, em pedacos, de meu corpo. Mas o movimento do pendulo ja se realizava sobre
o meu peito. Tanto a sarja da minha roupa, como a camisa que vestia ja haviam sido cortadas. O
pendulo oscilou ainda por duas vezes, e uma dor aguda me penetrou todos os nervos.”
Edgard Allan Poe, em O poco e o pendulo
“Todo coracao em caos traz uma estrela cintilante.”
Nietzsche
3.1 Plataforma Experimental do Pendulo Duplo
Plataformas experimentais sao recursos que agregam valor em estudos que buscam
avaliar a robustez de uma ferramenta matematica. Awrejcewicz e colaboradores (2007) uti-
lizam uma plataforma experimental para analisar a dinamica de um pendulo triplo excitado
por uma onda quadrada. Liu e Hu (2010), buscando aprofundar o conhecimento sobre os
efeitos de filtros digitais em sistemas mecanicos controlados, realizam testes em uma pla-
taforma experimental de um pendulo duplo sobre um carrinho de translacao. Christini e
colaboradores (1996) testam uma tecnica de estabilizacao de sistemas caoticos, especifica-
mente, o metodo de controle local, em uma plataforma experimental de um pendulo duplo.
Franca e Savi (2001) conduzem uma serie de analises experimentais sobre um pendulo nao-
linear excitado para avaliar a dinamica caotica nesse sistema. Wang e colaboradores (2008)
utilizam uma plataforma experimental com um pendulo invertido sobre uma carrinho para
implementar uma estrategia de controle hıbrido com o auxılio de uma camera. E, em um
outro trabalho, essa plataforma e modificada para que o pendulo mova sobre uma mesa, e,
sobre esse sistema com tres graus de liberdade, e implementado um sistema de controle de
22 3 Descricao do Sistema
trajetoria (Wang et al., 2010).
A plataforma experimental utilizada neste trabalho foi construıda por Firmo (2007)
durante seu trabalho de mestrado no qual ele investigou, com dados experimentais, o oscilador
autonomo construıdo. Ela e constituıda de um aparato mecanico, um subsistema de aciona-
mento, um subsistema de medicao e um subsistema de interface e coleta de dados. A Figura
3.1 mostra um esquema da bancada, com a plataforma do pendulo duplo, que esta instalada
no laboratorio de Modelagem Analise e Controle de Sistemas Nao-Lineares (MACSIN) do
Departamento de Engenharia Eletronica da Universidade Federal de Minas Gerais.
Figura 3.1: Representacao da bancada de estudos do laboratorio MACSIN do Departamento de Enge-nharia Eletronica da Universidade Federal de Minas Gerais com a plataforma experimentaldo pendulo duplo, utilizada para a realizacao deste trabalho de mestrado.
A seguir, sao detalhadas as partes que compoem a plataforma experimental do pen-
dulo duplo.
3.1.1 O Aparato Mecanico
O aparato mecanico e composto por um pendulo duplo, formado por duas hastes, um
motor de corrente contınua (CC) e um suporte, conforme mostra a Figura 3.2.
A haste 1 do pendulo duplo e formada por duas barras de alumınio (densidade ρ =
2,7Kg/m3) de dimensoes 0,27m × 0,032m × 0,0006m e a haste 2 e formada por uma barra,
tambem de alumınio, de dimensoes 0,216m× 0,032m× 0,013m.
3.1 Plataforma Experimental do Pendulo Duplo 23
SensorSensor
Motor CC
Pêndulo Duplo
Haste 1
Haste 2
rolamento de esferas,
Ponto J
Ponto O
Suporte com rolamentos de esferas
Figura 3.2: O aparato mecanico do pendulo duplo. Fonte: (Firmo, 2007)
O eixo que une as duas barras da haste 1 tambem serve para suportar a haste 2,
no ponto J , por meio de um rolamento de esfera. Assim, a haste 2 pode executar um giro
completo passando por entre as barras da haste 1.
O eixo que liga a haste 1 ao suporte de fixacao e suportado por dois rolamentos de
esferas. Este eixo esta acoplado ao eixo do motor CC, garantindo, dessa forma, a transmissao
do torque do motor ao pendulo duplo.
O momento de inercia do sistema mecanico e a combinacao do momento de inercia
das hastes com o momento de inercia do motor, Mm. O valor de Mm, encontrado apos
experimentos por Firmo e colaboradores (2007), e Mm = 22× 10−6kg.m2.
As fontes de amortecimento consideradas nesse aparato sao o atrito viscoso linear
e o atrito seco (ou atrito de Coulomb) que ocorrem nos rolamentos de sustentacao e nos
rolamentos do motor. Como apontam Horton e colaboradores (2008), essa e a maneira mais
apropriada de modelar a dissipacao de energia para uma vasta variedade de sistemas. Outras
formas possıveis incluem o efeito de Stribeck, friccao de variacao de estado (do ingles, slip-stick
motion) e o modelo de Dahl (Wit et al., 1995).
24 3 Descricao do Sistema
Considera-se que todas as forcas de atrito sao aplicadas nos pontos O e J (Firmo
et al., 2007). No ponto O, o coeficiente de atrito viscoso total e denotado por b1, e o atrito de
Coulomb e representado por b2. No ponto J , o coeficiente de atrito viscoso total e denotado
por b3, e o atrito de Coulomb e representado por b4.
3.1.2 Subsistema de Medicao
Medicao da Velocidade Angular da Haste 1
O sensor S1, acoplado diretamente ao eixo do motor CC, e uma pequena maquina CC
de imas permanentes, funcionando como taco-gerador, em que a velocidade angular de seu
eixo produz uma tensao de −5 V a 5 V em seus terminais de saıda, proporcional a velocidade
da haste 1 do pendulo duplo, θ1.
Medicao das Posicoes Angulares das Hastes 1 e 2
Para prover informacao sobres as posicoes angulares, θ1 e θ2, do pendulo, propoe-se,
neste trabalho, um sensor baseado em visao computacional. Portanto, tal sensor nao estava
disponıvel na plataforma experimental utilizada por Firmo (2007).
Esse sensor e formado por uma camera digital (ver Figura 3.3) e um sistema de
processamento digital de imagens (SPDI). A camera e instalada sobre um tripe de apoio
posicionado a uma distancia aproximada de 2 metros do pendulo duplo, como ilustra a Figura
3.1, e fornece imagens digitais que, posteriormente, sao processadas pelo SPDI, produzindo
estimativas das posicoes angulares.
A camera utilizada e uma DragonFlyExpress, modelo DX-BW/COL-XX, da fabri-
cante Point Grey. Os dados tecnicos estao descritos na Tabela 3.1. O Capıtulo 4 trata do
SPDI.
3.1.3 Subsistema de Acionamento
O motor CC possui alimentacao de campo ,Vf , e de armadura, Va, independentes.
Trata-se de um motor de 100W, do mesmo tipo dos utilizados em maquinas de costura, oper-
arando em corrente contınua (Firmo, 2007). Ele e responsavel por aplicar o torque necessario
para manter o pendulo duplo em movimento, compensando a dissipacao de energia pelas fontes
de atrito. Tal torque tem uma caracterıstica muito importante no sistema do pendulo duplo.
O torque e especialmente definido para ser uma funcao dos estados do proprio sistema,
3.1 Plataforma Experimental do Pendulo Duplo 25
Figura 3.3: Camera digital DragonFly2, modelo DR2-03S2M/C-EX-CS, da fabricante Point Grey.Utilizada no sistema de medicao das posicoes angulares baseado em visao computacional.
Tabela 3.1: Caracterısticas gerais da camera DR2-03S2M/C-EX-CS, da fabricante Point Grey.
Propriedade Min. Max.
Brilho 0,0 % 0,0 %
Exposicao −7,58 EV 2,41 EV
Nitidez 0 4095
Matiz −180,0 de 179,91 de
Saturacao 0,00 % 399,90 %
Gama 0,5 4,0
Iris 0 256
Obturador 0,02 ms 16,66 ms
Ganho −6 dB 30 dB
Quadros por Segundo 1,875 FPS 200 FPS
a saber, da posicao angular da haste 1, θ1, e da velocidade angular da haste 1, θ1. Dessa forma,
o sistema global permanece autonomo, ou seja, nenhuma excitacao externa explicitamente
dependente do tempo e aplicada (Firmo et al., 2007).
O mecanismo do torque e o seguinte: quando a posicao angular da haste 1 do pendulo
duplo estiver dentro de uma regiao definida por |θ1| < γ, em que γ e o angulo limite, o motor
e acionado, com o valor fixo da tensao de armadura Va, de forma a produzir um torque no
sentido de giro atual da haste 1, ou seja, o torque deve favorecer o movimento da haste 1
quando ela estiver nessa regiao especificada.
O sensor S2, instalado no eixo principal, capta quando a haste 1 do pendulo entra
26 3 Descricao do Sistema
e sai da fronteira γ. Esse sensor, mostrado na Figura 3.4, e composto de 2 pecas: um disco
semi-aberto e um fotosensor. O disco semi-aberto tem uma secao angular aberta equivalente a
2γ que permite a passagem de luz que e recebida pelo fotosensor. Ao receber luz o fotosensor
gera um sinal de nıvel logico 1.
Figura 3.4: Sensor S2. Fonte: (Firmo, 2007)
O sinal do sensor S2 e combinado com o sinal do sensor de velocidade S1 para coman-
dar o circuito de acionamento do motor, chamado ponte H. A ponte H define um dos possıveis
estados do motor, em funcao do seu comando: desligado, ligado no sentido-horario ou ligado
no sentido anti-horario. Essa funcionalidade torna a ponte H apropriada para a funcao torque
desejada. A Tabela 3.2 resume o funcionamento do sistema de acionamento.
Tabela 3.2: Quadro com o resumo do sistema de acionamento. O torque e uma funcao dosproprios estados do sistema e sempre contribui para o sentido do movimento do pendulo.
Sensor S1 Sensor S2 Resposta da ponte H Torque
sinal (+) 0 motor desligado 0
sinal (-) 0 motor desligado 0
sinal (+) 1 motor ligado sentido horario positivo (contribuindo)
sinal (-) 1 motor ligado sentindo anti-horario negativo (contribuindo)
3.1.4 Subsistema de Interface e Coleta de Dados
Uma interface grafica, ilustrada na Figura 3.5, desenvolvida por Thums (2008), per-
mite ao usuario da plataforma experimental definir a tensao de armadura Va do motor CC,
monitorar a velocidade da haste 1 do pendulo duplo e armazena-la em um arquivo de dados.
Ela esta instalada no computador da bancada.
O dispositivo que gerencia a comunicacao com a interface do usuario e coordena a
3.1 Plataforma Experimental do Pendulo Duplo 27
Figura 3.5: Interface grafica para o usuario ajustar a tensao de armadura do motor CC e coletar dadosda velocidade angular da haste 1 em experimentos com o pendulo duplo.
operacao dos demais circuitos da plataforma e o microcontrolador PIC18F4550 da Microchip.
O microcontrolador troca dados com a interface do usuario via interface de comunicacao USB.
E, tambem, pela USB que os circuitos eletronicos sao alimentados, o que e possıvel devido ao
baixo consumo de corrente desses dispositivos.
Ao receber o comando “Inicia Aquisicao” do usuario via interface grafica, o microcon-
trolador converte a referencia de tensao de armadura definida pelo usuario, que pode estar
na faixa 0V a 30V, para um valor de 0V a 5V que corresponde a razao cıclica do modulador
PWM responsavel por alimentar a ponte H do circuito de acionamento.
Para monitorar a velocidade angular da haste 1, o sinal de tensao produzido pelo
sensor S1 e amostrado pelo microcontrolador. A amostragem ocorre numa frequencia de 1kHz
e converte a faixa de tensao de −5 V a 5 V do sinal de S1 para a escala de velocidade, cuja
unidade e rad/s. Os valores amostrados sao armazenados temporariamente em um registro
do microcontrolador que a cada 1 segundo sao enviados a interface grafica que, por sua vez,
exibe os dados na tela e armazena-os em arquivo para posterior analise.
O desenvolvimento da interface com o usuario e restrito apenas a monitoracao e ao
armazenamento da velocidade angular da haste 1. Com a atual inclusao do sensor baseado em
28 3 Descricao do Sistema
visao computacional, com o SPDI, torna-se necessaria uma solucao para agrupar, de forma
sincronizada, os dados provenientes dessas duas fontes de informacao de forma a gerar um
unico arquivo de dados.
A solucao encontrada para tornar possıvel o sincronismo das informacoes e posicionar
um LED“pisca-pisca”no campo de visao da camera cujo instante do disparo inicial e o mesmo
em que se incia a aquisicao de dados da interface grafica. E, a cada 1 segundo, o LED pisca,
mudando seu estado de aceso para apagado, ou vice-versa. A Figura 3.6 ilustra o molde
instalado no corpo da camera com o LED de sincronismo.
Ao incluir o processamento visual do estado do LED no SPDI, uma informacao extra
(1 “um” para LED aceso, e 0 “zero” para LED apagado) e gerada e torna-se parte do arquivo
de dados que contem a medicao das posicoes angulares.
Figura 3.6: Ilustracao da montagem do aparato que contem a camera que faz a filmagem do movimentodo pendulo duplo caotico. As figuras (a) e (b) sao esquematicas, mostrando os componentesprincipais da imagem coletada. Em (a) tem-se um quadro no qual o LED de sincronismoesta acesso. Em (b), o LED de sincronismo esta apagado. O LED de sincronismo operadurante 1 segundo em cada estado.
A Figura 3.7 ilustra o processo de fusao dos dois arquivos de dados. O mecanismo
utilizado para essa fusao ocorre da seguinte maneira. A primeira linha do arquivo 1, das
velocidades angulares, corresponde a primeira linha do arquivo 2, das posicoes angulares, em
que a informacao extra, do estado do LED, e equivalente a 1 (um). Essas duas linhas sao
combinadas formando, assim, a primeira linha do arquivo 3, dos dados sincronizados.
Para gerar as proximas linhas, utiliza-se a razao da amostragem com que foram
3.1 Plataforma Experimental do Pendulo Duplo 29
gerados os arquivos 1 e 2. As linhas do arquivo 1 correspondem a amostragem de 1kHz. E
as linhas do arquivo 2 correspondem a taxa de aquisicao de quadros da camera, que pode ser
de 2Hz, 20Hz, ou outro valor qualquer que seja divisor de 1000Hz. Suponha que a taxa de
aquisicao da camera e de 20Hz. Nesse caso, a cada 50 linhas (1000/20 = 50) do arquivo 1
copiadas para o arquivo 3, combina-se uma linha do arquivo 1 com uma do arquivo 2. Toda
vez que se atingir 1000 linhas copiadas do arquivo 1 para o arquivo 3, o que corresponde a
1 segundo de historico, obrigatoriamente, a linha do arquivo 2 que sera combinada com a
linha do arquivo 1 e a proxima da sequencia que tem uma mudanca no estado do LED de
sincronismo, o que esta relacionado com a frequencia de pisca do mesmo. Isso e util porque nao
se tem garantia de que as imagens capturadas pela camera seja exatamente o valor ajustado.
As colunas do arquivo 3, correspondentes as posicoes angulares, sao identificadas por
“NaN” sempre que nao houver combinacao de uma linha do arquivo 1 com uma linha do
arquivo 2.
Arquivo#1 Arquivo#2
Arquivo#3
Figura 3.7: Arquivos gerados pelo sistema. O arquivo 1 e gerado pelo sistema de aquisicao de dadosvia USB e contem dados da velocidade da haste 1. O arquivo 2 e gerado pelo processamentodas imagens do pendulo duplo e contem dados das posicoes angulares das duas hastes edo estado do LED de sincronismo. O arquivo 3 e obtido apos fundir a informacao dosarquivos 1 e 2, essa fusao e um tipo de sincronismo governado pelo estado do LED e pelainformacao da taxa de quadros por segundo da filmagem do pendulo.
30 3 Descricao do Sistema
3.2 Modelagem Fenomenologica
A modelagem fenomenologica busca derivar as equacoes diferenciais que governam a
dinamica de um sistema. Para isso, no caso de sistemas mecanicos, utilizam-se, basicamente,
a aplicacao das leis de Newton ou metodos baseados na energia do sistema (Kelly, 2000).
Firmo (2007) deriva as equacoes diferenciais do pendulo duplo aplicando as leis de
Newton do equilıbrio das forcas e momentos angulares. Entretanto o formato das equacoes
resultantes nao e do tipo que usualmente se encontra, por exemplo, na literatura relacionada
ao movimento de bracos roboticos. Por outro lado, as equacoes de Lagrange, que combinam
consideracoes do metodo de energia com o conceito de trabalho virtual, sao mais recomendadas
para a maioria dos sistemas mecanicos que possuem varios graus de liberdade de movimento
(Inman, 2001). Para exemplificar, recomenda-se o trabalho de Kiyoumarsi e colaboradores
(2007), no qual os autores apresentam o desenvolvimento matematico completo, utilizando a
abordagem de Lagrange, para obter as equacoes dinamicas de um pendulo duplo configurado
para ser um esquema simplificado de um braco robotico flexıvel. Liu e Hu (2010) tambem
utilizam as equacoes de Lagrange para, “facilmente” (segundo o proprio autor), chegar a
equacao dinamica na forma matricial de um pendulo duplo que se move sobre um carrinho.
Outros trabalhos que apresentam a equacao do movimento na forma de Lagrange para sistemas
de pendulo sao (Bortoff, 1996) e (Awrejcewicz et al., 2007). E, a tıtulo de informacao, ha
trabalhos na area de identificacao de coeficientes de atrito baseados no conceito de Lagrange,
do balanco de energias (Liang, 2007; Feeny, 2009; Mann e Khasawneh, 2009).
Na tentativa de encontrar um modelo para o pendulo duplo experimental facilmente
descrito por equacoes matriciais em espaco de estados, opta-se por remodelar o sistema uti-
lizando a abordagem Lagrangiana, que esta no contexto dos metodos baseados na conservacao
da energia.
3.2.1 Modelagem sem Forcas
O diagrama do pendulo duplo da plataforma experimental e apresentado na Figura
3.8. Nesse diagrama, o pendulo esta representado como um sistema conservativo, nao apare-
cendo as forcas dissipativas nem as forcas externas, a fim de simplificar o desenvolvimento das
equacoes. Mais adiante, sao introduzidas as parcelas, por agora, omitidas.
Ainda com relacao ao diagrama, as setas indicam o movimento de rotacao das partes.
As massas m1 e m2 das hastes estao concentradas no centro de massa das mesmas e ficam
3.2 Modelagem Fenomenologica 31
a uma distancia l1 e l2 dos seus respectivos eixos de rotacao. Considerando que as hastes
possuem distribuicao homogena de massa, essas distancias sao dadas por Li/2, em que L e o
comprimento da haste i.
Figura 3.8: Diagrama esquematico do pendulo duplo experimental para o caso conservativo.
Para deduzir a equacao do movimento do pendulo duplo da plataforma experimental
deste trabalho comeca-se pela definicao do Lagrangiano, L, de um sistema dinamico, dado
por
L = T − V, (3.1)
em que T e a energia cinetica e V e a energia potencial, ambas avaliadas em um instante de
tempo qualquer.
Pode-se expressar o Lagrangiano como funcao de coordenadas generalizadas e suas
respectivas derivadas. Portanto, o proximo passo e a escolha das coordenadas generalizadas.
Como o pendulo duplo e um sistema com 2-graus de liberdade (2-DOF), ele possui um con-
junto de 2 varaveis cineticamente independentes que descrevem completamente o movimento
das suas partıculas (Kelly, 2000), a saber, as variaveis θ1 e θ2. Esse conjunto e chamado
de coordenadas generalizadas. Dessa forma, expressa-se o lagrangiano como L(θ1,θ2,θ1,θ2).
32 3 Descricao do Sistema
Define-se a equacao de Lagrange para um sistema conservativo como
d
dt
(
∂L
∂θi
)
− ∂L
∂θi= 0, i = 1,2. (3.2)
A energia potencial total do sistema, V , e dada por
V = V1 + V2, (3.3)
em que, V1 e V2 sao as energias potenciais da haste 1 e da haste 2, respectivamente, dadas por
V1 = −m1gl1cos(θ1), (3.4)
V2 = −m2g(L1cosθ1 + l2cosθ2). (3.5)
A energia cinetica total do sistema, T , e dada por
T = T1 + T2 + Tm, (3.6)
em que, T1 e T2 sao as energias cineticas da haste 1 e da haste 2, respectivamente, e Tm e a
energia cinetica rotacional do motor. Elas sao, respectivamente, dadas por
T1 =1
2m1l1
2θ21 +1
2Jm1θ
21, (3.7)
T2 =1
2m2l2
2θ22 +1
2m2L1
2θ21 +m2L1l2θ1θ2cos(θ1 − θ2) +1
2Jm2θ
22, (3.8)
Tm =1
2Mmθ21, (3.9)
em que Jmi e o momento de inercia da haste i, calculado como li2mi, e Mm e o momento de
inercia do motor C.C.
Substituindo as equacoes (3.4)-(3.5) em (3.3), e (3.7)-(3.9) em (3.6), obtem-se o la-
grangiano do pendulo duplo como
L =1
2Mmθ21 +
1
2m1l1
2θ21 +1
2Jm1θ
21 +
1
2m2l2
2θ22 +1
2m2L1
2θ21 (3.10)
+m2L1l2θ1θ2cos(θ1 − θ2) +1
2Jm2θ
22 +m1gl1cos(θ1) +m2g(L1cosθ1 + l2cosθ2).
3.2 Modelagem Fenomenologica 33
Para calcular a equacao (3.2) para a coordenada θ1, seguem as seguintes derivadas
∂L
∂θ1= Mmθ1 + Jm1θ1 +m1l1
2θ1 +m2L12θ1 +m2L1l2θ2cos(θ1 − θ2), (3.11)
d
dt
(
∂L
∂θ1
)
= Mmθ1 + Jm1θ1 +m1l12θ1 +m2L1
2θ1 (3.12)
+m2L1l2θ2cos(θ1 − θ2)− sen(θ1 − θ2)m2L1l2θ2(θ1 − θ2),
∂L
∂θ1= −gl1m1sen(θ1)− gL1m2sen(θ1)−m2L1l2θ1θ2sen(θ1 − θ2), (3.13)
o que resulta em
[Mm + Jm1 + m1l12 +m2L1
2]θ1 +m2L1l2cos(θ1 − θ2)θ2 (3.14)
+m2L1l2sen(θ1 − θ2)θ22 + gm1l1sen(θ1) + gm2L1sen(θ1) = 0
E para a coordenada θ2, seguem as seguintes derivadas
∂L
∂θ2= Jm2θ2 +m2l2
2θ2 +m2L1l2θ1cos(θ1 − θ2), (3.15)
d
dt
(
∂L
∂θ2
)
= m2l22θ2 +m2L1l2θ1cos(θ1 − θ2)− (3.16)
−sen(θ1 − θ2)m2L1l2θ1(θ1 − θ2),
∂L
∂θ2= −m2gl2sen(θ2)−m2L1l2θ1θ2sen(θ1 − θ2), (3.17)
que resultam em
[Jm2 +m2l22]θ2 + m2L1l2cos(θ1 − θ2)θ1 (3.18)
−m2L1l2sen(θ1 − θ2)θ21 + gm2l2sen(θ2) = 0
Representando (3.14) e (3.18) na forma matricial, obtem-se a equacao dinamica do
pendulo duplo conservativo
M(θ)θ + Γ(θ,θ)θ + p(θ) = 0, (3.19)
34 3 Descricao do Sistema
em que
M(θ) =
Mm + Jm1 +m1l12 +m2L1
2 m2L1l2cos(θ1 − θ2)
m2L1l2cos(θ1 − θ2) Jm2 +m2l22
,
Γ(θ,θ) = m2L1l2sen(θ1 − θ2)
12 θ2 θ2 − 1
2 θ1
12 θ2 − θ1 −1
2 θ1
,
p(θ) =
gm1l1sen(θ1) + gm2L1sen(θ1)
gm2l2sen(θ2)
. (3.20)
3.2.2 Modelagem com Forcas
Para avancar com a abordagem Lagrangiana no tratamento do caso de um sistema
sob a influencia de forcas externas nao conservativas, como e o presente caso, utiliza-se o
conceito de trabalho virtual, δW , dado por
δW =2
∑
i=1
Qi δθi, (3.21)
em que Qi sao as forcas generalizadas e δθi sao os deslocamentos virtuais que sao pequenos
deslocamentos realizados sob a acao do trabalho δW das forcas nao conservativas Qi. Com a
inclusao do trabalho virtual, a equacao de Lagrange e dada por
d
dt
(
∂L
∂θi
)
− ∂L
∂θi= Qi. (3.22)
As forcas nao-conservativas que atuam no pendulo duplo sao o atrito de Coulomb e
o atrito viscoso, na regiao das articulacoes, bem como a forca externa aplicada pelo motor
acoplado a haste 1.
O atrito viscoso, fv, ou amortecimento viscoso, e expresso por
fv = cθ, (3.23)
em que a constante de proporcionalidade c e chamada de coeficiente de amortecimento. O
3.2 Modelagem Fenomenologica 35
atrito seco, fc, ou de Coulomb, tem a forma
fc =
−µN, θ > 0
0, θ = 0
µN, θ < 0
, (3.24)
em que N e a forca normal e µ e o coeficiente de atrito deslizante (do ingles,slip motion).
Note que a definicao da forca de atrito para θ = 0 nao e necessaria, pois essa singularidade
no movimento, na qual o objeto fica paralisado, ou emperrado (do ingles,stick motion), nao e
considerada (Liang e Feeny, 2004). A equacao (3.24) pode ser escrita na forma reduzida como
fc = b sinal(θ), (3.25)
em que b e o coeficiente de Coulomb.
Conforme Liang (2007), modelos de amortecimento nao-linear quadraticos podem ser
empregados no lugar de (3.25). Em (de Paula et al., 2006), por exemplo, o atrito de Coulomb
e suavizado pelo uso da funcao arctan.
Finalmente, a fonte de energia provem do torque externo gerado pelo motor que e
dado por
fe = ktia, (3.26)
em que kt e a constante de torque do motor e ia e a corrente de armadura do motor e e dada
por
ia =g(θ1)
(
Vasinal(θ1)−Ksθ1
)
Ra, (3.27)
em que g(θ1) modela a excitacao do motor como
g(θ1) ,
0 se, |θ1| ≥ γ,
1 se, |θ1| < γ,
(3.28)
o qual exerce um torque proporcional a corrente de armadura ia, caso o modulo da posicao
angular da haste 1 seja inferior ao limiar γ. Por simplicidade, a dinamica de ia nao e consid-
36 3 Descricao do Sistema
erada em (3.27). Essa aproximacao e razoavel haja vista que a dinamica eletrica do motor
C.C. e desprezıvel quando comparada a dinamica do aparato mecanico.
A Figura 3.9 mostra o diagrama de corpo livre das hastes do pendulo duplo, exibindo
as forcas dissipativas e externas (desconsiderando a forca peso que ja foi contabilizada no caso
conservativo) que atuam nos pontos de articulacao O e J .
Ponto O
Ponto J
Ponto J
Figura 3.9: Diagrama de corpo livre das hastes do pendulo duplo.
Com base na Figura 3.9, a contribuicao das forcas (3.23),(3.25) e (3.26) nos desloca-
mentos virtuais δθ1 e δθ2 e expressa, conforme (3.21), por
δW = −(b1θ1 + b3sinal(θ1))δθ1 + (b2(θ2 − θ1) + b4sinal(θ2 − θ1))δθ1 + (3.29)
+feδθ1 − (b2(θ2 − θ1) + b4sinal(θ2 − θ1))δθ2,
logo, as forcas generalizadas que atuam em cada haste sao dadas por
Q1 = −(b1θ1 + b3sinal(θ1)) + (b2(θ2 − θ1) + b4sinal(θ2 − θ1)) + fe, (3.30)
Q2 = −(b2(θ2 − θ1) + b4sinal(θ2 − θ1)). (3.31)
Escrevendo (3.30)-(3.31) na forma matricial, tem-se
Q = −B1θ − F (θ)B2 + Fe. (3.32)
3.3 Caracterizacao Dinamica 37
em que
B1 =
b1 + b2 −b2
−b2 b2
, B2 =
b3
b4
,
F (θ) =
sinal(θ1) −sinal(θ2 − θ1)
0 sinal(θ2 − θ1)
, Fe =
fe
0
, (3.33)
3.2.3 Modelagem Completa
Finalmente, ao combinar a equacao (3.32) com as equacoes (3.19) e (3.22), obtem-se
as equacoes dinamicas do pendulo duplo, amortecido e excitado, na abordagem Lagrangiana
como
M(θ)θ + Γ(θ,θ)θ +B1θ + F (θ)B2 + p(θ) = Fe, (3.34)
ou, alternativamente,
θ =
θ1
θ2
= M(θ)−1(Fe − Γ(θ,θ)θ −B1θ − F (θ)B2 − p(θ)). (3.35)
Para escrever a equacao dinamica do pendulo duplo em espaco de estados, define-se
o vetor de estados x , [θ1 θ2 θ1 θ2]T. Utilizando (3.35), encontra-se
x =
θ1
θ2
θ1
θ2
=
θ1
θ2
M(θ)−1(Fe − Γ(θ,θ)θ −B1θ − F (θ)B2 − p(θ))
(3.36)
Observe que (3.36) esta na forma (5.3) com w(t) = 0.
A Figura 3.10 mostra uma simulacao, com duracao de 10 segundos, do modelo (3.36)
com os parametros da Tabela 3.3 e condicoes iniciais x0 = [0 − 90 − 573/s 0/s].
3.3 Caracterizacao Dinamica
A simulacao do modelo (3.36) do pendulo duplo da bancada experimental, ilustrada
na Figura 3.10, mostra series temporais com oscilacoes irregulares, aparentemente aperiodicas,
38 3 Descricao do Sistema
Tabela 3.3: Parametros do modelo do pendulo duplo.
Par. Valor Unidade Descricao
L1 0,273 m comprimento da haste 1
L2 0,216 m comprimento da haste 2
l1 0,158 m raio de giracao da haste 1
l2 0,125 m raio de giracao da haste 2
m1 0,297 kg massa da haste 1
m2 0,235 kg massa da haste 2
Jm1 74,14× 10−4 kgm2 momento inercia da haste 1
Jm2 36,71× 10−4 kgm2 momento inercia da haste 2
Mm 22× 10−6 kgm2 momento inercia do motor
b1 0,0010 Nm /rad coeficiente de amortecimento da junta 1
b2 0,000015 Nm /rad coeficiente de amortecimento da junta 2
b3 0,0010 Nm /rad coeficiente de Coulomb da junta 1
b4 0,00015 Nm /rad coeficiente de Coulomb da junta 2
g 9,81 m/s2 acelacao da gravidade
Ra 32 Ω resistencia da armadura do motor
La 30 mH indutancia da armadura do motor
Kt 0,0358 Nm/A constante de torque do motor
Ks 0,0358 V/rad/s constante de velocidade do motor
γ π/3 rad limiar de acionamento do motor
Va 19,0 volts tensao de armadura do motor
dos quatro estados do sistema. Series temporais com essas caracterısticas podem se originar
do caos determinıstico, de processos estocasticos ou de processos multi-periodicos, sendo que
esse ultimo se enquadra na classe dos processos regulares (Fiedler-Ferrara e Prado, 2009).
A possibilidade de que os sinais da Figura 3.10 sejam estocasticos e descartada, pois
esses sinais, como se sabe, foram gerados deterministicamente pelas equacoes diferenciais
(3.36), sem a presenca de ruıdo.
Por outro lado, a possibilidade de se tratar de caos determinıstico e possıvel pois o
sistema dinamico do pendulo duplo estudado obedece a um dos criterios para ser considerado
um sistema capaz de exibir comportamento caotico, que e possuir o mınimo de tres dimensoes
(Fiedler-Ferrara e Prado, 2009). No caso, o modelo do pendulo duplo define um sistema de
quatro dimensoes. Qi e colaboradores (2005) apresentam e analisam um sistema contınuo
autonomo caotico de quatro dimensoes.
A analise espectral, que e um dos metodos classicos de analise de sistemas, nao permite
distinguir processos regulares daqueles caoticos. Quando o processo regular e quasi-periodico
ou multi-periodico os picos de frequencia sao tao proximos que o espectro de frequencia que
se tem e praticamente contınuo assim como o espectro de frequencia de um sinal caotico
3.3 Caracterizacao Dinamica 39
0s 5s 10s−180
−90
0
90
180
(a)θ 1
( ° )
t(s)
0s 5s 10s−1145
−570
0
570
1145 (b)
θ 1• (°
/s)
t(s)
0s 5s 10s−2000
−1000
0180
(c)
θ 2 (
° )
t(s)
0s 5s 10s−2865
−1432
0
1432
2865 (d)
θ 2• (°
/s)
t(s)
Figura 3.10: Simulacao livre do modelo do pendulo duplo. Em (a), a posicao angular da haste 1, θ1.Em (b), a velocidade angular da haste 1, θ1. Em (c), a posicao angular da haste 2, θ2, e,em (c), a velocidade angular da haste 2, θ2.
(Fiedler-Ferrara e Prado, 2009). E, portanto, necessario avaliar os invariantes dinamicos para
garantir a identificacao do caos em sistemas fısicos.
Abarbanel e colaboradores (1993) elaborou uma revisao bastante completa das fer-
ramentas para analise de dinamica nao-linear e como caracterizar o comportamento caotico
observada em sistemas fısicos. Ressalta-se aqui “sistemas fısicos” pelo fato de que, na maioria
dos casos, nao se sabe as equacoes que governam tais sistemas, impedindo procedimentos
analıticos, como o calculo da matriz Jacobiana, por exemplo. O que, em geral se considera, e
que ha disponıvel apenas a medicao direta de um dos estados do sistema fısico. Felizmente, e
possıvel determinar as invariantes dinamicas por meio de uma unica serie temporal.
Ha uma serie de estudos de caracterizacao do caos em sistemas mecanicos. Rifai e
colaboradores (2007) utiliza curvas de nıvel geradas por expoentes de Lyapunov para estu-
dar as caracterısticas da bacia de atracao de um pendulo massa-mola. A bacia de atracao
fornece entendimento sobre como o sistema se move em direcao a um conjunto invariante
do espaco de estados. Franca e Savi (2001) utilizam, alem dos expoentes de Lyapunov, a
dimensao do atrator e mapas de Poincare para diferenciar o movimento periodico do caotico
em um pendulo nao-linear experimental. Blazejcyk e Kapitaniak (1998) analisam o fenomeno
40 3 Descricao do Sistema
da multi-estabilidade em um oscilador massa-mola com impacto. A multi-estabildade e car-
acterizada pela co-existencia de diferentes atratores caoticos para um mesmo conjunto de
parametros, e a condicao incial e que definira para qual atrator o sistema caminhara.
Com relacao ao pendulo estudado, Firmo (2007) conduziu uma serie de analises
numericas e experimentais para caracterizar sua dinamica. Essas analises incluem: analise
espectral, a reconstrucao do espaco de fases, estimativas do expoente de Lyapunov e da di-
mensao de correlacao do atrator. Todas essas analises foram feitas a partir da serie temporal
da velocidade angular da haste 1 e foi utilizado o pacote de algoritmos para analise nao-linear
de series temporais, TISEAN (Hegger et al., 1999). Como resultado, Firmo (2007) conclui
que o pendulo duplo e capaz de exibir dinamica caotica.
O parametro de bifurcacao e a tensao de armadura do motor, Va, embora os coefi-
cientes de atrito tambem possam conduzir o sistema ao caos. Veja, por exmeplo, os trabalhos
de Hinrichs e colaboradores (1997) e Feeny e Moon (1993) que abordam o efeito do atrito em
sistemas mecanicos com comportamento caotico.
Neste trabalho, nao sao calculados invariantes dinamicos para o novo modelo derivado,
(3.36), visto que o que diferencia esse modelo daquele apresentado por Firmo (2007) e a abor-
dagem utilizada para deriva-los. As propriedades principais do pendulo duplo experimental
sao consideradas em ambos os modelos. Mas, a fim de verificar quao semelhantes eles sao, do
ponto de vista estrutural, constroem-se os retratos de fases, a partir de dados simulados, para
os dois modelos com os mesmos parametros da Tabela 3.3. A Figura 3.11, com os retratos de
fases da haste 1, mostra que o novo modelo derivado sob a abordagem Lagrangiana parece ser
uma versao achatada do retrato de fases da mesma haste obtido para o modelo utilizado por
Firmo (2007). Verifica-se tambem, nos retratos de fases da haste 2, Figura 3.12, a presenca
caracterıstica de uma faixa central nestes retratos que tem a forma de um anel. Porem, a
largura do anel, no retrato de fases do modelo utilizado por Firmo (2007), e maior que a
apresentada no retrato de fases para o novo modelo derivado neste trabalho. Em suma, pode-
se perceber que o modelo segundo a abordagem Lagrangiana representa um pendulo duplo
cujas hastes oscilam com maior amplitude, porem com menos velocidade, em comparacao ao
modelo construıdo por Firmo (2007).
A proxima secao descreve uma das caracterısticas dos sistemas ditos caoticos que e a
imprevisibilidade.
3.3 Caracterizacao Dinamica 41
−3 −2 −1 0 1 2 3−30
−20
−10
0
10
20
30 (b)
θ 1• (r
ad/s
)θ1 (rad)
−3 −2 −1 0 1 2 3−30
−20
−10
0
10
20
30 (a)
θ 1• (r
ad/s
)
θ1 (rad)
Figura 3.11: Retrato de fases da haste 1. Em (a), o retrato obtido da simulacao do modelo dado pelasequacoes de Lagrange, derivado neste trabalho. Em (b), o retrato obtido pela simulacao domodelo de Firmo (2007), em que se utiliza a abordagem das Leis de Newton de equilıbriode forcas e momento.
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1−80
−60
−40
−20
0
20
40
60
80
cos(θ2)
(a)
sen(θ2• )
θ 2• (ra
d/s)
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1−80
−60
−40
−20
0
20
40
60
80
cos(θ2)
(b)
sen(θ2• )
θ 2• (ra
d/s)
Figura 3.12: Retrato de fases da haste 2. Em (a), o retrato obtido da simulacao do modelo dado pelasequacoes de Lagrange, derivado neste trabalho. Em (b), o retrato obtido pela simulacao domodelo de Firmo (2007), em que se utiliza a abordagem das Leis de Newton de equilıbriode forcas e momento.
3.3.1 O Caos e a Imprevisibilidade
A principal caracterıstica da dinamica caotica determinıstica e a dependencia sensi-
tiva as condicoes iniciais. A essa caracterıstica estao associados os atratores estranhos e a
imprevisibilidade.
42 3 Descricao do Sistema
Veja a Figura 3.13. Ela mostra a simulacao do modelo do pendulo duplo partindo de
condicoes iniciais muito proximas. Entretanto, pode-se observar que as trajetorias seguidas
por cada uma delas divergem em um prazo curto do tempo. Esse prazo de tempo e funcao
nao somente do erro na condicao inicial, mas, tambem, da condicao inicial em si, como aponta
Palmer (2000).
0 5 10 15−200
0
200 (a)
θ 1(
° )
t(s)
0 5 10 15−1145
−570
0
570
1145 (b)
θ 1• (°
/s)
t(s)
0 5 10 15−200
0
200 (c)
θ 2 (
° )
t(s)
0 5 10 15−2865
−1432
0
1432
2865 (d)
θ 2• (°
/s)
t(s)
Figura 3.13: Sensibilidade a condicoes iniciais exibida pelo modelo do pendulo duplo. A curva azulpartiu da condicao inicial [θ1 θ2 θ1 θ2]
T = [0,99π 0 0 0]T. A curva vermelha partiu dacondicao incial [0,9888π 0 0 0]T. Perceba que a diferenca de θ1, entre os dois casos, emuito pequena.
Um aspecto interessante da previsao em sistemas caoticos e esse: a condicao inicial
afeta a taxa com que o erro inicial de predicao cresce. Isso ocorre porque a divergencia das
trajetorias, ao longo do tempo, sao mais ou menos expressivas dependendo da regiao do atrator
3.3 Caracterizacao Dinamica 43
caotico que o sistema se encontra. A divergencia media local de orbitas e avaliada por meio
do caculo do expoente de Lyapunov. Portanto, outra relacao acerca do perıodo de tempo em
que se faz previsoes precisas e que ele e inversamente proporcional ao maximo expoente de
Lyapunov (Aguirre e Billings, 1994). Segundo Abarbanel e colaboradores (1993), a entropia
de Kolmogorov-Sinai fornece uma declaracao precisa a respeito dos limites de previsibilidade
de um sistema nao-linear.
Outro fator que prejudica a previsibilidade e a incerteza na formulacao do modelo do
sistema (Palmer, 2000). De fato, um bom modelo de predicao nao deve ser apenas confiavel, no
sentido de se ajustar a um conjunto de dados, mas tambem deve ser representativo (Abarbanel
et al., 1990; Aguirre e Billings, 1994).
O fenomeno da imprevisibilidade e de muita importancia para esse trabalho ja que
os estimadores recurssivos baseados no KF possuem uma etapa de predicao.
Propagar incertezas em um modelo que apresenta comportamento caotico nao e uma
tarefa simples visto que a PDF da incerteza inicial evolui para distribuicoes multi-modais
complicadas, de alta ordem. O artigo de Khalil e colaboradores (2009) mostra a transicao de
uma PDF inicialmente uniforme para situacoes com e sem ruıdo. Kapitaniak (1990) mostra
que ha uma analogia entre a transicao da PDF e o diagrama de bifurcacao de sistemas de-
terminısticos. Dependendo do passo de integracao do modelo, uma variavel Gaussiana pode
se descaracterizar completamente, podendo afetar o desempenho do estimador que considera
apenas os dois momentos principais (media e covariancia).
Capıtulo 4
Medicao dos Angulos do Pendulo usando
Processamento de Imagens
Socrates - Dessa forma, tais homens nao atribuirao realidade senao as sombras dos objetos
fabricados?
Glauco - Assim tera de ser.
Platao, A Republica, v. II p. 105 a 109
4.1 Definicao do Problema
Por meio de uma camera digital (ver Secao 3.1.2), e obtida uma imagem de entrada,
do pendulo duplo, no modelo de cor RGB (ver Secao 4.2) e resolucao de 640× 480 pixels. A
Figura 4.1 ilustra a imagem de entrada mencionada.
Objetiva-se obter uma estimativa dos angulos θ1 e θ2 formados pelas hastes do pendulo
duplo utilizando metodos de processamento de imagem. Para facilitar a tarefa e aumentar a
precisao das estimativas, sao fixados tres cırculos, com componente de cor proxima damagenta,
na estrutura do pendulo. Esse artifıcio e, de forma semelhante, adotada em outros trabalhos
(Wenzel et al., 2000; Tu e Ho, 2010; Teeple et al., 2009). Wang e colaboradores (2008) e
Wang e colaboradores (2010) optam por colocar um LED infra–vermelho na extremidade do
pendulo, enquanto que Espinoza-Quesada e Ramos-Velasco (2006) nao utilizam nenhum tipo
de auxılio.
Alem dos cırculos, e de interesse do sistema de processamento de imagem definir o
estado, aceso ou apagado, do LED de sincronismo (ver Secao 3.1.4), cuja cor, predominante-
mente, alterna entre o verde claro (quando aceso) e o verde escuro (quando apagado).
A excecao dos cırculos e do LED, os demais elementos da imagem, como a mesa, a
46 4 Medicao dos Angulos do Pendulo usando Processamento de Imagens
estante e as hastes do pendulo, sao considerados plano de fundo.
Figura 4.1: Imagem amostrada de um vıdeo produzido pela camera digital utilizada para o senso-riamento do movimento das hastes do pendulo duplo. Essa imagem e gerada no padraode cor RGB com resolucao de 640 × 480 pixels. Repare a existencia de tres marcas decor homogenea (proxima da magenta) na estrutura do pendulo e de um LED verde nocanto superior esquerdo. Tais artefatos sao utilizados pelo algoritmo de processamento deimagem apresentado da Secao 4.4.
Os cırculos coloridos, por estarem fixados a haste do pendulo, se movimentam, ocu-
pando diferentes posicoes a cada quadro de imagem obtido pela camera. Por outro lado, o
LED permanece fixo na regiao superior esquerda do quadro de imagem. Dessa forma, co-
existem duas regioes de interesse (ROI, do ingles region of interest). A primeira ROI, cujos
limites sao dinamicos, contem os tres cırculos que se movimentam; e a segunda tem limites
estaticos e engloba o espaco na imagem ocupado pelo LED.
Para inferir os valores dos angulos θ1 e θ2, e necessario localizar as centroides dos
cırculos fixados as hastes. Defina os centroides, C1, C2, e C3, como
Ci(k) = (xi(k), yi(k)), i = 1,2,3, (4.1)
em que i denota o ındice do cırculo, k ∈ N, tal que k ≤ L, e a ordem ocupada pela imagem
na sequencia das L imagens produzidas pelo vıdeo, xi e yi sao as coordenadas cartesianas da
centroide do cırculo i. O cırculo 1 (i = 1) e aquele fixado no rolamento do eixo que liga a
haste 1 ao suporte, o cırculo 2 (i = 2) esta localizado no rolamento do eixo que une a haste 1
com a haste 2, e o cırculo 3 (i = 3) esta localizado na extrema ponta da haste 2.
4.2 Parametrizacao de Imagens Digitais 47
Dessa forma, calculam-se as estimativas da seguinte maneira
θ1 =
0, se x2 = x1 e y2 > y1,
π, se x2 = x1 e y2 < y1,
π2 sinal(x2 − x1), se y2 = y1,
π2 + sinal(y1 − y2)
[
π2 − arctan
(
x2−x1|y2−y1|
)]
, caso contrario,
(4.2)
θ2 =
0, se x3 = x2 e y3 > y2,
π, se x3 = x2 e y3 < y2,
π2 sinal(x3 − x2), se y3 = y2,
θ1 − sinal(θ1)π, se a haste 2 estiver dentro da haste 1,
π2 + sinal(y2 − y3)
[
π2 − arctan
(
x3−x2|y3−y2|
)]
, caso contrario.
(4.3)
A proxima secao traz alguns dos fundamentos principais sobre processamento de
imagem digital para que, na secao subsequente, os metodos de processamento de imagem,
implementados pelo algoritmo de processamento de imagem, sejam introduzidos.
4.2 Parametrizacao de Imagens Digitais
Uma imagem, em geral, pode ser descrita por uma funcao bi-dimensional, g(x,y),
em que (x,y) denotam as coordenadas espaciais e g(x,y) corresponde a um valor do espaco
caracterıstico, Γ, da imagem no ponto (x,y) (Pal e Pal, 1993). Tal espaco caracterıstico
depende do tipo da fonte de iluminacao e do dispositivo que visualiza a cena (Gonzalez e
Woods, 2002). Alem disso, se, para formar a imagem, ocorrer um processo no qual tanto o
espaco de coordenadas, (x,y), quanto o valor caracterıstico, g(x,y), forem digitalizados, tal
imagem resultante e uma imagem digital (Pal e Pal, 1993).
Uma imagem digital, portanto, pode ser definida por um numero finito de matrizes
Gi ∈ DM×Ni em que M × N definem o tamanho da imagem tal que 0 ≤ x ≤ (M − 1) e
0 ≤ y ≤ (N − 1), e Di = d1, d2, · · · ,dI, dj ∈ Z, j = 1, · · · ,I e o conjunto de nıveis discretos
do espaco caracterıstico Γ. E i = 1, · · · ,l e o ındice da camada da imagem tal que l = 1, para
imagens monocromaticas e, em geral, l = 3 para imagens em cores.
48 4 Medicao dos Angulos do Pendulo usando Processamento de Imagens
Note que uma imagem digital pode ser matematicamente representada por uma ma-
triz com M ×N pontos, sendo que, cada ponto, ou elemento da figura, recebe o nome de pixel
(Gonzalez e Woods, 2002). A Figura 4.2 mostra a distribuicao dos pixels de uma imagem e a
convencao que se utiliza para localiza-los.
Figura 4.2: Representacao da imagem digital como um conjunto de pontos dispostos em linhas e col-unas, assim como uma matriz. Cada ponto, ou elemento da matriz, e chamado pixel.
Para compreender, de forma simplificada, um processo de formacao de imagem digital,
tem-se o exemplo ilustrativo da Figura 4.3. Em geral, a formacao da imagem digital e dividida
em etapas de aquisicao, amostragem e quantizacao. Neste exemplo, a aquisicao ocorre pela
projecao do objeto na superfıcie retangular que faz o papel de um sensor, Figura 4.3-(a). Essa
superfıcie sensora contem subdivisoes identicas, e, assim, e feita a amostragem espacial da
imagem do objeto.
Agora, considera-se, por simplicidade, que cada elemento sensor seja sensıvel ao seu
grau de preenchimento. Portanto, o espaco de caracterısticas e definido por um unico compo-
nente, nesse caso, o grau de preenchimento da projecao da imagem no sensor. Em seguida, a
etapa de quantizacao associa a resposta de cada elemento a um dos quatro nıveis de quanti-
zacao pre-estabelecidos (conforme Figura 4.3b), promovendo, dessa forma, a digitalizacao do
valor caracterıstico naquela regiao e finalizando a formacao da imagem digital.
A imagem digital deste exemplo pode ser visualizada em um monitor monocromatico
que transforma o valor do pixel em uma nıvel de cinza, Figura 4.3-(c).
O espaco de caracterısticas e que permite distinguir uma imagem monocromatica
4.2 Parametrizacao de Imagens Digitais 49
2 - preenchimento
intermediário
3 - pouco
preenchido
1 - totalmente
preenchido
23 1
(a) (b) (c)
4 4 4 4 4 4 4 4 1 2 4 4
4 4 4 4 4 4 4 4 1 2 4 4
4 4 4 4 4 4 4 3 1 2 4 4
4 4 4 4 4 4 4 2 1 1 4 4
4 4 4 4 4 2 1 1 1 2 4 4
4 4 4 4 2 1 1 2 3 4 4 4
4 4 2 1 1 1 4 4 4 4 4 4
2 1 1 1 2 4 4 4 4 4 4 4
2 1 1 2 4 4 4 4 4 4 4 4
3 2 2 4 4 4 4 4 4 4 4 4
4 - não
preenchido4
Figura 4.3: Ilustracao hipotetica de um processo de formacao de imagem digital, a partir da imagemnatural de um objeto, para exemplificar, simplificadamente, as etapas de: (a) amostragem,e (b) quantizacao. O conjunto discreto de valores caracterısticos formado pelos elementostotalmente preenchido, preenchimento intermediario, pouco preenchido e nao preenchido,sao numerados de 1 a 4, respectivamente, pela etapa de quantizacao. A parte (c) destafigura representa a visualizacao da imagem digital em escala de cinza.
de uma imagem em cores. No caso da imagem monocromatica, o espaco de caracterıstica
e formado apenas pela informacao da intensidade luminosa, ou brilho; e o conjunto discreto
caracterıstico, D = 0,1, · · · ,255, por exemplo, e comumente chamado de escala de cinza, em
que 0 corresponde ao preto e o valor maximo (nesse caso 255) ao branco.
Para produzir as imagens em cores, outros atributos da fonte luminosa, alem do brilho,
sao utilizados, como, por exemplo, a cor e a saturacao. A cor e a caracterıstica associado ao
espectro de frequencia visual, e a saturacao e uma medida da quantidade de branco de uma
cor. Esses tres atributos, ou componentes do espaco caracterıstico Γ, brilho, cor e saturacao,
chamado de modelo de cor HSI, permitem distinguir uma cor de outra.
Tres outros componentes alternativos foram derivados pela forma como o sistema
visual humando distingue as cores. Como se sabe, as celulas sensoras do sistema visual
humano sao sensıveis aos estımulos na banda de frequencia do vermelho, do azul e do verde.
A partir disso, foi criado o modelo de cor RGB, do ingles Red (vermelho), Green (verde) e
Blue (azul).
A Figura 4.4 e um diagrama que mostra os componentes da percepcao visual e mostra
a relacao entre os modelos de cor HSI e RGB.
Para obter imagens em cores, muitas cameras utilizam sensores sensıveis aos tres estı-
mulos, R, G e B. Sobre cada canal sensorial, sao executadas as tres etapas basicas da formacao
da imagem digital (aquisicao, amostragem e quantizacao) resultando em tres matrizes, ou tres
50 4 Medicao dos Angulos do Pendulo usando Processamento de Imagens
Brilho
Branco
Preto
SaturaçãoCor
BG
R
Figura 4.4: Componentes da percepcao visual. Aqui, dois modelos de cor sao mostrados simultanea-mente para que se observe a relacao entre os dois. O modelo de cor HSI e formado pelascomponentes: cor (H), saturacao (S) e brilho, ou intensidade, (I). E o modelo de cor RGBe caracterizado pelos tres estımulos de cor: vermelho (R), verde (G) e azul (B). Fonte:(Pratt, 2001).
camadas. A Figura 4.5 ilustra esse processo.
R
G
B
Monitor
RGB
Figura 4.5: Esquema de formacao (ou decomposicao) de uma imagem no modelo de cor RGB dado pelacombinacao de tres camadas monocromaticas correspondentes a cada um dos estımulos.
Cada pixel possui quatro vizinhos verticais e horizontais cujas coordenadas sao (x+
1,y),(x − 1,y),(x,y + 1) e (x,y − 1). Esse conjunto de pontos e denotado por V4(p). Outros
vizinhos estao localizados na diagonal, nas coordenadas (x+1,y+1),(x+1,y−1),(x−1,y+1)
e (x−1,y−1), e sao denotados por VD(p). No total, um pixel possui 8 vizinhos, exceto aqueles
casos em que o pixel de referencia esta localizado nas bordas da imagem.
4.3 Metodos de Processamento de Imagem 51
4.3 Metodos de Processamento de Imagem
4.3.1 Realce da Imagem
As tecnicas de realce de imagem sao usadas para melhorar a aparencia visual de
uma imagem ou converte-la para um formato que simplifique a analise a ser feita por um
sistema computadorizado ou pelo sistema visual humano (Pratt, 2001; Huang et al., 2006;
Kaiqi et al., 2005). Como aponta Cheng e Shi (2004), o realce da imagem e uma das questoes
mais importantes em aplicacoes menos complexas de processamento de imagem.
O objetivo desejado ao aplicar uma tecnica de realce varia conforme a aplicacao.
Para o realce de textura, em que o objetivo e enaltecer detalhes tais como bordas e linhas, os
metodos de realce podem ser agrupados, segundo Huang e colaboradores (2006), como aqueles
baseados na reducao de ruıdo (filtragem) ou aqueles baseados em contraste. Quanto ao ultimo
tipo, eles recebem diferentes classificacoes por parte de outros autores. Kaiqi e colaboradores
(2005) classificam as tecnicas de realce de imagem baseada em contraste segundo o tipo de
operador utilizado, podendo ser espacialmente uniforme ou espacialmente nao-uniforme. E,
Cheng e Shi (2004), dividem tais tecnicas entre local ou global.
Os metodos de filtragem propoem reduzir o ruıdo sem degradar os detalhes presentes
na imagem. A filtragem linear, tambem conhecida como filtragem de media, e uma operacao
de vizinhanca que trabalha com os valores dos pixels na imagem alvo, I, e com o valor
correspondente de uma sub-imagem, Imsk, que tem a mesma dimensao que a da vizinhanca
considerada, chamada de mascara. Os valores dos pixels da mascara sao os coeficientes do
filtro. Em geral, a filtragem linear de uma imagem I de tamanho M ×N com uma mascara
de filtragem Imsk de tamanho m× n e dada pela expressao:
Ifilt(c,r) =
a∑
t=−a
b∑
s=−b
Imsk(s,t)I(c+ t, r + s), (4.4)
em que a = (m−1)/2 e b = (n−1)/2. Para filtrar uma imagem completamente, essa equacao
deve ser aplicada para c = 0,1,2, · · · ,M − 1 e r = 0,1,2, · · · ,N − 1.
O processo de filtragem consiste simplesmente em movimentar a mascara do filtro
sobre a imagem alvo e, a partir disso, recalcular novos valores para cada pixel da imagem
alvo. No caso do filtro de media, a cada ponto (c,r) da imagem alvo, calcula-se o novo
valor correspondente na imagem filtrada usando uma relacao predefinida dada pela soma de
produtos dos coeficientes do filtro com o pixel correspondente na imagem alvo na area coberta
52 4 Medicao dos Angulos do Pendulo usando Processamento de Imagens
pela mascara do filtro. Porem, o filtro de media tem o efeito indesejado de borrar alguns
detalhes da imagem, como as bordas (Gonzalez e Woods, 2002). Uma alternativa e o uso do
filtro nao-linear, como por exemplo, o filtro de mediana, que e um dos mais conhecidos por
preservar bem os detalhes da imagem, alem de suprimir ruıdos impulsivos. Ko e Lee (1991)
apresenta duas extensoes do filtro de mediana, que sao o filtro de mediana com ponderacao
central (CWM) e o filtro de mediana com ponderacao central adaptativa (ACWM), sendo que
o ultimo exibe bons resultados tambem na supressao de ruıdos multiplicativos.
Os metodos de contraste, por enfatizar os conteudos de alta frequencia da imagem
a fim de evidenciar os detalhes, lidam com a questao da sensibilidade ao ruıdo e com os
problema de sobre-contraste, que e a elevacao do contraste em regioes que ja possuiam um
alto contraste, e de distorcao da imagem (Polesel et al., 2000).
Naik e Murthy (2003) apresentam um metodo de contraste para imagens em cores
que mantem a coloracao inalterada. Tal metodo consiste em aplicar uma transformacao aos
tres componentes de cor do RGB normalizados, (c1,c2,c3), por um mesmo fator de escala,
α, de modo que os novos valores dos componentes de cor sao dados por ci = αci, em que
ci ∈ [0, 1]. Para encontrar α, utiliza-se a funcao de realce frealce expressa por
frealce(z) =
δ1 + (m− δ1)(z−δ1m−δ1
)n , δ1 ≤ z ≤ m,
δ2 + (δ2 −m)( δ2−zδ2−m)n , m ≤ z ≤ δ2,
(4.5)
em que m e n sao duas constantes, z, frealce, ∈ [δ1 δ2]. No nosso caso, z = c1 + c2 + c3.
Sabendo-se que ci ∈ [0, 1] , o maior valor possıvel para z, representado por δ2, e 3. De forma
semelhante, o menor valor para z, representado por δ1, e 0. Logo, δ1 = 0 e δ2 = 3. A partir
de z e da equacao (4.5), calcula-se
α(z) =frealce(z)
z. (4.6)
Caso se verifique que α > 1, a transformacao deve ser feita no espaco de cor CMY .
O espaco CMY , cuja sigla corresponde as cores ciano, magenta e amarelo, respectivamente,
e o complemento do espaco de cor RGB. Para realizar a mudanca de espaco de cores RGB
para CMY , substitui-se z por u, em que u = d1+ d2+ d3, e di = 1− ci. Apos essa conversao,
calcula-se a transformacao nos componentes de cor CMY , por meio de di = αdi. Em seguida,
eles sao convertidos de volta para RGB.
4.3 Metodos de Processamento de Imagem 53
Aplicando os metodos de filtragem de media e de contraste, acima mencionados, na
imagem original do pendulo duplo exibida na Figura 4.1, obtem-se a sequencia de resultados
mostrado na Figura 4.6. Para auxiliar na analise, o histograma das imagens, que exibe a
distribuicao de pixels com o mesmo valor de intensidade, e colocado (ver Figuras 4.7 e 4.8). A
informacao procurada, que sao os tres cırculos de cor magenta, esta localizada nos picos que
aparecem na faixa de 50 a 100 do eixo de intensidade dos histogramas das Figuras 4.7a-c. Os
histogramas das Figuras 4.7d-f mostram o efeito suavizador do filtro de media pela eliminacao
de picos estreitos. Esse condicionamento ajuda o algorimto de processamento de imagens
a nao indentificar falsas regioes. O efeito do contraste, visto pelos histogramas das Figuras
4.8d-f, e o de deslocar, para direita, a faixa onde aparecem a informacao de interesse na figura
original para a faixa de 100 a 150 na figura realcada. Isso provoca um isolamento da faixa de
interesse facilitando a etapa de segmentacao do algoritmo de processamento de imagem que
sera descrita a seguir. Uma desvantagem do contraste e o aparecimento de picos indesejados,
como se observa na faixa de 200 a 250 do eixo de intensidade do histograma.
(a) (b) (c)
Figura 4.6: Etapas de realce da imagem do pendulo duplo. A imagem original (a), e inicialmentefiltrada, figura (b), por um filtro de media cuja mascara tem tamanho 3× 3. Em seguida(c), um realce de contraste, com a propriedade de preservar a coloracao da imagem, eaplicado.
4.3.2 Segmentacao
O processo de segmentacao consiste em particionar um conjunto A em subconjuntos
(regioes), S1, · · · ,Sn, conectados, porem, que nao se interceptam. Cada regiao e homogenea
e a uniao de duas regioes nao vizinhas tambem e homogenea. Formalmente, a segmentacao e
descrita por (Pal e Pal, 1993; Cheng et al., 2001)
n⋃
i=1
Si = A e Si ∩ Sj = , para i 6= j, (4.7)
54 4 Medicao dos Angulos do Pendulo usando Processamento de Imagens
0 50 100 150 200 2500
1
2
3
4
5x 10
−3 (a)
R
0 50 100 150 200 2500
1
2
3
4
5x 10
−3 (d)
R
0 50 100 150 200 2500
1
2
3
4
5x 10
−3 (b)
G
0 50 100 150 200 2500
1
2
3
4
5x 10
−3 (e)
G
0 50 100 150 200 2500
1
2
3
4
5x 10
−3 (c)
B
0 50 100 150 200 2500
1
2
3
4
5x 10
−3 (f)
B
Figura 4.7: Em (a)- (c), histograma das camadas R,G,B, respectivamente, da imagem original. E de(d)- (f), histograma das camadas R,G,B, respectivamente, da imagem filtrada.
tal que o predicado de homogeniedade P (Si) = verdadeiro para todas as regioes Si e P (Si ∩Sj) = falso, quando i 6= j e Si e Sj sao vizinhos. O predicado de homogeniedade e um criterio
baseado em alguma caracterıstica discriminante do pixel, como o nıvel de cinza.
De fato, as tecnicas de segmentacao para imagens monocromaticas foram as primeiras
a serem trabalhadas. Dentre elas estao a segmentacao por deteccao de limiar (thresholdind),
segmentacao por formacao de agrupamentos (clusters), segmentacao baseada em regiao, seg-
mentacao baseada em teoria nebulosa, segmentacao baseada em redes neurais, segmentacao
por relaxacao, e segmentacao por superfıcie. O trabalho de Pal e Pal (1993) fornece uma boa
revisao dos principais metodos.
As abordagens mencionadas utilizam o conceito de predicado de homogeniedade,
porem, pode-se realizar a segmentacao, diferentemente, via deteccao de descontinuidades no
nıvel de cinza ao percorrer os pixels da imagem. Segundo Pal e Pal (1993), resultados mais
significativos podem ser obtidos ao fundir os dois conceitos.
Grande parte das metodologias para segmentacao de imagens monocromaticas podem
ser extendidas para imagens em cores (Cheng et al., 2001). Para isso, por exemplo, basta
aplicar o metodo para cada componente de cor e combinar os resultados, de alguma maneira,
para obter o resultado final (Cheng et al., 2002).
Imagens em cores tem a vantagem de fornecer informacao adicional a intensidade se
comparada com imagens em escala de cinza. Tal informacao e a informacao de cor, dada pelo
espaco de cores sob o qual a imagem e formada (Cheng et al., 2001). Portanto a escolha de
4.3 Metodos de Processamento de Imagem 55
0 50 100 150 200 2500
1
2
3
4
5x 10
−3 (a)
R
0 50 100 150 200 2500
1
2
3
4
5x 10
−3 (d)
R
0 50 100 150 200 2500
1
2
3
4
5x 10
−3 (b)
G
0 50 100 150 200 2500
1
2
3
4
5x 10
−3 (e)
G
0 50 100 150 200 2500
1
2
3
4
5x 10
−3 (c)
B
0 50 100 150 200 2500
1
2
3
4
5x 10
−3 (f)
B
Figura 4.8: Em (a)- (c), histograma das camadas R,G,B, respectivamente, da imagem original. Ede (d)- (f), histograma das camadas R,G,B, respectivamente, da imagem realcada emcontraste.
um espaco de cores efetivo, com alto poder discriminante, e essencial (Ohta et al., 1980).
Apos um estudo comparativo, na qual 100 tipos diferentes de caracterısticas de cor
foram testadas, Ohta e colaboradores (1980) encontrou um espaco de cores, denominado
I1I2I3, com essa propriedade discriminante, muito util para um esquema de segmentacao.
Esse espaco e calculado a partir do espaco de cores RGB da seguinte forma
I1 =R+G+B
3,
I2 =R−B
2,
I3 =2G−R−B
4. (4.8)
note que o espaco I1I2I3 e uma transformacao linear do espaco RGB. Isso e interessante,
pois, normalmente, como alternativa as desvantagens do espaco RGB, recorre-se a alguma
transformacao nao-linear.
A Figura 4.9 e o resultado da decomposicao da imagem do penculo realcada, Figura
4.6-(c), nos tres componentes I1, I2, e I3, apos a mesma ser transformada pelas equacoes (4.8).
Observe que a componente I2, Figura 4.9(b), praticamente segmentou as regioes ref-
erentes os cırculos de cor magenta da imagem original da Figura 4.1. O grafico de superfıcie,
cujo valor de superfıcie equivale ao nıvel de intensidade, da Figura 4.10, mostra os picos de
56 4 Medicao dos Angulos do Pendulo usando Processamento de Imagens
(a) (b) (c)
Figura 4.9: Decomposicao da imagem realcada, Figura 4.6-(c), nos componentes (a) I1, (b) I2 e (c)I3, do espaco de cor definido por Ohta e colaboradores (1980).
intensidade correspondentes a tais regioes, para melhor visualizacao.
Figura 4.10: Superfıcie gerada pela intensidade da componente I2 avaliada em cada ponto da imagem.
Aplicando a funcao de limiar da forma
g(x,y) =
1, se f(x,y) ≥ T,
0, se f(x,y) < T,
(4.9)
a esta imagem, em que T = 0,3, obtem-se a imagem segmentada da Figura 4.11.
Uma outra maneira de alcancar esse resultado e utilizar todos os tres componentes de
4.3 Metodos de Processamento de Imagem 57
x
y
Figura 4.11: Imagem da Figura 4.9(b) segmentada pela funcao de limiar g(x,y). Cada pixel e classifi-cado como 1 ou 0.
cor da imagem. Para isso, define-se um predicado de homogeniedade baseado na similaridade
de cor. Essa maneira e muito utilizada em esquemas de segmentacao de cor, principalmente
na abordagem de segmentacao por regiao, como os esquemas de crescimento de regiao (region
growing), separacao de regiao (region splitting) e fusao de regiao (region merging). O uso de
similaridade de cor pode ser utilizado em qualquer modelo de cor, embora modelos de cor
sensıveis a variacao de luminosidade, sombras, e textura, como e o caso do modelo RGB,
dificulte seu uso (Cheng et al., 2001).
A similaridade de cor entre dois pixels, p1 e p2, pode ser medida pela distancia
euclidiana, Dp1,p2 , entre eles no espaco de cor que os define Gonzalez e Woods (2002). Supondo
que o espaco de cor seja o I1I2I3, tem-se que
Dp1,p2 =√
(I1,p1 − I1,p2)2 + (I2,p1 − I2,p2)
2 + (I3,p1 − I3,p2)2. (4.10)
Calculando (4.10) para todos os pixels da imagem da Figura 4.6-(c), descritos no
espaco I1I2I3 , em que p1 e o pixel no ponto (x,y) e p2 corresponde a cor a ser segmentada,
que e a cor magenta convertida de RGB para I1I2I3, obtem-se a superfıcie de similaridade
mostrada na Figura 4.12.
Aplicando a funcao de limiar da forma
g(x,y) =
1, se f(x,y) ≤ T,
0, se f(x,y) >, T
(4.11)
a esta imagem, em que T = 0,05, obtem a imagem segmentada da Figura 4.13.
58 4 Medicao dos Angulos do Pendulo usando Processamento de Imagens
Figura 4.12: Superfıcie de similaridade gerada pelo calculo da distancia euclidiana, no espaco I1I2I3,entre cada pixel da imagem realcada e o valor do pixel de referencia para segmentacao.
x
y
Figura 4.13: Imagem da Figura 4.6(c) segmentada pela funcao de limiar g(x,y) aplicada a superfıciede similaridade da Figura 4.12. Cada pixel e classificado como 1 ou 0
4.4 Algoritmo de Processamento de Imagem Implementado
O algoritmo de processamento de imagem desenvolvido foi escrito e testado no ambi-
ente Matlab utilizando uma ferramenta de processamento de imagem chamada Image Pocess-
ing Toolbox, versao 7.0.
Os arquivos de vıdeo do movimento do pendulo sao gerados pela camera (ver Secao
3.1.2) no formato “.avi”, utilizando o padrao de compressao de dados (codec), “DIVX”. A
Image Pocessing Toolbox disponibiliza uma funcao de leitura de vıdeos, chamada mmreader,
capaz de ler o formato “.avi” e de acessar o descompressor de dados adequado, neste caso, um
descompressor para “DIVX”, desde que ele esteja instalado no sistema do computador.
O vıdeo, entao, e lido e armazenado em um conjunto de L matrizes tri-dimensionais,
em que L e o numero total de quadros do vıdeo e cada dimensao da matriz e uma camada no
4.4 Algoritmo de Processamento de Imagem Implementado 59
formato RGB. O valor de cada elemento da matriz, ou pixel, varia entre 0 e 255.
O fluxograma do algoritmo e mostrado na Figura 4.14. A entrada do algoritmo e a
matriz de camadas RGB.
As etapas de filtragem e realce sao feitas, conforme mostra a Secao 4.3.1, utilizando
os metodos de filtragem de media e o metodo de Naik e Murthy (2003), respectivamente.
Para a segmentacao, opta-se por segmentar o componente I2 da imagem RGB con-
vertida em I1I2I3, conforme mostra a Secao 4.3.2, pela equacao de transformacao (4.8). Nao
se utiliza o criterio de similaridade de cor pois o mesmo aumentaria o custo computacional
alem de ser mais sensıvel ao limiar de corte utilizado para segmentar a cor.
Uma funcao da Image Pocessing Toolbox, capaz de localizar as centroides e encontrar
a area de um conjunto de pixels, de mesmo valor, conectados, e aplicada a imagem segmentada
para retornar as centroides C1, C2 e C3 (ver equacao (4.1)). Em seguida, as equacoes (4.2)-
(4.3) sao aplicadas para obter as estimativas de θ1 e θ2, respectivamente, finalizando o objetivo
do algoritmo.
I Imagem3,RGB
ROI 480 x 640
Ifilt
Ienh
Filtro de Média Máscara 3x3
Xbin I2 < Limiar
Localiza os pontos
Num. Pontos == 3 ?
Estima os ângulos
Define a região de interesse :
Etapa 1 de Realce (Filtragem) :
: Etapa 2 de Segmentacão
(Corte de Limiar)
[r g b]= [R G B]/255;Normaliza as componentes RGB :
Funcão contrasteEtapa 2 de Realce (Contraste) :
Início
I conversão (Ienh)3,I1 I2 I3Etapa 1 de Segmentacao
(Converte o modelo de cor) :
Limiar := 0,22
I2 I3,I2normaliza( )
Sim
Num. Pontos == 2 ?
Sim
ROI == 480 x 640 ?Sim
Não
Limiar == 0,30 ?
Sim
Aumenta a ROI
Limiar := Limiar + 0,02
Não
Não
I Imagem3,RGB
Figura 4.14: Fluxograma do algoritmo de processamento de imagens. A informacao de entrada e umaimagem e o algoritmo retorna os angulos θ1 e θ2 formado pelas hastes do pendulo.
O resultado do algoritmo de processamento de imagem para um vıdeo do pendulo
obtido a uma taxa de 20Hz, com um total de 280 imagens (ou quadros) e mostrado na Figura
60 4 Medicao dos Angulos do Pendulo usando Processamento de Imagens
4.15. As imagens desse vıdeo, em particular, apresenta muita variacao de intensidade de uma
para outra, e o algoritmo mostra-se bastante robusto nesse aspecto.
1 2 3 4 5 6 7 8 9 10 11 12 13 14
−90
0
90
(a)
θ 1(
° )
t(s)
1 2 3 4 5 6 7 8 9 10 11 12 13 14
−180
−90
0
90
180
(b)
θ 2 (
° )
t(s)
Figura 4.15: Serie temporal experimental produzida pelo algoritmo de processamento de imagem.
Capıtulo 5
Questoes Praticas de Implementacao
Algumas questoes preliminares, importantes para o caso em estudo, sao vistas nas
secoes 5.1 e 5.2. A primeira delas trata de verificacoes experimentais que motivam uma
pequena alteracao no modelo do pendulo duplo, usado na etapa de predicao do filtro, de-
senvolvido no Capıtulo 3. Alem disso, na Secao 5.1 sugere-se investigar o caso do estimador
utilizar apenas as medicoes das posicoes angulares. A Secao 5.2 discute alguns aspectos prati-
cos da implementacao do estimador, como, por exemplo, a maneira de se utilizar o modelo
de tempo contınuo do pendulo duplo no estimador de tempo discreto e a questao do compor-
tamento numerico do filtro durante a execucao. Na Secao 5.3, apresenta-se as metricas de
desempenho utilizadas pra avaliar o filtro e, por fim, na Secao 5.4 discute-se sobre a sintonia
do filtro que esta diretamente relacionada com o bom desempenho do mesmo.
5.1 Verificacoes Experimentais
A analise experimental, de sistemas mecanicos, e geralmente complexa (de Paula
et al., 2006). Assim, na tentativa de se obter bons resultados experimentais, em problemas
de estimacao de estados, e importante que os sinais estejam bem condicionados e que os
parametros do modelo estejam proximos dos valores verdadeiros. Nesse sentido, esta secao
trata inicialmente do procedimento de condicionamento do sinal de velocidade angular da
haste 1. Em seguida, trata-se de como obter estimativas iniciais para os coeficientes de atrito
viscoso e de Coulomb do modelo do pendulo duplo. Isso pode contribuir para a estimacao
recursiva de tais parametros.
62 5 Questoes Praticas de Implementacao
5.1.1 Analise Estatica e Dinamica do Sensor de Velocidade Angular
A calibracao do sensor de velocidade angular da haste 1 pode ser feita com base na
derivada aproximada do sinal de posicao angular medido pelo sistema de processamento de
imagem digital. Nesse caso, o sensor de visao computacional assume o papel de padrao. A
derivada aproximada e a diferenca entre a posicao no instante k e a posicao no instante k− 1
dividida pelo intervalo de amostragem. O procedimento de calibracao consiste simplesmente
em ajustar o ganho do sinal do sensor de velocidade. A Figura 5.1 compara o sinal de
velocidade obtido por meio do sinal de posicao angular da haste 1, conforme explicado, com
o sinal do sensor de velocidade antes e apos um ajuste manual de ganho igual a 15.
0 2 4 6 8 10 12 14 16 18 20−1000
−500
0
500
1000(a)
θ 1• (°
/s)
(s)
0 2 4 6 8 10 12 14 16 18 20−1000
−500
0
500
1000(b)
θ 1• (°
/s)
(s)
Figura 5.1: Series temporais da velocidade angular da haste 1. A serie com linha vermelha tracejada (--) e obtida pela direfenciacao da serie da posicao angular da haste 1 produzida pelo sensorde visao computacional. A serie com linha azul contınua (-) e gerada pelo sensor inercial, otaco gerador, acoplado a haste 1. No grafico (a) tem-se o sinal do sensor inercial conformecoletado pelo sistema de aquisicao. No grafico (b), o sinal de velocidade esta corrigido peloaumento em amplitude.
Uma caracterıstica do sensor S1, nao tratada por Firmo (2007), e a sua dinamica. Em
um ensaio de laboratorio, utilizando um osciloscopio digital, por meio do qual registravam-
se dados do experimento, recolheu-se a haste 2, em 180, de forma a formar um pendulo
simples. Entao, abandonou-se o pendulo simples do ponto mais alto e, com o auxılio das
maos, interrompeu-se o seu movimento, abruptamente, quando este passou por 90. Nesse
momento, a tensao fornecida pelo sensor caiu exponencialmente. A constante de tempo de
decaimento registrada e de aproximadamente 140ms. Tal resultado nao e esperado, desde que,
5.1 Verificacoes Experimentais 63
interrompendo-se o movimento do eixo do motor do sensor S1 nao ha geracao de forca contra-
eletromotriz ocasionando, por sua vez, a queda instantanea para zero da tensao nos terminais
do motor. A menos que, por exemplo, os terminais do motor nao estivesse aberto. De fato,
e possıvel observar que dentro da carcaca do sensor S1 existe um pequeno circuito eletronico.
Tal circuito esta acoplado de modo que seria necessario destruir o sensor para remove-lo. De
qualquer forma, o importante e que esse circuito acrescenta uma certa dinamica, indesejada
para a aplicacao como sensor de velocidade, ao sensor S1.
Deseja-se, portanto, verificar o que a dinamica do sensor S1 que produz o sinal de
velocidade angular da haste 1, pode alterar na analise da dinamica do pendulo duplo se tal
sinal for utilizado. Utiliza-se graficos de retrato de fases para fazer as observacoes. Nos casos
que sao apresentados a seguir, as medicoes sao obtidas a cada intervalo de 25 ms. Num
primeiro caso, utilizando-se medicoes das componentes θ1 e θ1, gera-se o retrato de fases da
haste 1 mostrado na Figura 5.2a. Este, portanto, e o retrato de fases sob a influencia do
sensor de velocidade S1. A fim de eliminar a influencia do sensor S1, num segundo caso, e
tracado outro retrato de fases a partir, somente, da medicao da componente θ1. Neste caso,
por meio do calculo da derivada aproximada de θ1, obtem-se a componente θ1 do retrato
de fases. Produz-se, assim, a Figura 5.2b1. Observa-se que ha, realmente, diferenca no
formato do retrato de fases apresentado nos dois casos. Curiosamente, ao filtrar o sinal da
velocidade angular, obtido pela derivada da posicao angular, com um filtro cuja constante de
tempo e de 140 ms (a mesma constante de tempo verificada na queda exponencial do sinal do
sensor S1 discutida anteriormente), obtem-se o retrato de fases da Figura 5.2c. Esse retrato e
visualmente semelhante ao da Figura 5.2a. Isso sugere que ha um filtro associado ao motor.
Esse filtro, muito provavelmente, e implementado pelo circuito eletronico visto, internamente,
na carcaca do motor do sensor S1, conforme discutido anteriormente.
A Figura 5.3 mostra as series temporais do sinal de velocidade filtrado, utilizado para
tracar o retrato de fases da Figura 5.2b, e do sinal de velocidade medido pelo sensor S1.
Observe a proximidade das series.
Portanto, o sinal do sensor S1 descaracteriza o retrato de fases da haste 1 podendo
conduzir a analises erroneas sobre a dinamica caotica do pendulo duplo. Devido a esse resul-
tado, e sugerido que se experimente estimar os estados do pendulo duplo a partir, somente, das
medicoes angulares obtidas pelo sensor baseado em visao computacional. Outra possibilidade
1Repare a semelhanca do retrato de fases da Figura 5.2b com o retrato de fases obtido na simulacao domodelo, sob a abordagem de Lagrange, da Figura 3.11a. Isso sugere que o o modelo de Lagrange representamelhor a dinamica do pendulo duplo do que o modelo utilizado por Firmo (2007), 3.11b.
64 5 Questoes Praticas de Implementacao
−3 −2 −1 0 321−30
−20
−10
0
10
20
30(a)
θ 1• (r
ad/s
)
θ1 (rad)−3 −2 −1 0 1 2 3
−30
−20
−10
0
10
20
30(b)
θ 1• (r
ad/s
)
θ1 (rad)
−3 −2 −1 0 1 2 3−30
−20
−10
0
10
20
30(c)
θ 1• (r
ad/s
)
θ1 (rad)
Figura 5.2: Retrato de fases construıdos com dados das medicoes, amostradas em 25 ms, da velocidadeangular e da posicao angular da haste 1. Em (a), utilizam-se dados diretos dos sensoresinercial e visual. Em (b), a componente θ1 e obtida pela diferenciacao dos dados do sensorvisual, eixo θ1. Em (c), tem-se os dados de θ1 usados em (b) filtrados por um filtro deprimeira ordem com constante de tempo de 140 ms.
0 500 1000 1500−1000
−800
−600
−400
−200
0
200
400
600
800
1000
θ 1• (°
/s)
(s)
Figura 5.3: Series temporais da velocidade angular da haste 1. A linha vermelha tracejada (- -) eo sinal da velocidade angular conforme coletado pelo sistema de aquisicao de dados. Alinha azul contınua (-) e obtida pela diferenciacao da serie de posicao angular da haste 1,produzida pelo sensor visual, avancada em 4 passos e filtrada, sem seguida, por um filtrode primeira ordem com constante de tempo de 140 ms.
seria incluir a dinamica do sensor no modelo do sistema.
5.1 Verificacoes Experimentais 65
5.1.2 Obtencao de Estimativas Iniciais para os Coeficientes de Atrito
Para obter estimativas iniciais para os coeficiente de atrito do pendulo duplo, realizam-
se dois experimentos controlados com as hastes do pendulo. Em tais experimentos, elimina-se
a presenca de forcas de excitacao e desacopla-se o movimento de uma haste com a outra. No
primeiro experimento, a haste 2 e recolhida para dentro da haste 1 formando, assim, uma
unica haste cujo valor da massa e a soma de m1 com m2. No segundo experimento, a haste 1
e segurada, com o auxılio das maos, permitindo, assim, apenas o movimento da haste 2. Em
ambos os experimentos o motor permanece desligado.
Desse modo, a lei fısica que governa o sistema e a de um pendulo simples amortecido
sem excitacao e que tem a vantagem de ter um conjunto de parametros reduzido em relacao ao
modelo do pendulo duplo com excitacao realimentada, que e o caso real. Nota-se que, apesar
de se reduzir o numero de parametros, os coeficientes de atrito nao mudam em funcao da
nova configuracao. As equacoes diferenciais do movimento do pendulo no primeiro e segundo
experimentos sao dadas, respectivamente, por
θ1 = − 1
Mm + Jm +ml21
(
gml1sen(θ1) + b1θ1 + b3sinal(θ1))
, (5.1)
θ2 = − 1
Jm2 +m2l22
(
gm2l2sen(θ2) + b2θ2 + b4sinal(θ2))
. (5.2)
Com o auxılio do sistema de processamento de imagens, a trajetoria das hastes, nos
experimentos, sao captadas com um intervalo de amostragem de 25ms. As figuras 5.4 e 5.5
mostram o sinal medido e a curva ajustada para os dois casos.
0 200 400 600 800 1000 1200 1400−100
−50
0
50
100
θ 1 (
° )
(s)
Figura 5.4: Oscilacoes amortecidas, sem excitacao, do experimento realizado com a haste 1 no qual amesma e abandonada da posicao inicial de 90. A haste 2 e mantida recolhida dentro dahaste 1. A curva vermelha e o sinal produzido pelo sensor visual. A curva azul e a curvaajustada para a equacao (5.1).
As curvas sao ajustadas por meio de inspecao visual e, dessa maneira, encontram-se
66 5 Questoes Praticas de Implementacao
0 500 1000 1500 2000 2500 3000 3500−100
−50
0
50
100
θ 1 (
° )
(s)
Figura 5.5: Oscilacoes amortecidas, sem excitacao, do experimento realizado com a haste 2 no qual amesma e abandonada da posicao inicial de −90. A curva vermelha e o sinal produzidopelo sensor visual. A curva azul e a curva ajustada para a equacao (5.2).
b1 = 0,0004 Nm/rad, b2 = 0,000108 Nm/rad, b3 = 0,0038 Nm/rad e b4 = 0,00018 Nm/rad.
Uma constatacao importante e a de que o valor das distancias l1 e l2 iguais a um terco do
comprimento das respectivas hastes, ou seja, l1 = L1/3 e l2 = L2/3, levam a uma melhor
aproximacao da curva real do que ao se utilizar l1 = L1/2 e l2 = L2/2, conforme previsto
no modelo apresentado na Secao 3.2. O valor de l1 e l2 esta relacionado, por uma relacao
proporcional inversa, com a frequencia das oscilacoes.
5.2 Consideracoes Praticas de Implementacao dos Algoritmos
de Filtragem de Kalman
5.2.1 Utilizando Estimadores de Tempo Discreto para Estimar Estados de
um Sistema Modelado por Equacoes Diferenciais
Na pratica, a maior parte dos sistemas de interesse sao de tempo contınuo. Quando
o modelo de processo for de tempo contınuo e as observacoes forem amostradas, recorre-se a
filtros do tipo contınuo-discreto (Athans et al., 1968; Sarkka, 2007; Sharma e Parthasarathy,
2008), tambem chamados de estimadores de tempo contınuo com medicoes amostradas. Eles
utilizam a estrutura recursiva dos estimadores de tempo discreto para a etapa de assimilacao de
dados, porem permitem avaliar a propagacao da media e covariancia dos estados no intervalo
entre observacoes.
Este e o caso deste trabalho. O modelo do pendulo duplo esta modelado por meio de
equacoes diferenciais numa representacao em espaco de estados, conforme se ve na equacao
(3.36), caracterizando um modelo contınuo. Deste sistema modelado pelas equacoes diferen-
cias, obtem-se medicoes amostradas da velocidade angular da haste 1 e das posicoes angulares
5.2 Consideracoes Praticas de Implementacao dos Algoritmos de Filtragem de Kalman 67
de ambas as hastes. As taxas de amostragem do sistema sao diferentes dependendo do tipo de
medicao. A velocidade angular e medida a uma taxa Ts correspondente a 5ms. As posicoes
angulares sao medidas a uma taxa Tpa que pode ser ajustada para 25, 50, 100 ou 200 ms.
Como gerenciar essas multiplas taxas de amostragem esta descrito na Secao 5.2.2. O que de
fato importa e que se deseja obter estimativas do pendulo duplo na mesma taxa de aquisicao
da velocidade angular, Ts, ou seja, deseja-se estimativas em intervalos de tempo discreto, k,
de modo que xk = x(Tsk). Os filtros apresentados nas secoes 2.3, 2.4.1 e 2.4.2 sao adequa-
dos para resolverem esse problema de estimacao em tempo discreto, considerando que ele faz
referencia a sistema dinamico de tempo discreto conforme descrito na Secao 2.2. O que se
torna necessario, entao, e transformar a representacao contınua do modelo (Sitz et al., 2004)
x(t) = g(x(t), t) + w(t), (5.3)
em uma versao discreta do tipo (2.1) para que se possam obter as propagacoes de media
um passo a frente conforme exigido pela formulacao do filtro de Kalman. Na equacao (5.3),
g : Rn × R → Rn e w(t) e uma parcela estocastica com distribuicao Gaussiana com media
nula e matriz de covariancia Q(t),
Para isso calcula-se
xk = xk−1 +
∫ kTs
(k−1)Ts
(g(x(t), t) + w(t))dt. (5.4)
em que xk−1 , x(Ts(k−1)) e w(t)dt = dΦ = Φ(Tsk)−Φ(Ts(k−1)), onde dΦ e um incremento
Browniano (Khalil et al., 2009). O processo de discretizacao transforma a parcela w(t) em√Tsǫk−1, em que ǫk−1 e uma variavel Gaussiana de media nula e matriz de covariancia Ek−1 =
TsQ(t).
Neste trabalho, resolver a integral da equacao 5.4 explicitamente e difıcil. Portanto,
ela e resolvida numericamente, por meio do algoritmo de Runge-Kutta de 4-ordem com passo
fixo de integracao de 1ms. Assume-se w(t) constante ao longo do intervalo de integracao
[(k − 1)Ts, kTs]. Esse procedimento server tanto para gerar a predicao um passo a frente do
estimador como para produzir os dados de simulacao.
Ressalta-se que o modelo contınuo nao foi discretizado explicitamente por meio do
calculo das Jacobianas, por exemplo. Portanto, essa forma de tratar o problema e impropria
para o EKF. O UKF, por outro lado, e flexıvel, pois o mesmo necessita apenas das realizacoes
68 5 Questoes Praticas de Implementacao
numericas de xk, nao definindo a maneira de se obte-las.
5.2.2 Multiplas Taxas de Amostragem
Retomando o que esta exposto na Secao 5.2.1, este trabalho trata de se utilizar
estimadores recursivos de tempo discreto para um sistema de tempo contınuo com medicoes
amostradas. Entretanto, uma particularidade ocorre com relacao a amostragem das medicoes,
pois as mesmas sao amostradas em taxas diferentes. Duas fontes de dados coexistem. Uma
fonte inercial, que e o sensor de velocidade da haste 1, fornece amostras a cada 5 ms; e, uma
outra fonte, do tipo visual, que e o sensor baseado em visao computacional, fornece amostras
das posicoes angulares das hastes 1 e 2 a cada 25 ms. Para a ultima tambem sao avaliados os
casos em que a amostragem ocorre a 50, 100 e 200 ms.
A questao que surge e como fundir a informacao dessas duas fontes de informacao
no esquema do estimador. Armesto e colaboradores (2008) abordam essa questao em seu
trabalho utilizando o conceito do vetor de medicao yk com tamanho variavel no tempo. Nessa
tecnica, sao adicionadas ao vetor yk somente as medicoes disponıveis. Em decorrencia do fato
de yk variar seu tamanho, a matriz Ck (para o caso de modelo linear de observacao) e o ruıdo
de medicao νk, veja (2.3), tambem sofrem a variacao de tamanho. A Figura 5.6 ilustra como
o vetor yk pode variar em funcao das medicoes disponıveis do pendulo duplo.
Figura 5.6: Representacao da disponibilidade de medicoes do pendulo duplo, pelos sensores, ao longodo tempo. O marca circular preta representa a informacao da velocidade angular disponi-bilizada pelo sensor inercial, acoplado ao eixo da haste 1. A marca circular azul representaa posicao angular da haste 1 e 2 disponibilizada pelo sensor visual. Em funcao da disponi-bilizade, o vetor de medicoes yk e formado. As medicoes das posicoes angulares podem serobtidas a intervalos de tempo (Tpa), multiplos de 5 ms. Tpa permanece constante durantetoda a execucao do filtro. Assume-se que os dois sensores estao sincronizados.
Com isso, o esquema do estimador adotado e como aquele exibido no diagrama da
5.2 Consideracoes Praticas de Implementacao dos Algoritmos de Filtragem de Kalman 69
Figura 5.7. O ciclo de predicao-assimilacao ocorre a cada 5 ms, seguindo a frequencia de
amostragem do sinal de velocidade angular da haste 1. Note que, quando o vetor de medicoes
estiver vazio, a etapa de assimilacao nao e realizada. Essa situacao pode ocorrer caso haja
uma falha nos sistemas de medicao.
Predicão
Assimilacão
Medicão
Monta vetor
e a matriz
S
N
Figura 5.7: Esquema do estimador utilizado para tratar o caso de multiplas frequencias de amostrageme que, ainda, estao sujeitos a instantes em que nao ha disponibilidade de informacao desensores, yk ∈ .
5.2.3 Restricao Intervalar na Posicao Angular
O modelo de simulacao e o modelo de predicao, utilizado pelo filtro na etapa de
predicao, utilizam as mesmas equacoes do modelo dinamico (3.36) cujos parametros sao ajus-
tados conforme a Tabela 5.1 que definem o pendulo duplo em um regime de movimento
caotico.
Alem de serem utilizados em momentos diferentes, ha outra diferenca entre os modelos
de simulacao e de predicao. O modelo de simulacao gera os dados das posicoes angulares dentro
da faixa [−180, + 180] enquanto que o modelo de predicao nao faz esse condicionamento
nos dados. O proposito do modelo de simulacao ser assim e para corresponder aos dados
das posicoes angulares amostrados do sistema experimental pelo sensor baseado em visao
computacional, que por sua vez, produz valores na faixa [−180, + 180]. Por outro lado,
o modelo de predicao nao realiza a conversao de valores θ1 e θ2 pois ele e utilizado por um
estimador baseado na geracao de pontos-sigmas, que, como visto na Secao 2.4.2, sao pontos
espalhados em torno de uma media. Caso o modelo de predicao faca o mesmo que o modelo
de simulacao, a matriz de covariancia do erro de estimacao, P xxk|k, se torna incoerente quando
a media dos estados θ1 e θ2 estiverem proximas das fronteiras −180 e +180.
A Figura 5.8 ilustra a situacao adversa provocada pelas caracterıstics dos modelos
de simulacao e de predicao discutidas anteriormente. Neste exemplo, utiliza-se o filtro UKF,
70 5 Questoes Praticas de Implementacao
com as mesmas equacoes apresentadas na Secao 2.4.2, para estimar os estados do pendulo
duplo utilizando a medicao, sem ruıdo, da velocidade angular da haste 1. Observe que as
estimativas de θ2 (Figura 5.8c), em varios instantes, por exemplo, em t = 0,5s ou em t = 3,0s,
saltam da faixa [−180, + 180], porem, sem comprometer as estimativas do outro estado,
que, por sinal, sao boas. Acredita-se que isso ocorra, mesmo na ausencia de ruıdo na medicao,
em funcao de imprecisoes numericas do filtro implementado em computador.
2.5 5 7.5 10
−180
−90
0
90
180
(a)
θ 1(
° )
t(s)
2.5 5 7.5 10
−180
−90
0
90
180
(b)
θ 2 (
° )
t(s)
Figura 5.8: Estados (a)–(b) do pendulo duplo estimados pelo UKF em um caso em que apenas avelocidade angular da haste 1 e medida, sem ruıdo, e nao e feita a conversao nas estimativasdos estados das posicoes angulares para a faixa [−180, + 180].A linha solida vermelha(–)corresponde ao valor verdadeiro do estado e a linha solida azul (–) corresponde a estimativado filtro UKF.
Para evitar que as estimativas relacionadas as posicoes angulares do pendulo, em
especial θ2, saem da faixa [−180, + 180], duas solucoes sao investigadas
1. converter a media das estimativas das posicoes angulares, xi,k|k−1 e xi,k|k, para i = 1,2,
ao longo da execucao do UKF, para a faixa [−180, + 180];
2. utilizar um estimador com restricoes como o IUKF, apresentado na Secao 2.5.1;
A primeira solucao produz o UKF-π, nomeado assim para remeter a conversao que se
faz nas medias. Para se chegar ao UKF-π, basta executar o Algoritmo 1 no inıcio da rotina do
filtro, sobre o vetor de estados xk−1|k−1, e apos a equacao (2.32), sobre o vetor da estimativa
de estados a priori xk|k−1.
5.2 Consideracoes Praticas de Implementacao dos Algoritmos de Filtragem de Kalman 71
if PosicaoAngular 6= π then
PosicaoAngular = RestoDaDivisao(PosicaoAngular+π2π ) - π ;
else
PosicaoAngular = PosicaoAngular ;end
Algoritmo 1: Algoritmo da Conversao-π
A Figura 5.9 mostra o resultado das duas solucoes propostas que sao utililzadas ao
longo dos experimentos.
2.5 5 7.5 10
−180
−90
0
90
180
(a)
θ 2 (
° )
t(s)
2.5 5 7.5 10
−180
−90
0
90
180
(b)
θ 2 (
° )
t(s)
Figura 5.9: Estimativas da posicao angular da haste 2 do pendulo duplo estimados medindo-se apenasa velocidade angular da haste 1, sem ruıdo. Em (a), mostra-se o resultado do UKF-πque realiza uma conversao nas estimativas dos estados das posicoes angulares para a faixa[−180, + 180]. E em (b), o resultado do IUKF que utiliza a transformada unscentedcom restricao intervalar. A linha solida vermelha(–) corresponde ao valor verdadeiro doestado e a linha solida azul (–) corresponde a estimativa do filtro.
5.2.4 Simetria da Matriz de Covariancia
A implementacao computacional do filtro exige, em certos casos, alguns artifıcios para
se obter uma execucao numerica robusta do mesmo. Um exemplo de problema encontrado e
aquele em que a matriz de covariancia dos estados, P xxk|k, se modifica ao longo das iteracoes e,
em certo momento, deixa de ser simetrica, quebrando, assim, uma das caracterısticas, imposta
pela definicao do filtro de Kalman, a essa matriz. A causa desse problema esta associada ao
fato de nao ser possıvel computacionalmente atingir a precisao aritmetica infinita necessaria
para calcular o ganho de do filtro de Kalman (Farrell, 2009).
72 5 Questoes Praticas de Implementacao
Tabela 5.1: Parametros do modelo de simulacao e predicao do Pendulo Duplo utilizados nostestes simulados e experimentais.
Par. Valor Unidade Descricao
L1 0,273 m comprimento da haste 1
L2 0,216 m comprimento da haste 2
l1 0,091 m raio de giracao da haste 1
l2 0,072 m raio de giracao da haste 2
m1 0,297 kg massa da haste 1
m2 0,235 kg massa da haste 2
Jm1 24,60× 10−4 kgm2 momento inercia da haste 1
Jm2 12,18× 10−4 kgm2 momento inercia da haste 2
Mm 22× 10−6 kgm2 momento inercia do motor
b1 0,0004 Nm /rad coeficiente de amortecimento da junta 1
b2 0,000108 Nm /rad coeficiente de amortecimento da junta 2
b3 0,0038 Nm /rad coeficiente de Coulomb da junta 1
b4 0,00018 Nm /rad coeficiente de Coulomb da junta 2
g 9,81 m/s2 acelacao da gravidade
Ra 32 Ω resistencia da armadura do motor
La 30 mH indutancia da armadura do motor
Kt 0,0358 Nm/A constante de torque do motor
Ks 0,0358 V/rad/s constante de velocidade do motor
γ π/3 rad limiar de acionamento do motor
Va 19,0 volts tensao de armadura do motor
Para contornar esses problemas, neste trabalho, adotam-se tres medidas. A primeira
delas e ajustar a escala dos estados de modo que todos variem dentro de uma faixa proxima
(Mariani e Ghisi, 2007). Originalmente, tem-se que
−90 ≤ θi ≤ +90 , i = 1,2
−1000 /s ≤ θ1 ≤ +1000 /s,
−1600 /s ≤ θ2 ≤ +1600 /s,
0 Nm/rad ≤ b1 ≤ 0,002 Nm/rad,
0 Nm/rad ≤ b2 ≤ 0,001 Nm/rad,
(5.5)
5.3 Avaliacao de Desempenho de Estimadores de Estado 73
Apos um ajuste de escala, a nova faixa de variacao e
−π rad ≤ θi ≤ +π rad, i = 1,2
−1,8 rad/0,1s ≤ θ1 ≤ +1,8 rad/0,1s,
−2,8 rad/0,1s ≤ θ2 ≤ +2,8 rad/0,1s,
0 Nmm/rad ≤ b1 ≤ 2 Nmm/rad,
0 Nmm/rad ≤ b2 ≤ 1 Nmm/rad,
(5.6)
A segunda medida adotada, altera a maneira de como P xxk|k e calculada, na etapa de
assimilacao de dados, pela equacao (2.12). A nova maneira, conhecida como forma de Joseph,
produz uma matriz de covariancia simetrica (Farrell, 2009) e e dada por
P xxk|k = (I −KkCk)P
xxk|k−1(I −KkCk)
T −KkRkKTk , (5.7)
para o caso em que o modelo de observacao e linear.
O terceiro artifıcio e forcar a simetria da matriz P xxk−1|k−1 da seguinte forma
P xxk−1|k−1 =
1
2
(
P xxk−1|k−1 +
(
P xxk−1|k−1
)T)
. (5.8)
5.3 Avaliacao de Desempenho de Estimadores de Estado
E de interesse avaliar o desempenho de um estimador em, basicamente, dois cenarios.
O primeiro e aquele no qual o estimador e comparado com outros estimadores para um mesmo
caso de aplicacao com condicoes semelhantes, e outro e aquele no qual o mesmo estimador e
avaliado sob diferentes condicoes. Por exemplo, Lefebvre e colaboradores (2004) comparara
o desempenho de tres algoritmos de filtragem nao-linear para tratar modelos de medicao
nao-lineares. Xue-Dong e Zhi-Huan (2008) comparam tres versoes generalizadas do EKF,
UKF e GPF para filtar series caoticas com ruıdo multiplicativo. Finalmente, Chandrasekar
e colaboradores (2007) comparam o EKF e o UKF na filtragem de sinais de sistemas com
dinamica nao-diferenciavel.
Para comparar ou avaliar o desempenho de um estimador nao-linear, utilizam-se
metricas de desempenho. Diferentes tipos de metricas sao usadas na literatura. Richard
74 5 Questoes Praticas de Implementacao
(1992) mede o desempenho do EKF, aplicado em tres tipos de mapas caoticos, por meio da
melhora na relacao sinal-ruıdo de cada componente de estado, considerando como ruıdo inicial
o erro entre o valor verdadeiro do estado e a medicao, o ruıdo final como o erro de estimacao,
e o sinal como a variancia da componente de estado. Para sistemas caoticos, o retrato de fases
produzido pelas componentes estimadas e utilizado em alguns trabalhos (Sitz et al., 2004,
2002; Aguirre et al., 2005). A propria comparacao visual entre as series temporais dos valores
verdadeiros e estimados dos estados e um recurso comumente utilizado (Khalil et al., 2009;
Armesto et al., 2008; Ray, 1995; Wheeler e Packard, 2009; Togneri e Deng, 2003). Outro
fator de desempenho importante para avaliar as questoes de viabilidade do uso do filtro em
aplicacoes reais e o processamento computacional consumido pelo mesmo, geralmente medido
pelo tempo gasto para executar o processamento de uma janela de dados especıfica (Togneri
e Deng, 2003; Teixeira et al., 2009, 2008; Armesto et al., 2008).
A analise do erro de estimacao, em simulacoes, e a maneira mais utilizada nos tra-
balhos sobre estimacao para medir o desempenho dos algoritmos, e serve para indicar quao
precisas sao as estimativas. Alguns autores apresentam o erro, em cada iteracao, em escala
logarıtmica (Teixeira et al., 2008; So et al., 1994; Xue-Dong e Zhi-Huan, 2008; Chandrasekar
et al., 2007). O erro medio quadratico (MSE) tambem e utilizado em varios trabalhos (Merwe
et al., 2000; Armesto et al., 2008; Wan et al., 1999; Kurian e Puthusserypady, 2006).
Neste trabalho, a analise do erro de estimacao e feita por meio do ındice RMSE que
produz uma medida combinada da polarizacao e variancia das estimativas do filtro (Arasarat-
nam e Haykin, 2009). Ele e calculado para cada componente de estado, xi, sobre uma quan-
tidade c de simulacoes Monte Carlo e e dado por
RMSEi ,1
c
c∑
j=1
√
√
√
√
√
1
kf − k0 + 1
kf∑
k=k0
(xi,k − xi,k|k,j)2
, (5.9)
em que xi,k e o valor verdadeiro do estado, xi,k|k,j e o valor estimado do estado na j-
esima simulacao, e [ko,kf ] define o intervalo de tempo considerado. Tal intervalo e escolhido
desconsiderando-se transiente inicial.
Ainda com relacao ao erro de estimacao, vale dizer que as metricas baseadas nele,
como as apresentadas ate agora, obviamente, so podem ser utilizadas em simulacao, onde
o valor verdadeiro de estado e conhecido. Quando esse nao for o caso, e o filtro estiver
processando dados experimentais, mede-se o desempenho do mesmo por meio do erro de
5.3 Avaliacao de Desempenho de Estimadores de Estado 75
inovacao dado por
ηk|k−1 , yk − yk|k−1. (5.10)
Um outro criterio de desempenho, muito importante, principalmente quando se trata
de filtros Gaussianos aplicados a sistemas cuja PDF dos estados e nao-Gaussiana, e a repre-
sentatividade das estimativas. Segundo Lefebvre e colaboradores (2004), esse criterio pode
ser dividido em duas questoes: consistencia e conteudo informativo das estimativas. Duas es-
timativas podem ser consistentes, embora uma delas possa ser mais informativa que a outra.
A Figura 5.10 ilustra isso.
Figura 5.10: Aproximacao da PDF nao-Gaussiana p(xk,Zi) por tres PDFs Gaussianasp1(xk,Zi),p2(xk,Zi) e p3(xk,Zi). A PDF e consistente se a sua media estiver dentrodo domınio de probabilidade da PDF verdadeira. p3(xk,Zi) e a unica nao consistente.p1(xk,Zi) e mais informativa que p2(xk,Zi). Fonte: (Lefebvre et al., 2004)
Uma medida de desempenho do filtro para indicar tanto a consistencia quanto o con-
teudo informativo das estimativas produzidas e matriz de covariancia do erro de estimacao P xxk|k
(Arasaratnam e Haykin, 2009). Diz-se que a estimativa de estado e consistente se satisfazer a
desigualdade
−α√
diag(P xxk|k) ≤ xk − xk|k ≤ α
√
diag(P xxk|k), k ∈ [k0, kf ], (5.11)
76 5 Questoes Praticas de Implementacao
em que α > 0 e o fator de confianca. Geralmente, escolhe-se α = 3, para o qual a confianca
indicada e de 99,7% (Teixeira, 2008).
5.4 Sintonia de Estimadores de Estado
E importante observar que as matrizes de covariancia Qk−1 e Rk, assumidas conhe-
cidas na formulacao do problema, sao utilizadas na etapa de predicao do KF. Entretanto, em
casos praticos, tais matrizes, nem sempre, sao completamente conhecidas. A sintonia do filtro
surge nesse contexto e esta secao dedica-se a esse assunto.
Para melhorar o desempenho do filtro e necessario sintoniza-lo. Sintonizar o filtro
KF consiste em selecionar valores numericos apropriados para as matrizes de covariancia
Qk−1 e Rk (Blauer e Belanger, 1987). Existem tecnicas para estimar tais ruıdos dinamicos
e observacionais, respectivamente, como se pode ver em Orrell (2005) e em Heald e Stark
(2000), ambos demonstrados para sistemas dinamicos caoticos.
Uma alternativa ao uso dessas tecnicas e o ajuste por tentativa e erro. Nesta abor-
dagem, deve-se levar em conta que o efeito da sintonia depende dos valores relativos entre
Qk−1 e Rk. Por isso, a ideia e fixar um valor para Rk, basendo-se, por exemplo, nos erros
das medicoes obtidos de ensaios de precisao nos sensores. Por simplicidade, geralmente Rk e
ajustada como uma matriz diagonal, ou seja, assume-se que as incertezas nas medicoes sejam
independentes, embora o conhecimento da correlacao cruzada reduza a taxa de falsas assimi-
lacoes (Smith e Singh, 2006). Em seguida, ajusta-se o valor de Qk−1 para tornar o filtro“mais”
ou “menos” aberto. Um filtro aberto tende a reduzir o erro de estimacao rapidamente, porem
com muitas variacoes transientes. Aqui, tambem por simplicidade, define-se Qk−1 como uma
matriz diagonal para controlar a convergencia de cada estado do filtro (Blauer e Belanger,
1987).
Uma referencia para o ajuste de Qk−1 e a distancia entre a curva do erro de estimacao,
ek = xk−xk|k, e a curva do intervalo de confianca, definido na Secao 5.3 como ±3√
diag(P xxk|k).
Se o intervalo de confianca da estimativa de um certo estado estiver muito proximo do valor
do erro de estimacao do mesmo, ao aumentar a variancia do ruıdo de processo relacionada a
tal estado, e provocado um afastamento entre o intervalo de confianca e o erro de estimacao.
Portanto, uma maneira de determinar a sintonia da matriz de covariancia Qk−1, assumindo
que Rk ja esta determinada, e
1. Defina um valor incial Qk−1 muito baixo, por exemplo, 10−9In < Qk−1 < 10−5In.
5.4 Sintonia de Estimadores de Estado 77
2. Proceda a execucao da estimacao.
3. Para cada estado, compare o erro de estimacao com o intervalo de confianca.
4. Caso o erro esteja ultrapassando o intervalo de confianca, aumente a variancia relativa
aquele estado.
5. Caso o intervalo de confianca esteja muito afastado da curva do erro, diminua a variancia
relativa aquele estado.
6. Repita os passos 2 a 5 ate que a curva do erro de estimacao esteja dentro dos limites de
confianca com um espacamento adequado.
Outros parametros de sintonia do filtro KF sao os valores iniciais das estimativas,
x0|0, e sua respectiva matriz de covariancia P xx0|0, que reflete a confianca que se tem nela.
Sabe-se que um alto P xx0|0 produz transientes iniciais altos e rapida convergencia, e um baixo
P xx0|0 produz efeito contrario.
Para ilustrar os efeitos da sintonia por tentativa e erro, e dado um exemplo de esti-
macao de estados para um pendulo simples nao-linear.
Exemplo de Sintonia do Filtro UKF
Considere que o sistema de um pendulo simples nao-linear possui modelos de processo
e de observacao dados, respectivamente, por
x1(t)
x2(t)
=
x2(t)
−(g/l) sen(x1(t))
+ w(t), (5.12)
e
yk = [1 0]
x1(Tk)
x2(Tk)
+ νk. (5.13)
em que x1 e a posicao angular, x2 e a velocidade angular, g = 9,81 m/s2 correspondente a
aceleracao da gravidade, l = 27,3 cm e o comprimento da haste, w ∈ R2 e o ruıdo de processo
cuja matriz de covariancia e Qk−1 = diag(0,007 0,007), e νk e o ruıdo na medicao cuja matriz
de covariancia e Rk = 0,1. Observe que apenas um dos estados e medido.
Deseja-se investigar como sao afetadas as estimativas do filtro UKF se o mesmo
utilizar matrizes de covariancia dos ruıdos tais como ρQQk−1 e ρRRk, em que ρQ e ρR sao os
78 5 Questoes Praticas de Implementacao
pesos que modificam os valores verdadeiros das respectivas matrizes de covariancia de ruıdo.
Como referencia, o caso ideal em que as matrizes Qk−1 e Rk sao exatamente conhecidas, ou
seja, ρQ = ρR = 1, e a estimativa inicial e exatamente o valor verdadeiro dos estados neste
instante, obtem-se os resultados da Figura 5.11. As figuras 5.12, 5.13 e 5.14 ilustram os casos
em que ha erro na sintonia das matrizes de covariancia utilizadas pelo filtro. Se o fator de
imprecisao ρR for igual a 0,01, significa que o filtro considera que o ruıdo da medicao tem
desvio padrao 10 vezes menor que o real, ou seja, que, do ponto-de-vista do filtro, a medicao
recebida e 10 vezes mais confiavel do que ela realmente e. Essa imprecisao se faz refletir na
inconsistencia da estimativa do estado diretamente associada a essa medicao que e a posicao
angular do pendulo (ver Figura 5.12). Note que, em termos de consistencia, a inovacao foi a
menos prejudicada em todos os casos apresentados.
De forma analoga, se o fator de imprecisao ρQ for igual a 100, significa que o modelo
de predicao e 10 vezes mais incerto do que ele realmente e, ou seja, que, para o UKF, o modelo
que ele possui nao e muito informativo, e, por isso, as medicoes devem ser mais confiaveis em
detrimento desse modelo. Isso reflete na matriz de covariancia das estimativas de estado e
abre um espaco para o filtro compensar o ruıdo de medicao no erro de estimacao dos estados,
como se pode ver na Figura 5.14.
5.4 Sintonia de Estimadores de Estado 79
0 1 2 3 4−150
−100
−50
0
50
100
150
Real x Estimativa − Estado x1 − ρ
Q = 1, ρ
R =1
s
grau
s
0 1 2 3 4−400
−300
−200
−100
0
100
200
300
400
Real x Estimativa − Estado x2 − ρ
Q = 1, ρ
R =1
s
grau
s/s
0 1 2 3 4−200
−150
−100
−50
0
50
100
150
200
Real x Estimativa − Medição y − ρQ
= 1, ρR
=1
s
grau
s
0 1 2 3 4−60
−40
−20
0
20
40
60
Erro de estimação − Estado x1 − ρ
Q = 1, ρ
R =1
s
grau
s
0 1 2 3 4−200
−150
−100
−50
0
50
100
150
200
Erro de estimação − Estado x2 − ρ
Q = 1, ρ
R =1
s
grau
s/s
0 1 2 3 4−200
−150
−100
−50
0
50
100
150
200
Erro de inovação − Medição y − ρQ
= 1, ρR
=1
s
grau
s
Figura 5.11: Caso ideal de estimacao de estados do pendulo simples nao linear utilizando o UKF. Asmatrizes de covariancia dos ruıdos de processo e medicao, respectivamente Qk−1 e Rk,sao conhecidas. A linha solida grossa vermelha(–) indica o valor verdadeiro do estado eda medicao (no caso do grafico (c)). A linha solida grossa azul(–) indica o valor estimadodo estado e da medicao( no caso do grafico (c)). A linha solida fina vermelha (–) e oerro de estimacao da componente i e erro de inovacao (no caso do grafico (f)) limitado
pelo intervalo de confianca ±3√
diagPxx(i,i),k |k (e ±3
√
diagPyy
k |k no caso do grafico (f))
indicados pela linha tracejada azul (–).
80 5 Questoes Praticas de Implementacao
0 1 2 3 4−150
−100
−50
0
50
100
150
200
Real x Estimativa − Estado x1 − ρ
Q = 1, ρ
R =0.01
s
grau
s
0 1 2 3 4−400
−300
−200
−100
0
100
200
300
400
Real x Estimativa − Estado x2 − ρ
Q = 1, ρ
R =0.01
s
grau
s/s
0 1 2 3 4−200
−150
−100
−50
0
50
100
150
200
Real x Estimativa − Medição y − ρQ
= 1, ρR
=0.01
s
grau
s
0 1 2 3 4−50
0
50
Erro de estimação − Estado x1 − ρ
Q = 1, ρ
R =0.01
s
grau
s
0 1 2 3 4−200
−150
−100
−50
0
50
100
150
200
Erro de estimação − Estado x2 − ρ
Q = 1, ρ
R =0.01
s
grau
s/s
0 1 2 3 4−200
−150
−100
−50
0
50
100
150
200
Erro de inovação − Medição y − ρQ
= 1, ρR
=0.01
s
grau
s
Figura 5.12: Caso de estimacao de estados do pendulo simples nao linear utilizando o UKF em que amatriz de covariancia do ruıdo de processo, Qk−1, e conhecida e a matriz de covarianciado ruıdo de medicao corresponde a 0,001 Rk. A linha solida grossa vermelha(–) indica ovalor verdadeiro do estado e da medicao (no caso do grafico (c)). A linha solida grossaazul(–) indica o valor estimado do estado e da medicao( no caso do grafico (c)). A linhasolida fina vermelha (–) e o erro de estimacao da componente i e erro de inovacao (no caso
do grafico (f)) limitado pelo intervalo de confianca ±3√
diagPxx(i,i),k |k (e ±3
√
diagPyy
k |kno caso do grafico (f)) indicados pela linha tracejada azul (–).
5.4 Sintonia de Estimadores de Estado 81
0 1 2 3 4−150
−100
−50
0
50
100
150
Real x Estimativa − Estado x1 − ρ
Q = 0.01, ρ
R =1
s
grau
s
0 1 2 3 4−600
−400
−200
0
200
400
Real x Estimativa − Estado x2 − ρ
Q = 0.01, ρ
R =1
s
grau
s/s
0 1 2 3 4−200
−150
−100
−50
0
50
100
150
200
Real x Estimativa − Medição y − ρQ
= 0.01, ρR
=1
s
grau
s
0 1 2 3 4−60
−40
−20
0
20
40
60
Erro de estimação − Estado x1 − ρ
Q = 0.01, ρ
R =1
s
grau
s
0 1 2 3 4−200
−150
−100
−50
0
50
100
150
200
Erro de estimação − Estado x2 − ρ
Q = 0.01, ρ
R =1
s
grau
s/s
0 1 2 3 4−200
−150
−100
−50
0
50
100
150
200
Erro de inovação − Medição y − ρQ
= 0.01, ρR
=1
s
grau
s
Figura 5.13: Caso de estimacao de estados do pendulo simples nao linear utilizando o UKF em que amatriz de covariancia do ruıdo de medicao,Rk, e conhecida e a matriz de covariancia doruıdo de processo corresponde a 0,001 Qk−1. A linha solida grossa vermelha(–) indica ovalor verdadeiro do estado e da medicao (no caso do grafico (c)). A linha solida grossaazul(–) indica o valor estimado do estado e da medicao( no caso do grafico (c)). A linhasolida fina vermelha (–) e o erro de estimacao da componente i e erro de inovacao (no caso
do grafico (f)) limitado pelo intervalo de confianca ±3√
diagPxx(i,i),k |k (e ±3
√
diagPyy
k |kno caso do grafico (f)) indicados pela linha tracejada azul (–).
82 5 Questoes Praticas de Implementacao
0 1 2 3 4−150
−100
−50
0
50
100
150
Real x Estimativa − Estado x1 − ρ
Q = 100, ρ
R =100
s
grau
s
0 1 2 3 4−300
−200
−100
0
100
200
300
400
Real x Estimativa − Estado x2 − ρ
Q = 100, ρ
R =100
s
grau
s/s
0 1 2 3 4−200
−150
−100
−50
0
50
100
150
200
Real x Estimativa − Medição y − ρQ
= 100, ρR
=100
s
grau
s
0 1 2 3 4−300
−200
−100
0
100
200
300
Erro de estimação − Estado x1 − ρ
Q = 100, ρ
R =100
s
grau
s
0 1 2 3 4−1500
−1000
−500
0
500
1000
1500
Erro de estimação − Estado x2 − ρ
Q = 100, ρ
R =100
s
grau
s/s
0 1 2 3 4−1000
−500
0
500
1000
Erro de inovação − Medição y − ρQ
= 100, ρR
=100
s
grau
s
Figura 5.14: Caso de estimacao de estados do pendulo simples nao linear utilizando o UKF em que asmatrizes de covariancia dos ruıdos de medicao,Rk, e de processo, Qk−1, sao desconhecidase correspondem a 100 Rk e 100 Qk−1, respectivamente. A linha solida grossa vermelha(–) indica o valor verdadeiro do estado e da medicao (no caso do grafico (c)). A linhasolida grossa azul(–) indica o valor estimado do estado e da medicao( no caso do grafico(c)). A linha solida fina vermelha (–) e o erro de estimacao da componente i e erro de
inovacao (no caso do grafico (f)) limitado pelo intervalo de confianca ±3√
diagPxx(i,i),k |k
(e ±3√
diagPyy
k |k no caso do grafico (f)) indicados pela linha tracejada azul (–).
Capıtulo 6
Resultados
6.1 Introducao
Neste capıtulo, os algoritmos UKF e IUKF sao usados para estimacao de estados e
parametros do pendulo duplo caotico apresentado no Capıtulo 3.
No campo da estimacao nao-linear, exemplos de fatores complicadores sao o grau de
nao-linearidade do sistema, a incerteza da condicao inicial, a esparsidade das medicoes e o
nıvel de ruıdo das medicoes (Majji et al., 2010). Teixeira e colaboradores (2005) conduzem
um estudo simulado de recontrucao da trajetoria de uma aeronave, utilizando o filtro UKF, e
observa um decaimento do desempenho a medida que a relacao sinal-ruıdo diminui. Khalil e
colaboradores (2009) comparam, em simulacao, o desempenho de tres estimadores de estados
para o oscilador de Duffing quando e variada a taxa de amostragem das medicoes. Como
esperado, os autores observam que o aumento da esparsidade dos dados diminui o desempenho
dos estimadores.
No caso deste trabalho, considerar os efeitos da variacao na taxa de amostragem
das imagens, e, por conseguinte, das posicoes angulares, e importante para se preparar para
situacoes em que tanto o hardware (a camera digital) quanto o sistema de processamento de
imagem impoe restricoes de velocidade. A velocidade do sistema de processamento de imagem
e um criterio fundamental para evoluir para um estimador de estados do pendulo duplo em
tempo real.
E muito comum, tambem, que nem todos os estados do sistema observado possam ser
medidos. Isso leva ao chamado problema de estimacao a partir de medicoes incompletas, ou,
problema de estimacao com componentes (ou variaveis) nao observadas (ou desconhecidas)
(Aguirre et al., 2005; Sitz et al., 2002). So e colaboradores (1994) propoem reconstruir o
vetor de estados de um rotor duplo, que apresenta dinamica caotica, a partir da medicao de
84 6 Resultados
apenas um dos quatro estados deste sistema. Assim, e testado o desempenho da reconstrucao
para varias configuracoes do vetor de medicoes. De fato, como mostra o estudo de Letellier
e colaboradores (2006), a escolha da variavel medida influencia a habilidade de se extrair
informacao dinamica de um sistema nao-linear. Tal analise e feita para um problema de
reconstrucao de atrator mas pode ser estendida para o problema de estimacao de estados.
Na tentativa de cobrir os principais aspectos que influenciam o desempenho da esti-
macao, neste trabalho, sao realizados testes para diferentes:
⋄ tipos de medicoes, ou seja, qual e o conjunto de variaveis do sistema medido,
⋄ nıvel do ruıdo nos dados,
⋄ taxa de amostragem dos sinais de medicao.
Sao investigados varios casos com base na variacao dessas condicoes. O desempenho do filtro
e avaliado em cada caso, primeiramente para dados simulados, e, num segundo momento, para
dados experimentais.
Tambem sao apresentados resultados, com dados simulados e experimentais, da esti-
macao conjunta de estados e parametros, a saber, os coeficientes de amortecimento viscoso,
b1 e b2, da junta 1 e da junta 2 do pendulo, respectivamente. Tal problema de estimacao
de parametros tem interessante aplicacoes de cunho pratico. Uma delas e a verificacao da
qualidade de outro pendulo construıdo usando as mesmas dimensoes e orientacoes de projeto.
Outra seria para o prognostico de quando se deve realizar uma manutencao preventiva do
equipamento, visto que o coeficiente de amortecimento pode refletir um desgaste na junta. Os
indicadores de desempenho para avaliar a qualidade das estimativas estao descritos na Secao
5.3.
6.2 Resultados Simulados
Nesta secao, sao apresentados resultados da estimacao de estados e estimacao con-
junta de estados e parametros realizadas pelo UKF-π e pelo IUKF com dados simulados.
Por se tratar de simulacao, o ruıdo de processo e nulo, pois o modelo que gera os dados e o
mesmo utilizado na etapa de predicao dos filtros, salva as consideracoes feitas na Secao 5.2.
Entretanto, a matriz de covariancia do ruıdo de processo, Qk−1, e ajustada com um valor nao
nulo durante a estimacao para para ajudar na convergencia e consistencia das estimativas. O
valor ajustado e especıfico para cada teste e segue os procedimentos de sintonia descritos na
6.2 Resultados Simulados 85
Secao 5.4. Alem disso, e aceitavel que os filtros sejam sintonizados com valores diferentes das
matrizes de covariancia do ruıdo de processo. Portanto, e adotada a simbologia QUKF−πk−1 para
denotar a matriz de covariancia usada pelo UKF-π, e, de forma semelhante, para o IUKF,
adota-se QIUKFk−1 .
A matriz de covariancia do erro de medicao, Rk, e assumida conhecida, ja que a var-
iancia, σ2ν , do ruıdo νk adicionado na observacao dos estados e escolhida. A sua definicao e es-
colhida em funcao dos valores das observacoes yk. Considerando que nao ha medicao da veloci-
dade angular da haste 2, a forma maxima da matriz Rk, quando yk = [θ1(kT ) θ2(kT ) θ1(kT )],
e Rk = diag(
σθ12, σθ2
2, σθ12)
.
Denominando por ydk o sinal desejado, que e o sinal da observacao dos estados sem
o ruıdo aditivo, uma forma de quantificar a influencia do ruıdo νk no sinal medido yk e por
meio da relacao sinal-ruıdo (do ingles, signal-to-noise ratio (SNR)) dada por
SNR (dB) = 20 logσyd
σν(6.1)
em que σyd e a dispersao media (desvio padrao amostral) do sinal sem ruıdo e σν e o desvio
padrao do ruıdo de medicao.
A condicao inicial das simulacoes e x0 = [90 0 0/s 0/s]T. A estimativa inicial
x0|0 e ajustada aqui de forma determinıstica para que se possa controlar o efeito do erro da
estimativa inicial nos testes. Ela e definida como
x0|0,i = x0,i +√
P xx0|0,(i,i), (6.2)
em que i e o ındice do estado e P xx0|0 e a covariancia do erro da estimativa inicial que e escolhida
como
P xx0|0 = diag
(
(10 )2, (10 )2, (50 /s)2, (50 /s)2)
. (6.3)
Porem, essa medida e utilizada apenas em testes isolados. Quando for o caso das
simulacoes de Monte Carlo, x0|0 e definido de forma aleatoria por
x0|0,i = x0,i + δi, (6.4)
86 6 Resultados
tal que δ e uma parcela gerada aleatoriamente como
δi ∼ N(0,√
P xx0|0,(i,i)). (6.5)
Na estimacao conjunta de estados e parametros, ajusta-se, tambem, a matriz de
covariancia do erro da estimativa inicial dos parametros, P pp0|0, como
P pp0|0 = diag
(
(0,005 Nm/rad)2, (0,005 Nm/rad)2)
(6.6)
sendo que a estimativa inicial e p0|0 = [0,00045 Nm/rad 0,00015 Nm/rad]T, de acordo com as
estimativas iniciais obtidas na Secao 5.1.2.
As restricoes impostas as estimativas do IUKF sao as mesmas das equacoes (5.6).
A Tabela 6.1 contem um sumario do que e possıvel variar nos experimentos simulados.
Tabela 6.1: Sumario das condicoes possıveis de serem variadas nos testes.
Caso 1 Caso 2 Caso 3 Caso 4 Caso 5 Caso 6 Caso 7
Tipos de medicao yk = θ1 yk = [θ1 θ1] yk = [θ2 θ1] yk = [θ1 θ2 θ1] yk = [θ1 θ2] yk = [θ1] yk = [θ2]
Relacao sinal-ruıdo1 ≈ 50 dB ≈ 30 dB ≈ 25 dB ≈ 18 dB ≈ 12 dB - -
Taxa de Amostragem2(Tpa) 40fps 20fps 4fps 2fps - - -1 Ruıdo sera adicionado aos sinais das posicoes angulares, quando os mesmos estiverem disponıveis.2 Somente quando as posicoes angulares estiverem disponıveis.
6.2.1 Efeito dos Tipos de Medicoes
Novamente com relacao a Figura 5.9, observe que, apos um rapido transiente, e
possıvel, tanto com o UKF-π como com o IUKF, obter boas estimativas da posicao angular da
haste 2 que nao e medida. Esse resultado tem significado para a questao da observabilidade do
sistema e, por meio dele, e sugerido que o sistema e observavel quando yk = [θ1]. Entretanto,
e importante que o desempenho dos filtros seja analisado em condicoes ruidosas, alias, uma
das funcionalidades dos mesmos e a de reduzir ruıdos de medicao.
Conforme verificado por Firmo (2007), o sinal de velocidade gerado pelo sensor
acoplado a haste 1 possui uma relacao sinal-ruıdo de aproximadamente 54dB. Nessas condicoes,
os filtros conseguem manter uma boa qualidade das estimativas de todos os estados. Entre-
tanto, quando a relacao sinal-ruıdo atinge o nıvel de 26dB, o filtro IUKF passa a apresentar
divergencia em certas regioes, como sugere a Figura 6.1.
Para melhorar a qualidade das estimativas, introduz-se a medicao da posicoes an-
6.2 Resultados Simulados 87
0s 5s 10s 15s 20s10
−2
10−1
100
101
102
103
(a)
log(
e θ 1,k|k
( ° ))
0s 5s 10s 15s 20s10
−2
10−1
100
101
102
103
(b)
log(
e θ 1• ,k|k
(m
/s))
0s 5s 10s 15s 20s10
−2
10−1
100
101
102
103
(c)
log(
e θ 2,k|k
( ° ))
0s 5s 10s 15s 20s10
−2
10−1
100
101
102
103
(d)
log(
e θ 2• ,k|k
(m
/s))
Figura 6.1: Comparacao do erro de estimacao dos estados (a)θ1, (b)θ1, (c)θ2 e (d)θ2 estimados pelo
UFK-π e IUKF. E medida apenas a velocidade angular da haste 1 com ruıdo tal queSNRθ1
≈ 26dB. O erro esta em escala logarıtmica para facilitar a comparacao. O errode estimacao dos estados dado pelo UKF-π esta indicado pela linha solida (–) vermelha.
Tal erro e limitado pelo intervalo de confianca ±3√
diagPxx(i,i),k |k, indicado pela linha
tracejada azul (- -). O erro de estimacao dos estados ao se utilizar o IUKF esta indicado pela
linha solida (–) bege. Tal erro e limitado pelo intervalo de confianca ±3√
diagPxx(i,i),k |k,
indicado pela linha tracejada rosa (- -).
gulares das hastes. Assim aumenta-se a quantidade de informacao que o filtro utiliza para
calcular suas estimativas. O efeito estabilizante disso e ilustrado na Figura 6.2.
A fim de saber sobre a contribuicao dada pela medicao de outras componentes de
estado, investiga-se, tambem, o resultado dos estimadores para outras configuracoes do vetor
de observacoes yk, em especial aquele caso em que apenas as medicoes das posicoes angulares
estejam disponıveis. Isso porque, como levantado na Secao 5.1.1, o sinal da velocidade angular,
disponibilizado na bancada experimental do pendulo duplo, e uma versao filtrada da velocidade
real, e, sendo assim, deve-se testar de antemao a viabilidade dele ser descartado.
As Figuras 6.3 e 6.4 mostram quais os casos testados para a configuracao de yk e os
respectivos erros medios de estimacao ao se realizar um conjunto de 5 simulacoes de estimacao
de estados utilizando-se o UKF-π e o IUKF, respectivamente. As matrizes de covariancia sao
ajustadas para QUKF−πk−1 = 10−12 diag
(
1, 1, 104, 104)
e QIUKFk−1 = 10−8 diag
(
102, 1, 104, 104)
.
Considera-se o desvio padrao associado as medicoes das posicoes angulares, σθ, igual a 0,2.
Mantem-se o nıvel de ruıdo no sinal da velocidade angular como o mesmo que provoca insta-
bilidade no IUKF, ou seja, SNRθ1≈ 26dB.
88 6 Resultados
10s 15s 20s−2865
−1432
0
1432
(a)
θ 2• (°
/s)
t(s)
10s 15s 20s−2865
−1432
0
1432
2865 (b)
θ 2• (°
/s)
t(s)
Figura 6.2: Efeito da inclusao da medicao das posicoes angulares para os estimadores. Nos graficos (a) e(b), a linha tracejada (- -) vermelha representa o estado real da velocidade angular da haste2 (variavel de estado nao medida). A linha solida (–) bege indica a estimativa do estadodada pelo UKF-π e a linha traco-ponto (-.-) azul representa a estimativa do estado dada
pelo IUKF. E considerado, no grafico (a), somente a medicao de θ1 com SNRθ1≈ 26dB.
No grafico (b), e considerada a inclusao das medicoes de θ1 e θ2 com ruıdo aditivo cujodesvio padrao e de 0,2.
O perfil das barras e diferente para os dois filtros avaliados. Isso mostra que a alteracao
que configuracao do vetor de medicao provoca no desempenho do filtro e funcao tambem do
tipo do filtro. Observe, por exemplo, que o desempenho do UKF-π melhora bastante quando
somente a medicao da posicao angular da haste 2 esta disponıvel. O mesmo nao ocorre com
o IUKF. A analise do IUKF mostra que quanto mais se mede, melhor sao os resultados (veja
as barras do caso 4 na Figura 6.4). Por outro lado, a analise dos resultados do UKF-π mostra
que a questao nao e somente a de se medir mais, mas que ha certas componentes de estados
que contribuem mais nos resultados do que outras. De fato, percebe-se, em ambos os filtros,
que incluir a medicao a respeito de outra haste melhora consideravelmente os resultados.
Isso pode ser visto ao se comparar o caso 2 com o caso 5. No geral, o UKF-π mostra-se um
melhor estimador, comparado ao IUKF, nas condicoes do teste, pelo fato dos indices atingirem
menores valores.
Devido aos bons resultados alcancados medindo-se apenas as posicoes angulares, nos
testes seguintes sao considerados tanto o caso do vetor yk = [θ1 θ1 θ2] quanto yk = [θ1 θ2].
6.2 Resultados Simulados 89
Figura 6.3: Grafico em barras, em escala logarıtmica, comparando o ındice RMSE da estimacao dosestados do pendulo duplo, ao se utilizar o UKF-π, para sete casos diferentes de configuracaodo vetor de medicao yk.
Figura 6.4: Grafico em barras, em escala logarıtmica, comparando o ındice RMSE da estimacao dosestados do pendulo duplo, ao se utilizar o IUKF, para sete casos diferentes de configuracaodo vetor de medicao yk.
6.2.2 Efeito do Nıvel de Ruıdo
Conforme menciona a Secao 6.2.1, a inclusao das medicoes das posicoes angulares
ajuda a estabilizar os resultados dos filtros, principalmente no caso do IUKF. Para responder
a questao de ate que ponto tais medicoes apresentam uma contribuicao significativa, e inter-
essante investigar o desempenho dos filtros com relacao ao nıvel de ruıdo em tais medicoes.
Para isto, e introduzida uma constante, ρ, que representa o nıvel de ruıdo na obser-
90 6 Resultados
vacao das posicoes angulares. Essa constante multiplica o desvio padrao mınimo considerado
para o ruıdo de medicao da posicao angular que e σθ1 = σθ2 = 0,2. Dessa forma, a matriz
Rk se torna Rk = ρ2diag(
σθ12, σθ2
2, σθ12/ρ2
)
.
Note que se mantem o sinal da velocidade angular da haste 1 com nıvel constante de
ruıdo que, nos experimentos, equivale a σθ1 = 15/s.
As figuras 6.5-6.6 contrastam dois nıveis de ruıdo, ρ = 10 e ρ = 100, na estimacao
pelos filtros UKF-π e IUKF, respectivamente. A taxa de aquisicao de imagens consider-
ada e de 40 fps. As covariancias do ruıdo de processo sao mantidas equivalentes as uti-
lizadas nos testes da Secao 6.2.1, ou seja, QUKF−πk−1 = 10−12 diag
(
1, 1, 104, 104)
e QIUKFk−1 =
10−8 diag(
102, 1, 104, 104)
.
Observa-se que o UKF-π mantem as estimativas consistentes ao longo das simulacoes,
enquanto que o IUKF apresenta momentos de inconsistencia acompanhados de um alto erro de
estimacao. Para ambos os filtros, nota-se, tambem, um aumento na incerteza das estimativas.
Interessante verificar que os intervalos de confianca evoluem de forma diferente nos dois filtros.
No IUKF, o intervalo de confianca e mais regular e elevado ao mesmo tempo. Por outro lado,
no UKF-π, o intervalo de confianca apresenta maior capacidade de acompanhar o erro de
estimacao e, em media, e menor que aquele produzido pelo IUKF.
Sao testados outros nıveis de ruıdo intermediarios por meio de simulacoes Monte
Carlo, a saber ρ = 20, 50. Considera-se, tambem verificar o desempenho dos filtros para duas
composicoes diferentes do vetor de observacao, yk = [θ1 θ1 θ2] e yk = [θ1 θ2]. As Figuras
6.7-6.8 contem os ındices de desempenho da estimacao para este teste.
Com base nestas figuras, observa-se que o UKF-π e melhor que o IUKF para o caso de
se utililzar as 3 medicoes yk = [θ1 θ1 θ2]. Alem disso, nota-se que para uma relacao sinal-ruıdo
inferior a 30dB, os erros de estimacao aumentam bastante.
6.2.3 Efeito da Taxa de Amostragem
Ainda com relacao ao estudo da inclusao das medicoes das posicoes angulares, nesta
secao avalia-se o comportamento dos filtros com relacao a esparsidade das leituras de posicoes
angulares.
Mantendo um nıvel de ruıdo, ρ = 10, nas medicoes das posicoes angulares, o que
representa um desvio padrao igual a 2, e preservando o ruıdo nas medicoes das velocidades
angulares tal que SNRθ1= 26dB, compara-se, nao somente a questao da esparsidade tempo-
ral das observacoes, como tambem, duas configuracoes do vetor de observacao: no primeiro
6.2 Resultados Simulados 91
0s 5s 10s 15s
100
101
102
103
e θ 2• ,k|k
(m
/s)
Figura 6.5: Erro logarıtmico, indicado pelas linhas solidas, da estimacao do estado nao medido, θ2,resultado da estimacao do filtro UKF-π para dois nıveis diferentes de ruıdo nos dados daposicao angular. A linha solida (–) bege ocorre quando a relacao sinal-ruıdo e de aproxi-madamente 30 dB e a linha solida (–) vermelha ocorre quando tal relacao diminui paraaproximadamente 12 dB. Nos dois casos, os erros de estimacao possuem como referencia
a linha do intervalo de confianca, ±3√
diagP44
(4,4),k |k, indicado pela linha tracejada (- -)
rosa e linha tracejada (- -) azul, respectivamente.
0s 5s 10s 15s
100
101
102
103
(d)
e θ 2• ,k|k
(m
/s)
Figura 6.6: Erro logarıtmico, indicado pelas linhas solidas, da estimacao do estado nao medido, θ2,resultado da estimacao do filtro IUKF para dois nıveis diferentes de ruıdo nos dados daposicao angular. A linha solida (–) bege ocorre quando a relacao sinal-ruıdo e de aproxi-madamente 30 dB e a linha solida (–) vermelha ocorre quando tal relacao diminui paraaproximadamente 12 dB. Nos dois casos, os erros de estimacao possuem como referencia
a linha do intervalo de confianca, ±3√
diagP44
(4,4),k |k, indicado pela linha tracejada (- -)
rosa e linha tracejada (- -) azul, respectivamente.
92 6 Resultados
Figura 6.7: Medias do ındice RMSE normalizado para uma simulacao Monte-Carlo com 20 realizacoespara estimacao dos estados do pendulo duplo caotico a partir da medicao de θ1, θ1 e θ2. Saosimulados cinco casos diferentes de nıvel de ruıdo nas observacoes das posicoes angulares.Em (a), mostram-se os resultados do UKF-π, e, em (b), os resultados do IUKF.
Figura 6.8: Medias do ındice RMSE normalizado para uma simulacao Monte-Carlo com 20 realizacoespara estimacao dos estados do pendulo duplo caotico a partir da medicao de θ1 e θ2. Saosimulados cinco casos diferentes de nıvel de ruıdo nas observacoes das posicoes angulares.Em (a), mostram-se os resultados do UKF-π, e, em (b), os resultados do IUKF.
momento, yk = [θ1 θ1 θ2] (ver figuras 6.9(a) e 6.10(a)), e, no segundo momento, yk = [θ1 θ2]
(ver figuras 6.9(b) e 6.10(b)).
Importante notar que, quando se mede apenas as posicoes angulares, resultados ruins
ocorrem caso se eleve o intervalo de amostragem Tpa para alem de 150ms, principalmente ao
se tratar do IUKF. Por outro lado, se forem utilizadas as medicoes da velocidade angular,
pode-se conseguir boas estimativas mesmo com Tpa = 500ms.
O problema da divergencia ainda afeta o filtro IUKF sendo que o tempo de duracao
aumenta quando se aumenta a esparsidade das medicoes. O UKF-π tambem diverge, em
certos momentos, quando se utilza apenas as medicoes das posicoes angulares.
Simulacoes Monte Carlo sao executadas para testar outras taxas de aquisicao das
6.2 Resultados Simulados 93
0s 5s 10s 15s 20s 25s10
−1
100
101
102
103
104
105
(a)
log(
e θ 2• ,k|k
(m
/s))
0s 5s 10s 15s 20s 25s10
−1
100
101
102
103
104
105
(b)
log(
e θ 2• ,k|k
(m
/s))
Figura 6.9: Erro logarıtmico, indicado pelas linhas solidas, da estimacao do estado nao medido, θ2,resultado da estimacao do filtro UKF-π para duas taxas diferentes de aquisicao de dadosda posicao angular. A linha solida (–) vermelha ocorre quando a taxa de aquisicao e de20 Hz e a linha solida (–) bege ocorre quando tal taxa diminui para 2 Hz, no grafico (a),e para 3,5 Hz, no caso (b). Nos dois casos, os erros de estimacao possuem como referencia
a linha do intervalo de confianca, ±3√
diagP44
(4,4),k |k, indicado pela linha tracejada (- -)
azul e linha tracejada (- -) rosa, respectivamente. O grafico (a) obtem-se para o caso dovetor de observacao yk = [θ1 θ1 θ2]. E, em (b), exclui-se a velocidade angular da haste 1.
posicoes angulares, sao eles, Tpa = 50ms (20fps), Tpa = 250ms (4fps) e Tpa = 500ms (2fps).
Os resultados sao mostrados nas Figuras 6.11-6.12. Novamente, nota-se que o UKF-π sobressai
ao IUKF. Interessante notar que, utilizando-se apenas as medicoes das posicoes angulares, os
filtros produzem resultados razoaveis para um intervalo de amostragem de ate 50ms. No caso
do UKF-π e possıvel estender esse intervalo ate 250ms. Isso traz uma informacao quantitativa
sobre a previsibilidade do pendulo duplo caotico.
6.2.4 Estimacao Conjunta de Estados e Parametros
Conforme discutido na Secao 2.6, e possıvel utilizar o UKF-π ou o IUKF para esti-
mar alguns parametros do modelo do sistema em observacao. A Tabela 5.1, contem todos
os parametros, e seus respectivos valores, do modelo do pendulo duplo caotico obtido pela
modelagem fenomenologica, conforme descrito na Secao 3.2.
Alguns dos parametros do pendulo duplo, alem de serem facilmente determinados
experimentalmente, variam muito pouco com o passar do tempo, como, por exemplo, as
massas e os comprimentos das hastes. Parametros, como os coeficientes de atrito, alem de
variarem com o tempo de uso da plataforma, dificilmente dispoe de instrumentos capazes de
94 6 Resultados
0s 5s 10s 15s 20s 25s10
−1
100
101
102
103
104
(a)
log(
e θ 2• ,k|k
(m
/s))
0s 5s 10s 15s 20s 25s10
−1
100
101
102
103
104
(b)
log(
e θ 2• ,k|k
(m
/s))
Figura 6.10: Erro logarıtmico, indicado pelas linhas solidas, da estimacao do estado nao medido, θ2,resultado da estimacao do filtro IUKF para duas taxas diferentes de aquisicao de dadosda posicao angular. A linha solida (–) vermelha ocorre quando a taxa de aquisicao e de20 Hz e a linha solida (–) bege ocorre quando tal taxa diminui para 2 Hz, no grafico (a), epara 3,5 Hz, no caso (b). Nos dois casos, os erros de estimacao possuem como referencia
a linha do intervalo de confianca, ±3√
diagP44
(4,4),k |k, indicado pela linha tracejada (- -)
azul e linha tracejada (- -) rosa, respectivamente. O grafico (a) obtem-se para o caso dovetor de observacao yk = [θ1 θ1 θ2]. E, em (b), exclui-se a velocidade angular da haste 1.
Figura 6.11: Medias do ındice RMSE normalizado para uma simulacao Monte-Carlo com 20 realizacoespara estimacao dos estados do pendulo duplo caotico a partir da medicao de θ1, θ1 e θ2.Sao simulados quatro casos diferentes de taxa de amostragem das posicoes angulares. Em(a), mostram-se os resultados do UKF-π, e, em (b), os resultados do IUKF.
mensura-los. Alem disso, a resposta do sistema e sensıvel a esses parametro.
Diante disso, e interessante um teste no qual estimam-se os coeficientes de atrito das
juntas do pendulo. Por simplicidade e por grau de significancia, apenas os coeficientes de
atrito viscoso, b1 e b2, sao estimados. Portanto, o vetor de parametros a sendo estimados e
6.2 Resultados Simulados 95
Figura 6.12: Medias do ındice RMSE normalizado para uma simulacao Monte-Carlo com 20 realizacoespara estimacao dos estados do pendulo duplo caotico a partir da medicao de θ1 e θ2. Saosimulados quatro casos diferentes de taxa de amostragem das posicoes angulares. Em (a),mostram-se os resultados do UKF-π, e, em (b), os resultados do IUKF.
pk = [b1,k b2,k]T, cujo valor verdadeiro e p = [0,0004Nm/rad 0,000108Nm/rad]T.
Para a realizacao das simulacoes, utilizam-se as medicoes das posicoes angulares e da
velocidade angular da haste 1. As posicoes angulares sao obtidas a cada 50ms e ajusta-se um
desvio padrao do ruıdo de suas medicao igual a 2, ou seja, ρ = 10. A velocidade angular
e mantida sob uma relacao sinal-ruıdo igual a 26dB. A estimativa inicial dos parametros e
escolhida como p0|0 = [0,00045Nm/rad 0,00015Nm/rad]T com a covariancia inicial associada
P pp0|0 = diag
(
(0,005Nm/rad)2, (0,005Nm/rad)2)
. As covariancias do ruıdo de processo sao
reajustadas para QUKF−πk−1 = QIUKF
k−1 = 10−4 diag(
10−2, 10−4, 1, 1)
e as covariancias do ruıdo
de processo associada a evolucao dos parametros sao ajustadas como QUKF−πp,k−1 = QIUKF
p,k−1 =
10−5 diag (1, 1).
As figuras 6.13 e 6.14 mostram os graficos de estimacao dos parametros usando o
UKF-π e o IUKF, respectivamente. A Figura 6.15 mostra os erros de estimacao e a confianca
das estimativas ao longo da simulacao. Com base nessas figuras, percebe-se que os dois filtros
apresentaram erro de estimacao semelhante para a velocidade angular da haste 2, inclusive os
momentos de inconsistencia nas estimativas desse estado parecem ser os mesmos para os dois
filtros. Porem, o IUKF mostra-se mais robusto com relacao as estimativas dos parametros
comparado ao UKF-π. Alem de mais robusto, o IUKF apresenta menor erro medio e menor
grau de incerteza nas estimativas dos parametros. Isso pode ser devido as restricoes impostas
ao filtro que forca o mesmo a nao sair de uma determinada faixa de variacao esperada para
os valores dos parametros. O UKF-π, por nao sofrer de tal restricao, compensa grande parte
do erro de estimacao dos estados nas estimativas dos parametros.
96 6 Resultados
Apesar do IUKF nao convergir para os valores verdadeiros dos parametros, ele con-
verge para valores muito proximos.
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s−4
−3
−2
−1
0
1
2
3
4x 10
−3 (a)
b 1 (N
m/r
ad)
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s−4
−3
−2
−1
0
1
2
3
4x 10
−3 (b)
b 2 (N
m/r
ad)
Figura 6.13: Resultado, do UKF-π, para estimacao conjunta de estados e parametros, com dadossimulados, medindo-se as posicoes angulares a uma taxa de 20 Hz e ruıdo com desviopadrao σθ = 2 . A velocidade angular da haste 1 e medida. Em (a) e (b), as linhasgrossas pretas (–) indicam o valor verdadeiro dos dois coeficientes b1 e b2, respectivamente.As linhas solidas azuis (–) mostram o resultado obtido da estimacao conjunta de de taisparametros , e as linhas pontilhadas vermelhas(− · −) indicam tres desvios padroes para
mais e para menos (±3√
diagPpp
k |k) dos parametros estimados.
A Tabela 6.2 contem os resultados do erro medio da estimacao conjunta para difer-
entes nıveis de ruıdo nas medicoes. Os mesmos tipos de ındices sao apresentados na Tabela
6.3, porem para o caso de diferentes taxas de aquisicao da posicao angular. A analise destas
tabelas sugere que o sinal ruidoso da velocidade angular da haste 1, cuja relacao sinal-ruıdo
esta ajustada em 26dB, nao contribui efetivamente para as estimativas dos parametros visto
que os valores de desempenho nao sofrem variacoes significativas quando tal sinal esta pre-
sente. Por isso, recomenda-se que o sinal da velocidade angular tenha nıvel de contaminacao de
ruıdo tal que a relacao sinal-ruıdo seja superior a 26dB para que as estimativas dos parametros
sejam melhores.
Os diagramas das figuras 6.16 e 6.17 mostram os valores medios dos parametros
obtidos nestas simulacoes. Percebe-se que o IUKF produz estimativas mais proximas dos
valores reais. Alem disso, o UKF apresenta grande dificuldade em estimar o coeficiente de
6.2 Resultados Simulados 97
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s−4
−3
−2
−1
0
1
2
3
4x 10
−3 (a)
b 1 (N
m/r
ad)
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s−4
−3
−2
−1
0
1
2
3
4x 10
−3 (b)
b 2 (N
m/r
ad)
Figura 6.14: Resultado, do IUKF, para estimacao conjunta de estados e parametros, com dados simu-lados, medindo-se as posicoes angulares a uma taxa de 20 Hz e ruıdo com desvio padraoσθ = 2 . A velocidade angular da haste 1 e medida. Em (a) e (b), as linhas grossas pretas(–) indicam o valor verdadeiro dos dois coeficientes b1 e b2, respectivamente. As linhassolidas azuis (–) mostram o resultado obtido da estimacao conjunta de de tais parametros, e as linhas pontilhadas vermelhas(− · −) indicam tres desvios padroes para mais e para
menos (±3√
diagPpp
k |k) dos parametros estimados.
atrito viscoso da junta 2, b2.
98 6 Resultados
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s
10−6
10−4
10−2
100
(a)
log(
e b 1,k|k
(N
m/r
ad))
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s
10−6
10−4
10−2
100
(b)
log(
e b 2,k|k
(N
m/r
ad))
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s
10−4
10−2
100
102
104
(c)
log(
e θ 2• ,k|k
(m
/s))
Figura 6.15: Erro de estimacao, em escala logarıtmica, dos dois parametros estimados, (a)b1 e (b)b2,e do estado nao medido (c)θ2, referentes aos graficos das figuras 6.13 e 6.14. Os errossao indicados por linhas solidas (–) vermelhas, no caso do UKF-π, e por linhas solidas(–) bege, no caso do IUKF. Os erros de estimacao possuem como referencia a linha do
intervalo de confianca, ±3√
diagP44
(i,i),k |k, indicado pela linha tracejada (- -) azul, no
caso do UKF-π, e linha tracejada (- -) rosa, no caso do IUKF.
Tabela 6.2: Media do ındice RMSE para uma simulacao Monte-Carlo com 5 realizacoes paraestimacao conjunta de estados e parametros do pendulo duplo caotico para quatro casosdiferentes de nıvel de ruıdo nas observacoes.
SNRθ2 (/s) b1 (Nm/rad) b2 (Nm/rad)
UKF-π IUKF UKF-π IUKF UKF-π IUKF
yk = [θ1 θ1 θ2]T
50 dB (ρ = 1) 316,81 244,27 0,0024 0,000065 0,00056 0,000158
30 dB (ρ = 10) 283,90 222,50 0,0026 0,000109 0,000754 0,000094
25 dB (ρ = 20) 243,32 403,27 0,0038 0,000049 0,0014 0,000094
18 dB (ρ = 50) 282,32 391,00 0,0118 0,00011 0,0036 0,000126
12 dB (ρ = 100) 341,58 435,36 0,0079 0,000082 0,0041 0,000157
yk = [θ1 θ2]T
50 dB (ρ = 1) 62,77 594,94 0,0059 0,000519 0,0014 0,000155
30 dB (ρ = 10) 643,1 480,76 0,0028 0,000357 0,0027 0,000178
25 dB (ρ = 20) 727,33 495,87 0,0117 0,000233 0,0125 0,000267
18 dB (ρ = 50) 767,33 740,36 0,0293 0,000249 0,0237 0,000257
12 dB (ρ = 100) 748,59 769,31 0,0265 0,000263 0,0265 0,000271
6.2 Resultados Simulados 99
Tabela 6.3: Media do ındice RMSE para uma simulacao Monte-Carlo com 5 realizacoes paraestimacao conjunta de estados e parametros do pendulo duplo caotico para quatro casosdiferentes de nıvel de ruıdo nas observacoes.
Tpaθ2 (/s) b1 (Nm/rad) b2 (Nm/rad)
UKF-π IUKF UKF-π IUKF UKF-π IUKF
yk = [θ1 θ1 θ2]T
25 ms (40 fps) 338,98 278,70 0,0028 0,000103 0,000611 0,000136
50 ms (20 fps) 163,71 546,34 0,0014 0,000187 0,000465 0,000134
250 ms (4 fps) 352,25 457,16 0,0051 0,000077 0,0015 0,000139
500 ms (2 fps) 319,42 343,31 0,0083 0,000148 0,0031 0,000067
yk = [θ1 θ2]T
25 ms (40 fps) 40,86 576,71 0,000222 0,000549 0,000064 0,000239
50 ms (20 fps) 885,41 809,40 0,000275 0,000472 0,000917 0,000229
250 ms (4 fps) 1769,9 1027,0 0,0124 0,000328 0,0112 0,000134
500 ms (2 fps) 1632,6 1141,1 0,0034 0,000325 0,0030 0,000133
Figura 6.16: Diagramas de estimacao dos coeficientes de atrito viscoso, b1 e b2, das juntas do penduloduplo, para diferentes relacoes sinal-ruıdo das medicoes das posicoes angulares. E medidaa velocidade angular da haste 1. Em cada eixo do grafico, e marcado o valor medio doparametro estimado apos simulacao Monte-Carlo com 5 realizacoes. Os pontos marcadossao ligados formando, assim, um polıgono. O polıgono com os valores reais e o pentagonode linha solida (–) preta. O polıgono obtido pelo UKF-π e formado pela linha solida (–)cinza escuro, e o polıgono obtido pelo IUKF e formado pela linha tracejada (- -) cinzaclaro. Em (a), mostra-se o diagrama do atrito viscoso da junta 1, b1. E, em (b), oresultado para o atrito viscoso da junta 2, b2.
Para finalizar os teste de estimacao conjunta de parametros e estados, avalia-se a
100 6 Resultados
Figura 6.17: Diagramas de estimacao dos coeficientes de atrito viscoso, b1 e b2, das juntas do penduloduplo, para diferentes taxas de aquisicao das posicoes angulares. E medida a velocidadeangular da haste 1. Em cada eixo do grafico, e marcado o valor medio do parametroestimado apos simulacao Monte-Carlo com 5 realizacoes. Os pontos marcados sao ligadosformando, assim, um polıgono. O polıgono com os valores reais e o quadrado de linhasolida (–) preta. O polıgono obtido pelo UKF-π e formado pela linha solida (–) cinzaescuro, e o polıgono obtido pelo IUKF e formado pela linha tracejada (- -) cinza claro.Em (a), mostra-se o diagrama do atrito viscoso da junta 1, b1. E, em (b), o resultadopara o atrito viscoso da junta 2, b2.
capacidade dos filtros UKF-π e IUKF para rastrear mudanca nos valores dos parametros
do sistema. Para isso, simula-se um caso em que a junta 2 passa, a partir de determinado
momento, a apresentar amortecimento viscoso bem elevado, tal que b2 = 0,005Nm/rad. Com
esse valor de amortecimento, a haste oscila em regime periodico. Os resultados sao mostrados
nas Figuras 6.18 e 6.19. Observa-se que o resultado nao e satisfatorio. O esforco dos filtros
em acompanhar a mudanca do parametro e pouco. Interessante que o IUKF, apos o degrau
no coeficiente no coeficiente de atrito viscoso da junta 2, tende a convergir a estimativa do
coeficiente de atrito viscoso da junta 1 em direcao ao valor real deste parametro.
6.2 Resultados Simulados 101
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s−5
0
5x 10
−3 (a)
b 1 (N
m/r
ad)
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s
0
1
2
3
4
5
6x 10
−3 (b)
b 2 (N
m/r
ad)
Figura 6.18: Resultado, do UKF-π, para o teste de rastrear mudanca no parametro b2 do sistema.Sao utilizados dados simulados, medindo-se as posicoes angulares a uma taxa de 20 Hz eruıdo com desvio padrao σθ = 2 . A velocidade angular da haste 1 e medida. Em (a)e (b), as linhas grossas pretas (–) indicam o valor verdadeiro dos dois coeficientes b1 eb2, respectivamente. As linhas solidas azuis (–) mostram o resultado obtido da estimacaoconjunta de de tais parametros , e as linhas pontilhadas vermelhas(− · −) indicam tres
desvios padroes para mais e para menos (±3√
diagPpp
k |k) dos parametros estimados.
102 6 Resultados
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s−2
0
2
4
6
8
10x 10
−4 (a)
b 1 (N
m/r
ad)
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s
0
1
2
3
4
5
6x 10
−3 (b)
b 2 (N
m/r
ad)
Figura 6.19: Resultado, do UKF-π, para o teste de rastrear mudanca no parametro b2 do sistema.Sao utilizados dados simulados, medindo-se as posicoes angulares a uma taxa de 20 Hz eruıdo com desvio padrao σθ = 2 . A velocidade angular da haste 1 e medida. Em (a)e (b), as linhas grossas pretas (–) indicam o valor verdadeiro dos dois coeficientes b1 eb2, respectivamente. As linhas solidas azuis (–) mostram o resultado obtido da estimacaoconjunta de de tais parametros , e as linhas pontilhadas vermelhas(− · −) indicam tres
desvios padroes para mais e para menos (±3√
diagPpp
k |k) dos parametros estimados.
6.3 Resultados Experimentais 103
6.3 Resultados Experimentais
A seguir, utilizam-se dados experimentais coletados da plataforma do pendulo duplo
por meio do Subsistema de Interface e Coleta de Dados descrito na Secao 3.1.4.
Diferentemente dos testes com dados simulados, a matriz de covariancia do ruıdo,
Rk, nao possui o valor exato das variancias dos ruıdos das medicoes. Quanto mais proximo
a covariancia Rk estiver dos valores verdadeiros, melhor e. A variancia do ruıdo do sinal de
velocidade angular e encontrada utilizando a informacao presente no trabalho de Firmo (2007)
de que a relacao sinal-ruıdo deste sinal e de aproximadamente 54dB. Simulando o modelo
do pendulo duplo por 100 segundos, observa-se que a dispersao media da velocidade angular
e 362,4/s. Por meio da equacao (6.1), encontra-se, entao, o desvio padrao do ruıdo como
0,72/s . Com relacao ao ruıdo do sensor baseado em visao computacional, nao se dispoe de
um metodo para determina-lo. Considera-se que o desvio padrao das medicoes angulares e de
2, por observacao dos dados com o pendulo parado. A matrizes de covariancia dos erros de
processo, QUKF−πk−1 e QIUKF
k−1 , sao ajustada de forma a ajudar na convergencia e consistencia
das estimativas.
Num primeiro momento, realiza-se a estimacao dos estados e, em seguida, sao esti-
mados, conjuntamente, estados e parametros.
6.3.1 Estimacao de Estados
Como descrito na Secao 5.3, em casos experimentais, utiliza-se o sinal de inovacao
para avaliar o desempenho dos filtros uma vez que nao se conhece os valores verdadeiros
dos estados. A Figura 6.20 mostra os erros de inovacao das medicoes da velocidade angular
da haste 1 e da posicao angular da haste 2 produzidos pelos filtros UKF-π e IUKF durante
50 segundos de estimacao com dados experimentais. Observe que os erros estao dentro do
intervalo de confianca, demonstrando, assim, que as estimativas estao consistentes.
Nesse experimento, as covariancias do ruıdo de processo sao ajustadas comoQUKF−πk−1 =
diag (0,025, 0,0025, 0,25, 0,0005) e QIUKFk−1 = diag (0,025, 0,0025, 0,25, 0,004). As posicoes
angulares sao obtidas a taxa de 20Hz.
As figuras 6.21(a) e 6.21(b) mostram o retrato de fases contruıdo com as estimativas
obtidas no experimento. Percebe-se que a Figura 6.21(a) se assemelha com a Figura 5.2(a).
A fim de remover o efeito da dinamica do sensor de velocidade, refaz-se o teste
utilizando-se somente as medicoes das posicoes angulares. Com isso, obtem-se os retratos
104 6 Resultados
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s
−150
−100
−50
0
50
100
150
(a)
η θ 1• ,k|k
(° /s
)
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s−400
−300
−200
−100
0
100
200
300
400(b)
η θ 2,k|k
( ° )
Figura 6.20: Comparacao do erro de inovacao do UFK-π e IUKF para o caso experimental de estimacaode estados. Em (a), tem-se o erro de inovacao da velocidade angular da haste 1 e, em(b), tem-se o erro de inovacao para a posicao angular da haste 2. Os erros sao indicadospela cor vermelha, no caso do UKF-π, e pela cor bege, no caso do IUKF. O intervalo de
confianca ±3√
diagPyy
(i,i),k |k, onde i e o ındice da medicao, esta indicado em azul, para
o caso do UKF-π, e indicado em rosa, para o caso do IUKF.
de fase exibidos nas figuras 6.21(c) e 6.21(d). Neste caso, a Figura 6.21(c) se assemelha a
Figura 3.11, que, de fato, aproxima-se mais da dinamica exibida pelo modelo do pendulo
duplo.
No entanto, retirar a medicao da velocidade angular tem efeito prejudicial nas es-
timativas do UKF-π, como mostra a Figura 6.22. Nota-se, no intervalo de 20 a 21s, fortes
oscilacoes nas estimativas das velocidades angulares. O mesmo nao ocorre com o IUKF que,
como se ve na Figura 6.23, manteve estimativas suaves mesmo com a remocao da velocidade
angular do conjunto das variaveis medidas.
6.3.2 Estimacao Conjunta de Estados e Parametros
No experimento da estimacao conjunta, deseja-se estimar os mesmos parametros es-
timados na Secao 6.2.4, porem, a partir de dados experimentais. Outra diferenca deste teste
com o teste da Secao 6.2.4 e que o ruıdo associado a medicao da velocidade angular e mais
baixo (SNR ≈ 54dB) e o intervalo de aquisicao das posicoes angulares, Tpa, e mais curto,
25ms. Apesar das condicoes parecerem melhores, lembra-se que a medicao experimental da
velocidade angular contem informacao da dinamica do sensor, que nao e levada em conta pelo
modelo de predicao do filtro.
As figuras 6.24 e 6.25 mostram os graficos de estimacao dos parametros usando o UKF-
6.3 Resultados Experimentais 105
−3 −2 −1 0 1 2 3−30
−20
−10
0
10
20
30 (a)
θ 1• (ra
d/s)
θ1(rad) −1−0.5
00.5
1
−1
−0.5
0
0.5
1
−50
0
50
cos(θ2)
(b)
sen(θ2• )
θ 2• (ra
d/s)
−3 −2 −1 0 1 2 3−30
−20
−10
0
10
20
30 (c)
θ 1• (ra
d/s)
θ1(rad)−1
−0.50
0.51
−1−0.5
00.5
1
−50
0
50
cos(θ2)
(d)
sen(θ2• )
θ 2• (ra
d/s)
Figura 6.21: Retrato de fases da haste 1, (a) e (c), e da haste 2, (b) e (d), construıdo com os estadosestimados pelo IUKF a partir de dados experimentais coletados do pendulo duplo. Em (a)e (b), as estimativas sao geradas medindo-se as posicoes angulares e a velocidade angularda haste 1. Em (c) e (d), medem-se apenas as posicoes angulares para obter os retratosde fases.
π e o IUKF, respectivamente. E a Figura 6.26 mostra os sinais de inovacao ao longo do teste.
Os valores medios dos parametros estimados sao b1 = −0,02Nm/rad e b2 = 0,025Nm/rad
para o UKF-π; e b1 = 0,0005Nm/rad e b2 = 0,0003Nm/rad para o IUKF. Novamente, o IUKF
apresenta-se melhor que o UKF-π para o problema da estimacao conjunta. Alem disso, nota-
se uma semelhanca na trajetoria seguida pelas estimativas dos parametros com os resultados
da Secao 6.2.4, para o caso do IUKF. O UKF-π gera estimativas de parametros com valores
negativos durante intervalos de tempo apreciaveis, o que nao e adequado para o sistema sendo
identificado.
106 6 Resultados
20s 25s 30s−1145
−570
0
570
1145 (b)
θ 1• (°
/s)
t(s)
20s 25s 30s−2865
−1432
0
1432
2865 (d)
θ 2• (°
/s)
t(s)
Figura 6.22: Estimativas das velocidades angulares, dadas pelo UKF-π a partir de dados experimentais.Sao consideradas duas situacoes. A primeira em que a velocidade angular da haste 1 foiutilizada pelo filtro. Nesse caso as estimativas sao indicadas pela linha solida (–) azul.E, num segundo momento, nao se utiliza a velocidade angular da haste 1. Nesse caso asestimativas sao indicadas pela linha tracejada (–) rosa.
20s 25s 30s−1145
−570
0
570
1145 (a)
θ 1• (°
/s)
t(s)
20s 25s 30s−2865
−1432
0
1432
2865 (b)
θ 2• (°
/s)
t(s)
Figura 6.23: Estimativas das velocidades angulares, dadas pelo IUKF a partir de dados experimentais.Sao consideradas duas situacoes. A primeira em que a velocidade angular da haste 1 foiutilizada pelo filtro. Nesse caso as estimativas sao indicadas pela linha solida (–) azul.E, num segundo momento, nao se utiliza a velocidade angular da haste 1. Nesse caso asestimativas sao indicadas pela linha tracejada (–) rosa.
6.3 Resultados Experimentais 107
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s
−0.03
−0.02
−0.01
0
0.01
0.02
(a)
b 1 (N
m/r
ad)
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s−0.02
−0.01
0
0.01
0.02
0.03
(b)
b 2 (N
m/r
ad)
Figura 6.24: Resultado, do UKF-π, para estimacao conjunta de estados e parametros, com dadosexperimentais, medindo-se, alem da velocidade angular da haste 1, as posicoes angularesa uma taxa de 40 Hz. Em (a), (b), e (c), as linhas grossas pretas (–) indicam o valordos tres coeficientes b1, b2 e kt, respectivamente, do modelo do pendulo duplo obtido em5.1.2. As linhas solidas azuis (–) mostram o resultado obtido da estimacao conjunta de detais parametros , e as linhas pontilhadas vermelhas(− · −) indicam tres desvios padroes
para mais e para menos (±3√
diagPpp
k |k) dos parametros estimados.
108 6 Resultados
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s−0.02
−0.015
−0.01
−0.005
0
0.005
0.01
0.015
0.02 (a)
b 1 (N
m/r
ad)
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s
−0.015
−0.01
−0.005
0
0.005
0.01
0.015
0.02 (b)
b 2 (N
m/r
ad)
Figura 6.25: Resultado, do IUKF, para estimacao conjunta de estados e parametros, com dados ex-perimentais, medindo-se, alem da velocidade angular da haste 1, as posicoes angulares auma taxa de 40 Hz. Em (a), (b), e (c), as linhas grossas pretas (–) indicam o valor dostres coeficientes b1, b2 e kt, respectivamente, do modelo do pendulo duplo obtido em 5.1.2.As linhas solidas azuis (–) mostram o resultado obtido da estimacao conjunta de de taisparametros , e as linhas pontilhadas vermelhas(− · −) indicam tres desvios padroes para
mais e para menos (±3√
diagPpp
k |k) dos parametros estimados.
6.3 Resultados Experimentais 109
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s−200
−150
−100
−50
0
50
100
150
200(a)
η θ 1• ,k|k
(° /s
)
0s 5s 10s 15s 20s 25s 30s 35s 40s 45s−500
0
500(b)
η θ 2,k|k
( ° )
Figura 6.26: Comparacao do erro de inovacao do UFK-π e IUKF para o caso experimental de estimacaoconjunta de estados e parametros apresentados nas figuras 6.26-6.24, respectivamente.Em (a), tem-se o erro de inovacao da velocidade angular da haste 1 e, em (b), tem-seo erro de inovacao para a posicao angular da haste 2. Os erros sao indicados pela corvermelha, no caso do UKF-π, e pela cor bege, no caso do IUKF. O intervalo de confianca
±3√
diagPyy
(i,i),k |k, onde i e o ındice da medicao, esta indicado em azul, para o caso do
UKF-π, e indicado em rosa, para o caso do IUKF.
Capıtulo 7
Conclusoes e Propostas de Continuidade
“Ainda que eu falasse a lıngua dos anjos e dos homens, se nao tivesse amor, eu nada seria.”
Apostolo Paulo
7.1 Discussao e Conclusoes
Este trabalho cumpre os objetivos que foram propostos. Parte dos resultados aqui
apresentados encontra-se em (Rezende et al., 2010).
Implementam-se os algoritmos de filtragem de Kalman para sistemas nao-lineares
baseados na abordagem por pontos sigma, a saber, o filtro de Kalman unscented (UKF)
e o filtro de Kalman unscented intervalar (IUKF), para estimacao conjunta de estados e
parametros de um pendulo duplo caotico experimental. Esse ultimo filtro, o IUKF, contempla
uma maneira de acresentar informacao a priori, sobre os estados, escrita na forma de intervalos.
No caso do pendulo, um tipo de informacao a priori e que a posicao angular das hastes oscila
dentro da faixa [−π,π].
Os filtros implementados sao capazes de tratar dados de fontes sensoras recebidos em
diferentes intervalos de amostragem desde que sejam sıncronas. Para o caso deste trabalho,
tais intervalos de amostragem devem ser multiplos de 5ms, mas, esse parametro pode ser
alterado para outras aplicacoes.
Deriva-se, tambem, um modelo para o pendulo duplo da plataforma experimental
estudada utilizando-se a abordagem de Lagrange. Tal modelo apresenta mais claramente as
parcelas conservativas e nao-conservativas que compoe o sistema em contrapartida ao modelo
derivado segundo as equacoes de Newton.
Aplica-se os filtros UKF e IUKF na estimacao de estados e parametros do pendulo
duplo caotico usando, inicialmente, dados simulados e, por ulitmo, dados experimentais. Um
112 7 Conclusoes e Propostas de Continuidade
recurso para coletar experimentalmente dados da velocidade angular da haste 1 ja estava
disponıvel antes mesmo da realizacao deste trabalho. Porem, para ser posıvel medir as posicoes
angulares, desenvolveu-se um sensor baseado em visao computacional.
As condicoes que produzem efeito na qualidade das estimativas e que foram avaliadas,
com dados simulados, sao os tipos de medicoes, o nıvel de ruıdo nas medicoes e a esparcidade
das medicoes. Sobre essas condicoes, os filtros apresentam desempenhos diferentes, embora
fique claro que o aumeto do ruıdo e o aumento da esparcidade tendem a piorar o resultado
de ambos os filtros. Na estimacao puramente de estados, o UKF-π mostra-se melhor que o
IUKF. Porem, no caso da estimacao conjunta de estados e parametros, o IUKF se mostra
melhor que o UKF-π.
E possıvel estimar os quatro estados do sistema por meio da medicao de uma variavel
de estado, por exemplo, a velocidade angular da haste 1, que e aquela que apresenta a maior
taxa de disponibilidade para o filtro, 200Hz. Porem, deve-se observar a questao do ruıdo.
O que se sabe e que, para estimacao de estados com dados experimentais, utilizar somente
a velocidade angular da haste 1 nao e aconselhavel ja que a medicao da mesma contem
informacao dinamica do sensor, que, por sua vez, nao e considerada no processo de filtragem.
Como foi visto, acrescentar as medicoes das posicoes angulares melhora consideravel-
mente o desempenho do filtro principalmente se existir ao menos uma medicao a respeito de
cada uma das duas hastes, como por exemplo, se se medir a velocidade angular da haste 1 e a
posicao angular da haste 2. Para evitar a contra-indicacao de se utilizar a velocidade angular
da haste 1, para dados experimentais, verificou-se a possibilidade da estimacao utlizando-se
somente medicoes das posicoes angulares. Os resultados nessa configuracao sao bons e muito
uteis para o caso da caracterizacao dinamica do sistema. Porem, sofre do fator limitante
que e a taxa de processamento do sensor baseado em visao computacional cujo valor maximo
alcancado neste trabalho foi de 40Hz.
O modelo matematico tambem e um fator crucial na questao do desempenho do filtro
para dados experimentais apesar de que, neste trabalho, por se ter um conhecimento razoavel
a respeito das equacoes que governam o sistema, acredita-se que o modelo nao seja uma fonte
de muita incerteza. Alem disso, por se tratar de um modelo baseado na fısica do processo, a
estimacao de alguns de seus parametros e algo bem interessante devido ao apelo fısico. Neste
trabalho, obteve-se bons resultados na estimacao dos coeficientes de atrito viscoso das duas
juntas do pendulo duplo utilizando-se o filtro IUKF.
7.2 Trabalhos Futuros 113
7.2 Trabalhos Futuros
Uma das dificuldades deste trabalho foi com relacao a sintonia das matrizes de covari-
ancia do ruıdo de processo e de medicao. Para o caso experimental, nao se dispos de metodos
precisos de estimacao dessas matrizes. Um estudo interessante seria obter valores para essas
matrizes sem ser por tentativa e erro.
Outra questao importante e com relacao ao sensor da velocidade angular da haste
1. Seria bastante util uma forma de realizar a medicao dessa velocidade com um sensor de
dinamica mais rapida.
Acredita-se que, para dar extensao a este trabalho para a area de controle, seria
necessario implementar um estimador capaz de trabalhar on-line. Para isso, um grande esforco
com relacao ao sistema de processamento de imagem e programacao em tempo real deve ser
feito.
Bibliografia
Abarbanel, H. D. I., Brown, R., e Kadtke, J. B. (1990). Prediction in chaotic nonlinear
systems: Methods for time series with broadband fourier spectra. Physical Review A,
41 (4), 1782–1807.
Abarbanel, H. D. I., Brown, R., Sidorowich, J. J., e Tsimring, L. Sh. (1993). The analysis of
observed chaotic data in physical systems. Reviews of Modern Physics, 65 (4), 1331–1392.
Abdallah, F., Gning, A., e Bonnifait, P. (2008). Box particle filtering for nonlinear state
estimation using interval analysis. Automatica, 44 (3), 807–815.
Aguirre, L. A. e Billings, S. A. (1994). Validating identified nonlinear models with chaotic
dynamics. International Journal of Bifurcation and Chaos, 4 (1), 109–125.
Aguirre, L. A., Teixeira, B. O. S., e Torres, L. A. B. (2005). Using data-driven discrete-time
models and the unscented Kalman filter to estimate unobserved variables of nonlinear
systems. Physical Review E, 72 (2),1–12.
Aguirre, L. A. e Billings, S. A. (1995). Identification of models for chaotic systems from
noisy data: implications for performance and nonlinear filtering. Physica D: Nonlinear
Phenomena, 85 (1–2), 239–258.
Alspach, D. L. e Sorenson, H. W. (1972). Nonlinear bayesian estimation using gaussian sum
approximations. IEEE Transactions on Automatic Control, 17 (4), 439–448.
Anderson, B. D. O. e Moore, J. B. (1979). Optimal Filtering (1 ed.). Information and Systems
Science Series. New Jersey: Prentice Hall, Inc.
Arasaratnam, I. e Haykin, S. (2009). Cubature kalman filters. IEEE Transactions on Auto-
matic Control, 54 (6), 1254–1269.
116 Referencias Bibliograficas
Armesto, L., Tornero, J., e Vincze, M. (2008). On multi-rate fusion for non-linear sampled-
data systems: Application to a 6D tracking system. Robotics and Autonomous Systems,
56 (8), 706–715.
Athans, M., Wishner, R. P., e Bertolini, A. (1968). Suboptimal state estimation for
Continuous-Time nonlinear systems from discrete noisy measurements. IEEE Trans-
actions on Automatic Control, 13 (5), 504–514.
Awrejcewicz, J., Kudra, G., e Wasilewski, G. (2007). Experimental and numerical investi-
gation of chaotic regions in the triple physical pendulum. Nonlinear Dynamics, 50 (4),
755–766.
Bagchi, A. e ten Brummelhuis, P. (1990). Simultaneous ML estimation of state and parameters
for hyperbolic systems with noisy boundary conditions. In Proceedings of the IEEE
Conference on Decision and Control, 1, 222–224, Honolulu , Hawaii.
Blauer, M. e Belanger, P. R. (1987). State and parameter estimation for robotic manipulators
using force measurements. IEEE Transactions on Automatic Control, 32 (12), 1055–1066.
Blazejcyk, B. e Kapitaniak, T. (1998). Co-existing attractors of impact oscillator. Chaos,
Solitons and Fractals, 9 (8), 1439–1443.
Bortoff, S. A. Robust Swing-Up control for a rotational double pendulum. In Proceedings of
the 13th IFAC World Congress, (pp. 413–418)., San Francisco, California.
Chandrasekar, J., Ridley, A. J., e Bernstein, D. S. (2007). A comparison of the extended and
unscented Kalman filters for Discrete-Time systems with nondifferentiable dynamics. In
Proceedings of the 2007 American Control Conference, (pp. 4431–4436)., New York City,
USA.
Cheng, H. D., Jiang, X. H., Sun, Y., e Wang, J. (2001). Color image segmentation: advances
and prospects. Pattern Recognition, 34 (12), 2259–2281.
Cheng, H. D., Jiang, X. H., e Wang, J. (2002). Color image segmentation based on homogram
thresholding and region merging. Pattern Recognition, 35 (2), 373–393.
Cheng, H. D. e Shi, X. J. (2004). A simple and effective histogram equalization approach to
image enhancement. Digital Signal Processing: A Review Journal, 14 (2), 158–170.
Referencias Bibliograficas 117
Christini, D. J., Collins, J. J., e Linsay, P. S. (1996). Experimental control of high-dimensional
chaos: The driven double pendulum. Physical Review E, 54 (5), 4824–4827.
Cox, H. (1964). On the estimation of state variables and parameters for noisy dynamic
systems. IEEE Transactions on Automatic Control, 9 (1), 5–12.
Daum, F. (2005). Nonlinear filters: Beyond the Kalman filter. IEEE Aerospace and Electronic
Systems Magazine, 20 (8), 57–69.
Davis, M. (1981). New approach to filtering for nonlinear systems. IEE Proceedings D Control
Theory and Applications, 128 (5), 166–172.
de Paula, A. S., Savi, M. A., e Pereira-Pinto, F. H. I. (2006). Chaos and transient chaos in
an experimental nonlinear pendulum. Journal of Sound and Vibration, 294 (3), 585–595.
Dempster, A., Laird, N., e Rubin, D. (1977). Maximum likelihood from incomplete data via
the EM algorithm. Journal of the Royal Statistical Society, 39 (1), 1–38.
Djuric, P. M., Kotecha, J. H., Zhang, J., Huang, Y., Ghirmai, T., Bugallo, M. F., e Mıguez,
J. (2003). Particle filtering. IEEE Signal Processing Magazine, 20 (5), 19–38.
Doucet, A., Godsill, S., e Andrieu, C. (2000). On sequential monte carlo sampling methods
for bayesian filtering. Statistics and Computing, 10 (3), 197–208.
Drake, D. (1996). Minimum mean square error estimation for a class of chaotic systems.
Espinoza-Quesada, E. S. e Ramos-Velasco, L. (2006). Vision based control of an underactu-
ated system using a reduced observer. In Proceedings of the Electronics, Robotics and
Automotive Mechanics Conference, CERMA 2006, 1 , 9–14.
Evensen, G. (1997). Advanced data assimilation for strongly nonlinear dynamics. Monthly
Weather Review, 125 (6), 1342–1354.
Farrell, J. A. (2009). Aided Navigation: GPS with high rate sensors (International Edition
ed.). Taiwan: McGraw-Hill.
Feeny, B. F. (2009). Estimating damping parameters in multi-degree-of-freedom vibration
systems by balancing energy. Journal of Vibration and Acoustics, 131 (4), 041005–041014.
Feeny, B. F. e Moon, F. C. (1993). Bifurcation sequences of a coulomb friction oscillator.
Nonlinear Dynamics, 4 (1), 25–37.
118 Referencias Bibliograficas
Fiedler-Ferrara, N. e Prado, C. (2009). Caos, Uma Introducao (Second ed.). Sao Paulo, Brasil:
Edgard Blucher.
Firmo, D. (2007). Construcao e Caracterizacao de um Pendulo Duplo Caotico. Disertacao de
Mestrado, Programa de Pos-Graduacao em Engenharia Eletrica, Universidade Federal de
Minas Gerais.
Firmo, D., Torres, L., e Nepomuceno, E. (2007). Simulation and dynamical characterization of
an active mechanical chaotic double pendulum. In Procedings of COBEM 2007, Brasılia,
DF, Brazil. ABCM.
Franca, L. e Savi, M. (2001). Distinguishing periodic and chaotic time series obtained from
an experimental nonlinear pendulum. Nonlinear Dynamics, 26 (3), 253–271.
Gertner, I. (1978). An alternative approach to nonlinear filtering. Stochastic Processes and
their Applications, 7 (3), 231–246.
Gonzalez, R. e Woods, R. (2002). Digital Image Processing (Second ed.). Prentice Hall, Inc.
Grassberger, P., Hegger, R., Kantz, H., e Schaffrath, C. (1993). On noise reduction methods
for chaotic data. Chaos, 3 (2), 127–141.
Heald, J. P. M. e Stark, J. (2000). Estimation of noise levels for models of chaotic dynamical
systems. Physical Review Letters, 84 (11), 2366–2369.
Hegger, R., Kantz, H., e Schreiber, T. (1999). Practical implementation of nonlinear time
series methods: The TISEAN. Chaos, 9 (2), 413–435.
Hinrichs, N., Oestreich, M., e Popp, K. (1997). Dynamics of oscillators with impact and
friction. Chaos, Solitons and Fractals, 8 (4), 535–558.
Horton, B., Wiercigroch, M., e Xu, X. (2008). Transient tumbling chaos and damping iden-
tification for parametric pendulum. Philosophical Transactions of The Royal Society,
366 (1866), 767–784.
Huang, K.-Q., Wang, Q., e Wu, Z.-Y. (2006). Natural color image enhancement and evaluation
algorithm based on human visual system. Computer Vision and Image Understanding,
103 (1), 52–63.
Inman, D. J. (2001). Engineering Vibrations (2 ed.). New Jersey, USA: Prentice-Hall.
Referencias Bibliograficas 119
Jazwinski, A. H. (1970). Stochastic processes and Filtering Theory (1 ed.). New York: Aca-
demic Press, Inc.
Julier, S. e Uhlmann, J. (1997). A new extension of the Kalman filter to nonlinear systems.
In International Symposium on Aerospace/Defense Sensing, Simulation and Controls, 3 ,
26–37.
Julier, S., Uhlmann, J., e Durrant-Whyte, H. (2000). A new method for the nonlinear trans-
formation of means and covariances in filters and estimators. IEEE Transactions on
Automatic Control, 45 (3), 477–482.
Kaiqi, H., Zhenyang, W., e Qiao, W. (2005). Image enhancement based on the statistics of
visual representation. Image and Vision Computing, 23 (1), 51–57.
Kalman, R. (1960). A new approach to linear filtering and prediction problems. Transactions
of the ASME - Journal of Basic Engineering, 82, 35–45.
Kapitaniak, T. (1990). Chaos in systems with noise (Second ed.). Singapore: World Scientific.
Kelly, S. G. (2000). Fundamentals of Mechanical Vibrations (2 ed.). Singapore: McGraw-Hill.
Khalil, M., Sarkar, A., e Adhikari, S. (2009). Nonlinear filters for chaotic oscillatory systems.
Nonlinear Dynamics, 55 (1–2), 113–137.
Kiyoumarsi, A., Ataei, M., e Ashrafi, R. (2007). The mathematical modeling of a Double-
Pendulum system as a physical model of flexible arm robot. (pp. 1900–1904)., Guangzhou,
China.
Ko, S.-J. e Lee, Y. H. (1991). Center weighted median filters and their applications to image
enhancement. IEEE Transactions on Circuits and Systems, 38 (9), 984–993.
Kurian, A. P. e Puthusserypady, S. (2006). Unscented Kalman filter and particle filter for
chaotic synchronization. In Proceedings of IEEE Asia-Pacific Conference on Circuits and
Systems, 1830–1834.
Lefebvre, T., Bruyninckx, H., e Schutter, J. (2004). Kalman filters for non-linear systems: a
comparison of performance. International Journal of Control, 77 (7), 639–653.
Letellier, C., Aguirre, L., e Maquet, J. (2006). How the choice of the observable may influence
the analysis of nonlinear dynamical systems. Communications in Nonlinear Science and
Numerical Simulation, 11 (5), 555–576.
120 Referencias Bibliograficas
Liang, J. (2007). Damping estimation via energy-dissipation method. Journal of Sound and
Vibration, 307 (1–2), 349–364.
Liang, J. e Feeny, B. F. (2004). Identifying coulomb and viscous friction in forced dual-damped
oscillators. Journal of Vibration and Acoustics, 126 (1), 118–125.
Liu, B. e Hu, H. (2010). Group delay induced instabilities and hopf bifurcations, of a controlled
double pendulum. International Journal of Non-Linear Mechanics, 45 (4), 442–452.
Majji, M., Junkins, J. L., e Turner, J. D. (2010). A perturbation method for estimation of
dynamic systems. Nonlinear Dynamics, 60 (3), 303–325.
Mann, B. P. e Khasawneh, F. A. (2009). An energy-balance approach for oscillator parameter
identification. Journal of Sound and Vibration, 321 (1–2), 65–78.
Mariani, S. e Ghisi, A. (2007). Unscented Kalman filtering for nonlinear structural dynamics.
Nonlinear Dynamics, 49 (1–2), 131–150.
Maybeck, P. (1979). Introduction. In Stochastic models, estimation and control, volume I (pp.
1–16). Lodon: Academic Press, Inc.
Meng, X. e Rubin, D. (1993). Maximum likelihood estimation via the ECM algorithm: A
general framework. Biometrika, 80 (2), 267–278.
Merwe, R., Freitas, N., Doucet, A., e Wan, E. (2000). The unscented particle filter. Relatorio
Tecnico, Departamento de Engenharia da Universidade de Cambridge, 1–45.
Merwe, R., Wan, E., e Julier, S. (2004). Sigma-Point Kalman filters for nonlinear estimation
and Sensor-Fusion - applications to integrated navigation -. Technical report, American
Institute of Aeronautics and Astronautics.
Moireau, P., Chapelle, D., e Tallec, P. (2008). Joint state and parameter estimation for
distributed mechanical systems. Computer methods in applied mechanics and engineering,
197, 659–677.
Monteiro, L. (2006). Sistemas Dinamicos (2 ed.). Sao Paulo, Brasil: Livraria da Fısica.
Mulder, J., Chu, Q., Sridhar, J., Breeman, J., e Laban, M. (1999). Non-linear aircraft flight
path reconstruction review and new advances. Progress in Aerospace Sciences, 35 (7),
673–726.
Referencias Bibliograficas 121
Naik, S. K. e Murthy, C. A. (2003). Hue-preserving color image enhancement without gamut
problem. IEEE Transactions on Image Processing, 12 (12), 1591–1598.
Nelson, L. e Stear, E. (1976). The simultaneous On-Line estimation of parameters and states
in linear systems. IEEE Transactions on Automatic Control, 21 (1), 94–98.
Norgaard, M., Poulsen, N., e Ravn, O. (2000). Advances in Derivative-Free state estimation
for nonlinear systems. Technical IMM-REP-1998-15, Technical University of Denmark,
Lyngby, Denmark.
Ohta, Y.-I., Kanade, T., e Sakai, T. (1980). Color information for region segmentation.
Computer Graphics and Image Processing, 13 (3), 222–241.
Orrell, D. (2005). Filtering chaos: A technique to estimate dynamical and observational noise
in nonlinear systems. International Journal of Bifurcation and Chaos, 15 (1), 99–107.
Pal, N. R. e Pal, S. K. (1993). A review on image segmentation techniques. Pattern Recogni-
tion, 26 (9), 1277–1294.
Palmer, T. N. (2000). Predicting uncertainty in forecasts of weather and climate. Reports on
Progress in Physics, 63 (2), 71–116.
Papadopoulos, H. e Wornell, G. (1995). Maximum-Likelihood estimation of a class of chaotic
signals. IEEE Transactions on Information Theory, 41 (1), 312–317.
Polesel, A., Ramponi, G., e Mathews, V. J. (2000). Image enhancement via adaptive unsharp
masking. IEEE Transactions on Image Processing, 9 (3), 505–510.
Pratt, W. (2001). Digital Image Processing: PIKS Inside (Third ed.). John Wiley e Sons,
Inc.
Qi, G., Du, S., Chen, G., Chen, Z., e Yuan, Z. (2005). On a four-dimensional chaotic system.
Chaos, Solitons and Fractals, 23 (5), 1671–1682.
Ray, L. R. (1995). Nonlinear state and tire force estimation for advanced vehicle control.
IEEE Transactions on Control System Technology, 3 (1), 117–124.
Rezende, E. F. A., Teixeira, B. O. S., e Torres, L. A. B. (2010). Estimacao de estados
e parametros de um pendulo duplo caotico. Anais do XVIII Congresso Brasileiro de
Automatica, (pp. 810–817)., Bonito, MS, Brasil.
122 Referencias Bibliograficas
Rhodes, I. (1971). A tutorial introduction to estimation and filtering. IEEE Transactions on
Automatic Control, 16 (6), 688–706.
Richard, M. (1992). Probabilistic state estimation with Discrete-Time chaotic systems. Tech-
nical RLE Technical Report no. 571, Massachusetts Institute of Technology, Research
Laboratory of Electronics.
Rifai, K. E., Haller, G., e Bajaj, A. K. (2007). Global dynamics of an autoparametric spring
mass pendulum system. Nonlinear Dynamics, 49 (1–2), 105–116.
Salapaka, S., Dahleh, M., e Giarre, L. (1997). Filtering of nonlinear chaotic time-series with
noise. In Proceedings of the 36th Conference on Decision e Control, (pp. 1669–1671).,
San Diego, California, USA.
Sarkka, S. (2007). On unscented kalman filtering for state estimation of Continuous-Time
nonlinear systems. IEEE Transactions on Automatic Control, 52 (9), 1631–1641.
Schreiber, T. (1993). Extremely simple nonlinear noise-reduction method. Physical Review
E, 47 (4), 2401–2404.
Sharma, S. N. e Parthasarathy, H. (2008). A two-body continuous-discrete filter. Nonlinear
Dynamics, 51 (1–2), 155–170.
Simon, D. (2006). Optimal State Estimation (1 ed.). New Jersey: John Wiley e Sons,Inc.
Sitz, A., Schwarz, U., e Kurths, J. (2004). The unscented Kalman filter, a powerful tool for
data analysis. International Journal of Bifurcation and Chaos, 14 (6), 2093–2105.
Sitz, A., Schwarz, U., Kurths, J., e Voss, H. (2002). Estimation of parameters and unobserved
components for nonlinear systems from noisy time series. Physical Review, 66 (016210),
9.
Smith, D. e Singh, S. (2006). Approaches to Multi-Sensor data fusion in targeting tracking:
A survey. IEEE Transactions on Knowledge and Data Engineering, 18 (2), 1696–1710.
So, P., Ott, E., e Dayawansa, W. P. (1994). Observing chaos: Deducing and tracking the
state of a chaotic system from limited observation. Physical Review E, 49 (4), 2650–2660.
Soroush, M. (1998). State and parameter estimation and their application in process control.
Computers e Chemical Engineering, 23 (2), 229–245.
Referencias Bibliograficas 123
Teeple, T., Castaneta, M., Deluzio, K., e Bryant, T. (2009). Pendulum-based method for
determining the temporal accuracy of digital video-based motion capture systems. Gait
e Posture, 29 (2), 349–353.
Teixeira, B. O. S. (2008). Estimacao de Estados com Restricoes para Sistemas Dinamicos
Lineares e Nao-Lineares. Tese de Doutorado, Programa de Pos-Graduacao em Engenharia
Eletrica, Universidade Federal de Minas Gerais.
Teixeira, B. O. S., Torres, L. A. B., e Aguirre, L. A. (2010). Filtragem de Kalman com restri-
coes para sistemas Nao-Lineares: revisao e novos resultados. Sba Controle e Automacao,
21 (2), 127–146.
Teixeira, B. O. S., Torres, L. A. B., Aguirre, L. A., e Bernstein, D. S. (2009). On unscented
Kalman filtering with state interval constraints. Journal of Process Control, 20 (1), 45–57.
Teixeira, B. O. S., Torres, L. A. B., Oliveira, P. H. A. O., e Aguirre, L. A. (2005). Flight
path reconstruction using the unscented Kalman filter algorithm. In Procedings of 18th
International Congress of Mechanical Engineering, Ouro Preto, MG.
Teixeira, B. O. S., Santillo, M. A., Erwin, R. S., e Bernstein, D. S. (2008). Spacecraft tracking
using Sampled-Data Kalman filters. IEEE Control Systems Magazine, 28 (4), 78–94.
Thums, G. D. (2008). Construcao e implementacao de um pendulo duplo caotico. Relatorio
Final de Atividades de Iniciacao Cientıfica, Programa PI BIC/CNPQ, Departamento de
Engenharia Eletronica, Universidade Federal de Minas Gerais.
Togneri, R. e Deng, L. (2003). Joint state and parameter estimation for a Target-Directed
nonlinear dynamic system model. IEEE Transactions on Signal Processing, 51 (12), 3061–
3070.
Tu, Y.-W. e Ho, M.-T. (2010). Design and implementation of dsp and fpga-based robust visual
servoing control of an inverted pendulum. In Procedings of the 2010 IEEE International
Conference on Control Applications, (pp. 83–88)., Yokohama, Japan.
Voss, H., Timmer, J., e Kurths, J. (2004). Nonlinear dynamical system identification from
uncertain and indirect measurements. International Journal of Bifurcation and Chaos,
14 (6), 1905–1933.
124 Referencias Bibliograficas
Walker, D. M. e Mess, A. I. (1996). Noise reduction of chaotic systems by Kalman filtering
and by shadowing. International Journal of Bifurcation and Chaos in Applied Sciences
and Engineering, 7 (3), 769–779.
Wan, E., Merwe, R., e Nelson, A. (1999). Dual estimation and the unscented transformation.
Technical report, Oregon Graduate Institute of Science e Technology, Portland, Oregon.
Wang, H., Chamroo, A., Vasseur, C., e Koncar, V. (2008). Hybrid control for vision based
cart-inverted pendulum system. In 2008 American Control Conference, (pp. 3845–3850).,
Seattle, Washington, USA. AACC.
Wang, H., Chamroo, A., Vasseur, C., Koncar, V., e Christov, N. (2010). Modelling and
trajectory tracking control of a 2-dof vision based inverted pendulum. Control Engineering
and Applied Informatics, 12 (3), 59–66.
Weinstein, L. e Adam, J. A. (2008). Guesstimation: solving the world’s problems on the back
of a cocktail napkin (1 ed.). New Jersey, Princeton: Princeton University Press.
Wenzel, L., Vazquez, N., Nair, D., e Jamal, R. (2000). Computer vision based inverted
pendulum. IEEE Instrumentation and Measurement Technology Conference, 3 , 1319–
1323.
Wheeler, T. e Packard, A. (2009). An extension of Sigma-Point Kalman filtering using nonli-
near estimator bases. (pp. 1861–1864)., Hyatt Regency Riverfront, St. Louis, MO, USA.
Wit, C. C., Olsson, H., Astrom, K. J., e Lischinsky, P. (1995). A new model for control of
systems with friction. IEEE Transactions on Automatic Control, 40 (3), 419–425.
Xiaolin, R. e Guangrui, H. (1998). Parameter estimation and filtering for chaotic time series
by steepest descent. In Proceedings of ICSP ’98, (pp. 217–220).
Xue-Dong, W. e Zhi-Huan, S. (2008). GEKF, GUKF and GGPF based prediction of chaotic
time-series with additive and multiplicative noises. Chinese Physics, 17 (9), 3241–3246.
Zhai, T., Yaz, E., e Ruan, H. (2004). Minimum variance estimator design for systems with
quadratic nonlinearities. In Proceedings of 2004 IEEE Electro/Information Technology
Conference, (pp. 183–189).
Ziman, M., Plesch, M., Buzek, V., e Stelmachovic, P. (2005). Process reconstruction: From
unphysical to physical maps via maximum likelihood. Physical Review, 72, 5.
Recommended