Upload
vophuc
View
214
Download
0
Embed Size (px)
Citation preview
UNIVERSIDADE DE SÃO PAULO
ESCOLA DE ENGENHARIA DE SÃO CARLOS
DEPARTAMENTO DE ENGENHARIA MECÂNICA
Rafael Gomes Gobbo
GERAÇÃO DE TRAJETÓRIAS ESTÁVEIS PARA EXOESQUELETOS
DE MEMBROS INFERIORES UTILIZANDO OSCILADORES
NEURAIS
São Carlos – SP
2011
Rafael Gomes Gobbo
GERAÇÃO DE TRAJETÓRIAS ESTÁVEIS PARA EXOESQUELETOS
DE MEMBROS INFERIORES UTILIZANDO OSCILADORES
NEURAIS
Trabalho de Conclusão
de Curso apresentado à
Escola de Engenharia de São
Carlos da Universidade de
São Paulo como parte dos
requisitos para graduação
em Engenharia Mecatrônica.
Orientador: Prof. Dr. Adriano Almeida Gonçalves Siqueira
São Carlos – SP
2011
AUTORIZO A REPRODUÇÃO E DIVULGAÇÃO TOTAL OU PARCIAL DESTE TRABALHO, POR QUALQUER MEIO CONVENCIONAL OU ELETRÔNICO, PARA FINS DE ESTUDO E PESQUISA, DESDE QUE CITADA A FONTE.
Ficha catalográfica preparada pela Seção de Tratamento da Informação do Serviço de Biblioteca – EESC/USP
Gobbo, Rafael Gomes.
G575g Geração de trajetórias estáveis para exoesqueletos de
membros inferiores utilizando osciladores neurais. /
Rafael Gomes Gobbo ; orientador Adriano Almeida
Gonçalves Siqueira –- São Carlos, 2011.
Monografia (Graduação em Engenharia Mecatrônica) --
Escola de Engenharia de São Carlos da Universidade
de São Paulo, 2011.
1. Redes neurais. 2. Exoesqueleto. 3. Auto-adaptação.
I. Titulo.
Dedicatória
Agradeço a Deus, em suas várias
formas de manifestação:
...nas experiências que tive, que
fizeram de mim quem sou hoje
...na família e nos amigos que
tenho, que me darão forças amanhã
...e no sentimento de um amanhã
melhor, de onde olharei para trás
e direi que valeu a pena.
Resumo
O relatório então presente mostra o desenvolvimento do
estudo acerca do tópico proposto, qual seja geração de
trajetórias estáveis para exoesqueletos de membros inferiores. O
trabalho aqui apresentando conclui a abordagem do assunto desde
o estudo inicial e implementação do gerador de trajetórias
estáveis para exoesqueletos de membros inferiores até a
adaptação de marcha durante o caminhar para alguns tipos de
realimentação.
Assim sendo, procurou-se desenvolver e simular redes
compostas por osciladores neurais e seus neurônios a fim de
entender o comportamento do modelo, viabilizando partir para o
conseguinte tema proposto, sobre adaptação do padrão de marcha.
O estudo sobre os tipos de realimentação e os respectivos
impactos comportamentais no sistema foi de alta importância para
que o estudo se tornasse mais refinado e prático.
As aplicações de um gerador de trajetórias que receba
realimentação do ambiente são, por exemplo, possibilitar a
criação de padrões de caminhada e marcha auto-adaptativos para
robôs e também auxiliar no processo de reabilitação de
pacientes, onde a interação entre o paciente e o sistema fará as
vezes do estímulo de realimentação do ambiente externo.
Palavras-chave: Redes neurais, Exoesqueleto, Auto-adaptação.
Abstract
The report now presented shows the development of the study
on the proposed topic, namely the generation of stable
trajectories for lower limb exoskeletons. The work presented
here concludes the initial approach of the matter since the
early study and implementation of the stable trajectories
generator for exoskeletons up to the auto-adaptation of the
walking gait itself given a variety of feedback inputs.
Therefore, we sought to develop and simulate neural
networks consisting of oscillators and their neurons in order to
understand the behavior of the model, thus allowing leave for
the proposed theme, on adaptation of the gait pattern. The study
on the types of feedback and their behavioral effects in the
system was of high importance for the study to become more
refined and practical.
The application of a trajectory generator that receives
feedback of the environment are, for example, enabling the
creation of walking patterns and gaits for self-adaptive robots
and also assist in the rehabilitation process of patients, case
in which the interaction between the patient and the system will
take place of the stimulus feedback from the external
environment.
Keywords: Neural networks, Exoskeleton, self-adaptation.
Lista de Ilustrações
FIGURA 1 Lokomat ............................................ 3
FIGURA 2 Modelo do Robô ..................................... 5
FIGURA 3(a) Diagrama do sistema sem o uso de redes neurais .. 6
FIGURA 3(b) Diagrama do sistema com o uso de redes neurais .. 6
FIGURA 4(a) desejado fixo ............................. 7
FIGURA 4(b) desejado variando ......................... 7
FIGURA 5 Diagrama esquemático de dois neurônios individuais 12
FIGURA 6 Diagrama esquemático do Oscilador Matsuoka ........ 12
FIGURA 7 Entrada degrau de valor para um neurônio
individual ........................................ 13
FIGURA 8 Diagrama de blocos do oscilador Matsuoka .......... 14
FIGURA 9 Geração rítmica para entrada constante ............ 15
FIGURA 10 Entrainment do oscilador Matsuoka ................ 15
FIGURA 11 Influência da constante de tempo na freqüência 16
FIGURA 12 Conexões inibitórias entre osciladores neurais
(vermelho e verde) ............................... 19
FIGURA 13 Rede Neural com MPG em estudo (modelo 6ON) ....... 21
FIGURA 14 Nomenclatura dos pesos de conexão ................ 22
FIGURA 15 Ligação vertical ( , , ) .. 23
FIGURA 16 Ligação cruzada ( , , ) ... 23
FIGURA 17 Modelo Quadril com Joelho/Pé (modelo 2ON) ........ 24
FIGURA 18 Aplicação do ON individual com feedback .......... 26
FIGURA 19 Aplicação do ON em uma rede neural ............... 26
FIGURA 20 Quadril da perna esquerda ........................ 29
FIGURA 21 Joelho da perna esquerda otimizado (ON individual) 30
FIGURA 22 Fase Desejada entre Quadril e Joelho da perna
esquerda (modelo 2ON) ............................. 31
FIGURA 23 Fase Ótima entre Quadril e Joelho esquerda (modelo
2ON) .............................................. 31
FIGURA 24 Fase Inicial no Modelo 6 ON ...................... 32
FIGURA 25 Fase dos Quadris ajustada no Modelo 6 ON ......... 33
FIGURA 26 Fase totalmente ajustada no Modelo 6 ON .......... 34
FIGURA 27 Otimização dividido +- para o pé da perna direita 37
FIGURA 28 Otimização dividido +- para o joelho da perna
direita ........................................... 37
FIGURA 29 Otimização dividido +- para o quadril da perna
direita ........................................... 38
Lista de Tabelas
TABELA 1 Defasagem Quadril com Joelho/Pé .................. 24
TABELA 2 Execução do Otimizador ........................... 29
TABELA 3 Parâmetros Otimizados ............................ 29
TABELA 4 Tipos de feedback utilizados e suas denominações . 36
TABELA 5 Resultados para dividido +- e inteiro +- ......... 36
TABELA 6 Parâmetros otimizados para feedback dividido +- .. 38
TABELA 7 Parâmetros otimizados para feedback inteiro +- ... 39
Sumário
1. Introdução .......................................... 1
1.1. Motivação ............................................................................................................. 1
1.2. Revisão Bibliográfica ................................................................................. 2
2. Objetivos e Etapas .................................. 8
3. Osciladores Neurais ................................. 9
3.1. Modelagem Matemática do Neurônio Matsuoka ................................. 9
3.2. Oscilador Matsuoka ...................................................................................... 10
3.3. Testes Comparativos ................................................................................... 12
4. Redes Neurais ...................................... 17
4.1. Conexão Vertical e Cruzada para 2 Osciladores Neurais .. 17
4.2. Rede Neural para o Caminhar Humano ............................................... 20
4.3. Resultados ......................................................................................................... 22
5. Adaptação – Otimização dos Parâmetros .............. 26
5.1. Resultados Otimizados sem Feedback ............................................... 28
5.1.1. Juntas Individuais .............................................................................. 28
5.1.2. Modelo com 2 e 6 Osciladores Neurais ................................... 30
5.2. Resultados Otimizados com Feedback ............................................... 34
6. Conclusão .......................................... 40
7. Referências Bibliográficas ......................... 41
1
1. Introdução
1.1. Motivação
Robôs bípedes são sistemas altamente não-lineares com
complexidade de vários graus de liberdade. Entretanto, o estudo
de tais sistemas pode gerar o desenvolvimento de dispositivos a
serem utilizados pelas pessoas em diversas situações do dia-a-
dia como, por exemplo, órteses ativas para os membros
inferiores. Atualmente há uma grande escassez de ferramentas
poderosas o suficiente para realizar o seu controle em tempo
real, fazendo-se necessário o desenvolvimento de técnicas mais
eficientes do que as hoje existentes.
O controle dinâmico de tais robôs é desafiador pois deve
operar de acordo com suas variáveis de estado, atuar na presença
de um campo gravitacional e sobretudo, porém mais interessante,
de forma a se adaptar com ambientes e estímulos externos
igualmente dinâmicos. Os robôs exigem o desenvolvimento de
técnicas robustas para abranger uma vasta gama de controle, como
torque, estabilidade, trajetória e geração de ritmos dependentes
do ambiente, através de sensoriamento e percepção.
Nas décadas recentes, a robótica mundial tem focado em
pesquisas no campo de geração de trajetórias de forma geral.
Porém, o resultado destas pesquisas pode ser de grande valor
quando voltada a uma área de interesse em particular, que
consiste em auxiliar pessoas que tenham deficiência motora.
Somente no Brasil existem cerca de 8 milhões de pessoas com
deficiência motora [7], e estas pessoas necessitam de aparelhos
de suporte durante sua reabilitação. Para o bom funcionamento de
equipamentos utilizados na reabilitação de membros inferiores,
faz-se necessário considerar a geração de uma trajetória de
referência, geralmente baseada no caminhar de pessoas saudáveis,
e a adaptação dessa trajetória através da interação com o
usuário.
2
A ideia de adaptação é fazer com que o paciente interaja
com o equipamento, de forma que este forneça potência somente
quando necessário, no instante em que o usuário demonstrar
intenção de movimento. Este tipo de interação necessita de
atuadores elásticos, que reproduzem determinadas características
dos músculos humanos, sendo basicamente compostos por um motor
elétrico ou hidráulico ligado em série ao efetuador através de
molas [19][21]. Com essas características torna-se possível
implementar controles de adaptação dos movimentos com a
utilização de algoritmos capazes de captar as informações
provindas do usuário e transmiti-las de forma precisa aos
atuadores do equipamento.
1.2. Revisão Bibliográfica
A agência de defesa dos Estados Unidos, DARPA, financia a
construção de dois exoesqueletos para fins militares. Dentro
desse programa citam-se os exoesqueletos BLEEX2 (Berkeley Lower
Extremity Exoskeleton), desenvolvido na Universidade da
Califórnia e que utiliza atuadores hidráulicos acionados por uma
bomba ligada a um pequeno motor a gasolina [12][13][29] e o
Raytheon, desenvolvido pela empresa Sarcos Research Corporation.
Fora desse programa, destaca-se o desenvolvimento do HAL-5
(Hybrid Assistive Limb), da Universidade de Tsukuba, Japão. O
HAL-5 é desenvolvido para fins de reabilitação, da mesma forma
que o ReWalk, desenvolvido pela empresa Argo Medical
Technologies, em Israel. O ReWalk detecta os movimentos da parte
superior do corpo e, a partir daí, o processo de caminhada é
iniciado.
Ainda no contexto de reabilitação temos o uso de órteses do
tipo RGO (Reciprocating Gait Orthosis) para pessoas com
paraplegia, que possibilitam o caminhar através de um mecanismo
que utiliza o movimento de uma perna para provocar o movimento
da outra perna. Algumas pesquisas propõem o uso de eletrodos que
permitem a estimulação elétrica funcional dos músculos do
paciente para reduzir os esforços necessários durante o caminhar
[9][18][22]. Membros da Universidade de Delaware [1] propõem uma
3
órtese com atuação eletromecânica que usa o balanço da gravidade
para reduzir os torques requeridos pelos atuadores durante o
movimento.
Em [10] uma órtese robótica denominada Lokomat é utilizada
na reabilitação de pessoas com deficiência, Figura 1. A órtese é
fixada em uma esteira e um sistema de compensação de pesos
suporta o peso do paciente. Uma trajetória padrão é aplicada na
órtese e são utilizados algoritmos de adaptação do padrão de
marcha, que possibilitam ao paciente ter a capacidade de alterar
o padrão de marcha conforme o seu grau de locomoção voluntária
[11][20]. No caso de um exoesqueleto que se moverá livremente no
espaço, a geração de trajetórias estáveis deve ser considerada.
Em [6] é apresentada uma metodologia de geração de trajetórias
estáveis considerando o ZMP (Zero Moment Point).
Em [23] é mostrado o robô bípede Lucy, que tem um sistema
de geração de trajetórias em tempo real utilizando a equação de
momento angular para a dinâmica natural dos membros superiores.
Com isso determina-se o comportamento dos membros inferiores. Em
[14] propõe-se um gerador de trajetórias no qual o movimento do
centro de gravidade do robô é simulado por um sistema de pêndulo
invertido, e a cinemática inversa do robô é usada para calcular
Figura 1: Lokomat.
4
as posições do centro de gravidade e da extremidade do pé do
robô, que é o ponto de interesse. É utilizada em [4] uma rede
neural auto-adaptativa com algoritmos genéticos para encontrar o
melhor ponto de estabilidade ZMP, gerando assim uma trajetória
estável que permite que o robô caminhe sobre superfícies de
diferentes inclinações.
Matsuoka propõe o uso de CPGs (Central Pattern Generators)
na geração de trajetórias [17]. Os CPGs são capazes de produzir
sinais oscilatórios que simulam os estímulos nervosos existentes
durante o caminhar humano através de modelos matemáticos de
neurônios. As capacidades extensora e flexora dos músculos são
representadas pelas respostas de cada neurônio. Quando ocorre a
inibição mútua entre dois neurônios, diz-se formarem um
oscilador neural. Por sua vez, ao interligar dois ou mais
osciladores neurais obtém-se a chamada rede neural, que
possibilita a obtenção de respostas verossímeis às da situação
real [26]. Em [2] também são realizados e exibidos resultados de
testes utilizando osciladores neurais no robô QRIO para a
geração de trajetórias.
Heralic [5] avalia a realimentação em redes neurais, sendo
então mencionado que este sinal pode ser utilizado como
chaveamento durante o caminhar, ativando ou desativando
determinados osciladores neurais.
No Laboratório de Mecatrônica da USP - São Carlos está
sendo desenvolvido um exoesqueleto de membros inferiores para
auxílio de pessoas com deficiência. O exoesqueleto em questão é
baseado em uma órtese RGO e utiliza atuadores elásticos em série
para a movimentação das juntas [8]. Sensores de força do tipo
FRS (Force Resistor Sensor) são instalados em pontos de contato
com o pé para se determinar os instantes de contato com o solo.
Nesse projeto, foi considerado um gerador de trajetórias
estáveis com o uso de splines cúbicas [6].
Considerando um ciclo de caminhar contendo uma fase de
suporte duplo (ambos os pés em contato com o solo) e uma fase de
suporte simples (apenas um pé em contato com o solo), o modelo
do robô está representado na Figura 2. Trajetórias suaves são
obtidas através de interpolação por splines cúbicas, a partir de
5
pontos pré-determinados de uma trajetória considerada padrão, o
que permite a obtenção de funções deriváveis até segunda ordem.
As trajetórias dos pés podem ser parametrizadas tomando-se
a posição planar do tornozelo e o ângulo entre o pé e o
solo. Semelhantemente, o movimento do quadril também pode ser
parametrizado, tomando-se então a posição do quadril e o
ângulo entre o tronco e o plano horizontal.
A dinâmica do exoesqueleto como um todo é modelada usando a
equação básica da robótica, derivada pelo Princípio de Lagrange
em [3]. Em [15] afirma-se que o torque a ser aplicado pelos
atuadores pode ser obtido utilizando o controle torque calculado
acrescido de um controle PD.
Para realizar o processo de adaptação do padrão de marcha,
foi utilizado um algoritmo baseado na dinâmica inversa do
modelo, que trabalha via minimização dos torques provenientes da
interação usuário-órtese. Para efeito de simulações, os torques
de interação entre a órtese e o paciente são obtidos a partir de
um acoplamento virtual do tipo mola, ou seja, proporcional à
diferença entre a posição simulada e a de referência. A variação
na trajetória de referência é calculada de modo que esta
variação resulte na redução do torque ativo produzido pelo
paciente. A Figura 3(a) ilustra o sistema de adaptação baseado
na dinâmica inversa.
Com o objetivo de melhorar o desempenho do sistema de
Figura 2: Modelo do Robô.
6
geração de trajetórias e da adaptação de marcha, foi
desenvolvido um sistema de adaptação utilizando redes neurais. O
sistema de adaptação proposto emprega três redes MLPs
(Multilayer Perceptron), correspondendo a Neural Network 1, a
Neural Network 2 e a Neural Network 3, indicadas por NN1, NN2 e
NN3 respectivamente (Figura 3(b)). A finalidade da implementação
dessas três redes é reduzir o tempo gasto durante o processo de
optimização e adaptação dos parâmetros da trajetória.
A primeira rede neural, NN1, é treinada offline utilizando
o modelo dinâmico paciente-órtese e a mudança na trajetória de
referência para obter a variação no torque. A segunda rede
neural, NN2, encontra o valor de que minimiza o
determinado funcional [14]. O treinamento dessa rede é
realizado online e, para que convirja, fazemos igual ao
erro de saída da rede. A rede NN3 substitui o gerador de
trajetórias analítico e tem como entradas o valor do parâmetro
e o instante de tempo e, como saídas, as posições ( ),
velocidades ( ) e acelerações ( ) de cada uma das sete juntas da
órtese.
Utilizando esse sistema, foram realizadas simulações em
MatLab. Abaixo é mostrado o resultado para adaptações que
Figura 3(a): Diagrama do sistema sem o
uso de redes neurais.
Figura 3(b): Diagrama do sistema com o
uso de redes neurais.
7
ocorrem depois da metade de cada passo. A Figura 4(a) mostra a
adaptação da trajetória do fêmur esquerdo considerando um valor
de desejado fixo em s para todos os passos. A Figura
4(b) mostra a mesma simulação realizada considerando uma
adaptação no primeiro passo de s, passando a
s no segundo passo e, posteriormente, a s
no terceiro passo. Observa-se que o sistema proposto é eficiente
nas simulações, e o custo computacional foi reduzido
significativamente com o uso de redes neurais.
Porém, apesar de se mostrar eficiente nas simulações
realizadas, para que o sistema esteja apto a trabalhar com
outros valores dos parâmetros envolvidos, há a necessidade de se
treinar as redes com intervalos maiores para cada parâmetro.
Isso torna esse sistema inviável no sentido de gerar trajetórias
e adaptações on-line. Nesse sentido, outra abordagem com
ferramentas matemáticas ainda mais poderosas deve ser realizada
para que o sistema possa ser aplicado em tempo real no
equipamento que está sendo construído.
Figura 4(a): desejado fixo. Figura 4(b): desejado variando.
8
2. Objetivos e Etapas
A presente pesquisa destina-se a desenvolver novos métodos
de utilização de modelos matemáticos de neurônios, osciladores e
redes neurais com aplicação em exoesqueletos para membros
inferiores através da avaliação e melhorias de trabalhos
existentes tais como [26].
Ao longo da pesquisa foram realizados testes e simulações
que permitiram saber se os resultados obtidos estavam coerentes
com os obtidos previamente em outros países, como os presentes
em [2].
O estudo sobre a aplicação de redes neurais de forma auto-
adaptativa se insere no contexto de permitir que o equipamento
desenvolvido na USP – São Carlos pelo aluno Bruno Jardim [8] se
locomova independentemente em terrenos, a priori, desconhecidos.
Para o aprofundamento em redes neurais auto-adaptativas
contamos com o auxílio do aluno Marciel Alberto Gomes, que
desenvolve estudos na área de adaptação do padrão de marcha.
Para melhor acompanhamento dos eventos, enumeramos as
etapas do projeto:
• Revisão bibliográfica;
• Implementação de osciladores neurais;
• Desenvolvimento do gerador de trajetórias estáveis para o
exoesqueleto baseado em osciladores neurais;
• Desenvolvimento de algoritmos de adaptação do padrão de
marcha;
• Confecção do relatório do trabalho.
9
3. Osciladores Neurais
3.1. Modelagem Matemática do Neurônio Matsuoka
Logo no começo do projeto recorremos ao estudo e simulação
do neurônio Matsuoka [17], com o objetivo de criar-se um
oscilador neural a partir do mesmo.
Matsuoka propõe em [17] um modelo de neurônio individual
cujo tratamento numérico é mais simples em comparação com os
demais modelos, sendo amplamente usado devido à efetividade em
pesquisas voltadas a robótica.
As seguintes equações modelam a dinâmica do neurônio a
partir de simplificações realizadas no modelo proposto em [27]:
(1)
(2)
(3)
O significado de cada uma das variáveis consta abaixo:
é uma variável de estado interna que corresponde ao
potencial de membrana do neurônio;
é uma variável de estado representando o grau de adaptação
e auto-inibição do neurônio;
é uma constante de adaptação, também relacionado à
adaptação do neurônio;
é o sinal de saída do neurônio. Como veremos mais adiante
corresponde à saída do neurônio extensor ou flexor do
músculo;
é o sinal de realimentação do neurônio. O termo
poderia ser substituído por dependendo na função do
neurônio (extensor ou flexor);
é a constante de tempo relacionada ao tempo de subida para
uma entrada degrau (step input);
é a constante de tempo que especifica o atraso do tempo de
10
adaptação;
relaciona-se ao sinal de entrada do driver. É uma entrada
não oscilante, conforme [5].
é a constante que indica a força do sinal de entrada sinal
de realimentação.
Avaliou-se então que um único neurônio não é capaz de gerar
o sinal periódico desejado, estando este resultado exposto na
Seção 3.3.
Para a obtenção de sinal periódico fazemos o uso do
oscilador Matsuoka.
3.2. Oscilador Matsuoka
O oscilador Matsuoka é definido como sendo dois neurônios
interligados e inibindo-se mutuamente. Como já mencionado acima,
cada neurônio passa a representar a capacidade extensora (E) e
flexora (F) do músculo.
Ao possibilitarmos a comunicação entre dois neurônios,
surgem variáveis adicionais que incorporam as equações 1, 2 e 3.
Para uma melhor visualização, cada neurônio passa a ser
representado por equações semelhantes porém com índices
distintos, que facilitam o entendimento das mesmas.
O conjunto de equações para um oscilador Matsuoka encontra-
se abaixo:
(4)
(5)
(6)
(7)
(8)
(9)
11
Note a semelhança com as equações de quando há apenas um
neurônio.
Embora possível e de maior valor nesta pesquisa, nestas
equações foram omitidos os termos que consideram a comunicação
entre dois ou mais osciladores, uma vez que no momento estamos
tratando de apenas um oscilador. A interação será abordada mais
adiante.
Os sub-índices e correspondem ao neurônio extensor (4,
5 e 6) e flexor (7, 8 e 9) do oscilador neural de índice
(neste caso temos somente ).
Note que, em comparação às equações 1, 2 e 3, foram
adicionados os termos relativos ao grau ou força de inibição
mútua, sendo eles e , presentes nos neurônios
extensor e flexor respectivamente. Deste forma, é demandada a
explicação sobre os termos que foram acrescentados.
e são os sinais de saída de cada neurônio do oscilador
neural. A saída do oscilador neural em si, , é tida como
a subtração destes valores:
(10)
e são constantes e denotam o peso da conexão sináptica
inibitória entre os neurônios extensor e flexor.
As ilustrações a seguir mostram o diagrama esquemático de
dois neurônios individuais (Figura 5) e, em sequência, o de um
oscilador Matsuoka (Figura 6, adote ).
Nestas figuras entende-se:
.
12
3.3. Testes Comparativos
A cada etapa de simulação eram realizados testes para
verificar se o modelo computacional construído estava correto.
Inibitório Excitatório
E
F
Figura 5: Diagrama esquemático de dois
neurônios individuais.
Figura 6: Diagrama esquemático do
Oscilador Matsuoka.
Inibitório Excitatório
E
F
13
Construiu-se primeiramente o modelo do neurônio individual
no Simulink, dado pelas equações 1, 2 e 3. Para a validação,
recorremos a [16], onde são realizados testes com parâmetros
conhecidos. Neste artigo, o autor adota
, e . Além disso, como um neurônio individual
não se comunica externamente, ele não possui entrada
proprioceptiva, isto é, o sinal de realimentação é nulo e logo
. Assim, adotamos pois ele multiplica .
O sinal de entrada vem do parâmetro , e nos testes
adotamos uma entrada degrau no instante (zero) e de valor
, e . As condições iniciais são todas nulas.
Para todas as três entradas houve estabilização do sinal de
saída, como exemplifica a Figura 7.
Tendo sido verificada esta característica do neurônio
Matsuoka, prosseguiu-se para o oscilador neural Matsuoka. Nesta
etapa constatou-se que o modelo em Simulink do oscilador (Figura
8) é pouco versátil quanto ao manuseio de gráficos e na
agilidade de mudança de parâmetros, embora seja um software que
possibilita visualizar o diagrama de blocos diretamente; por
isso empregamos também o MatLab na construção dos modelos de
oscilador.
Os testes realizados para o oscilador avaliam duas
características importantes e desejáveis: a geração de sinal
rítmico dada uma entrada tônica não periódica e a adaptação a um
sinal periódico (entrainment). Estes experimentos são realizados
em [2], e os tomamos como base.
Figura 7: Entrada degrau de valor para um neurônio individual.
14
A geração de um sinal rítmico para uma entrada tônica
constante, por exemplo, pode ser obtida tomando os seguintes
valores: ,
, , , , e
e (realimentação nula).
As condições iniciais adotadas foram nulas. Note na Figura
9 que o oscilador é capaz de gerar sinal rítmico mesmo sendo o
sinal de realimentação nulo (“input nulo”, conforme legenda).
A adoção
é uma recomendação presente em [25],
onde afirma-se que para oscilações estáveis o denominador deve
estar entre e .
A Figura 9 mostra o resultado deste teste; ela mostra
também outra propriedade, que é a influência do valor da entrada
tônica . Segundo [25] a amplitude de oscilação é proporcional
ao valor de , o que é de fato confirmado pelo teste.
Ambas as curvas da figura são para o conjunto de parâmetros
mencionado acima, exceto pelo valor de , que varia de a . Ao
dobrar a entrada tônica a amplitude igualmente dobrou.
Convém ressaltar que esta relação é altamente volátil no
que diz respeito à sensibilidade das variáveis, isto é, a
proporcionalidade é válida apenas em uma gama de valores
específica dados os valores dos demais parâmetros.
Figura 8: Diagrama de blocos do oscilador Matsuoka.
15
A propriedade de adaptação (entrainment) é mostrada na
Figura 10. A curva foi gerada usando o mesmo conjunto de
parâmetros indicado acima, porém sendo a entrada tônica um
sinal periódico e fazendo-se necessário adotar um valor para o
sinal de realimentação diferente de zero.
Este comportamento é bastante funcional, uma vez que
durante o caminhar vários estímulos externos podem começar a
atuar subitamente sobre o sistema de forma periódica. Assim, o
modelo mostra-se capaz de tratar o sinal de realimentação de
forma a continuar gerando um sinal rítmico, sinal este que
jamais deve ser perdido durante uma locomoção estável.
Figura 9: Geração rítmica para entrada constante.
Figura 10: Entrainment do oscilador Matsuoka.
16
Na Figura 10, a entrada tônica é nula até , quando ela
então se torna periódica e defasada de em relação à saída
inicial. Em observa-se que o oscilador ajusta
significativamente a fase da entrada com a da saída, mantendo
também um padrão periódico de mesma frequência.
Em [25] um comportamento adicional é citado: sugere-se que
a constante de tempo seja inversamente proporcional à
freqüência da saída. Esta afirmação também foi analisada e
confirmada, porém mais uma vez cabe mencionar que é válida
apenas para determinados valores de variáveis. A Figura 11 exibe
graficamente a variação da freqüência.
Novamente os valores adotados foram os apresentados no
conjunto acima, inclusive a entrada tônica como e a
realimentação nula.
Figura 11: Influência da constante de tempo na freqüência.
17
4. Redes Neurais
Pesquisas neurobiológicas afirmam que os padrões de ritmo
na locomoção dos animais (o andar de bípedes e quadrúpedes, o
vôo de aves e o nadar de peixes) são gerados em algumas unidades
neurais centrais. Adicionalmente, os animais não somente geram
os sinais como também são capazes de alterar amplamente a sua
velocidade. A mudança do ato de andar para o de galopar é um
exemplo comum em casos de quadrúpedes.
Assumindo-se que os ociladores neurais são a unidade básica
para o entendimento de cada junta, pois correspondem ao músculo
extensor e flexor, foram realizados estudos que contemplavam a
interação entre diversos osciladores neurais [27]. A estas
configurações damos o nome de rede neural.
Nestes estudos buscou-se também adotar uma unidade central,
chamada de CPG (Central Pattern Generator) ou MPG (Main Phase
Generator), conforme a motivação biológica mencionada acima.
Essa unidade central se encarregaria de prover o rítmo ao resto
do sistema.
4.1. Conexão Vertical e Cruzada para 2 Osciladores
Neurais
O equacionamento de uma rede neural com 2 osciladores é
semelhante ao do oscilador apresentado anteriormente. Resta
apenas computar os termos que consideram a comunicação entre os
neurônios de osciladores diferentes. Segundo Yang [27], o
equacionamento é como segue (equações 11, 12, 13, 14, 15 e 16).
Um resumo sobre as variáveis e seus significados faz-se
necessário para eliminar quaisquer dúvidas que possam existir ao
passarmos da análise de um neurônio individual, para a de um
único oscilador e enfim para a uma rede neural com 2
osciladores, agora apresentada.
(11)
18
(12)
(13)
(14)
(15)
(16)
Os sub-índices e continuam correspondendo aos neurônios
extensor e flexor do oscilador neural de índice . Agora, os
índices correspondem aos demais osciladores neurais da rede,
cada um composto por um neurônio extensor e flexor.
Os termos em que o índice está são os termos que foram
inseridos nas equações: e
. Então comecemos o
resumo por eles:
é a constante que denota o peso, ou força, da conexão
sináptica inibitória entre os neurônios dos osciladores
neurais e . Fazem parte desses valores as constantes ,
, e . A influência desses valores na pode ser vista
na Figura 12. O somatório representa justamente o
efeito global da interação de todos os osciladores da rede
neural;
: variável de estado interna que corresponde ao potencial
de membrana dos neurônios do oscilador neural ;
: variável de estado representando o grau de adaptação e
auto-inibição dos neurônios do oscilador neural ;
: é uma constante de adaptação e aparece junto ao termo ,
também relacionado à adaptação do neurônio;
e : sinais de saída do -ésimo oscilador neural.
Correspondem à saída do neurônio extensor ou flexor. Note que
ambas as saídas e são compostas apenas das partes
positivas da variável e , respectivamente. Assim sendo,
19
assume-se que a saída de cada oscilador neural como um todo é
a subtração destes valores:
(17)
: sinal de entrada do oscilador neural. Corresponde a um
sinal de realimentação do sistema real. Note que os termos
e separam a entrada em duas partes: a parte
positiva segue ao neurônio extensor enquanto a parte negativa
chega ao neurônio flexor;
: é uma constante de tempo que especifica o tempo de subida
no oscilador para uma entrada degrau (step). Segundo [25] a
freqüência do sinal de saída do neurônio é grosseiramente
proporcional a , o que já foi verificado;
: constante de tempo que especifica o atraso na adaptação
do oscilador. Note que esse valor também está presente em um
termo que contém , assim como o valor . Em [25] afirma-se
que e determinam a velocidade e a forma da saída do
oscilador neural;
Inibitório Excitatório
E2 F2
E1 F1
Figura 12: Conexões inibitórias entre osciladores neurais
(vermelho e verde).
20
e : denotam o peso da conexão sináptica inibitória
entre os neurônios extensor e flexor do mesmo oscilador
neural;
: é chamada de entrada tônica (tonic input), pois seu valor
constante é proporcional à amplitude de oscilação [25]. Na
Seção 3.3 isto já foi discutido;
: constante que indica o peso do sinal de entrada sinal de
realimentação do sensor no -ésimo oscilador. Pode-se dizer
que o sinal de entrada é dimensionado através das constantes
.
A ligação entre os dois osciladores neurais, dada pelos
parâmetros , , e , geralmente ocorre de duas formas
distintas. Os osciladores podem estar se comunicando
verticalmente, isto é, extensor com extensor ou flexor com
flexor ou então de forma cruzada, quando temos o extensor de um
com o flexor de outro. Ambas as ligações estão representadas na
Figura 12: em vermelho temos a ligação vertical e em verde a
cruzada.
Dessa forma, quando adotamos a ligação vertical, por
exemplo, os parâmetros da ligação cruzada devem ser anulados, ou
seja, O mesmo raciocínio é adotado quando usamos a
ligação cruzada.
Uma questão que merece atenção especial é a realimentação.
Nestas equações a realimentação é apenas mencionada em termos
matemáticos, mas veremos a seguir o que ela de fato representa.
4.2. Rede Neural para o Caminhar Humano
Com base em uma pura analogia com o corpo humano, e sabendo
que cada oscilador neural, composto por dois neurônios,
assemelha-se à função de uma junta, um sistema mecânico complexo
formado por várias juntas, elos e atuadores pode ser
representado por uma rede neural complexa composta por mais de
dois osciladores neurais. Como um oscilador com dois neurônios é
capaz de representar uma única junta, vários osciladores em uma
21
mesma rede comunicam-se entre si de forma a possibilitar maior
versatilidade do modelo. Para efeitos de ilustração
disponibiliza-se a imagem abaixo (Figura 13), na qual cada
circunferência corresponde a um neurônio extensor ou flexor, e
cada par de neurônios (oscilador) corresponde a uma junta do
corpo. Na realidade, um modelo semelhante é proposto em [16] e
representa o corpo da cintura para baixo. Este modelo foi então
aperfeiçoado conforme proposto em [5], tomando-se como feedback
os ângulos das juntas dos joelhos e pés. A realimentação é
enviada ao MPG (quadril). Feitos estes arranjos, obtemos o
diagrama presente na Figura 13.
A figura acima deixa claro que a realimentação comumente
usada pela maioria dos autores é o ângulo de junta. Heralic [5]
sugere também que a realimentação pode ser usada para chavear o
movimento das pernas, e, neste caso, a realimentação seria
proveniente de um sensor binário de contato para informar quando
determinada perna encostou no chão.
Figura 14: Rede neural com seis osciladores Matsuoka.
E5 F5 E6 F6
E3 F3 E4 F4
F1 F2
E1 E2
𝜃1
Perna Esquerda Perna Direita
Pés
𝜃2
𝜃3 𝜃4
𝜃5 𝜃6
Joelhos
Quadris
MPG
Figura 13: Rede Neural com MPG em estudo (modelo 6ON).
22
Notar na figura que a realimentação de ângulo das juntas do
joelho e do pé é enviada somente ao oscilador do quadril do
mesmo lado (esquerdo ou direito). Assim sendo, este passa a
formar o MPG, pois será através do quadril que os joelhos e os
pés receberão a informação do ambiente ao redor. Ainda, repare
que a realimentação está puramente presente de forma indicada na
figura, o que abre a possibilidade de estudarmos alguns tipos de
realimentação mais adiante do joelho e pé para o quadril.
Conforme abordado na Seção 4.1, a rede neural apresentada
apresenta conexão vertical entre os osciladores do quadril.
Por último, e não menos importante, a Figura 14 abaixo
mostra a denominação dos pesos das conexões entre os diversos
osciladores. Na figura, “j” se refere a joelho e “p” a pé.
4.3. Resultados
Com base em [26] estudamos o comportamento de redes neurais
ligadas verticalmente e em cruz. Os resultados obtidos condizem
com o que é dito em [26], isto é, ao ligarmos dois osciladores
na vertical as saídas de ambos os osciladores estarão defasadas
em . Isto ocorre porque o sinal do flexor F1 (oscilador 1)
estará em fase com o do extensor E2 (oscilador 2).
E5 F5
E3 F3
E1
F1
WE
WF
WEj
WFEj
WEp WFEp
Figura 14: Nomenclatura dos pesos de conexão.
23
Semelhantemente, se a ligação for cruzada então o flexor F1
estará defasado em com o extensor E2, gerando saídas dos
osciladores em fase. As Figuras 15 e 16 ilustram este fato.
Os parâmetros adotados foram os seguintes: ,
, , , ,
. Para ambas as ligações o sinal de realimentação foi
tido como uma entrada degrau no instante e de valor final
.
Figura 15: Ligação vertical ( , , ).
Figura 16: Ligação cruzada ( , , ).
24
Para começar a entender a rede neural da Figura 13, foi
feita uma análise dos osciladores que compreendem a comunicação
ente o quadril e o joelho ou o quadril e o pé. Note na figura
que as configurações são iguais ao modelo abaixo (Figura 17). Na
Figura 16, os pesos podem ser do joelho ou do pé.
Intuitivamente, ao analisar o modelo, temos que com a
escolha apropriada dos pesos e é possível gerar
uma diferença de fase controlada entre a saída do oscilador 1
(quadril) e a do oscilador 2 (joelho ou pé). A averiguação foi
feita e o acontecimento confirmado. Os parâmetros adotados foram
, , , , ,
e . A realimentação é .
A defasagem angular máxima obtida a partir da referência
foi . A tabela abaixo mostra integralmente os resultados
assim como os respectivos pesos das conexões (Tabela 1).
F1 E1
F2 E2
WE(j,p) WFE(j,p)
Figura 17: Modelo Quadril com Joelho/Pé (modelo 2ON).
WE WFE Defasagem (°)
0,5 0,05 0
0,5 0,15 5,02
0,5 0,2 10,05
0,5 0,25 16,74
0,5 0,28 21,77
0,5 0,3 30,14
0,5 0,31 38,51
0,5 0,32 43,53
0,5 0,33 46,88
0,5 0,34 63,63
0,5 0,35 70,33
0,5 0,36 82,05
0,5 0,37 93,77
0,5 0,38 105,49
0,5 0,39 125,58
0,5 0,4 138,98
0,5 0,41 147,35
0,5 0,42 155,72
Tabela 1: Defasagem Quadril com Joelho/Pé.
25
Esta possiblidade de alterar e corrigir as diferenças de
fase é extremamente importante para o caso de um caminhar
estável, uma vez que a defasagem angular entre as juntas do
quadril, joelho e pé durante deve ser imposta ao modelo através
dos parâmetros de inibição entre os osciladores expostos na
Tabela 1.
26
5. Adaptação – Otimização dos Parâmetros
Tendo em mãos as trajetórias do caminhar de um indivíduo
saudável, o passo seguinte abordado foi o ajuste das curvas dos
osciladores a estas trajetórias previamente conhecidas. Esta
etapa vem ao encontro da necessidade de determinarmos como o
comportamento de auto-adaptaçao ocorrerá nos osciladores neurais
Matsuoka e, consequentemente, em redes neurais.
Abaixo encontram-se dois diagramas (Figura 18 e Figura 19)
que sintetizam a aplicação dos osciladores neurais para o
caminhar humano, com a aplicação de feedback.
Na Figura 18 cada oscilador neural foi utilizado para
representar uma única junta do modelo bípede inferior: quadril,
ON Controle de
Torque +
-
Erro Trajetória
desejada Torque
SIMULADOR
(Modelo Dinâmico) Posição Real
Simulada
Feedback de ângulo de junta
Figura 18: Aplicação do ON individual com feedback.
Figura 19: Aplicação do ON em uma rede neural
27
joelho e pé, divididos entre lado esquerdo e direito (Figura 2).
Isto totaliza 6 juntas e, logo, 6 osciladores neurais.
Neste caso, a realimentação é fornecida ao oscilador neural
para que ele adapte a sua trajetória de acordo com a posição
real obtida na saída do simulador dinâmico. Assim, o oscilador
neural se incumbe de fornecer uma curva estável e rítmica de
referência para o restante do sistema.
Esta trajetória de referência é usada para o cálculo do
erro entre o ângulo desejado e o real simulado, proveniente do
simulador, para que seja determinado o torque a ser aplicado na
junta em questão. O torque é então enviado ao simulador para que
ele forneça o novo ângulo de junta, que será usado como
feedback. Em [15] propõe-se calcular o torque através de um
controlador PD.
Na Figura 19 temos também a utilização de 6 osciladores
neurais, porém eles configuram uma rede neural devido à
existência de interação entre eles. A figura esquematiza o
funcionamento da rede neural com MPG da Figura 13. Nela, o sinal
de realimentação consiste na posição real simulada de cada junta
que, ao invés de ir para seu respectivo oscilador neural, vai
para o MPG, situado no quadril. O MPG calcula então a posição
desejada do quadril, que passa a influenciar os osciladores dos
joelhos e pés. Após calculadas, as 6 trajetórias seguem para o
cálculo do erro.
Embora cada oscilador ainda assim continue sendo
responsável por gerar apenas a trajetória da junta referente a
ele, os osciladores do quadril e do joelho enxergam o ambiente
externo apenas através da interação com o MPG.
O ajuste das curvas é realizado pela alteração dos
parâmetros dos osciladores neurais: , , , , , e . A
realimentação é dada pela variável .
Devido à complexidade e alto custo computacional exigido
para realizar a otimização baseando-nos no esquema da Figura 19,
pois afinal ocorre a interação entre 6 osciladores neurais e
envolve cerca de 60 parâmetros simultâneos, as otimizações dos
parâmetros realizadas nas seções 5.1 e 5.2 dizem respeito apenas
ao esquema da Figura 18. Esta simplificação facilita a abordagem
28
das equações uma vez que reduz o número de parâmetros a serem
otimizados de 60 para 10.
Ainda, durante a implementação do otimizador mostrou-se
conveniente adotarmos uma nova lista de parâmetros para os
osciladores. A mudança realizada é simples e consiste em adotar
parâmetros independentes entre si para cada neurônio no mesmo
oscilador. Isso fornece melhores resultados quando em comparação
com o conjunto de parâmetros logo acima.
Os parâmetros utilizados foram então: , , , , ,
, , , e . Essa mudança retroage nas equações 4, 5, 7 e
8 (referentes aos osciladores neurais), de forma que os sub-
índices e denotam em que neurônio os parâmetros estão.
Atenção especial para e , que estão nos neurônios
contrários aos sub-índices (ver equações 4 e 7), pois estes
parâmetros indicam justamente o peso da conexão com o neurônio
complementar do oscilador. Adotou-se o ganho da realimentação,
quando presente, , ou seja, o valor em si do ganho não foi
otimizado, porém diversas configurações de feedback foram
analisadas.
Foram realizadas as otimizações com e sem feedback, além de
estudadas também novas expressões para o sinal de realimentação,
como mencionado acima. O critério de parada da otimização foi
adotato como sendo a iteração a partir da qual a melhoria não
mais era significativa, cerca de 5% de diferença entre a
iteração anterior.
5.1. Resultados Otimizados sem Feedback
5.1.1. Juntas Individuais
A Tabela 2 resume a otimização para o caso dos osciladores
neurais atuando independentemente e sem feedback (como proposto
na Figura 18 porém em malha aberta), ao passo que a Tabela 3
revela os valores dos parâmetros ótimos. Foram gerados gráficos
para visualizar o quanto a otimização conseguiu se aproximar da
trajetória real da junta. Os gráficos de todas as juntas foram
29
gerados, e exibem-se os referentes ao quadril da perna esquerda
(Figura 20) e o joelho da perna esquerda (Figura 21).
Os resultados das demais juntas foram semelhantes, o que
exclui a necessidade de mostrá-los. Quando necessário, adotar
junta 1, 2 e 3 como pé, joelho e quadril, respectivamente.
Junta Perna Esquerda Perna Direita
Iterações Erro Iterações Erro
Pé 52 82,63470 42 70,09940
Joelho 41 58,01090 22 61,81290
Quadril 42 18,51880 27 11,63540
Tabela 2: Execução do Otimizador.
Parâmetro Perna Esquerda Perna Direita
Pé Joelho Quadril Pé Joelho Quadril
Tre 0,0967 0,0057 0,0310 0,0982 0,0052 0,0933
Trf 0,0780 0,0642 0,0964 0,0238 0,1452 0,0392
Tae 0,2327 1,2010 1,4281 0,3167 1,6641 0,5269
Taf 0,5327 1,2412 1,6943 0,7316 1,6780 0,6410
be 0,9489 0,8675 1,6414 0,8837 1,8174 0,8372
bf 0,8884 0,8086 1,7908 0,5291 1,8213 0,7200
wf 1,6689 1,5531 0,9578 1,2801 1,4528 0,9082
we 1,3135 0,8649 1,3584 1,3515 0,9685 1,6955
se 0,6688 0,8350 1,4400 0,8001 1,0780 1,1487
sf 0,5341 0,6229 1,3763 0,6541 0,9030 1,2900
Tabela 3: Parâmetros Otimizados.
Figura 20: Quadril da perna esquerda.
30
Em ambas as Figuras 20 e 21 observa-se que, mesmo na melhor
combinação dos parâmetros, o oscilador neural não é capaz de
aproximar com qualidade sem realimentação. Além disso,
constataremos mais adiante que foi necessária uma quantidade
relativamente alta de iterações em relação ao caso com feedback.
5.1.2. Modelo com 2 e 6 Osciladores Neurais
Embora a otimização tenha sido realizada para o caso de
osciladores neurais atuando individualmente como uma junta em
malha aberta, avaliou-se a utilização destes parâmetros ótimos
nos modelos de rede neural com 2 e 6 osciladores, também sem
realimentação, puramente para determinar o seu comportamento
(Figuras 17 e 13 respectivamente). Como já vimos ser possível
ajustar a fase de acordo com o nosso interesse na Seção 4.3,
buscamos também aproximar as fases entre as juntas nestes dois
casos.
Conforme descrito na Seção 4.2, a rede neural com 2
osciladores pode representar a comunicação do quadril com joelho
ou do quadril com pé. As duas curvas na Figura 22 representam as
trajetórias geradas no modelo da Figura 17 com pesos nulos para
o quadril e o joelho esquerdos, utilizando os parâmetros
Figura 21: Joelho da perna esquerda otimizado (ON individual).
31
respectivos otimizados anteriormente na Seção 5.1.1. Nessa
figura a defasagem foi ajustada manualmente até um ponto
compatível com a de uma trajetória de referência.
Já a Figura 23 expõe as curvas das mesmas juntas, os mesmos
parâmetros e ainda segundo o modelo da Figura 17, porém nela a
defasagem foi ajustada pelo ajuste dos pesos e .
Ainda, o ajuste conseguiu fases a princípio iguais com os
pesos adotados e (Figuras 22 e 23).
Partindo agora para o caso com 6 osciladores neurais, o
procedimento adotado foi o mesmo, isto é, substituímos os
Figura 22: Fase Desejada entre Quadril e Joelho da perna esquerda
(modelo 2ON).
Figura 23: Fase Ótima entre Quadril e Joelho esquerda (modelo
2ON).
32
valores dos parâmetros calculados através da otimização para o
caso individual (Tabela 3) na Seção 5.1.1 no modelo apresentado
na Figura 13, porém desconsiderando a realimentação indicada na
figura.
Como é possível verificar na Figura 13, agora teremos que
achar os pesos da conexão entre quadril e joelho, quadril e pé e
entre os osciladores do quadril, que formam o MPG, de forma a
ajustar a fase para um caminhar harmonioso. O diferencial agora
consiste em identificar os pesos entre os osciladores do
quadril, uma vez que logo acima foi feito o ajuste de fase entre
quadril e joelho, o que em teoria se assemelha também ao ajuste
entre quadril e pé. Lembre-se que a ligação entre os osciladores
do quadril ocorre na forma vertical, como explicado na Seção
4.1.
A Figura 24 ilustra o estado inicial e não tratado quando
da substituição dos parâmetros otimizados no modelo 6ON. Nela
nenhum ajuste havia sido feito e os pesos eram todos nulos:
, o que significa que não tínhamos
implementado a rede neural propriamente dita.
Figura 24: Fase Inicial no Modelo 6 ON.
33
Através desta figura podemos notar que as curvas dos lados
esquerdo e direito, mesmo com os valores otimizados, possuem
frequências diferentes, indicando que por mais que o otimizador
tenha encontrado os parâmetros ótimos, eles não são suficientes
para gerar trajetórias compatíveis entre as duas pernas.
A primeira ação corretiva foi ajustar a fase entre os
quadris, através do ajuste de e (Figura 25). Nela
observa-se que conseguimos obter a defasagem desejada para as
juntas do quadril, qual seja , muito embora ainda falte
corrigir as juntas do joelho e do pé.
Deste ponto, identificamos os valores para e
que colocam as trajetórias dos joelhos e dos pés na fase
adequada para o caminhar humano. É importante ressaltar que a
condição para o caminhar saudável não é posicionar as 6 curvas
na mesma fase (pico com pico e vale com vale), mas sim cada
curva na fase adequada obtida através do sensoriamento de um
caminhar real. A Figura 26 mostra êxito neste tópico.
É interessante perceber que a simples presença de
comunicação entre os osciladores do quadril foi suficiente para
Figura 25: Fase dos Quadris ajustada no Modelo 6 ON.
34
fazer com que os osciladores dos joelhos esquerdo e direito,
assim como os dos pés, oscilassem numa mesma frequência. Ou
seja, o MPG realmente está atuando sobre as demais juntas,
oferecendo um ritmo a ser seguido.
Os pesos finais para a condição atingida na Figura 26 foram
, , , , e ,
sendo os pesos do joelho e pé iguais para os lados esquerdo e
direito do modelo.
5.2. Resultados Otimizados com Feedback
Os resultados obtidos na seção anterior revelam que a rede
neural proposta segundo a Figura 13 faz com que padrões rítmicos
surjam para todos os osciladores que a compõe, e mais
importante, na mesma freqüência, mesmo que sem realimentação.
Porém, a busca pela capacidade adaptativa do modelo é
imposta somente quando há a presença da realimentação.
A fim de viabilizar um estudo mais simplificado sobre os
casos com realimentação, adotamos como sinal de feedback o
próprio ângulo de junta desejado para o oscilador em questão.
Observando-se a Figura 18 sabemos que isso não é necessariamente
Figura 26: Fase totalmente ajustada no Modelo 6 ON.
35
verdade, uma vez que o controlador não é exato e não consegue
posicionar a junta no ângulo desejado sem erro algum. Contudo
essa afirmação é aceitável e bastante plausível caso o oscilador
neural já esteja gerando a própria curva desejada e o controle
de torque seja exato e instantâneo; ou seja, assumir o feedback
como o ângulo de junta é válido para a condição de equilíbrio do
oscilador.
Adicionalmente, com a finalidade de chegar a uma conclusão
sobre a forma de utilizar a realimentação, propusemos diversos
tipos de realimentação, conforme mostra a Tabela 4. Nesta tabela
exibimos o tipo de realimentação usado, que substitui o termo de
realimentação nas equações 4 e 7 (Seção 3.2), e a sua
denominação neste estudo. Tenha em mente que essa otimização foi
realizada utilizando o esquema da Figura 18, considerando cada
neurônio independentemente, como já foi mencionado no início da
Seção 5.
Visando ser o mais sucinto possível, os resultados
imediatos que obtivemos foram que os casos com feedback dividido
-+ e inteiro -+ não foram capazes de convergir para parâmetros
ótimos, satisfazendo o critério de erro de .
O feedback dividido ++, embora tenha convergido, foi capaz
de gerar somente a parcela positiva da trajetória das juntas,
enquanto o inteiro ++ convergiu e conseguiu representar todas as
trajetórias.
Todas as juntas da perna esquerda e direita utilizando
dividido -– e inteiro –- convergiram. Das juntas que usaram
dividido -–, todas conseguiram representar somente a parcela
positiva da trajetória; das que usaram inteiro –- apenas uma
junta não conseguiu representar toda a trajetória.
Cabe notar que o feedback dividido -- é o mesmo usado nas
equações presentes em [16], e presentes também na Seção 3.2
deste relatório, quando da explicação sobre osciladores neurais
Matsuoka. Ou seja, embora mencionado por alguns autores, os
resultados aqui obtidos revelam que este não é o tipo de
realimentação mais eficiente.
36
Por último, os casos dividido +- e inteiro +- apresentaram
desempenho exemplar, pois para todas as 6 juntas a otimização
convergiu e foi capaz de gerar a trajetória inteira. O
diferencial está no fato de que o número de iterações para as
convergências nestes 2 casos foram as menores encontradas diante
de todos os outros tipos de feedback. Adicionalmente, o erro
final obtido também foi notoriamente pequeno em relação aos
outros. A Tabela 5 indica o número de iterações e o erro final
obtidos nestes casos.
Embora tenha sido feita a otimização para ambas as pernas,
o que totaliza 6 juntas para cada tipo de feedback, as Figuras
27, 28 e 29 mostram o desempenho da otimização no caso dividido
+- das 3 juntas da perna direita. Os resultados da perna
esquerda e para o caso inteiro +- são similares, no que diz
respeito à eficiência do feedback. Mais uma vez entenda junta 1,
2 e 3 como pé, joelho e quadril respectivamente.
Expressão para o Feedback
Denominação Extensor Flexor
Dividido --
Dividido -+
Dividido +-
Dividido ++
Inteiro --
Inteiro -+
Inteiro +-
Inteiro ++ Tabela 4: Tipos de feedback utilizados e suas denominações.
Tipo de feedback Perna Esquerda Perna Direita
Iterações Erro Iterações Erro
Dividido +-
Pé 7 0,03365 4 0,86784
Joelho 11 0,14051 14 1,23199
Quadril 12 0,30592 7 0,84864
Inteiro +-
Pé 8 0,09336 6 1,03341
Joelho 11 0,29900 9 1,31959
Quadril 11 0,54967 5 1,09998
Tabela 5: Resultados para dividido +- e inteiro +-.
37
Figura 27: Otimização dividido +- para o pé da perna direita.
Figura 28: Otimização dividido +- para o joelho da perna direita.
38
Os parâmetros resultantes da otimização que levam aos
valores presentes na Tabela 5 e aos gráficos acima resumem-se
nas Tabelas 6 e 7:
Figura 29: Otimização dividido +- para o quadril da perna direita.
Parâmetros
Dividido +-
Perna Esquerda Perna Direita
Pé Joelho Quadril Pé Joelho Quadril
Tre 0,0075 0,0063 0,0056 0,0101 0,0089 0,0104
Trf 0,0052 0,0071 0,0091 0,0054 0,0059 0,0081
Tae 0,4740 0,3489 0,3898 0,6173 0,3466 0,9446
Taf 1,0775 0,8186 1,1182 1,1701 0,9564 1,1553
be 0,1976 0,1110 0,0633 0,3223 0,1452 0,2503
bf 0,2155 0,1427 0,3310 0,2621 0,1238 0,3255
wf 1,5786 1,4378 1,2062 0,5693 0,5788 1,0705
we 0,0162 0,1470 0,2785 -0,0173 1,1728 1,4265
se 0,0512 0,0394 0,0281 0,0760 0,0455 0,0840
sf 0,0330 0,0312 0,0615 0,0431 0,0267 0,0569
Tabela 6: Parâmetros otimizados para feedback dividido +-.
39
Parâmetros
Inteiro +-
Perna Esquerda Perna Direita
Pé Joelho Quadril Pé Joelho Quadril
Tre 0,0089 0,0055 0,0071 0,0108 0,0094 0,0091
Trf 0,0051 0,0085 0,0196 0,0084 0,0069 0,0079
Tae 0,6903 1,3170 0,8096 0,8505 0,9283 0,3053
Taf 1,3280 1,0585 1,8288 0,8984 1,2857 0,2203
be 0,3204 0,4449 0,0941 0,5400 0,3378 0,0843
bf 0,2426 0,2435 1,3365 0,3946 0,3336 0,1024
wf 2,5232 0,9833 1,2256 1,7253 1,9971 1,0489
we -0,3651 0,6104 0,3097 0,8327 2,0761 1,0947
se 0,0650 0,1044 0,0320 0,1002 0,0759 0,0223
sf 0,0352 0,0524 0,2514 0,0480 0,0648 0,0283
Tabela 7: Parâmetros otimizados para feedback inteiro +-.
40
6. Conclusão
Os resultados obtidos ao longo da elaboração deste
relatório, e que aqui presentes estão, nos levam desde o
entendimento básico do funcionamento de um neurônio até a sua
aplicação em redes neurais com capacidades auto-adaptativas.
A escassa quantidade de informação detalhada em artigos
nacionais e estrangeiros tratando deste assunto e a falta de
conhecimento prévio sobre o tema acabou por possibilitar uma
abordagem mais ampla do trabalho. Ela representou uma
oportunidade de não só testar e avaliar os dados presentes em
artigos estrangeiros, mas também de colocá-los à prova sob
outras óticas, como foi realizado, por exemplo, com os 8 tipos
propostos de utilização do sinal de realimentação nos
osciladores neurais.
No escopo científico em que se insere, este relatório e as
informações nele podem e devem ser utilizadas para fundamentar
estudos futuros de redes neurais e suas aplicações para a
geração de trajetórias estáveis e auto-adaptativas em robôs e
órteses robóticas.
41
7. Referências Bibliográficas
[1] BANALA, S. K.; AGRAWAL, S. K.. Gait Rehabilitation with an
Active Leg Orthosis. Proceedings of the IDETC/CIE 2005 ASME
2005 International Design Engineering Technical Conferences
and Computers and Information in Engineering Conference.
Califórnia, Estados Unidos. Pág. 1–7. 2005.
[2] ENDO, G.; NAKANISHI, J.; MORIMOTO, J.; CHENG, G..
Experimental Studies of a Neural Oscillator for Biped
Locomotion with QRIO. Proceedings of the 2005 IEEE
International Conference on Robotics and Automation.
Barcelona, Espanha. Abril, 2005.
[3] FU, K.; GONZALEZ, R. C.; LEE, C. S. G.. Robotics: Control,
Sensing, Vision and Intelligence. McGraw-Hill Inc., Nova
Iorque, Estados Unidos. 1987.
[4] FUKUDA, T.; KOMATA, Y.; ARAKAWA, T.. Recurrent Neural
Network with Self-adaptive GAs for Biped Locomotion Robot.
International Conference on Neural Networks. Vol. 3, pág.
1710–1715. 1997.
[5] HERALIC, A.; WOLFF, K.; WAHDE, M.. Central Pattern
Generators for Gait Generation in Bipedal Robots. Chalmers
University of Technology, Goteborg, Suécia. Pág. 285–304.
Junho, 2007.
[6] HUANG, Q.; YOKOI, K.; KAJITA, S.; KANEKO, K.; ARAI, H.;
KOYACHI, N.; TANIE, K.. Planning Walking Patterns for a
Biped Robot. IEEE Transactions on Robotics and Automation.
Vol. 17, nº 3, pág. 280–289. Junho, 2001.
[7] IBGE, I. B. D. G. E. E.. Censo Demográfico 2000 -
Características Gerais da População. Ministério do
Planejamento, Orçamento e Gestão. 2003.
42
[8] JARDIM, B.; SIQUEIRA, A. A. G. Desenvolvimento de Atuadores
Elásticos em Série para Acionamento de uma Órtese Tornozelo
Pé Ativa. Anais do XVII Congresso Brasileiro de Automática.
Pág. 1–6. 2008.
[9] JASPERS, P.; VAN PETEGEM, W.; VAN DER PERRE, G.; PEERAER,
L.. Design of an Automatic Step Intention Detection System
for a Hybrid Gait Orthosis. Proceedings of the 18th Annual
International Conference of the IEEE Engineering in
Medicine and Biology Society. Amsterdam, Holanda. Vol. 1,
pág. 457–458. 1996.
[10] JEZERNIK, S.; COLOMBO, G.; KELLER, T.; FRUEH, H.; MORARI,
M.. Robotic Orthosis Lokomat: A Research and Rehabilitation
Tool. Neuromodulation. Vol. 6, nº 2, pág. 108–115. Abril,
2003.
[11] JEZERNIK, S.; COLOMBO, G.; MORARI, M.. Automatic Gait-
Pattern Adaptation Algorithms for Rehabilitation with a 4-
DOF Robotic Orthosis. IEEE Transactions on Robotics and
Automation. Vol. 20, nº 3, pág. 574–582. Junho, 2004.
[12] KAZEROONI, H.. Exoskeletons for Human Power Augmentation.
Proceedings of the 2005 IEEE/RSJ International Conference
on Intelligent Robots and Systems. Edmonton, Alberta,
Canadá. Pág. 3459–3464. 2005.
[13] KIM, S.; ANWAR, G.; KAZEROONI, H.. High-speed Communication
Network for Controls with the Application on the
Exoskeleton. Proceedings of the 2004 American Control
Conference. Boston, Massachusetts, Estados Unidos. Vol. 1,
pág. 355–360. 2004.
[14] KITAMURA, S.; KUREMATSU, Y.; IWATA, M.. Motion Generation
of a Biped Locomotive Robot using an Inverted Pendulum
Model and Neural Networks. Proceedings of the 29th IEEE
Conference on Decision and Control. Vol. 6, pág. 3308–3312.
43
1990.
[15] LEWIS, F. L.; ABDALLAH, C. T.; DAWSON, D. M.. Control of
Robot Manipulators. Macmillan Publishing Company, Nova
Iorque, Estados Unidos. 1993.
[16] LIU, G. L.; HABIB, M. K.; WATANABE, K.; IZUMI, K.. Central
Pattern Generators based on Matsuoka Oscillators for the
Locomotion of Biped Robots. Artif. Life Robotics. Vol. 12,
nº 1, pág. 264–269. 2008.
[17] MATSUOKA, K. Mechanisms of Frequency and Pattern Control in
the Neural Rhythm Generators. Biol. Cybern. Vol. 56, nº 1,
pág. 345–353. 1987.
[18] PEREZ-ORIVE, J.; MAYAGOITIA, R.. A Closed-loop Control
System to be used a Hybrid RGO System. Proceedings of the
16th Annual International Conference of the IEEE
Engineering in Medicine and Biology Society. Vol. 1, pág.
410–411. 1994.
[19] PRATT, G.; WILLIAMSON, M.. Series Elastic Actuators.
Proceedings of the 1995 IEEE/RSJ International Conference
on Intelligent Robots and Systems. Pittsburgh, Pensilvânia.
Vol. 1, pág. 399–406. 1995.
[20] RIENER, R.; LUNENBURGER, L.; JEZERNIK, S.; ANDERSCHITZ, M.;
COLOMBO, G.; DIETZ, V.. Patient-Cooperative Strategies for
Robot-Aided Treadmill Training: First Experimental Results.
IEEE Transactions on Neural Systems and Rehabilitation
Engineering. Vol. 13, nº 3, pág. 380–394. Setembro, 2005.
[21] ROBINSON, D. W.; PRATT, J.; PALUSKA, D.; PRATT, G.. Series
Elastic Actuator Development for a Biomimetic Walking
Robot. Proceedings of the 1999 IEEE/ASME International
Conference on Advanced Intelligent Mechatronics. Atlanta,
Geórgia, Estados Unidos. Pág. 561–568. 1999.
44
[22] TO, C.; KIRSCH, R.; KOBETIC, R.; TRIOLO, R.. Simulation of
a Functional Neuro-Muscular Stimulation Powered Mechanical
Gait Orthosis with Coordinated Joint Locking. IEEE
Transactions on Neural Systems and Rehabilitation
Engineering. Vol.13, nº 2, pág. 227–235. Junho, 2005.
[23] VANDERBORGHT, B.; VERRELST, B.; VAN HAM, R.; VAN DAMME, M.;
LEFEBER, D.. Objective Locomotion Parameters based Inverted
Pendulum Trajectory Generator. Robotics and Autonomous
Systems. Vol. 56, nº 9, pág. 738–750. 2008.
[24] WILLIAMSON, M.. Neural Control of Rhythmic Arm Movements.
Neural Networks. Vol. 11, nº 7 e 8, pág. 1379–1394. 1998
[25] WILLIAMSON, M.. Designing Rhythmic Motions using Neural
Oscillators. MIT AI Lab, 545 Technology Square, Cambridge,
Massachusetts, Estados Unidos.
[26] YANG, W.; CHONG, N. Y.; KIM, C.; YOU, B. J.. Self-Adapting
Humanoid Locomotion using a Neural Oscillator Network.
Proceedings of the 2007 IEEE/RSJ International Conference
on Intelligent Robots and Systems. San Diego, Califórnia,
Estados Unidos. Pág. 309-216. Novembro, 2007.
[27] YANG, W.; MURAI, S.; MURAKAMI, K.; SEO, W.; CHONG, N. Y..
Adaptation in Bipedal Locomotion using Phase Oscillator
Networks. The 3rd International Conference on Ubiquitous
Robots and Ambient Intelligence (URAI). San Diego,
Califórnia, Estados Unidos. Pág. 309-216. Novembro, 2006.
[28] ZOSS, A.; CHU, A.; KAZEROONI, H.. Biomechanical Design of
the Berkeley Lower Extremity Exoskeleton (BLEEX). IEEE/ASME
Transactions on Mechatronics. Vol. 11, nº 2, pág. 128–138.
2006.
[29] ZOSS, A.; KAZEROONI, H.; CHU, A. (2005).. On the Mechanical
45
Design of the Berkeley Lower Extremity Exoskeleton (BLEEX).
Proceedings of the 2005 IEEE/RSJ International Conference
on Intelligent Robots and Systems. Edmonton, Alberta,
Canadá. Pág. 3465–3472. 2005.