UNIVERSIDADE DE SÃO PAULO DEPARTAMENTO DE … · o padrão de marcha conforme o seu grau de locomoção voluntária [11][20]. No caso de um exoesqueleto que se moverá livremente

UNIVERSIDADE DE SÃO PAULO

ESCOLA DE ENGENHARIA DE SÃO CARLOS

DEPARTAMENTO DE ENGENHARIA MECÂNICA

Rafael Gomes Gobbo

GERAÇÃO DE TRAJETÓRIAS ESTÁVEIS PARA EXOESQUELETOS

DE MEMBROS INFERIORES UTILIZANDO OSCILADORES

NEURAIS

São Carlos – SP

2011

Rafael Gomes Gobbo

GERAÇÃO DE TRAJETÓRIAS ESTÁVEIS PARA EXOESQUELETOS

DE MEMBROS INFERIORES UTILIZANDO OSCILADORES

NEURAIS

Trabalho de Conclusão

de Curso apresentado à

Escola de Engenharia de São

Carlos da Universidade de

São Paulo como parte dos

requisitos para graduação

em Engenharia Mecatrônica.

Orientador: Prof. Dr. Adriano Almeida Gonçalves Siqueira

São Carlos – SP

2011

AUTORIZO A REPRODUÇÃO E DIVULGAÇÃO TOTAL OU PARCIAL DESTE TRABALHO, POR QUALQUER MEIO CONVENCIONAL OU ELETRÔNICO, PARA FINS DE ESTUDO E PESQUISA, DESDE QUE CITADA A FONTE.

Ficha catalográfica preparada pela Seção de Tratamento da Informação do Serviço de Biblioteca – EESC/USP

Gobbo, Rafael Gomes.

G575g Geração de trajetórias estáveis para exoesqueletos de

membros inferiores utilizando osciladores neurais. /

Rafael Gomes Gobbo ; orientador Adriano Almeida

Gonçalves Siqueira –- São Carlos, 2011.

Monografia (Graduação em Engenharia Mecatrônica) --

Escola de Engenharia de São Carlos da Universidade

de São Paulo, 2011.

1. Redes neurais. 2. Exoesqueleto. 3. Auto-adaptação.

I. Titulo.

Dedicatória

Agradeço a Deus, em suas várias

formas de manifestação:

...nas experiências que tive, que

fizeram de mim quem sou hoje

...na família e nos amigos que

tenho, que me darão forças amanhã

...e no sentimento de um amanhã

melhor, de onde olharei para trás

e direi que valeu a pena.

Resumo

O relatório então presente mostra o desenvolvimento do

estudo acerca do tópico proposto, qual seja geração de

trajetórias estáveis para exoesqueletos de membros inferiores. O

trabalho aqui apresentando conclui a abordagem do assunto desde

o estudo inicial e implementação do gerador de trajetórias

estáveis para exoesqueletos de membros inferiores até a

adaptação de marcha durante o caminhar para alguns tipos de

realimentação.

Assim sendo, procurou-se desenvolver e simular redes

compostas por osciladores neurais e seus neurônios a fim de

entender o comportamento do modelo, viabilizando partir para o

conseguinte tema proposto, sobre adaptação do padrão de marcha.

O estudo sobre os tipos de realimentação e os respectivos

impactos comportamentais no sistema foi de alta importância para

que o estudo se tornasse mais refinado e prático.

As aplicações de um gerador de trajetórias que receba

realimentação do ambiente são, por exemplo, possibilitar a

criação de padrões de caminhada e marcha auto-adaptativos para

robôs e também auxiliar no processo de reabilitação de

pacientes, onde a interação entre o paciente e o sistema fará as

vezes do estímulo de realimentação do ambiente externo.

Palavras-chave: Redes neurais, Exoesqueleto, Auto-adaptação.

Abstract

The report now presented shows the development of the study

on the proposed topic, namely the generation of stable

trajectories for lower limb exoskeletons. The work presented

here concludes the initial approach of the matter since the

early study and implementation of the stable trajectories

generator for exoskeletons up to the auto-adaptation of the

walking gait itself given a variety of feedback inputs.

Therefore, we sought to develop and simulate neural

networks consisting of oscillators and their neurons in order to

understand the behavior of the model, thus allowing leave for

the proposed theme, on adaptation of the gait pattern. The study

on the types of feedback and their behavioral effects in the

system was of high importance for the study to become more

refined and practical.

The application of a trajectory generator that receives

feedback of the environment are, for example, enabling the

creation of walking patterns and gaits for self-adaptive robots

and also assist in the rehabilitation process of patients, case

in which the interaction between the patient and the system will

take place of the stimulus feedback from the external

environment.

Keywords: Neural networks, Exoskeleton, self-adaptation.

Lista de Ilustrações

FIGURA 1 Lokomat ............................................ 3

FIGURA 2 Modelo do Robô ..................................... 5

FIGURA 3(a) Diagrama do sistema sem o uso de redes neurais .. 6

FIGURA 3(b) Diagrama do sistema com o uso de redes neurais .. 6

FIGURA 4(a) desejado fixo ............................. 7

FIGURA 4(b) desejado variando ......................... 7

FIGURA 5 Diagrama esquemático de dois neurônios individuais 12

FIGURA 6 Diagrama esquemático do Oscilador Matsuoka ........ 12

FIGURA 7 Entrada degrau de valor para um neurônio

individual ........................................ 13

FIGURA 8 Diagrama de blocos do oscilador Matsuoka .......... 14

FIGURA 9 Geração rítmica para entrada constante ............ 15

FIGURA 10 Entrainment do oscilador Matsuoka ................ 15

FIGURA 11 Influência da constante de tempo na freqüência 16

FIGURA 12 Conexões inibitórias entre osciladores neurais

(vermelho e verde) ............................... 19

FIGURA 13 Rede Neural com MPG em estudo (modelo 6ON) ....... 21

FIGURA 14 Nomenclatura dos pesos de conexão ................ 22

FIGURA 15 Ligação vertical ( , , ) .. 23

FIGURA 16 Ligação cruzada ( , , ) ... 23

FIGURA 17 Modelo Quadril com Joelho/Pé (modelo 2ON) ........ 24

FIGURA 18 Aplicação do ON individual com feedback .......... 26

FIGURA 19 Aplicação do ON em uma rede neural ............... 26

FIGURA 20 Quadril da perna esquerda ........................ 29

FIGURA 21 Joelho da perna esquerda otimizado (ON individual) 30

FIGURA 22 Fase Desejada entre Quadril e Joelho da perna

esquerda (modelo 2ON) ............................. 31

FIGURA 23 Fase Ótima entre Quadril e Joelho esquerda (modelo

2ON) .............................................. 31

FIGURA 24 Fase Inicial no Modelo 6 ON ...................... 32

FIGURA 25 Fase dos Quadris ajustada no Modelo 6 ON ......... 33

FIGURA 26 Fase totalmente ajustada no Modelo 6 ON .......... 34

FIGURA 27 Otimização dividido +- para o pé da perna direita 37

FIGURA 28 Otimização dividido +- para o joelho da perna

direita ........................................... 37

FIGURA 29 Otimização dividido +- para o quadril da perna

direita ........................................... 38

Lista de Tabelas

TABELA 1 Defasagem Quadril com Joelho/Pé .................. 24

TABELA 2 Execução do Otimizador ........................... 29

TABELA 3 Parâmetros Otimizados ............................ 29

TABELA 4 Tipos de feedback utilizados e suas denominações . 36

TABELA 5 Resultados para dividido +- e inteiro +- ......... 36

TABELA 6 Parâmetros otimizados para feedback dividido +- .. 38

TABELA 7 Parâmetros otimizados para feedback inteiro +- ... 39

Sumário

1. Introdução .......................................... 1

1.1. Motivação ............................................................................................................. 1

1.2. Revisão Bibliográfica ................................................................................. 2

2. Objetivos e Etapas .................................. 8

3. Osciladores Neurais ................................. 9

3.1. Modelagem Matemática do Neurônio Matsuoka ................................. 9

3.2. Oscilador Matsuoka ...................................................................................... 10

3.3. Testes Comparativos ................................................................................... 12

4. Redes Neurais ...................................... 17

4.1. Conexão Vertical e Cruzada para 2 Osciladores Neurais .. 17

4.2. Rede Neural para o Caminhar Humano ............................................... 20

4.3. Resultados ......................................................................................................... 22

5. Adaptação – Otimização dos Parâmetros .............. 26

5.1. Resultados Otimizados sem Feedback ............................................... 28

5.1.1. Juntas Individuais .............................................................................. 28

5.1.2. Modelo com 2 e 6 Osciladores Neurais ................................... 30

5.2. Resultados Otimizados com Feedback ............................................... 34

6. Conclusão .......................................... 40

7. Referências Bibliográficas ......................... 41

1

1. Introdução

1.1. Motivação

Robôs bípedes são sistemas altamente não-lineares com

complexidade de vários graus de liberdade. Entretanto, o estudo

de tais sistemas pode gerar o desenvolvimento de dispositivos a

serem utilizados pelas pessoas em diversas situações do dia-a-

dia como, por exemplo, órteses ativas para os membros

inferiores. Atualmente há uma grande escassez de ferramentas

poderosas o suficiente para realizar o seu controle em tempo

real, fazendo-se necessário o desenvolvimento de técnicas mais

eficientes do que as hoje existentes.

O controle dinâmico de tais robôs é desafiador pois deve

operar de acordo com suas variáveis de estado, atuar na presença

de um campo gravitacional e sobretudo, porém mais interessante,

de forma a se adaptar com ambientes e estímulos externos

igualmente dinâmicos. Os robôs exigem o desenvolvimento de

técnicas robustas para abranger uma vasta gama de controle, como

torque, estabilidade, trajetória e geração de ritmos dependentes

do ambiente, através de sensoriamento e percepção.

Nas décadas recentes, a robótica mundial tem focado em

pesquisas no campo de geração de trajetórias de forma geral.

Porém, o resultado destas pesquisas pode ser de grande valor

quando voltada a uma área de interesse em particular, que

consiste em auxiliar pessoas que tenham deficiência motora.

Somente no Brasil existem cerca de 8 milhões de pessoas com

deficiência motora [7], e estas pessoas necessitam de aparelhos

de suporte durante sua reabilitação. Para o bom funcionamento de

equipamentos utilizados na reabilitação de membros inferiores,

faz-se necessário considerar a geração de uma trajetória de

referência, geralmente baseada no caminhar de pessoas saudáveis,

e a adaptação dessa trajetória através da interação com o

usuário.

2

A ideia de adaptação é fazer com que o paciente interaja

com o equipamento, de forma que este forneça potência somente

quando necessário, no instante em que o usuário demonstrar

intenção de movimento. Este tipo de interação necessita de

atuadores elásticos, que reproduzem determinadas características

dos músculos humanos, sendo basicamente compostos por um motor

elétrico ou hidráulico ligado em série ao efetuador através de

molas [19][21]. Com essas características torna-se possível

implementar controles de adaptação dos movimentos com a

utilização de algoritmos capazes de captar as informações

provindas do usuário e transmiti-las de forma precisa aos

atuadores do equipamento.

1.2. Revisão Bibliográfica

A agência de defesa dos Estados Unidos, DARPA, financia a

construção de dois exoesqueletos para fins militares. Dentro

desse programa citam-se os exoesqueletos BLEEX2 (Berkeley Lower

Extremity Exoskeleton), desenvolvido na Universidade da

Califórnia e que utiliza atuadores hidráulicos acionados por uma

bomba ligada a um pequeno motor a gasolina [12][13][29] e o

Raytheon, desenvolvido pela empresa Sarcos Research Corporation.

Fora desse programa, destaca-se o desenvolvimento do HAL-5

(Hybrid Assistive Limb), da Universidade de Tsukuba, Japão. O

HAL-5 é desenvolvido para fins de reabilitação, da mesma forma

que o ReWalk, desenvolvido pela empresa Argo Medical

Technologies, em Israel. O ReWalk detecta os movimentos da parte

superior do corpo e, a partir daí, o processo de caminhada é

iniciado.

Ainda no contexto de reabilitação temos o uso de órteses do

tipo RGO (Reciprocating Gait Orthosis) para pessoas com

paraplegia, que possibilitam o caminhar através de um mecanismo

que utiliza o movimento de uma perna para provocar o movimento

da outra perna. Algumas pesquisas propõem o uso de eletrodos que

permitem a estimulação elétrica funcional dos músculos do

paciente para reduzir os esforços necessários durante o caminhar

[9][18][22]. Membros da Universidade de Delaware [1] propõem uma

3

órtese com atuação eletromecânica que usa o balanço da gravidade

para reduzir os torques requeridos pelos atuadores durante o

movimento.

Em [10] uma órtese robótica denominada Lokomat é utilizada

na reabilitação de pessoas com deficiência, Figura 1. A órtese é

fixada em uma esteira e um sistema de compensação de pesos

suporta o peso do paciente. Uma trajetória padrão é aplicada na

órtese e são utilizados algoritmos de adaptação do padrão de

marcha, que possibilitam ao paciente ter a capacidade de alterar

o padrão de marcha conforme o seu grau de locomoção voluntária

[11][20]. No caso de um exoesqueleto que se moverá livremente no

espaço, a geração de trajetórias estáveis deve ser considerada.

Em [6] é apresentada uma metodologia de geração de trajetórias

estáveis considerando o ZMP (Zero Moment Point).

Em [23] é mostrado o robô bípede Lucy, que tem um sistema

de geração de trajetórias em tempo real utilizando a equação de

momento angular para a dinâmica natural dos membros superiores.

Com isso determina-se o comportamento dos membros inferiores. Em

[14] propõe-se um gerador de trajetórias no qual o movimento do

centro de gravidade do robô é simulado por um sistema de pêndulo

invertido, e a cinemática inversa do robô é usada para calcular

Figura 1: Lokomat.

4

as posições do centro de gravidade e da extremidade do pé do

robô, que é o ponto de interesse. É utilizada em [4] uma rede

neural auto-adaptativa com algoritmos genéticos para encontrar o

melhor ponto de estabilidade ZMP, gerando assim uma trajetória

estável que permite que o robô caminhe sobre superfícies de

diferentes inclinações.

Matsuoka propõe o uso de CPGs (Central Pattern Generators)

na geração de trajetórias [17]. Os CPGs são capazes de produzir

sinais oscilatórios que simulam os estímulos nervosos existentes

durante o caminhar humano através de modelos matemáticos de

neurônios. As capacidades extensora e flexora dos músculos são

representadas pelas respostas de cada neurônio. Quando ocorre a

inibição mútua entre dois neurônios, diz-se formarem um

oscilador neural. Por sua vez, ao interligar dois ou mais

osciladores neurais obtém-se a chamada rede neural, que

possibilita a obtenção de respostas verossímeis às da situação

real [26]. Em [2] também são realizados e exibidos resultados de

testes utilizando osciladores neurais no robô QRIO para a

geração de trajetórias.

Heralic [5] avalia a realimentação em redes neurais, sendo

então mencionado que este sinal pode ser utilizado como

chaveamento durante o caminhar, ativando ou desativando

determinados osciladores neurais.

No Laboratório de Mecatrônica da USP - São Carlos está

sendo desenvolvido um exoesqueleto de membros inferiores para

auxílio de pessoas com deficiência. O exoesqueleto em questão é

baseado em uma órtese RGO e utiliza atuadores elásticos em série

para a movimentação das juntas [8]. Sensores de força do tipo

FRS (Force Resistor Sensor) são instalados em pontos de contato

com o pé para se determinar os instantes de contato com o solo.

Nesse projeto, foi considerado um gerador de trajetórias

estáveis com o uso de splines cúbicas [6].

Considerando um ciclo de caminhar contendo uma fase de

suporte duplo (ambos os pés em contato com o solo) e uma fase de

suporte simples (apenas um pé em contato com o solo), o modelo

do robô está representado na Figura 2. Trajetórias suaves são

obtidas através de interpolação por splines cúbicas, a partir de

5

pontos pré-determinados de uma trajetória considerada padrão, o

que permite a obtenção de funções deriváveis até segunda ordem.

As trajetórias dos pés podem ser parametrizadas tomando-se

a posição planar do tornozelo e o ângulo entre o pé e o

solo. Semelhantemente, o movimento do quadril também pode ser

parametrizado, tomando-se então a posição do quadril e o

ângulo entre o tronco e o plano horizontal.

A dinâmica do exoesqueleto como um todo é modelada usando a

equação básica da robótica, derivada pelo Princípio de Lagrange

em [3]. Em [15] afirma-se que o torque a ser aplicado pelos

atuadores pode ser obtido utilizando o controle torque calculado

acrescido de um controle PD.

Para realizar o processo de adaptação do padrão de marcha,

foi utilizado um algoritmo baseado na dinâmica inversa do

modelo, que trabalha via minimização dos torques provenientes da

interação usuário-órtese. Para efeito de simulações, os torques

de interação entre a órtese e o paciente são obtidos a partir de

um acoplamento virtual do tipo mola, ou seja, proporcional à

diferença entre a posição simulada e a de referência. A variação

na trajetória de referência é calculada de modo que esta

variação resulte na redução do torque ativo produzido pelo

paciente. A Figura 3(a) ilustra o sistema de adaptação baseado

na dinâmica inversa.

Com o objetivo de melhorar o desempenho do sistema de

Figura 2: Modelo do Robô.

6

geração de trajetórias e da adaptação de marcha, foi

desenvolvido um sistema de adaptação utilizando redes neurais. O

sistema de adaptação proposto emprega três redes MLPs

(Multilayer Perceptron), correspondendo a Neural Network 1, a

Neural Network 2 e a Neural Network 3, indicadas por NN1, NN2 e

NN3 respectivamente (Figura 3(b)). A finalidade da implementação

dessas três redes é reduzir o tempo gasto durante o processo de

optimização e adaptação dos parâmetros da trajetória.

A primeira rede neural, NN1, é treinada offline utilizando

o modelo dinâmico paciente-órtese e a mudança na trajetória de

referência para obter a variação no torque. A segunda rede

neural, NN2, encontra o valor de que minimiza o

determinado funcional [14]. O treinamento dessa rede é

realizado online e, para que convirja, fazemos igual ao

erro de saída da rede. A rede NN3 substitui o gerador de

trajetórias analítico e tem como entradas o valor do parâmetro

e o instante de tempo e, como saídas, as posições ( ),

velocidades ( ) e acelerações ( ) de cada uma das sete juntas da

órtese.

Utilizando esse sistema, foram realizadas simulações em

MatLab. Abaixo é mostrado o resultado para adaptações que

Figura 3(a): Diagrama do sistema sem o

uso de redes neurais.

Figura 3(b): Diagrama do sistema com o

uso de redes neurais.

7

ocorrem depois da metade de cada passo. A Figura 4(a) mostra a

adaptação da trajetória do fêmur esquerdo considerando um valor

de desejado fixo em s para todos os passos. A Figura

4(b) mostra a mesma simulação realizada considerando uma

adaptação no primeiro passo de s, passando a

s no segundo passo e, posteriormente, a s

no terceiro passo. Observa-se que o sistema proposto é eficiente

nas simulações, e o custo computacional foi reduzido

significativamente com o uso de redes neurais.

Porém, apesar de se mostrar eficiente nas simulações

realizadas, para que o sistema esteja apto a trabalhar com

outros valores dos parâmetros envolvidos, há a necessidade de se

treinar as redes com intervalos maiores para cada parâmetro.

Isso torna esse sistema inviável no sentido de gerar trajetórias

e adaptações on-line. Nesse sentido, outra abordagem com

ferramentas matemáticas ainda mais poderosas deve ser realizada

para que o sistema possa ser aplicado em tempo real no

equipamento que está sendo construído.

Figura 4(a): desejado fixo. Figura 4(b): desejado variando.

8

2. Objetivos e Etapas

A presente pesquisa destina-se a desenvolver novos métodos

de utilização de modelos matemáticos de neurônios, osciladores e

redes neurais com aplicação em exoesqueletos para membros

inferiores através da avaliação e melhorias de trabalhos

existentes tais como [26].

Ao longo da pesquisa foram realizados testes e simulações

que permitiram saber se os resultados obtidos estavam coerentes

com os obtidos previamente em outros países, como os presentes

em [2].

O estudo sobre a aplicação de redes neurais de forma auto-

adaptativa se insere no contexto de permitir que o equipamento

desenvolvido na USP – São Carlos pelo aluno Bruno Jardim [8] se

locomova independentemente em terrenos, a priori, desconhecidos.

Para o aprofundamento em redes neurais auto-adaptativas

contamos com o auxílio do aluno Marciel Alberto Gomes, que

desenvolve estudos na área de adaptação do padrão de marcha.

Para melhor acompanhamento dos eventos, enumeramos as

etapas do projeto:

• Revisão bibliográfica;

• Implementação de osciladores neurais;

• Desenvolvimento do gerador de trajetórias estáveis para o

exoesqueleto baseado em osciladores neurais;

• Desenvolvimento de algoritmos de adaptação do padrão de

marcha;

• Confecção do relatório do trabalho.

9

3. Osciladores Neurais

3.1. Modelagem Matemática do Neurônio Matsuoka

Logo no começo do projeto recorremos ao estudo e simulação

do neurônio Matsuoka [17], com o objetivo de criar-se um

oscilador neural a partir do mesmo.

Matsuoka propõe em [17] um modelo de neurônio individual

cujo tratamento numérico é mais simples em comparação com os

demais modelos, sendo amplamente usado devido à efetividade em

pesquisas voltadas a robótica.

As seguintes equações modelam a dinâmica do neurônio a

partir de simplificações realizadas no modelo proposto em [27]:

(1)

(2)

(3)

O significado de cada uma das variáveis consta abaixo:

é uma variável de estado interna que corresponde ao

potencial de membrana do neurônio;

é uma variável de estado representando o grau de adaptação

e auto-inibição do neurônio;

é uma constante de adaptação, também relacionado à

adaptação do neurônio;

é o sinal de saída do neurônio. Como veremos mais adiante

corresponde à saída do neurônio extensor ou flexor do

músculo;

é o sinal de realimentação do neurônio. O termo

poderia ser substituído por dependendo na função do

neurônio (extensor ou flexor);

é a constante de tempo relacionada ao tempo de subida para

uma entrada degrau (step input);

é a constante de tempo que especifica o atraso do tempo de

10

adaptação;

relaciona-se ao sinal de entrada do driver. É uma entrada

não oscilante, conforme [5].

é a constante que indica a força do sinal de entrada sinal

de realimentação.

Avaliou-se então que um único neurônio não é capaz de gerar

o sinal periódico desejado, estando este resultado exposto na

Seção 3.3.

Para a obtenção de sinal periódico fazemos o uso do

oscilador Matsuoka.

3.2. Oscilador Matsuoka

O oscilador Matsuoka é definido como sendo dois neurônios

interligados e inibindo-se mutuamente. Como já mencionado acima,

cada neurônio passa a representar a capacidade extensora (E) e

flexora (F) do músculo.

Ao possibilitarmos a comunicação entre dois neurônios,

surgem variáveis adicionais que incorporam as equações 1, 2 e 3.

Para uma melhor visualização, cada neurônio passa a ser

representado por equações semelhantes porém com índices

distintos, que facilitam o entendimento das mesmas.

O conjunto de equações para um oscilador Matsuoka encontra-

se abaixo:

(4)

(5)

(6)

(7)

(8)

(9)

11

Note a semelhança com as equações de quando há apenas um

neurônio.

Embora possível e de maior valor nesta pesquisa, nestas

equações foram omitidos os termos que consideram a comunicação

entre dois ou mais osciladores, uma vez que no momento estamos

tratando de apenas um oscilador. A interação será abordada mais

adiante.

Os sub-índices e correspondem ao neurônio extensor (4,

5 e 6) e flexor (7, 8 e 9) do oscilador neural de índice

(neste caso temos somente ).

Note que, em comparação às equações 1, 2 e 3, foram

adicionados os termos relativos ao grau ou força de inibição

mútua, sendo eles e , presentes nos neurônios

extensor e flexor respectivamente. Deste forma, é demandada a

explicação sobre os termos que foram acrescentados.

e são os sinais de saída de cada neurônio do oscilador

neural. A saída do oscilador neural em si, , é tida como

a subtração destes valores:

(10)

e são constantes e denotam o peso da conexão sináptica

inibitória entre os neurônios extensor e flexor.

As ilustrações a seguir mostram o diagrama esquemático de

dois neurônios individuais (Figura 5) e, em sequência, o de um

oscilador Matsuoka (Figura 6, adote ).

Nestas figuras entende-se:

.

12

3.3. Testes Comparativos

A cada etapa de simulação eram realizados testes para

verificar se o modelo computacional construído estava correto.

Inibitório Excitatório

E

F

Figura 5: Diagrama esquemático de dois

neurônios individuais.

Figura 6: Diagrama esquemático do

Oscilador Matsuoka.


E

F

13

Construiu-se primeiramente o modelo do neurônio individual

no Simulink, dado pelas equações 1, 2 e 3. Para a validação,

recorremos a [16], onde são realizados testes com parâmetros

conhecidos. Neste artigo, o autor adota

, e . Além disso, como um neurônio individual

não se comunica externamente, ele não possui entrada

proprioceptiva, isto é, o sinal de realimentação é nulo e logo

. Assim, adotamos pois ele multiplica .

O sinal de entrada vem do parâmetro , e nos testes

adotamos uma entrada degrau no instante (zero) e de valor

, e . As condições iniciais são todas nulas.

Para todas as três entradas houve estabilização do sinal de

saída, como exemplifica a Figura 7.

Tendo sido verificada esta característica do neurônio

Matsuoka, prosseguiu-se para o oscilador neural Matsuoka. Nesta

etapa constatou-se que o modelo em Simulink do oscilador (Figura

8) é pouco versátil quanto ao manuseio de gráficos e na

agilidade de mudança de parâmetros, embora seja um software que

possibilita visualizar o diagrama de blocos diretamente; por

isso empregamos também o MatLab na construção dos modelos de

oscilador.

Os testes realizados para o oscilador avaliam duas

características importantes e desejáveis: a geração de sinal

rítmico dada uma entrada tônica não periódica e a adaptação a um

sinal periódico (entrainment). Estes experimentos são realizados

em [2], e os tomamos como base.

Figura 7: Entrada degrau de valor para um neurônio individual.

14

A geração de um sinal rítmico para uma entrada tônica

constante, por exemplo, pode ser obtida tomando os seguintes

valores: ,

, , , , e

e (realimentação nula).

As condições iniciais adotadas foram nulas. Note na Figura

9 que o oscilador é capaz de gerar sinal rítmico mesmo sendo o

sinal de realimentação nulo (“input nulo”, conforme legenda).

A adoção

é uma recomendação presente em [25],

onde afirma-se que para oscilações estáveis o denominador deve

estar entre e .

A Figura 9 mostra o resultado deste teste; ela mostra

também outra propriedade, que é a influência do valor da entrada

tônica . Segundo [25] a amplitude de oscilação é proporcional

ao valor de , o que é de fato confirmado pelo teste.

Ambas as curvas da figura são para o conjunto de parâmetros

mencionado acima, exceto pelo valor de , que varia de a . Ao

dobrar a entrada tônica a amplitude igualmente dobrou.

Convém ressaltar que esta relação é altamente volátil no

que diz respeito à sensibilidade das variáveis, isto é, a

proporcionalidade é válida apenas em uma gama de valores

específica dados os valores dos demais parâmetros.

Figura 8: Diagrama de blocos do oscilador Matsuoka.

15

A propriedade de adaptação (entrainment) é mostrada na

Figura 10. A curva foi gerada usando o mesmo conjunto de

parâmetros indicado acima, porém sendo a entrada tônica um

sinal periódico e fazendo-se necessário adotar um valor para o

sinal de realimentação diferente de zero.

Este comportamento é bastante funcional, uma vez que

durante o caminhar vários estímulos externos podem começar a

atuar subitamente sobre o sistema de forma periódica. Assim, o

modelo mostra-se capaz de tratar o sinal de realimentação de

forma a continuar gerando um sinal rítmico, sinal este que

jamais deve ser perdido durante uma locomoção estável.

Figura 9: Geração rítmica para entrada constante.

Figura 10: Entrainment do oscilador Matsuoka.

16

Na Figura 10, a entrada tônica é nula até , quando ela

então se torna periódica e defasada de em relação à saída

inicial. Em observa-se que o oscilador ajusta

significativamente a fase da entrada com a da saída, mantendo

também um padrão periódico de mesma frequência.

Em [25] um comportamento adicional é citado: sugere-se que

a constante de tempo seja inversamente proporcional à

freqüência da saída. Esta afirmação também foi analisada e

confirmada, porém mais uma vez cabe mencionar que é válida

apenas para determinados valores de variáveis. A Figura 11 exibe

graficamente a variação da freqüência.

Novamente os valores adotados foram os apresentados no

conjunto acima, inclusive a entrada tônica como e a

realimentação nula.

Figura 11: Influência da constante de tempo na freqüência.

17

4. Redes Neurais

Pesquisas neurobiológicas afirmam que os padrões de ritmo

na locomoção dos animais (o andar de bípedes e quadrúpedes, o

vôo de aves e o nadar de peixes) são gerados em algumas unidades

neurais centrais. Adicionalmente, os animais não somente geram

os sinais como também são capazes de alterar amplamente a sua

velocidade. A mudança do ato de andar para o de galopar é um

exemplo comum em casos de quadrúpedes.

Assumindo-se que os ociladores neurais são a unidade básica

para o entendimento de cada junta, pois correspondem ao músculo

extensor e flexor, foram realizados estudos que contemplavam a

interação entre diversos osciladores neurais [27]. A estas

configurações damos o nome de rede neural.

Nestes estudos buscou-se também adotar uma unidade central,

chamada de CPG (Central Pattern Generator) ou MPG (Main Phase

Generator), conforme a motivação biológica mencionada acima.

Essa unidade central se encarregaria de prover o rítmo ao resto

do sistema.

4.1. Conexão Vertical e Cruzada para 2 Osciladores

Neurais

O equacionamento de uma rede neural com 2 osciladores é

semelhante ao do oscilador apresentado anteriormente. Resta

apenas computar os termos que consideram a comunicação entre os

neurônios de osciladores diferentes. Segundo Yang [27], o

equacionamento é como segue (equações 11, 12, 13, 14, 15 e 16).

Um resumo sobre as variáveis e seus significados faz-se

necessário para eliminar quaisquer dúvidas que possam existir ao

passarmos da análise de um neurônio individual, para a de um

único oscilador e enfim para a uma rede neural com 2

osciladores, agora apresentada.

(11)

18

(12)

(13)

(14)

(15)

(16)

Os sub-índices e continuam correspondendo aos neurônios

extensor e flexor do oscilador neural de índice . Agora, os

índices correspondem aos demais osciladores neurais da rede,

cada um composto por um neurônio extensor e flexor.

Os termos em que o índice está são os termos que foram

inseridos nas equações: e

. Então comecemos o

resumo por eles:

é a constante que denota o peso, ou força, da conexão

sináptica inibitória entre os neurônios dos osciladores

neurais e . Fazem parte desses valores as constantes ,

, e . A influência desses valores na pode ser vista

na Figura 12. O somatório representa justamente o

efeito global da interação de todos os osciladores da rede

neural;

: variável de estado interna que corresponde ao potencial

de membrana dos neurônios do oscilador neural ;

: variável de estado representando o grau de adaptação e

auto-inibição dos neurônios do oscilador neural ;

: é uma constante de adaptação e aparece junto ao termo ,

também relacionado à adaptação do neurônio;

e : sinais de saída do -ésimo oscilador neural.

Correspondem à saída do neurônio extensor ou flexor. Note que

ambas as saídas e são compostas apenas das partes

positivas da variável e , respectivamente. Assim sendo,

19

assume-se que a saída de cada oscilador neural como um todo é

a subtração destes valores:

(17)

: sinal de entrada do oscilador neural. Corresponde a um

sinal de realimentação do sistema real. Note que os termos

e separam a entrada em duas partes: a parte

positiva segue ao neurônio extensor enquanto a parte negativa

chega ao neurônio flexor;

: é uma constante de tempo que especifica o tempo de subida

no oscilador para uma entrada degrau (step). Segundo [25] a

freqüência do sinal de saída do neurônio é grosseiramente

proporcional a , o que já foi verificado;

: constante de tempo que especifica o atraso na adaptação

do oscilador. Note que esse valor também está presente em um

termo que contém , assim como o valor . Em [25] afirma-se

que e determinam a velocidade e a forma da saída do

oscilador neural;


E2 F2

E1 F1

Figura 12: Conexões inibitórias entre osciladores neurais

(vermelho e verde).

20

e : denotam o peso da conexão sináptica inibitória

entre os neurônios extensor e flexor do mesmo oscilador

neural;

: é chamada de entrada tônica (tonic input), pois seu valor

constante é proporcional à amplitude de oscilação [25]. Na

Seção 3.3 isto já foi discutido;

: constante que indica o peso do sinal de entrada sinal de

realimentação do sensor no -ésimo oscilador. Pode-se dizer

que o sinal de entrada é dimensionado através das constantes

.

A ligação entre os dois osciladores neurais, dada pelos

parâmetros , , e , geralmente ocorre de duas formas

distintas. Os osciladores podem estar se comunicando

verticalmente, isto é, extensor com extensor ou flexor com

flexor ou então de forma cruzada, quando temos o extensor de um

com o flexor de outro. Ambas as ligações estão representadas na

Figura 12: em vermelho temos a ligação vertical e em verde a

cruzada.

Dessa forma, quando adotamos a ligação vertical, por

exemplo, os parâmetros da ligação cruzada devem ser anulados, ou

seja, O mesmo raciocínio é adotado quando usamos a

ligação cruzada.

Uma questão que merece atenção especial é a realimentação.

Nestas equações a realimentação é apenas mencionada em termos

matemáticos, mas veremos a seguir o que ela de fato representa.

4.2. Rede Neural para o Caminhar Humano

Com base em uma pura analogia com o corpo humano, e sabendo

que cada oscilador neural, composto por dois neurônios,

assemelha-se à função de uma junta, um sistema mecânico complexo

formado por várias juntas, elos e atuadores pode ser

representado por uma rede neural complexa composta por mais de

dois osciladores neurais. Como um oscilador com dois neurônios é

capaz de representar uma única junta, vários osciladores em uma

21

mesma rede comunicam-se entre si de forma a possibilitar maior

versatilidade do modelo. Para efeitos de ilustração

disponibiliza-se a imagem abaixo (Figura 13), na qual cada

circunferência corresponde a um neurônio extensor ou flexor, e

cada par de neurônios (oscilador) corresponde a uma junta do

corpo. Na realidade, um modelo semelhante é proposto em [16] e

representa o corpo da cintura para baixo. Este modelo foi então

aperfeiçoado conforme proposto em [5], tomando-se como feedback

os ângulos das juntas dos joelhos e pés. A realimentação é

enviada ao MPG (quadril). Feitos estes arranjos, obtemos o

diagrama presente na Figura 13.

A figura acima deixa claro que a realimentação comumente

usada pela maioria dos autores é o ângulo de junta. Heralic [5]

sugere também que a realimentação pode ser usada para chavear o

movimento das pernas, e, neste caso, a realimentação seria

proveniente de um sensor binário de contato para informar quando

determinada perna encostou no chão.

Figura 14: Rede neural com seis osciladores Matsuoka.

E5 F5 E6 F6

E3 F3 E4 F4

F1 F2

E1 E2

𝜃1

Perna Esquerda Perna Direita

Pés

𝜃2

𝜃3 𝜃4

𝜃5 𝜃6

Joelhos

Quadris

MPG

Figura 13: Rede Neural com MPG em estudo (modelo 6ON).

22

Notar na figura que a realimentação de ângulo das juntas do

joelho e do pé é enviada somente ao oscilador do quadril do

mesmo lado (esquerdo ou direito). Assim sendo, este passa a

formar o MPG, pois será através do quadril que os joelhos e os

pés receberão a informação do ambiente ao redor. Ainda, repare

que a realimentação está puramente presente de forma indicada na

figura, o que abre a possibilidade de estudarmos alguns tipos de

realimentação mais adiante do joelho e pé para o quadril.

Conforme abordado na Seção 4.1, a rede neural apresentada

apresenta conexão vertical entre os osciladores do quadril.

Por último, e não menos importante, a Figura 14 abaixo

mostra a denominação dos pesos das conexões entre os diversos

osciladores. Na figura, “j” se refere a joelho e “p” a pé.

4.3. Resultados

Com base em [26] estudamos o comportamento de redes neurais

ligadas verticalmente e em cruz. Os resultados obtidos condizem

com o que é dito em [26], isto é, ao ligarmos dois osciladores

na vertical as saídas de ambos os osciladores estarão defasadas

em . Isto ocorre porque o sinal do flexor F1 (oscilador 1)

estará em fase com o do extensor E2 (oscilador 2).

E5 F5

E3 F3

E1

F1

WE

WF

WEj

WFEj

WEp WFEp

Figura 14: Nomenclatura dos pesos de conexão.

23

Semelhantemente, se a ligação for cruzada então o flexor F1

estará defasado em com o extensor E2, gerando saídas dos

osciladores em fase. As Figuras 15 e 16 ilustram este fato.

Os parâmetros adotados foram os seguintes: ,

, , , ,

. Para ambas as ligações o sinal de realimentação foi

tido como uma entrada degrau no instante e de valor final

.

Figura 15: Ligação vertical ( , , ).

Figura 16: Ligação cruzada ( , , ).

24

Para começar a entender a rede neural da Figura 13, foi

feita uma análise dos osciladores que compreendem a comunicação

ente o quadril e o joelho ou o quadril e o pé. Note na figura

que as configurações são iguais ao modelo abaixo (Figura 17). Na

Figura 16, os pesos podem ser do joelho ou do pé.

Intuitivamente, ao analisar o modelo, temos que com a

escolha apropriada dos pesos e é possível gerar

uma diferença de fase controlada entre a saída do oscilador 1

(quadril) e a do oscilador 2 (joelho ou pé). A averiguação foi

feita e o acontecimento confirmado. Os parâmetros adotados foram

, , , , ,

e . A realimentação é .

A defasagem angular máxima obtida a partir da referência

foi . A tabela abaixo mostra integralmente os resultados

assim como os respectivos pesos das conexões (Tabela 1).

F1 E1

F2 E2

WE(j,p) WFE(j,p)

Figura 17: Modelo Quadril com Joelho/Pé (modelo 2ON).

WE WFE Defasagem (°)

0,5 0,05 0

0,5 0,15 5,02

0,5 0,2 10,05

0,5 0,25 16,74

0,5 0,28 21,77

0,5 0,3 30,14

0,5 0,31 38,51

0,5 0,32 43,53

0,5 0,33 46,88

0,5 0,34 63,63

0,5 0,35 70,33

0,5 0,36 82,05

0,5 0,37 93,77

0,5 0,38 105,49

0,5 0,39 125,58

0,5 0,4 138,98

0,5 0,41 147,35

0,5 0,42 155,72

Tabela 1: Defasagem Quadril com Joelho/Pé.

25

Esta possiblidade de alterar e corrigir as diferenças de

fase é extremamente importante para o caso de um caminhar

estável, uma vez que a defasagem angular entre as juntas do

quadril, joelho e pé durante deve ser imposta ao modelo através

dos parâmetros de inibição entre os osciladores expostos na

Tabela 1.

26

5. Adaptação – Otimização dos Parâmetros

Tendo em mãos as trajetórias do caminhar de um indivíduo

saudável, o passo seguinte abordado foi o ajuste das curvas dos

osciladores a estas trajetórias previamente conhecidas. Esta

etapa vem ao encontro da necessidade de determinarmos como o

comportamento de auto-adaptaçao ocorrerá nos osciladores neurais

Matsuoka e, consequentemente, em redes neurais.

Abaixo encontram-se dois diagramas (Figura 18 e Figura 19)

que sintetizam a aplicação dos osciladores neurais para o

caminhar humano, com a aplicação de feedback.

Na Figura 18 cada oscilador neural foi utilizado para

representar uma única junta do modelo bípede inferior: quadril,

ON Controle de

Torque +

-

Erro Trajetória

desejada Torque

SIMULADOR

(Modelo Dinâmico) Posição Real

Simulada

Feedback de ângulo de junta

Figura 18: Aplicação do ON individual com feedback.

Figura 19: Aplicação do ON em uma rede neural

27

joelho e pé, divididos entre lado esquerdo e direito (Figura 2).

Isto totaliza 6 juntas e, logo, 6 osciladores neurais.

Neste caso, a realimentação é fornecida ao oscilador neural

para que ele adapte a sua trajetória de acordo com a posição

real obtida na saída do simulador dinâmico. Assim, o oscilador

neural se incumbe de fornecer uma curva estável e rítmica de

referência para o restante do sistema.

Esta trajetória de referência é usada para o cálculo do

erro entre o ângulo desejado e o real simulado, proveniente do

simulador, para que seja determinado o torque a ser aplicado na

junta em questão. O torque é então enviado ao simulador para que

ele forneça o novo ângulo de junta, que será usado como

feedback. Em [15] propõe-se calcular o torque através de um

controlador PD.

Na Figura 19 temos também a utilização de 6 osciladores

neurais, porém eles configuram uma rede neural devido à

existência de interação entre eles. A figura esquematiza o

funcionamento da rede neural com MPG da Figura 13. Nela, o sinal

de realimentação consiste na posição real simulada de cada junta

que, ao invés de ir para seu respectivo oscilador neural, vai

para o MPG, situado no quadril. O MPG calcula então a posição

desejada do quadril, que passa a influenciar os osciladores dos

joelhos e pés. Após calculadas, as 6 trajetórias seguem para o

cálculo do erro.

Embora cada oscilador ainda assim continue sendo

responsável por gerar apenas a trajetória da junta referente a

ele, os osciladores do quadril e do joelho enxergam o ambiente

externo apenas através da interação com o MPG.

O ajuste das curvas é realizado pela alteração dos

parâmetros dos osciladores neurais: , , , , , e . A

realimentação é dada pela variável .

Devido à complexidade e alto custo computacional exigido

para realizar a otimização baseando-nos no esquema da Figura 19,

pois afinal ocorre a interação entre 6 osciladores neurais e

envolve cerca de 60 parâmetros simultâneos, as otimizações dos

parâmetros realizadas nas seções 5.1 e 5.2 dizem respeito apenas

ao esquema da Figura 18. Esta simplificação facilita a abordagem

28

das equações uma vez que reduz o número de parâmetros a serem

otimizados de 60 para 10.

Ainda, durante a implementação do otimizador mostrou-se

conveniente adotarmos uma nova lista de parâmetros para os

osciladores. A mudança realizada é simples e consiste em adotar

parâmetros independentes entre si para cada neurônio no mesmo

oscilador. Isso fornece melhores resultados quando em comparação

com o conjunto de parâmetros logo acima.

Os parâmetros utilizados foram então: , , , , ,

, , , e . Essa mudança retroage nas equações 4, 5, 7 e

8 (referentes aos osciladores neurais), de forma que os sub-

índices e denotam em que neurônio os parâmetros estão.

Atenção especial para e , que estão nos neurônios

contrários aos sub-índices (ver equações 4 e 7), pois estes

parâmetros indicam justamente o peso da conexão com o neurônio

complementar do oscilador. Adotou-se o ganho da realimentação,

quando presente, , ou seja, o valor em si do ganho não foi

otimizado, porém diversas configurações de feedback foram

analisadas.

Foram realizadas as otimizações com e sem feedback, além de

estudadas também novas expressões para o sinal de realimentação,

como mencionado acima. O critério de parada da otimização foi

adotato como sendo a iteração a partir da qual a melhoria não

mais era significativa, cerca de 5% de diferença entre a

iteração anterior.

5.1. Resultados Otimizados sem Feedback

5.1.1. Juntas Individuais

A Tabela 2 resume a otimização para o caso dos osciladores

neurais atuando independentemente e sem feedback (como proposto

na Figura 18 porém em malha aberta), ao passo que a Tabela 3

revela os valores dos parâmetros ótimos. Foram gerados gráficos

para visualizar o quanto a otimização conseguiu se aproximar da

trajetória real da junta. Os gráficos de todas as juntas foram

29

gerados, e exibem-se os referentes ao quadril da perna esquerda

(Figura 20) e o joelho da perna esquerda (Figura 21).

Os resultados das demais juntas foram semelhantes, o que

exclui a necessidade de mostrá-los. Quando necessário, adotar

junta 1, 2 e 3 como pé, joelho e quadril, respectivamente.

Junta Perna Esquerda Perna Direita

Iterações Erro Iterações Erro

Pé 52 82,63470 42 70,09940

Joelho 41 58,01090 22 61,81290

Quadril 42 18,51880 27 11,63540

Tabela 2: Execução do Otimizador.

Parâmetro Perna Esquerda Perna Direita

Pé Joelho Quadril Pé Joelho Quadril

Tre 0,0967 0,0057 0,0310 0,0982 0,0052 0,0933

Trf 0,0780 0,0642 0,0964 0,0238 0,1452 0,0392

Tae 0,2327 1,2010 1,4281 0,3167 1,6641 0,5269

Taf 0,5327 1,2412 1,6943 0,7316 1,6780 0,6410

be 0,9489 0,8675 1,6414 0,8837 1,8174 0,8372

bf 0,8884 0,8086 1,7908 0,5291 1,8213 0,7200

wf 1,6689 1,5531 0,9578 1,2801 1,4528 0,9082

we 1,3135 0,8649 1,3584 1,3515 0,9685 1,6955

se 0,6688 0,8350 1,4400 0,8001 1,0780 1,1487

sf 0,5341 0,6229 1,3763 0,6541 0,9030 1,2900

Tabela 3: Parâmetros Otimizados.

Figura 20: Quadril da perna esquerda.

30

Em ambas as Figuras 20 e 21 observa-se que, mesmo na melhor

combinação dos parâmetros, o oscilador neural não é capaz de

aproximar com qualidade sem realimentação. Além disso,

constataremos mais adiante que foi necessária uma quantidade

relativamente alta de iterações em relação ao caso com feedback.

5.1.2. Modelo com 2 e 6 Osciladores Neurais

Embora a otimização tenha sido realizada para o caso de

osciladores neurais atuando individualmente como uma junta em

malha aberta, avaliou-se a utilização destes parâmetros ótimos

nos modelos de rede neural com 2 e 6 osciladores, também sem

realimentação, puramente para determinar o seu comportamento

(Figuras 17 e 13 respectivamente). Como já vimos ser possível

ajustar a fase de acordo com o nosso interesse na Seção 4.3,

buscamos também aproximar as fases entre as juntas nestes dois

casos.

Conforme descrito na Seção 4.2, a rede neural com 2

osciladores pode representar a comunicação do quadril com joelho

ou do quadril com pé. As duas curvas na Figura 22 representam as

trajetórias geradas no modelo da Figura 17 com pesos nulos para

o quadril e o joelho esquerdos, utilizando os parâmetros

Figura 21: Joelho da perna esquerda otimizado (ON individual).

31

respectivos otimizados anteriormente na Seção 5.1.1. Nessa

figura a defasagem foi ajustada manualmente até um ponto

compatível com a de uma trajetória de referência.

Já a Figura 23 expõe as curvas das mesmas juntas, os mesmos

parâmetros e ainda segundo o modelo da Figura 17, porém nela a

defasagem foi ajustada pelo ajuste dos pesos e .

Ainda, o ajuste conseguiu fases a princípio iguais com os

pesos adotados e (Figuras 22 e 23).

Partindo agora para o caso com 6 osciladores neurais, o

procedimento adotado foi o mesmo, isto é, substituímos os

Figura 22: Fase Desejada entre Quadril e Joelho da perna esquerda

(modelo 2ON).

Figura 23: Fase Ótima entre Quadril e Joelho esquerda (modelo

2ON).

32

valores dos parâmetros calculados através da otimização para o

caso individual (Tabela 3) na Seção 5.1.1 no modelo apresentado

na Figura 13, porém desconsiderando a realimentação indicada na

figura.

Como é possível verificar na Figura 13, agora teremos que

achar os pesos da conexão entre quadril e joelho, quadril e pé e

entre os osciladores do quadril, que formam o MPG, de forma a

ajustar a fase para um caminhar harmonioso. O diferencial agora

consiste em identificar os pesos entre os osciladores do

quadril, uma vez que logo acima foi feito o ajuste de fase entre

quadril e joelho, o que em teoria se assemelha também ao ajuste

entre quadril e pé. Lembre-se que a ligação entre os osciladores

do quadril ocorre na forma vertical, como explicado na Seção

4.1.

A Figura 24 ilustra o estado inicial e não tratado quando

da substituição dos parâmetros otimizados no modelo 6ON. Nela

nenhum ajuste havia sido feito e os pesos eram todos nulos:

, o que significa que não tínhamos

implementado a rede neural propriamente dita.

Figura 24: Fase Inicial no Modelo 6 ON.

33

Através desta figura podemos notar que as curvas dos lados

esquerdo e direito, mesmo com os valores otimizados, possuem

frequências diferentes, indicando que por mais que o otimizador

tenha encontrado os parâmetros ótimos, eles não são suficientes

para gerar trajetórias compatíveis entre as duas pernas.

A primeira ação corretiva foi ajustar a fase entre os

quadris, através do ajuste de e (Figura 25). Nela

observa-se que conseguimos obter a defasagem desejada para as

juntas do quadril, qual seja , muito embora ainda falte

corrigir as juntas do joelho e do pé.

Deste ponto, identificamos os valores para e

que colocam as trajetórias dos joelhos e dos pés na fase

adequada para o caminhar humano. É importante ressaltar que a

condição para o caminhar saudável não é posicionar as 6 curvas

na mesma fase (pico com pico e vale com vale), mas sim cada

curva na fase adequada obtida através do sensoriamento de um

caminhar real. A Figura 26 mostra êxito neste tópico.

É interessante perceber que a simples presença de

comunicação entre os osciladores do quadril foi suficiente para

Figura 25: Fase dos Quadris ajustada no Modelo 6 ON.

34

fazer com que os osciladores dos joelhos esquerdo e direito,

assim como os dos pés, oscilassem numa mesma frequência. Ou

seja, o MPG realmente está atuando sobre as demais juntas,

oferecendo um ritmo a ser seguido.

Os pesos finais para a condição atingida na Figura 26 foram

, , , , e ,

sendo os pesos do joelho e pé iguais para os lados esquerdo e

direito do modelo.

5.2. Resultados Otimizados com Feedback

Os resultados obtidos na seção anterior revelam que a rede

neural proposta segundo a Figura 13 faz com que padrões rítmicos

surjam para todos os osciladores que a compõe, e mais

importante, na mesma freqüência, mesmo que sem realimentação.

Porém, a busca pela capacidade adaptativa do modelo é

imposta somente quando há a presença da realimentação.

A fim de viabilizar um estudo mais simplificado sobre os

casos com realimentação, adotamos como sinal de feedback o

próprio ângulo de junta desejado para o oscilador em questão.

Observando-se a Figura 18 sabemos que isso não é necessariamente

Figura 26: Fase totalmente ajustada no Modelo 6 ON.

35

verdade, uma vez que o controlador não é exato e não consegue

posicionar a junta no ângulo desejado sem erro algum. Contudo

essa afirmação é aceitável e bastante plausível caso o oscilador

neural já esteja gerando a própria curva desejada e o controle

de torque seja exato e instantâneo; ou seja, assumir o feedback

como o ângulo de junta é válido para a condição de equilíbrio do

oscilador.

Adicionalmente, com a finalidade de chegar a uma conclusão

sobre a forma de utilizar a realimentação, propusemos diversos

tipos de realimentação, conforme mostra a Tabela 4. Nesta tabela

exibimos o tipo de realimentação usado, que substitui o termo de

realimentação nas equações 4 e 7 (Seção 3.2), e a sua

denominação neste estudo. Tenha em mente que essa otimização foi

realizada utilizando o esquema da Figura 18, considerando cada

neurônio independentemente, como já foi mencionado no início da

Seção 5.

Visando ser o mais sucinto possível, os resultados

imediatos que obtivemos foram que os casos com feedback dividido

-+ e inteiro -+ não foram capazes de convergir para parâmetros

ótimos, satisfazendo o critério de erro de .

O feedback dividido ++, embora tenha convergido, foi capaz

de gerar somente a parcela positiva da trajetória das juntas,

enquanto o inteiro ++ convergiu e conseguiu representar todas as

trajetórias.

Todas as juntas da perna esquerda e direita utilizando

dividido -– e inteiro –- convergiram. Das juntas que usaram

dividido -–, todas conseguiram representar somente a parcela

positiva da trajetória; das que usaram inteiro –- apenas uma

junta não conseguiu representar toda a trajetória.

Cabe notar que o feedback dividido -- é o mesmo usado nas

equações presentes em [16], e presentes também na Seção 3.2

deste relatório, quando da explicação sobre osciladores neurais

Matsuoka. Ou seja, embora mencionado por alguns autores, os

resultados aqui obtidos revelam que este não é o tipo de

realimentação mais eficiente.

36

Por último, os casos dividido +- e inteiro +- apresentaram

desempenho exemplar, pois para todas as 6 juntas a otimização

convergiu e foi capaz de gerar a trajetória inteira. O

diferencial está no fato de que o número de iterações para as

convergências nestes 2 casos foram as menores encontradas diante

de todos os outros tipos de feedback. Adicionalmente, o erro

final obtido também foi notoriamente pequeno em relação aos

outros. A Tabela 5 indica o número de iterações e o erro final

obtidos nestes casos.

Embora tenha sido feita a otimização para ambas as pernas,

o que totaliza 6 juntas para cada tipo de feedback, as Figuras

27, 28 e 29 mostram o desempenho da otimização no caso dividido

+- das 3 juntas da perna direita. Os resultados da perna

esquerda e para o caso inteiro +- são similares, no que diz

respeito à eficiência do feedback. Mais uma vez entenda junta 1,

2 e 3 como pé, joelho e quadril respectivamente.

Expressão para o Feedback

Denominação Extensor Flexor

Dividido --

Dividido -+

Dividido +-

Dividido ++

Inteiro --

Inteiro -+

Inteiro +-

Inteiro ++ Tabela 4: Tipos de feedback utilizados e suas denominações.

Tipo de feedback Perna Esquerda Perna Direita

Iterações Erro Iterações Erro

Dividido +-

Pé 7 0,03365 4 0,86784

Joelho 11 0,14051 14 1,23199

Quadril 12 0,30592 7 0,84864

Inteiro +-

Pé 8 0,09336 6 1,03341

Joelho 11 0,29900 9 1,31959

Quadril 11 0,54967 5 1,09998

Tabela 5: Resultados para dividido +- e inteiro +-.

37

Figura 27: Otimização dividido +- para o pé da perna direita.

Figura 28: Otimização dividido +- para o joelho da perna direita.

38

Os parâmetros resultantes da otimização que levam aos

valores presentes na Tabela 5 e aos gráficos acima resumem-se

nas Tabelas 6 e 7:

Figura 29: Otimização dividido +- para o quadril da perna direita.

Parâmetros

Dividido +-



Tre 0,0075 0,0063 0,0056 0,0101 0,0089 0,0104

Trf 0,0052 0,0071 0,0091 0,0054 0,0059 0,0081

Tae 0,4740 0,3489 0,3898 0,6173 0,3466 0,9446

Taf 1,0775 0,8186 1,1182 1,1701 0,9564 1,1553

be 0,1976 0,1110 0,0633 0,3223 0,1452 0,2503

bf 0,2155 0,1427 0,3310 0,2621 0,1238 0,3255

wf 1,5786 1,4378 1,2062 0,5693 0,5788 1,0705

we 0,0162 0,1470 0,2785 -0,0173 1,1728 1,4265

se 0,0512 0,0394 0,0281 0,0760 0,0455 0,0840

sf 0,0330 0,0312 0,0615 0,0431 0,0267 0,0569

Tabela 6: Parâmetros otimizados para feedback dividido +-.

39

Parâmetros

Inteiro +-



Tre 0,0089 0,0055 0,0071 0,0108 0,0094 0,0091

Trf 0,0051 0,0085 0,0196 0,0084 0,0069 0,0079

Tae 0,6903 1,3170 0,8096 0,8505 0,9283 0,3053

Taf 1,3280 1,0585 1,8288 0,8984 1,2857 0,2203

be 0,3204 0,4449 0,0941 0,5400 0,3378 0,0843

bf 0,2426 0,2435 1,3365 0,3946 0,3336 0,1024

wf 2,5232 0,9833 1,2256 1,7253 1,9971 1,0489

we -0,3651 0,6104 0,3097 0,8327 2,0761 1,0947

se 0,0650 0,1044 0,0320 0,1002 0,0759 0,0223

sf 0,0352 0,0524 0,2514 0,0480 0,0648 0,0283

Tabela 7: Parâmetros otimizados para feedback inteiro +-.

40

6. Conclusão

Os resultados obtidos ao longo da elaboração deste

relatório, e que aqui presentes estão, nos levam desde o

entendimento básico do funcionamento de um neurônio até a sua

aplicação em redes neurais com capacidades auto-adaptativas.

A escassa quantidade de informação detalhada em artigos

nacionais e estrangeiros tratando deste assunto e a falta de

conhecimento prévio sobre o tema acabou por possibilitar uma

abordagem mais ampla do trabalho. Ela representou uma

oportunidade de não só testar e avaliar os dados presentes em

artigos estrangeiros, mas também de colocá-los à prova sob

outras óticas, como foi realizado, por exemplo, com os 8 tipos

propostos de utilização do sinal de realimentação nos

osciladores neurais.

No escopo científico em que se insere, este relatório e as

informações nele podem e devem ser utilizadas para fundamentar

estudos futuros de redes neurais e suas aplicações para a

geração de trajetórias estáveis e auto-adaptativas em robôs e

órteses robóticas.

41

7. Referências Bibliográficas

[1] BANALA, S. K.; AGRAWAL, S. K.. Gait Rehabilitation with an

Active Leg Orthosis. Proceedings of the IDETC/CIE 2005 ASME

2005 International Design Engineering Technical Conferences

and Computers and Information in Engineering Conference.

Califórnia, Estados Unidos. Pág. 1–7. 2005.

[2] ENDO, G.; NAKANISHI, J.; MORIMOTO, J.; CHENG, G..

Experimental Studies of a Neural Oscillator for Biped

Locomotion with QRIO. Proceedings of the 2005 IEEE

International Conference on Robotics and Automation.

Barcelona, Espanha. Abril, 2005.

[3] FU, K.; GONZALEZ, R. C.; LEE, C. S. G.. Robotics: Control,

Sensing, Vision and Intelligence. McGraw-Hill Inc., Nova

Iorque, Estados Unidos. 1987.

[4] FUKUDA, T.; KOMATA, Y.; ARAKAWA, T.. Recurrent Neural

Network with Self-adaptive GAs for Biped Locomotion Robot.

International Conference on Neural Networks. Vol. 3, pág.

1710–1715. 1997.

[5] HERALIC, A.; WOLFF, K.; WAHDE, M.. Central Pattern

Generators for Gait Generation in Bipedal Robots. Chalmers

University of Technology, Goteborg, Suécia. Pág. 285–304.

Junho, 2007.

[6] HUANG, Q.; YOKOI, K.; KAJITA, S.; KANEKO, K.; ARAI, H.;

KOYACHI, N.; TANIE, K.. Planning Walking Patterns for a

Biped Robot. IEEE Transactions on Robotics and Automation.

Vol. 17, nº 3, pág. 280–289. Junho, 2001.

[7] IBGE, I. B. D. G. E. E.. Censo Demográfico 2000 -

Características Gerais da População. Ministério do

Planejamento, Orçamento e Gestão. 2003.

42

[8] JARDIM, B.; SIQUEIRA, A. A. G. Desenvolvimento de Atuadores

Elásticos em Série para Acionamento de uma Órtese Tornozelo

Pé Ativa. Anais do XVII Congresso Brasileiro de Automática.

Pág. 1–6. 2008.

[9] JASPERS, P.; VAN PETEGEM, W.; VAN DER PERRE, G.; PEERAER,

L.. Design of an Automatic Step Intention Detection System

for a Hybrid Gait Orthosis. Proceedings of the 18th Annual

International Conference of the IEEE Engineering in

Medicine and Biology Society. Amsterdam, Holanda. Vol. 1,

pág. 457–458. 1996.

[10] JEZERNIK, S.; COLOMBO, G.; KELLER, T.; FRUEH, H.; MORARI,

M.. Robotic Orthosis Lokomat: A Research and Rehabilitation

Tool. Neuromodulation. Vol. 6, nº 2, pág. 108–115. Abril,

2003.

[11] JEZERNIK, S.; COLOMBO, G.; MORARI, M.. Automatic Gait-

Pattern Adaptation Algorithms for Rehabilitation with a 4-

DOF Robotic Orthosis. IEEE Transactions on Robotics and

Automation. Vol. 20, nº 3, pág. 574–582. Junho, 2004.

[12] KAZEROONI, H.. Exoskeletons for Human Power Augmentation.

Proceedings of the 2005 IEEE/RSJ International Conference

on Intelligent Robots and Systems. Edmonton, Alberta,

Canadá. Pág. 3459–3464. 2005.

[13] KIM, S.; ANWAR, G.; KAZEROONI, H.. High-speed Communication

Network for Controls with the Application on the

Exoskeleton. Proceedings of the 2004 American Control

Conference. Boston, Massachusetts, Estados Unidos. Vol. 1,

pág. 355–360. 2004.

[14] KITAMURA, S.; KUREMATSU, Y.; IWATA, M.. Motion Generation

of a Biped Locomotive Robot using an Inverted Pendulum

Model and Neural Networks. Proceedings of the 29th IEEE

Conference on Decision and Control. Vol. 6, pág. 3308–3312.

43

1990.

[15] LEWIS, F. L.; ABDALLAH, C. T.; DAWSON, D. M.. Control of

Robot Manipulators. Macmillan Publishing Company, Nova

Iorque, Estados Unidos. 1993.

[16] LIU, G. L.; HABIB, M. K.; WATANABE, K.; IZUMI, K.. Central

Pattern Generators based on Matsuoka Oscillators for the

Locomotion of Biped Robots. Artif. Life Robotics. Vol. 12,

nº 1, pág. 264–269. 2008.

[17] MATSUOKA, K. Mechanisms of Frequency and Pattern Control in

the Neural Rhythm Generators. Biol. Cybern. Vol. 56, nº 1,

pág. 345–353. 1987.

[18] PEREZ-ORIVE, J.; MAYAGOITIA, R.. A Closed-loop Control

System to be used a Hybrid RGO System. Proceedings of the

16th Annual International Conference of the IEEE

Engineering in Medicine and Biology Society. Vol. 1, pág.

410–411. 1994.

[19] PRATT, G.; WILLIAMSON, M.. Series Elastic Actuators.


on Intelligent Robots and Systems. Pittsburgh, Pensilvânia.

Vol. 1, pág. 399–406. 1995.

[20] RIENER, R.; LUNENBURGER, L.; JEZERNIK, S.; ANDERSCHITZ, M.;

COLOMBO, G.; DIETZ, V.. Patient-Cooperative Strategies for

Robot-Aided Treadmill Training: First Experimental Results.

IEEE Transactions on Neural Systems and Rehabilitation

Engineering. Vol. 13, nº 3, pág. 380–394. Setembro, 2005.

[21] ROBINSON, D. W.; PRATT, J.; PALUSKA, D.; PRATT, G.. Series

Elastic Actuator Development for a Biomimetic Walking

Robot. Proceedings of the 1999 IEEE/ASME International

Conference on Advanced Intelligent Mechatronics. Atlanta,

Geórgia, Estados Unidos. Pág. 561–568. 1999.

44

[22] TO, C.; KIRSCH, R.; KOBETIC, R.; TRIOLO, R.. Simulation of

a Functional Neuro-Muscular Stimulation Powered Mechanical

Gait Orthosis with Coordinated Joint Locking. IEEE

Transactions on Neural Systems and Rehabilitation

Engineering. Vol.13, nº 2, pág. 227–235. Junho, 2005.

[23] VANDERBORGHT, B.; VERRELST, B.; VAN HAM, R.; VAN DAMME, M.;

LEFEBER, D.. Objective Locomotion Parameters based Inverted

Pendulum Trajectory Generator. Robotics and Autonomous

Systems. Vol. 56, nº 9, pág. 738–750. 2008.

[24] WILLIAMSON, M.. Neural Control of Rhythmic Arm Movements.

Neural Networks. Vol. 11, nº 7 e 8, pág. 1379–1394. 1998

[25] WILLIAMSON, M.. Designing Rhythmic Motions using Neural

Oscillators. MIT AI Lab, 545 Technology Square, Cambridge,

Massachusetts, Estados Unidos.

[26] YANG, W.; CHONG, N. Y.; KIM, C.; YOU, B. J.. Self-Adapting

Humanoid Locomotion using a Neural Oscillator Network.


on Intelligent Robots and Systems. San Diego, Califórnia,

Estados Unidos. Pág. 309-216. Novembro, 2007.

[27] YANG, W.; MURAI, S.; MURAKAMI, K.; SEO, W.; CHONG, N. Y..

Adaptation in Bipedal Locomotion using Phase Oscillator

Networks. The 3rd International Conference on Ubiquitous

Robots and Ambient Intelligence (URAI). San Diego,

Califórnia, Estados Unidos. Pág. 309-216. Novembro, 2006.

[28] ZOSS, A.; CHU, A.; KAZEROONI, H.. Biomechanical Design of

the Berkeley Lower Extremity Exoskeleton (BLEEX). IEEE/ASME

Transactions on Mechatronics. Vol. 11, nº 2, pág. 128–138.

2006.

[29] ZOSS, A.; KAZEROONI, H.; CHU, A. (2005).. On the Mechanical

45

Design of the Berkeley Lower Extremity Exoskeleton (BLEEX).


on Intelligent Robots and Systems. Edmonton, Alberta,

Canadá. Pág. 3465–3472. 2005.

Documents

UNIVERSIDADE DE SÃO PAULO DEPARTAMENTO DE … · o padrão de marcha conforme o seu grau de locomoção voluntária [11][20]. No caso de um exoesqueleto que se moverá livremente