} z | y>repositorio.ul.pt/bitstream/10451/1597/1/17293... · k, ao máximo divisor comum mónico de todos os determinantes das submatrizes de ordem kda matriz xI n A. Convenciona-se

Tese orientada peloProf. Doutor Fernando Abel da Conceição Silva

“encontrar um problema, ver a sua beleza e apaixonar-se por ele;

casar e viver feliz com ele até que a morte nos separe − a não

ser que encontrem um outro problema ainda mais fascinante,

ou, evidentemente, a não ser que obtenhamos uma solução.

Mas, mesmo que obtenhamos uma solução,

poderemos então descobrir, para nosso deleite,

a existência de toda uma família de problemas-filhos,

encantadores ainda que talvez difíceis,

para cujo bem-estar poderemos trabalhar,

com um sentido, até ao fim dos nossos dias.”K. Popper

agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante

a realização deste trabalho.

aos responsáveis pelo Centro de Estruturas Lineares e Combi-

natórias (CELC), pelo apoio financeiro para participação em reuniões

científicas no país e no estrangeiro.

aos colegas do departamento de Matemática da Universidade

de Aveiro e a todos os que nele trabalham, pelo companheirismo e

pelas excelentes condições de trabalho.

a todos aqueles que me deram sugestões, críticas e esclareci-

mentos para uma maior simplicidade e clareza na escrita deste texto,

em particular ao Professor Doutor Paolo Vettori, pela disponibilidade

e pelo apoio.

aos Amigos que, estando sempre presentes, me deram força

para continuar nos momentos mais difíceis.

aos meus Pais e às minhas Manas, pelo carinho e pelo apoio

constantes em todas as fases deste trabalho.

ao Bruno, pelo Amor, pelo aconchego.

à Carolina, por fazer da minha vida Amor.

Bolsa de Doutoramento SFRH/BD/11133/2002

resumo O objectivo deste trabalho é estabelecer relações entre a classe de

semelhança de uma matriz quadrada A e as classes de congruência

de matrizes quadradas hermíticas K e H , quando é válida a equação

de Lyapunov AH +HA∗ = K.

O teorema geral da inércia é uma solução parcial deste problema, bem

como outros teoremas sobre inércia já conhecidos.

Nesta tese, mostramos relações entre a classe de semelhança da ma-

triz A e as classes de congruência das matrizes K e H , quando é

válida a equação de Lyapunov para os seguintes casos:

� H é uma matriz definida positiva

� A é uma matriz não derrogatória

Estudamos também o problema correspondente para sistemas linea-

res discretos, ou seja, estabelecemos relações entre a classe de

semelhança da matriz A e as classes de congruência das matrizes

K e H , quando é válida a equação de Stein H − AHA∗ = K. A

resposta a este problema é imediata para os casos referidos anterior-

mente, dada a existência de uma transformada de Cayley que rela-

ciona as duas equações.

palavras-chave inércia de matrizes

equação de Lyapunov

equação de Stein

estabilidade

transformada de Cayley

abstract The aim of this work is to establish relations between the simila-

rity class of a square matrix A and the congruence classes of her-

mitian squares matrices K and H , when the Lyapunov equation

AH +HA∗ = K is satisfied.

The main inertia theorem is a partial solution to this problem as well as

other known inertia theorems.

We obtain relations between the similarity class of A and the con-

gruence classes of K and H , when the Lyapunov equation is satisfied

for the following cases:

� H is a definite positive matrix

� A is a nonderogatory matrix

We also study the corresponding problem for discrete linear systems,

that is, establish relations between the similarity class ofA and the con-

gruence classes of K and H , when the Stein equation H − AHA∗ =

K is satisfied. The answer to this became immediate for the cases

mentioned above, due to a Cayley transform that relates the two equa-

tions.

keywords inertia of matrices

Lyapunov equation

Stein equation

stability

Cayley transform

notaçãoC corpo dos números complexos

C[x] anel dos polinómios com indeterminada x e coeficientes em C

Cn×m conjunto das matrizes de ordem n×m com entradas em C

Cn×m[x] conjunto das matrizes de ordem n×m com entradas em C[x]

A = [aij] matriz cuja entrada (i, j) é igual a aij

In matriz identidade de ordem n

0p×q matriz nula de ordem p× q

0p matriz nula de ordem p× p

diag(λ1, . . . , λn) matriz diagonal cuja diagonal principal é λ1, . . . , λn

carA característica da matriz A

detA determinante da matriz A

trA traço da matriz A

NucA núcleo da matriz A: NucA = {X : AX = 0}

A−1 inversa da matriz A

AT transposta da matriz A

A conjugada da matriz A

A∗ transposta da conjugada da matriz A: A∗ =(A)T

A⊕B soma directa das matrizes A e B

i unidade imaginária

<(λ) parte real do número complexo λ

=(λ) parte imaginária do número complexo λ

gr(f) grau do polinómio f

f |g polinómio f divide polinómio g

(a, b, c) ≥ (u, v, w) a ≥ u, b ≥ v e c ≥ w

Índice

1 Preliminares 2

1.1 Revisões de conceitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2 Inércia matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.3 Estabilidade de sistemas e estabilidade matricial . . . . . . . . . . . . . . . . . 10

2 Equação de Lyapunov 15

2.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2 A nossa contribuição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.2.1 H é uma matriz definida positiva . . . . . . . . . . . . . . . . . . . . . 19

2.2.2 L é uma matriz não derrogatória . . . . . . . . . . . . . . . . . . . . . 34

3 Equação de Stein 43

3.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.2 A nossa contribuição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

3.2.0 Lemas Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

3.2.1 H é uma matriz definida positiva . . . . . . . . . . . . . . . . . . . . . 52

3.2.2 S é uma matriz não derrogatória . . . . . . . . . . . . . . . . . . . . . 57

Bibliografia 59

Índice Remissivo 62

1

Capítulo 1

Preliminares

“The structures of mathematics and the propositions about

them are ways for the imagination to travel and the wings,

or legs, or vehicles to take you where you want to go.”

S. Buchanan

Este capítulo é dedicado à exposição de conceitos e resultados já conhecidos. São apresentados

tópicos sobre a teoria das matrizes que consideramos fundamentais para a compreensão dos

resultados obtidos nos capítulos seguintes e que podem ser encontrados, na sua generalidade, em

[8, 10, 11, 12, 25].

1.1 Revisões de conceitos

Nesta secção são revistos tópicos da teoria das matrizes, com o intuito de tornar este trabalho tão

auto-contido quanto possível.

Dadas duas matrizes A,B ∈ Cn×m, dizemos que A e B são equivalentes se existem matrizes

não singulares P ∈ Cn×n e Q ∈ Cm×m tais que B = PAQ.

2


Em particular, se m = n, dizemos que as matrizes A e B são semelhantes se P = Q−1, ou seja,

se existe uma matriz não singular Q ∈ Cn×n tal que B = Q−1AQ. Se a matriz Q for uma matriz

de permutação (isto é, uma matriz que se obtém da matriz identidade por permutação de linhas

ou de colunas), dizemos que A e B são semelhantes por permutação.

Dizemos ainda que as matrizes A,B ∈ Cn×n são congruentes se existe uma matriz não singular

R ∈ Cn×n tal que B = RAR∗.

Dada uma matriz A ∈ Cn×n chamamos polinómio característico de A ao polinómio mónico

det(xIn − A) ∈ C[x].

Os valores próprios de A são as raízes do seu polinómio característico. Ao conjunto de todos

os valores próprios de A chamamos espectro de A e representamos por σ(A). Claramente que,

atendendo ao teorema fundamental da Álgebra, toda a matriz n×n tem n valores próprios em C

(contando com as multiplicidades).

É sabido que, se λ1, . . . , λn ∈ C são os valores próprios da matriz A, então

trA = λ1 + · · ·+ λn e detA = λ1 · · · · · λn.

Seja λ ∈ C um valor próprio de A. A multiplicidade algébrica de λ, que representamos por

ma(λ), é a multiplicidade de λ enquanto zero do polinómio característico e, por isso, é usual

referir a multiplicidade algébrica apenas por multiplicidade. A multiplicidade geométrica de λ,

que representamos pormg(λ), é a dimensão do subespaço vectorial Nuc(λIn−A). Se cada valor

próprio de A tem multiplicidade geométrica 1, dizemos que A é uma matriz não derrogatória.

Caso contrário, dizemos que A é uma matriz derrogatória.

O próximo resultado permite concluir que matrizes semelhantes partilham diversas propriedades:

o mesmo polinómio característico e, consequentemente, os mesmos valores próprios, o mesmo

determinante, o mesmo traço, entre outras.

Teorema 1.1.1 (Decomposição de Schur) [25] Seja A ∈ Cn×n uma matriz. Então A é seme-

lhante a uma matriz triangular superior cuja diagonal principal é constituída pelos seus valores

próprios.

3


Outro resultado que interessa recordar estabelece uma relação entre os valores próprios de uma

matriz hermítica e os valores próprios de uma sua submatriz principal. Recorde-se que uma

matriz A ∈ Cn×n é hermítica se A∗ = A.

Teorema 1.1.2 (Entrelaçamento dos valores próprios) [11] Seja A ∈ Cn×n uma matriz her-

mítica particionada da seguinte forma:

A =

A11 ∗

∗ ∗

, onde A11 ∈ Cr×r para algum r ∈ {1, . . . , n}.

Sejam λ1, . . . , λn ∈ R os valores próprios de A tais que λ1 ≤ · · · ≤ λn e sejam α1, . . . , αr ∈ R

os valores próprios de A11 tais que α1 ≤ · · · ≤ αr. Então, para todo t ∈ {1, . . . , r},

λt ≤ αt ≤ λt+n−r.

Para cada k ∈ {1, . . . , n}, chamamos k-ésimo divisor determinantal da matriz polinomial

xIn − A ∈ Cn×n[x], e representamos por dk, ao máximo divisor comum mónico de todos os

determinantes das submatrizes de ordem k da matriz xIn − A. Convenciona-se que d0 ≡ 1

e prova-se que, na sequência dos divisores determinantais, cada polinómio é divisível pelo seu

sucessor, isto é, dk−1| dk, para todo k ∈ {1, . . . , n}. Definimos o k-ésimo factor invariante da

matriz xIn − A, e representamos por fk, como sendo o polinómio

fk =dkdk−1

∈ C[x].

Cada factor invariante pode ser decomposto na forma

fk = (x− λ1)αk1(x− λ2)

αk2 · · · (x− λt)αkt ,

onde λ1, . . . , λt são os valores próprios distintos da matriz A e αkj ∈ N0, para todo k ∈

{1, . . . , n} e para todo j ∈ {1, . . . , t}. Chamamos divisor elementar da matriz xIn − A a

cada elemento da forma (x− λj)αkj com αkj > 0.

Chamamos polinómios invariantes da matriz A aos factores invariantes da matriz xIn − A. O

polinómio característico de uma matriz é igual ao produto dos seus polinómios invariantes. Além

disso, duas matrizes são semelhantes se e só se têm os mesmos polinómios invariantes.

4


Existe uma relação entre a multiplicidade geométrica de um valor próprio e os polinómios in-

variantes de uma matriz. De facto, se λ é um valor próprio da matriz A, então a multiplicidade

geométrica de λ é o número de polinómios invariantes de A que admitem λ como raiz. Podemos

então dizer que uma matriz é não derrogatória se e só se tem apenas um polinómio invariante não

constante.

Chamamos matriz companheira de um polinómio mónico f(x) ∈ C[x] de grau p ≥ 1 da forma

f(x) = xp + ap−1xp−1 + · · ·+ a1x+ a0,

à matriz definida por

C(f) =

0 Ip−1

−a0 −a1 . . . −ap−1

∈ Cp×p.

A matriz C(f) tem polinómios invariantes 1, . . . , 1, f(x).

Teorema 1.1.3 (Forma normal companheira) [12] Seja A ∈ Cn×n uma matriz. Sejam ainda

f1, . . . , ft ∈ C[x] polinómios mónicos diferentes de 1 tais que f1| · · · |ft e gr(f1 · · · ft) = n. A

matriz A é semelhante à matriz

C(f1)⊕ · · · ⊕ C(ft)

se e só se f1, . . . , ft são os polinómios invariantes de A diferentes de 1.

Chamamos bloco de Jordan de tamanho p × p associado a λ ∈ C à matriz triangular superior

da forma

Jp(λ) =

λ 1 0 · · · 0

0 λ 1. . . ...

... . . . . . . . . . 0

0 · · · 0 λ 1

0 · · · 0 0 λ

∈ Cp×p.

A matriz Jp(λ) tem polinómios invariantes 1, . . . , 1, (x− λ)p.

5


Teorema 1.1.4 (Forma normal de Jordan) [12] Seja A ∈ Cn×n uma matriz e sejam p1, . . . , pt

inteiros positivos tais que p1 + · · · + pt = n. Sejam ainda λ1, . . . , λt ∈ C. A matriz A é

semelhante à matriz

Jp1(λ1)⊕ · · · ⊕ Jpt(λt)

se e só se (x− λ1)p1 , . . . , (x− λt)pt são os divisores elementares da matriz xIn − A.

Note-se que λ1, . . . , λt são os valores próprios da matriz A (não necessariamente distintos). Para

cada i ∈ {1, . . . , t}, a multiplicidade geométrica de λi é o número de blocos de Jordan associados

a λi e a sua multiplicidade algébrica é a soma das ordens dos blocos de Jordan associados a λi,

que surgem na forma normal de Jordan da matriz A.

Os dois próximos lemas são necessários nas demonstrações dos nossos resultados. As respectivas

demonstrações são omitidas uma vez que consistem na simples aplicação de operações de per-

mutação.

Seja λ ∈ C e sejam r1, . . . , rp inteiros positivos tais que r1 + · · ·+ rp = n. Então:

Lema 1.1.5 Toda a matriz da forma Jr1(λ)⊕· · ·⊕Jrp(λ) ∈ Cn×n é semelhante por permutação

a uma matriz da forma λIp 0

∗ ∗

∈ Cn×n.

Lema 1.1.6 Se ma(λ) ≥ 2 então toda a matriz da forma Jr1(λ) ⊕ · · · ⊕ Jrp(λ) ∈ Cn×n é

semelhante por permutação a uma matriz da formaλIp 0 0

Ip λIp 0

∗ ∗ ∗

∈ Cn×n.

Por fim recordamos algumas propriedades das matrizes definidas positivas.

6

1.2 Inércia matricial

Seja A ∈ Cn×n uma matriz hermítica. Dizemos que A é uma matriz definida positiva, e repre-

sentamos por A > 0, se, para qualquer vector não nulo x ∈ Cn×1 \ {0}, x∗Ax > 0.

Se enfraquecermos a desigualdade estrita obtemos um novo conceito: dizemos que A é uma

matriz semi-definida positiva, e representamos por A ≥ 0, se x∗Ax ≥ 0, qualquer que seja

x ∈ Cn×1 \ {0}.

Prova-se que uma matriz é definida positiva se e só se é congruente com a matriz identidade.

Analogamente, uma matriz A é semi-definida positiva se e só se é congruente com a matriz

Ir ⊕ 0n−r, onde r = carA.

Seja A ∈ Cn×n uma matriz definida positiva. Então prova-se que:

� toda a submatriz principal da matriz A é definida positiva;

� os valores próprios da matriz A são números reais positivos;

� para todo α > 0, αA é uma matriz definida positiva; se α < 0, então a matriz −αA é

definida positiva;

� seja B ∈ Cn×n uma matriz congruente com a matriz A, então B também é uma matriz

definida positiva.

Invertendo as desigualdades das definições anteriores, obtemos conceitos duais. Dizemos que

a matriz A é definida negativa, e representamos por A < 0, se −A é uma matriz definida

positiva. Analogamente, dizemos que A é uma matriz semi-definida negativa, e representamos

por A ≤ 0, se a matriz −A é semi-definida positiva.

Se a matriz A não é definida positiva (respectivamente, negativa) nem semi-definida positiva

(respectivamente, negativa) então dizemos que A é uma matriz indefinida.


Nesta secção recordamos um dos conceitos fundamentais para o nosso trabalho: apresentamos a

definição de inércia matricial e analisamos algumas das suas propriedades.

7


Seja A ∈ Cn×n uma matriz. A inércia de A (ou a inércia de A relativamente ao eixo imaginá-

rio) é o terno

In(A) = (π(A), ν(A), δ(A))

onde π(A) denota o número de valores próprios da matriz A com parte real positiva, ν(A) o

número de valores próprios da matriz A com parte real negativa e δ(A) denota o número de

valores próprios da matriz A com parte real nula (contando sempre com as multiplicidades).

A inércia de A relativamente ao círculo unitário é o terno

In1(A) = (π1(A), ν1(A), δ1(A))

onde π1(A) denota o número de valores próprios da matriz A com módulo inferior a 1, ν1(A) o

número de valores próprios da matriz A módulo superior a 1 e δ1(A) denota o número de valores

próprios da matriz A módulo igual a 1 (contando sempre com as multiplicidades).

Em qualquer uma das definições, é fácil verificar que:

π(A) + ν(A) + δ(A) = n = π1(A) + ν1(A) + δ1(A).

Recorde-se que, dadas duas matrizes A,B ∈ Cn×n, temos que:

� λ1, . . . , λn ∈ σ(A) se e só se −λ1, . . . ,−λn ∈ σ(−A);

� λ1, . . . , λn ∈ σ(A) e µ1, . . . , µn ∈ σ(B) se e só se λ1, . . . , λn, µ1, . . . , µn ∈ σ(A⊕B);

� se A é uma matriz não singular então λ1, . . . , λn ∈ σ(A) se e só se λ−11 , . . . , λ−1

n ∈ σ(A−1).

� se A e B são matrizes semelhantes então λ1, . . . , λn ∈ σ(A) se e só se λ1, . . . , λn ∈ σ(B).

Assim, estas propriedades dos valores próprios de uma matriz permitem estabelecer algumas

propriedades para as inércias.

Teorema 1.2.1 Sejam A,B ∈ Cn×n matrizes. Então:

In(−A) = (ν(A), π(A), δ(A)) In1(−A) = In1(A)

In(A⊕B) = In(A) + In(B) In1(A⊕B) = In1(A) + In1(B)

Se A é uma matriz não singular então In(A−1) = In(A) e In1(A−1) = (ν1(A), π1(A), δ1(A)).

Além disso, se A e B são matrizes semelhantes então In(A) = In(B) e In1(A) = In1(B).

8


Os dois próximos resultados permitem afirmar que a inércia de matrizes hermíticas é também

invariante para a congruência de matrizes.

Teorema 1.2.2 (Teorema da inércia de Sylvester) [12] Toda a matriz hermítica A ∈ Cn×n é

congruente com uma única matriz da forma Iπ ⊕ (−Iν)⊕ 0δ e, além disso, In(A) = (π, ν, δ).

Corolário 1.2.3 [12] Duas matrizes hermíticas são congruentes se e só se têm a mesma inércia.

O teorema seguinte é um caso particular do resultado obtido em [1] por B. E. Cain e E. M. Sá e

relaciona a inércia de uma matriz hermítica com as inércias de duas suas submatrizes principais

complementares.

Teorema 1.2.4 [1] Sejam H1 ∈ Cn1×n1 e H2 ∈ Cn2×n2 matrizes hermíticas, com n1 + n2 = n,

tais que

In(H1) = (π1, ν1, δ1) e In(H2) = (π2, ν2, δ2).

Sejam ainda π, ν, δ inteiros não negativos. Então existe uma matriz X ∈ Cn1×n2 tal que

In

H1 X

X∗ H2

= (π, ν, δ)

se e só se π e ν satisfazem as seguintes condições:

(i) π + ν ≤ n;

(ii) max{π1, π2} ≤ π ≤ min{n1 + π2, n2 + π1};

(iii) max{ν1, ν2} ≤ ν ≤ min{n1 + ν2, n2 + ν1};

(iv) π − ν ≤ π1 + π2;

(v) ν − π ≤ ν1 + ν2.

9

1.3 Estabilidade de sistemas e estabilidade matricial


Nesta secção, fazemos uma breve abordagem aos sistemas contínuos e discretos. É com base no

estudo destes sistemas que surgem as equações que são mote deste trabalho. Por se tratar de uma

teoria que não se insere no âmbito deste trabalho, omitimos as demonstrações, podendo estas ser

encontradas em [5, 8, 11].

Num modelo matemático, o comportamento de um sistema real pode ser descrito por uma lista

de parâmetros que variam ao longo do tempo, chamados variáveis de estado do sistema. Fre-

quentemente, existem relações de dependência entre as variáveis de estado que tomam a forma de

equações diferenciais ou equações com diferenças, as chamadas equações de estado do sistema.

O objectivo do estudo matemático destes sistemas é conseguir determinar o seu comportamento.

Um conceito subjacente a esse estudo é o de estabilidade.

Consideremos um sistema descrito por uma lista finita de variáveis de estado, que obedecem a

um sistema contínuo de equações diferenciais lineares com coeficientes constantes definido por

χ(t) = Aχ(t)

onde A ∈ Cn×n e χ representa a derivada de χ em ordem ao tempo t.

Dizemos que o sistema contínuo descrito anteriormente é estável se todas as suas soluções con-

vergem para 0 quando t converge para +∞, ou equivalentemente, se eAt converge para 0 quando

t converge para +∞. Um dos critérios de estabilidade de sistemas contínuos é apresentado no

próximo resultado.

Teorema 1.3.1 [5] Seja A ∈ Cn×n uma matriz. O sistema χ(t) = Aχ(t) é estável se e só se

todos os valores próprios da matriz A têm parte real negativa.

Em 1892, na sua tese de doutoramento, Lyapunov publica um resultado histórico na estabilidade

de sistemas não lineares de equações diferenciais, que pode ser formulado para sistemas lineares,

com equações matriciais.

10


A relação entre a teoria da estabilidade e as equações matriciais é estabelecida definindo uma

matriz

H = −∫ +∞

0

eAtKeA∗tdt

ondeK é uma matriz arbitrária definida positiva. Note-se que, sendoA uma matriz representativa

de um sistema contínuo estável, então eAt converge para 0 quando t converge para +∞ e este

integral impróprio é convergente. Mostra-se (cf. [5]) que H satisfaz a equação

AH +HA∗ = K. (1.1)

Esta equação é conhecida como equação de Lyapunov e é um dos objectos de estudo do

nosso trabalho. Vamos ver no próximo capítulo que a estabilidade de um sistema contínuo está

associada à existência de soluções desta equação.

Existem sistemas cujo modelo natural é discreto. Consideremos um sistema discreto descrito

pelas seguintes equações com diferenças lineares com coeficientes constantes

xk = Axk−1, com k ∈ {1, . . . , n}

onde A ∈ Cn×n e xi ∈ Cn×1, para todo i ∈ {1, . . . , n}.

Dizemos que um sistema discreto da forma anterior é estável se uma solução do sistema da forma

x0, x1, x2, . . . converge para 0, qualquer que seja a escolha inicial de x0 ou, equivalentemente,

se Ak converge para 0 quando k converge para +∞.

Um dos critérios de estabilidade de sistemas discretos é análogo ao referido para sistemas con-

tínuos, mas usando o conceito de inércia relativamente ao círculo unitário.

Teorema 1.3.2 [5] Seja A ∈ Cn×n uma matriz. O sistema xk = Axk−1, com k ∈ {1, . . . , n}, é

estável se e só se todos os valores próprios da matriz A têm módulo inferior a 1.

Em 1952, Stein publica um estudo análogo ao de Lyapunov mas relativo à estabilidade de sis-

temas discretos. Este estudo baseia-se na definição de uma matriz H da forma

H =+∞∑k=0

AkK(A∗)k (1.2)

11


onde K é uma matriz arbitrária definida positiva. De facto, se A é uma matriz representativa de

um sistema discreto estável, então Ak converge para 0 quando t converge para +∞ e esta série é

convergente. Mostra-se que H satisfaz a equação

H − AHA∗ = K. (1.3)

Esta equação é denominada por equação de Stein e é também objecto de estudo do nosso tra-

balho. No último capítulo, vamos ver que a estabilidade de sistemas discretos está também

associada à existência de soluções da equação de Stein.

De seguida, introduzimos a estabilidade matricial tendo por base a estabilidade de sistemas.

Seja A ∈ Cn×n uma matriz. Dizemos que A é uma matriz estável se o sistema contínuo que lhe

está associado

χ(t) = Aχ(t)

é estável, ou seja, se todos os valores próprios da matriz A têm parte real negativa. Repare-se

que a matriz A é estável se e só se In(A) = (0, n, 0).

Dadas as propriedades da inércia (enunciadas no teorema 1.2.1), podemos concluir que se A é

uma matriz estável então A é uma matriz não singular e A−1, A∗ e AT também são matrizes

estáveis. E, além disso, como a inércia é invariante para a semelhança, o mesmo se pode afirmar

para a estabilidade, ou seja, se A é uma matriz estável então qualquer matriz semelhante a A é

estável.

Um conceito dual de estabilidade é definido da seguinte forma: dizemos que a matrizA é estável

positiva se todos os seus valores próprios têm parte real positiva, ou seja, In(A) = (n, 0, 0).

Claramente que a matriz A é estável positiva se e só se −A é uma matriz estável. Assim é

possível reescrever qualquer resultado referente a matrizes estáveis num resultado idêntico sobre

matrizes estáveis positivas, inserindo adequadamente o sinal −, e vice-versa. Por conveniência

de notação, vamos utilizar o conceito de matrizes estáveis positivas em detrimento do conceito

de matrizes estáveis.

Podemos ainda definir estabilidade de uma matriz associada a um sistema discreto.

12


Dizemos que a matriz A é estável relativamente ao círculo unitário se o sistema discreto que

lhe está associado, xk = Axk−1, com k ∈ {1, . . . , n}, é estável, ou seja, se todos os valores

próprios da matriz A têm módulo inferior a 1, isto é, In1(A) = (n, 0, 0).

Em [21], O. Taussky (e, indirectamente, Stein [17]) aplica uma transformação matricial estabe-

lecendo uma relação entre matrizes estáveis e matrizes estáveis relativamente ao círculo unitário.

Seja A ∈ Cn×n uma matriz tal que a matriz In + A é não singular, ou seja, −1 /∈ σ(A).

Chamamos transformada de Cayley da matriz A, e denotamos por C(A), à matriz definida

por

C(A) = (In + A)−1(In − A) ∈ Cn×n.

Teorema 1.3.3 Seja A ∈ Cn×n uma matriz tal que −1 /∈ σ(A). Então In1(A) = In(C(A)).

Demonstração. Seja A ∈ Cn×n uma matriz tal que µ1, . . . , µn são os seus valores próprios.

Note-se que, como −1 /∈ σ(A), é possível definir a sua transformada de Cayley, C(A). Pela

decomposição de Schur, existe uma matriz não singular U ∈ Cn×n tal que U−1AU é uma matriz

triangular superior cuja diagonal é µ1, . . . , µn. Então:

U−1C(A)U =(In + U−1AU

)−1 (In − U−1AU

)=

(1 + µ1)

−1(1− µ1) ∗. . .

0 (1 + µn)−1(1− µn)

e os valores próprios da matriz C(A) são λ1, . . . , λn, onde λk = (1 + µk)

−1(1 − µk), para todo

k ∈ {1, . . . , n}. Note-se que, para cada k ∈ {1, . . . , n},

λk = |1 + µk|−2(1− |µk|2 − 2=(µk)i

)e, consequentemente, <(λk) = |1 + µk|−2

(1− |µk|2

).

Assim, se |µk| = 1 (respectivamente, |µk| > 1 e |µk| < 1), então <(λk) = 0 (respectivamente,

<(λk) < 0 e <(λk) > 0), para todo k ∈ {1, . . . , n}, e, portanto, In1(A) = In(C(A)).

13


Note-se que se A é uma matriz estável relativamente ao círculo unitário e se µ1, . . . , µn são os

seus valores próprios, então |µk| < 1, para todo k ∈ {1, . . . , n}. Donde −1 /∈ σ(A) e, portanto,

a matriz C(A) está bem definida. Aplicando o teorema anterior obtemos:

Corolário 1.3.4 Seja A ∈ Cn×n uma matriz. A matriz A é estável relativamente ao círculo

unitário se e só se a matriz C(A) é estável positiva.

Também fazendo uso da transformada de Cayley, anteriormente definida, é possível criar uma

relação entre a equação de Lyapunov e a equação de Stein.

Teorema 1.3.5 Seja H ∈ Cn×n uma matriz hermítica e seja A ∈ Cn×n uma matriz estável

relativamente ao círculo unitário. Então

In(C(A)H +HC(A)∗) = In(H − AHA∗).

Demonstração. Seja H ∈ Cn×n uma matriz hermítica e seja A ∈ Cn×n uma matriz estável

relativamente ao círculo unitário. Repare-se que −1 /∈ σ(A) e, portanto, a matriz C(A) está bem

definida. Então:

C(A)H +HC(A)∗ = K ⇔ (In + A)−1(In − A)H +H(In − A∗)(In + A∗)−1 = K

⇔ (In − A)H(In + A∗) + (In + A)H(In − A∗) = (In + A)K(In + A∗)

⇔ 2 (H − AHA∗) = (In + A)K(In + A∗)

⇔ H − AHA∗ =(2−

12 (In + A)

)K(2−

12 (In + A∗)

)Logo existe uma matriz não singular X = 2−

12 (In + A) ∈ Cn×n tal que

H − AHA∗ = X (C(A)H +HC(A)∗)X∗

e, portanto, a matriz C(A)H + HC(A)∗ é congruente com a matriz H − AHA∗. Como são

matrizes hermíticas, pelo Corolário 1.2.3,

In(C(A)H +HC(A)∗) = In(H − AHA∗).

14

Capítulo 2

Equação de Lyapunov

“But, in this respect, hardly any other

method of investigation could be said

to be completely satisfactory.”

A. Lyapunov

O objectivo principal deste capítulo é estabelecer relações entre a classe de semelhança da matriz

L e as classes de congruência das matrizes K e H quando é válida a equação de Lyapunov

LH +HL∗ = K. Obtêm-se conjuntos completos de relações nos seguintes dois casos: (i) H é

uma matriz definida positiva e (ii) L é uma matriz não derrogatória.

Os resultados principais deste capítulo podem ser encontrados em [18, 19].

2.1 Motivação

Nesta secção recordamos o teorema de Lyapunov e algumas generalizações que motivaram a

formulação do nosso problema. Analisamos também esses resultados enquanto soluções parti-

culares desse problema.

15

2.1 Motivação

Tal como já referimos, em 1892, Lyapunov publica um resultado histórico que estabelece uma

relação entre as matrizes estáveis positivas e as matrizes definidas positivas.

Teorema 2.1.1 (Teorema de Lyapunov) [12] Sejam L,K ∈ Cn×n matrizes tais que K é uma

matriz definida positiva. A matriz L é estável positiva se e só se existe uma matriz definida

positiva H ∈ Cn×n que satisfaz a equação de Lyapunov LH +HL∗ = K.

Uma das generalizações mais importantes deste teorema é o teorema geral da inércia. Este

resultado é obtido por A. Ostrowski e H. Schneider [16] e, independentemente, por O. Taussky

[20] que prova o caso particular K = In.

Teorema 2.1.2 (Teorema geral da inércia) [16] SejamL,K ∈ Cn×n matrizes tais queK é uma

matriz definida positiva. Então existe uma matriz hermítica H ∈ Cn×n tal que LH +HL∗ = K

se e só se δ(L) = 0. Além disso, se existir uma matriz hermíticaH ∈ Cn×n tal que LH+HL∗ =

K então In(L) = In(H).

Repare-se que, para toda a matriz não singular R ∈ Cn×n, a equação de Lyapunov é equivalente

à equação

(RLR−1)(RHR∗) + (RHR∗)(RLR−1)∗ = RKR∗. (2.1)

Atendendo a esta observação, o teorema anterior pode ser formulado da seguinte forma:

Teorema 2.1.3 Sejam L,H ∈ Cn×n matrizes tais que H é uma matriz hermítica. Então existe

uma matriz L′ ∈ Cn×n semelhante à matriz L e existe uma matriz H ′ ∈ Cn×n congruente com a

matriz H tais que L′H ′ +H ′L′∗ é definida positiva se e só se δ(L) = 0 e In(L) = In(H).

Demonstração. Sejam L,H ∈ Cn×n matrizes tais que H é uma matriz hermítica.

Suponhamos que existe uma matriz L′ ∈ Cn×n semelhante à matriz L e que existe uma matriz

H ′ ∈ Cn×n congruente com a matriz H tais que L′H ′ + H ′L′∗ > 0. Pelo teorema geral da

inércia, δ(L′) = 0 e In(L′) = In(H ′). Donde, pelas propriedades da inércia (teorema 1.2.1) e

pelo corolário 1.2.3, vem que δ(L) = 0 e In(L) = In(H).

16

2.1 Motivação

Reciprocamente, suponhamos que δ(L) = 0 e In(L) = In(H). Novamente pelo teorema geral

da inércia, existe uma matriz hermítica H ′ ∈ Cn×n tal que LH ′ +H ′L∗ > 0 e In(L) = In(H ′).

Logo In(H ′) = In(H), ou seja, a matriz H ′ é congruente com a matriz H , pelo corolário 1.2.3.

Além disso, atendendo a (2.1), existe uma matriz L′ ∈ Cn×n semelhante à matriz L tal que a

matriz L′H ′′+H ′′L′∗ é definida positiva, onde H ′′ ∈ Cn×n é uma matriz congruente às matrizes

H e H ′.

Assim, este teorema fornece um sistema completo de relações entre a classe de semelhança da

matriz L e a classe de congruência da matriz H , quando K é uma matriz definida positiva e é

válida a equação de Lyapunov. E sugere o problema base do nosso trabalho.

Problema 1 Determinar um sistema completo de relações entre a classe de semelhança da ma-

triz L e as classes de congruência das matrizes H e K quando é válida a equação de Lyapunov.

Existem na literatura algumas soluções parciais. Por exemplo, o teorema geral da inércia é uma

solução parcial do problema para o caso em que K é uma matriz definida positiva. Também o

teorema de Lyapunov é uma solução parcial do problema para o caso em queK eH são matrizes

definidas positivas. De facto, podemos enunciá-lo do seguinte modo:

Teorema 2.1.4 Sejam L,H ∈ Cn×n matrizes tais que H é uma matriz definida positiva. Então

existe uma matriz L′ ∈ Cn×n semelhante à matriz L e existe uma matriz definida positiva H ′ ∈

Cn×n congruente com a matriz H tais que a matriz L′H ′ + H ′L′∗ é definida positiva se e só se

π(L) = n.

Demonstração. Sejam L,H ∈ Cn×n matrizes tais que H é uma matriz definida positiva.

Suponhamos que existe uma matriz L′ ∈ Cn×n semelhante à matriz L e que existe uma matriz

definida positivaH ′ ∈ Cn×n congruente com a matrizH tais queL′H ′+H ′L′∗ > 0. Pelo teorema

de Lyapunov, L′ é uma matriz estável positiva, ou seja, π(L′) = n. Donde, pelas propriedades

da inércia (teorema 1.2.1), vem que π(L) = n.

O recíproco é aplicação directa do teorema 2.1.3, uma vez que δ(L) = 0.

17

2.1 Motivação

O próximo resultado, obtido por D. Carlson e H. Schneider [2] motivados pelo teorema de Lya-

punov enfraquecendo a condição “K é uma matriz definida positiva”, fornece um sistema com-

pleto de relações entre a classe de semelhança da matriz L e a classe de congruência da matriz

H quando L é uma matriz não singular e K é uma matriz semi-definida positiva. No final da

próxima secção é apresentada uma demonstração alternativa deste teorema enquanto corolário

de um dos principais resultados (corolário 2.2.8).

Teorema 2.1.5 [2] Seja L ∈ Cn×n uma matriz. Então existe uma matriz definida positiva

H ∈ Cn×n tal que LH + HL∗ é semi-definida positiva se e só se a matriz L não tem divisores

elementares com raízes imaginárias múltiplas e ν(L) = 0.

Em [6], L. M. DeAlba e C. R. Johnson estudam uma variante do problema 1 e garantem que as

inércias das matrizes L, H e K são independentes, sob certas condições, sempre que é válida a

equação de Lyapunov e K é uma matriz indefinida. Observe-se que no artigo referido é estudada

a equação de Stein. No entanto, pelo que foi visto anteriormente, facilmente se podem reescrever

os resultados obtidos em análogos para a equação de Lyapunov, uma vez que são válidas as

condições do teorema 1.3.5.

Teorema 2.1.6 [6, Teorema 3] Sejam πk, νk ,δk, πh, νh, δh, π, ν, δ inteiros não negativos tais

que πk > 0, νk ≤ πh + νh e πk + νk + δk = πh + νh + δh = π + ν + δ = n.

Então existe uma matriz não singular L ∈ Cn×n e existem matrizes hermíticas H,K ∈ Cn×n

tais que é válida a equação de Lyapunov LH +HL∗ = K e

In(K) = (πk, νk, δk), In(H) = (πh, νh, δh) e In(L) = (π, ν, δ).

18

2.2 A nossa contribuição


2.2.1 H é uma matriz definida positiva

Nesta secção apresentamos um sistema completo de relações entre a classe de semelhança de L e

a classe de congruência de K quando é válida a equação de Lyapunov, H é uma matriz definida

positiva e, ou L é uma matriz não derrogatória ou K é uma matriz semi-definida positiva.

Seguimos de perto [18].

Sejam L,K,H ∈ Cn×n matrizes. Tal como vimos anteriormente, LH+HL∗ = K é equivalente

a (2.1). Assim, nas demonstrações, a matriz L é substituída, sempre que necessário, por uma

qualquer matriz que lhe seja semelhante, sem que haja perda de generalidade.

Denotamos por i(L) o número de polinómios invariantes não constantes de L. Denotamos por

i+(L) o número de polinómios invariantes de L com pelo menos uma raiz com parte real positiva,

por i−(L) o número de polinómios invariantes de L com pelo menos uma raiz com parte real

negativa e por i0(L) o número de polinómios invariantes de L com pelo menos uma raiz com

parte real nula. Denotamos ainda por i20(L) o número de polinómios invariantes de L com pelo

menos uma raiz com a parte real nula e multiplicidade superior ou igual a 2.

O próximo teorema apresenta condições necessárias para a solução parcial do problema 1 quando

H é uma matriz definida positiva.

Teorema 2.2.1 Sejam L,K,H ∈ Cn×n matrizes tais que K é uma matriz hermítica e H é uma

matriz definida positiva.

Se LH +HL∗ = K então são válidas as seguintes condições:

π(K) ≥ max{i+(L), i20(L)} (2.2)

ν(K) ≥ max{i−(L), i20(L)} (2.3)

δ(K) ≥ 2i0(L)− n (2.4)

19


π(K) + δ(K) ≥ i0(L) (2.5)

ν(K) + δ(K) ≥ i0(L) (2.6)

e o seguinte caso não é válido:

(S) δ(L) > δ(K), i20(L) = 0 e min{π(K), ν(K)} = 0.

Demonstração. Sejam L,K,H ∈ Cn×n matrizes tais que K é uma matriz hermítica e H é uma

matriz definida positiva. Suponhamos que LH +HL∗ = K.

� demonstração de ν(K) ≥ i−(L)� Seja p = i−(L). Pelo lema 1.1.5, a forma normal de Jordan

da matriz L é semelhante por permutação a uma matriz da forma

L′ =

λIp 0

∗ ∗

, para algum λ ∈ C tal que <(λ) < 0.

Note-se que, dada a cadeia de divisibilidade entre os polinómios invariantes, é possível escolher

um valor próprio λ da matriz L tal que <(λ) < 0 e mg(λ) = p. Sem perda de generalidade,

suponhamos que L = L′. Particione-se a matriz H da seguinte forma:

H =

H11 H12

H∗12 H22

, com H11 ∈ Cp×p. (2.7)

Então −2<(λ)H11 é uma submatriz principal da matriz −K e é definida positiva. Pelo entre-

laçamento dos valores próprios, ν(K) = π(−K) ≥ p = i−(L).

� demonstração de π(K) ≥ i+(L)� Análoga à demonstração de anterior.

� demonstração de ν(K) ≥ i(L) e π(K) ≥ i(L)� Seja p = i20(L). Pelo lema 1.1.6, a forma

normal de Jordan da matriz L é semelhante por permutação a uma matriz da forma

L′ =

λIp 0 0

Ip λIp 0

∗ ∗ ∗

, para algum λ ∈ C tal que <(λ) = 0.

20


Novamente, dada a cadeia de divisibilidade entre os polinómios invariantes, é possível escolher

um valor próprio λ da matriz L tal que <(λ) = 0, mg(λ) = p e ma(λ) ≥ 2. Sem perda de

generalidade, suponhamos que L = L′ e particione-se a matriz H da seguinte forma:

H =

H11 H12 H13

H∗12 H22 H23

H∗13 H∗23 H33

, onde H11, H22 ∈ Cp×p.

Então

Kp =

0 H11

H11 H12 +H∗12

é uma submatriz principal da matriz K. Como Kp é uma matriz não singular e 0p é uma sua

submatriz principal, pelo entrelaçamento dos valores próprios, In(Kp) = (p, p, 0). Consequente-

mente, ν(K) ≥ p = i20(L) e π(K) ≥ p = i20(L).

E concluímos que as condições (2.2) e (2.3) são válidas.

� demonstração de δ(K) ≥ i(L)− n� Seja p = i0(L). Pelo lema 1.1.5, a forma normal de

Jordan da matriz L é semelhante por permutação a uma matriz da forma

L′ =

λIp 0

∗ ∗


Sem perda de generalidade, suponhamos que L = L′ e particione-se a matriz H como em (2.7).

Então 0p é uma submatriz principal da matriz K e, consequentemente, carK ≤ n − p. Logo,

como K é uma matriz hermítica,

δ(K) = n− carK ≥ p− carK ≥ p− (n− p) = 2i0(L)− n.

�demonstração deπ(K) + δ(K) ≥ i(L) e ν(K) + δ(K) ≥ i(L)� Aplicando um raciocínio

análogo ao da demonstração anterior, seja p = i0(L). A forma normal de Jordan da matriz L é

semelhante por permutação a uma matriz da forma

L′ =

λIp 0

∗ ∗


21


Sem perda de generalidade, suponhamos que L = L′ e particione-se a matriz H como em (2.7).

Então 0p é uma submatriz principal da matriz K e, portanto, carK ≤ n− p. Então:

π(K) + δ(K) = π(K) + (n− carK) ≥ π(K) + (n− (n− p)) ≥ p = i0(L).

Analogamente, ν(K) + δ(K) ≥ ν(K) + (n− (n− p)) ≥ p = i0(L).

� demonstração de (S) não é válido� Por indução em n.

Se n = 1, suponhamos que L = [l11] e H = [h11], para algum l11 ∈ C e para algum h11 ∈ R tal

que h11 > 0. Então:

LH +HL∗ = [2<(l11)h11] e In(L) = In(LH +HL∗) = In(K).

Logo o caso (S) não se verifica.

Seja n ≥ 2. Com vista a uma contradição, suponhamos que (S) é válido.

Então, como δ(L) > 0 e i20(L) = 0, a matriz L admite pelo menos um valor próprio imaginário

puro com multiplicidade 1 e, portanto, é semelhante a uma matriz da forma [λ]⊕L0, para algum

λ ∈ C tal que <(λ) = 0 e L0 ∈ C(n−1)×(n−1). Sem perda de generalidade, suponhamos que

L = [λ]⊕ L0 e particione-se a matriz H da seguinte forma:

H =

h g

g∗ H0

∈ Cn×n, onde H0 ∈ C(n−1)×(n−1).

Então

K =

0 g(λIn−1 + L∗0)

(−λIn−1 + L0)g∗ L0H0 +H0L

∗0

.Se g(λIn−1 + L∗0) 6= 0 então

M =

0 m12

m∗12 m22

∈ C2×2, com m12,m22 ∈ C \ {0},

é uma submatriz principal da matriz K tal que In(M) = (1, 1, 0). Pelo entrelaçamento dos

valores próprios,

π(K) ≥ π(M) = 1 e ν(K) ≥ ν(M) = 1,

22


o que é absurdo pois, por (S), min{π(K), ν(K)} = 0.

Suponhamos agora que g(λIn−1 + L∗0) = 0. Seja K0 = L0H0 +H0L∗0 ∈ C(n−1)×(n−1). Note-se

que i20(L0) = 0 e, como (S) é válido,

δ(L0) = δ(L)− 1 > δ(K)− 1 = δ(K0).

Por hipótese de indução, (S) não é válido para a matriz K0, logo min{π(K0), ν(K0)} > 0. Mas

π(K) = π(K0) e ν(K) = ν(K0) e obtemos de novo uma contradição.

Concluímos assim que o caso (S) não é válido.

Tal como vamos ver mais adiante, as condições (2.2) a (2.6) não são condições suficientes para

quaisquer matrizes L e K.

Chamamos τ -matriz a toda a matriz triangular superior T = [tij] ∈ Cn×n tal que ti,i+1 6= 0,

para todo i ∈ {1, . . . , n− 1}.

Os próximos lemas envolvem este conceito e são úteis na demonstração do resultado principal

desta secção.

Lema 2.2.2 Sejam λ1, ..., λn ∈ C ordenados por forma a que:

� se λi = λj , para algum i < j, então λi = λk, para todo k ∈ {i, . . . , j}.

Seja

T =

λ1 ∗

. . .

0 λn

∈ Cn×n (2.8)

uma τ -matriz. Então T é uma matriz não derrogatória.

Demonstração. Começamos por mostrar que

i(A) = n−RC(A),

onde RC(A) = minα∈C

car(αIn − A), para qualquer matriz A ∈ Cn×n (cf. [15]).

23


Suponhamos que a matriz A tem t valores próprios distintos, com 1 ≤ t ≤ n, e que os seus

divisores elementares são da forma

(x− λi)ri,1 , . . . , (x− λi)ri,si , para todo i ∈ {1, . . . , t},

onde 0 < ri,1 ≤ · · · ≤ ri,si. Então i(A) = max

i∈{1,...,t}si.

Como RC(A) é invariante para a semelhança, podemos considerar, sem perda de generalidade,

a matriz A na forma normal de Jordan. Na matriz λjIn − A existem sj linhas nulas e sj colu-

nas nulas e a matriz que resulta da eliminação dessas linhas e dessas colunas é não singular e,

portanto, car(λjIn − A) = n− sj . Logo

RC(A) = minα∈C

car(αIn − A) = n− maxi∈{1,...,t}

si = n− i(A).

Assim, em particular, RC(T ) = n − i(T ). Atendendo à forma da matriz T , RC(T ) = n − 1.

Donde i(T ) = 1, isto é, T é uma matriz não derrogatória.

Lema 2.2.3 Sejam a, b ∈ R e λ ∈ C. Seja ainda K ∈ C3×3 uma matriz hermítica tal que

In(K) ≥ (1, 1, 0). Então, para todo z ∈ C \ {0}, existe y ∈ C tal que a matriz

T =

ia z y

0 ib 1

0 0 λ

∈ C3×3

satisfaz a condição In(T + T ∗) = In(K).

Demonstração. Seja

S =

1 0 0

0 1 0

−z−1 −y z−1 1

∈ C3×3.

Então a matriz T + T ∗ é congruente com a matriz

S(T + T ∗)S∗ =

0 z

z 0

⊕ [2<(λ)− 2<(yz−1)].

24


Como

In

0 z

z 0

= (1, 1, 0),

o valor de y pode ser escolhido por forma a que In(T + T ∗) = In(K).

Lema 2.2.4 Seja L ∈ Cn×n uma matriz não derrogatória tal que π(L) = 0. Seja K ∈ Cn×n

uma matriz hermítica. Sejam ainda λ1, . . . , λn os valores próprios da matriz L ordenados por

forma a que:

� se λi = λj , para algum i < j, então λi = λk, para todo k ∈ {i, . . . , j};

� se <(λi) = 0, para algum i, então <(λk) = 0, para todo k ∈ {1, . . . , i}.

Suponhamos ainda que o seguinte caso não é válido:

(S′) n ≥ 2, δ(L) > 0 e min{π(K), ν(K)} = 0.

Se são válidas as condições (2.2) a (2.6) então a matriz L é semelhante a uma τ -matriz da forma

(2.8) e In(T + T ∗) = In(K).

Demonstração. Por indução em n.

Suponhamos n = 1. Como L é uma matriz não derrogatória, i(L) = 1 e i20(L) = 0. Além disso,

por hipótese, i+(L) = 0. Assim In(L) = (0, 1, 0) ou In(L) = (0, 0, 1). Por outro lado, das

condições (2.2) a (2.4) vem que

π(K) = 0, ν(K) ≥ i−(L) e δ(K) ≥ 2i0(L)− 1.

Logo In(L) = In(L+ L∗) = In(K).

Suponhamos agora que n = 2. Então, para todo t ∈ C \ {0}, a matriz L é semelhante à matriz

T =

λ1 t

0 λ2

∈ C2×2.

Note-se que L e T são matrizes não derrogatórias e têm os mesmos valores próprios. Por

hipótese, ou <(λ1) = 0 ou <(λ1) < 0.

Se <(λ1) = 0, então a matriz T + T ∗ tem uma submatriz nula de ordem 1 e det(T + T ∗) 6= 0.

Pelo entrelaçamento dos valores próprios, In(T + T ∗) = (1, 1, 0), para todo t ∈ C \ {0}.

25


Por outro lado, pelas condições (2.2) a (2.4), sabemos que π(K) ≥ 1 e δ(K) ≥ 0. Além

disso, como (S′) não é válido e δ(L) > 0, então min{π(K), ν(K)} 6= 0 e, consequentemente,

ν(K) ≥ 1. O que permite concluir que In(K) = (1, 1, 0) = In(T + T ∗).

Se <(λ1) < 0, pela forma como os valores próprios da matriz L foram ordenados e recordando

que π(L) = 0, concluímos que <(λ2) < 0. Além disso, a condição (2.3) implica que ν(K) ≥ 1.

Como

In(T + T ∗) =

(0, 2, 0), se 0 < |t| < 2

√<(λ1)<(λ2)

(1, 1, 0), se |t| > 2√<(λ1)<(λ2)

(0, 1, 1), se |t| = 2√<(λ1)<(λ2)

basta escolher t ∈ C \ {0} por forma a que In(T ∗ + T ) = In(K).

Por fim, suponhamos que n ≥ 3. Seja L0 ∈ C(n−1)×(n−1) uma matriz não derrogatória cujos

valores próprios são λ1, . . . , λn−1. Se n = 3 e In(K) = (1, 1, 1), seja K0 = diag(1,−1); caso

contrário, seja K0 ∈ C(n−1)×(n−1) uma matriz hermítica tal que

min{π(K), 1} ≤ π(K0) ≤ π(K)

min{ν(K), 1} ≤ ν(K0) ≤ ν(K)

min{δ(K), 1} ≤ δ(K0) ≤ δ(K).

De acordo com a hipótese de indução, a matriz L0 é semelhante a uma τ -matriz da forma

T0 =

λ1 ∗

. . .

0 λn−1

=

∗ t

0 λn−1

∈ C(n−1)×(n−1), (2.9)

com t ∈ C(n−2)×1 e In(T0 + T ∗0 ) = In(K0).

Como π(L) = 0, ou <(λn−1) < 0 ou <(λn−1) = 0.

�caso 1� Suponhamos que <(λn−1) < 0. Seja

X0 =

In−2 −(2<(λn−1))−1t

0 1

∈ C(n−1)×(n−1).

26


Então a matriz T0 + T ∗0 é congruente com a matriz

X0(T0 + T ∗0 )X∗0 = S ⊕ [2<(λn−1)] ∈ C(n−1)×(n−1),

para alguma matriz S ∈ C(n−2)×(n−2). Logo

In(K0) = In(T0 + T ∗0 ) = In(S) + In ([2<(λn−1)]),

ou seja, In(S) = In(K0)− (0, 1, 0).

Seja Kr ∈ C2×2 uma matriz tal que

In(Kr) = In(K)− In(S) ≥ In(K0)− In(S) = (0, 1, 0).

Por hipótese de indução, existe ν ∈ C \ {0} tal que a matriz

R =

λn−1 ν

0 λn

∈ C2×2

satisfaz a condição In(R +R∗) = In(Kr).

Seja

T =

T0

(2<(λn−1))−1νt

ν

0 λn

∈ Cn×n.

Pelo lema 2.2.2, T é uma matriz não derrogatória e, consequentemente, T e L são matrizes

semelhantes. Seja X = X0 ⊕ [1]. Então a matriz T + T ∗ é congruente com a matriz

X(T + T ∗)X∗ = S ⊕ (R +R∗),

o que mostra que In(T + T ∗) = In(S) + In(R +R∗) = In(K).

�caso 2� Suponhamos agora que <(λn−1) = 0. Então, pela forma como foram ordenados os

valores próprios da matriz L, <(λi) = 0, para todo i ∈ {1, . . . , n− 1}, ou seja, todas as entradas

principais da matriz T0 + T ∗0 são iguais a 0. Particione-se a matriz T0 da seguinte forma:

T0 =

T11 T12

0 T22

∈ C(n−1)×(n−1),

onde T22 =

λn−2 t

0 λn−1

∈ C2×2, com t ∈ C \ {0}. Consequentemente, In(T2,2 + T ∗2,2) =

(1, 1, 0).

27


Se n = 3, consideremos T0 = T22. Como In(K) ≥ (1, 1, 0), pelo lema 2.2.3, existe y ∈ C tal

que a matriz

T =

λ1 t y

0 λ2 1

0 0 λ3

∈ C3×3

é semelhante à matriz L e satisfaz a condição In(T + T ∗) = In(K).

Suponhamos agora que n > 3. Seja

X0 =

In−3 −T12(T22 + T ∗22)−1

0 I2

∈ C(n−1)×(n−1).

Então a matriz T0 + T ∗0 é congruente com a matriz

X0(T0 + T ∗0 )X∗0 = S ⊕ (T22 + T ∗22) ∈ C(n−1)×(n−1),

para alguma matriz S ∈ C(n−3)×(n−3). Então

In(K0) = In(T0 + T ∗0 ) = In(S) + In(T22 + T ∗22),

ou seja, In(S) = In(K0) − In(T22 + T ∗22). Novamente, pelo lema 2.2.3, existe y ∈ C tal que a

matriz

R =

T22

y

1

0 λn

∈ C3×3

satisfaz a condição In(R +R∗) = In(K)− In(S). Note-se que

In(K)− In(S) ≥ In(K0)− In(S) = In(T22 + T ∗22) = (1, 1, 0).

Seja

T =

T11 T12 T12(T22 + T ∗22)

−1M

0 T22 M

0 0 λn

∈ Cn×n,

com M = [y 1]T ∈ C2×1. Pelo lema 2.2.2, T é uma matriz não derrogatória e como as matrizes

T e L têm os mesmos valores próprios, são semelhantes.

Seja X = X0⊕ [1] ∈ Cn×n. Então a matriz T + T ∗ é congruente com a matriz X(T + T ∗)X∗ =

S ⊕ (R +R∗), o que mostra que In(T + T ∗) = In(S) + In(R +R∗) = In(K).

28


Analogamente se mostra que:

Lema 2.2.5 Seja L ∈ Cn×n uma matriz não derrogatória tal que ν(L) = 0. Seja K ∈ Cn×n

uma matriz hermítica. Sejam ainda λ1, . . . , λn os valores próprios de L ordenados de acordo

com o lema 2.2.4. Suponhamos ainda que não é válido o caso (S′).

Se são válidas as condições (2.2) a (2.6) então L é semelhante a uma τ -matriz da forma (2.8) e

In(T + T ∗) = In(K).

O próximo teorema é uma das soluções parciais do problema 1 a apresentar neste trabalho.

Este resultado estabelece as relações entre a classe de semelhança da matriz L e a classe de

congruência da matriz K quando é válida a equação de Lyapunov e H é uma matriz definida

positiva e ou L é uma matriz não derrogatória ou K é uma matriz semi-definida positiva.

Teorema 2.2.6 Sejam L,K ∈ Cn×n matrizes tais que K é uma matriz hermítica. Suponhamos

que ou L é uma matriz não derrogatória ou K é uma matriz semi-definida positiva. Suponhamos

ainda que não é válido o caso (S), referido no enunciado no teorema 2.2.1.

Então existe uma matriz definida positiva H ∈ Cn×n tal que

In(LH +HL∗) = In(K)

se e só se são válidas as condições (2.2) a (2.6).

Demonstração. Note-se que o teorema 2.2.1 é a condição suficiente. Resta apenas mostrar

a condição necessária. Sejam L,K ∈ Cn×n matrizes tais que K é uma matriz hermítica e

suponhamos não é válido o caso (S).

Se a matriz L é escalar então é da forma L = λIn, para algum λ ∈ C. As condições (2.2) a (2.6)

implicam que existe uma matriz definida positiva H ∈ Cn×n tal que In(K) = In(LH + HL∗).

De facto, como In(L+ L∗) = In(L), basta considerar H = In.

Suponhamos agora que a matriz L é não escalar. A demonstração é feita por indução em n. Para

n = 1, a demonstração é trivial. Suponhamos então que n ≥ 2.

29


�caso 1� Suponhamos que L é uma matriz não derrogatória. Vamos considerar 3 casos: (i)

π(L) = 0, (ii) ν(L) = 0 e (iii) π(L) > 0 e ν(L) = 0.

� Suponhamos que π(L) = 0� Sejam λ1, . . . , λn os valores próprios da matriz L. Sem perda de

generalidade, suponhamos que estão ordenados de acordo com o lema 2.2.4.

Se não é válido o caso (S′) então, pelo lema 2.2.4, existe uma matriz não singular X ∈ Cn×n tal

que a matriz L é semelhante à matriz T = X−1LX e In(T + T ∗) = In(K). Por outro lado,

In(T + T ∗) = In (X(T + T ∗)X∗) = In(LXX∗ +XX∗L∗).

Logo existe uma matriz definida positiva H = XX∗ ∈ Cn×n tal que In(LH +HL∗) = In(K).

Note-se que XX∗ é uma matriz definida positiva pois x∗(XX∗)x > 0, para todo x ∈ C \ {0}.

Suponhamos agora que (S′) é válido, ou seja, δ(L) > 0 e min{π(K), ν(K)} = 0. Então, pelas

condições (2.2) a (2.6), concluimos que i20(L) = 0, i0(L) = 1 e δ(K) > 0. Além disso, como

(S) não é válido, temos que δ(K) ≥ δ(L).

Sem perda de generalidade, suponhamos que <(λ1) = 0.

Suponhamos que n = 2. Suponhamos ainda que <(λ2) = 0. Como i20(L) = 0, vem que λ1 6= λ2

e a matriz L é semelhante à matriz diag(λ1, λ2). Sem perda de generalidade, suponhamos L =

diag(λ1, λ2). Então In(L + L∗) = (0, 0, 2) = In(K), pois δ(K) ≥ δ(L) = 2. Suponhamos

agora que <(λ2) 6= 0. Sendo π(L) = 0, <(λ2) < 0. Novamente, sem perda de generalidade,

consideremos L = diag(λ1, λ2). Como δ(K) ≥ δ(L) = 1 e i−(L) = 1, pela condição (2.3),

vem que ν(K) ≥ 1 e é fácil verificar que In(L+ L∗) = (0, 1, 1) = In(K).

Suponhamos agora que n ≥ 3. Como <(λ1) = 0 e i20(L) = 0, a matriz L é semelhante à

matriz [λ1] ⊕ L0, para alguma matriz L0 ∈ C(n−1)×(n−1). Sem perda de generalidade, seja

L = [λ1]⊕L0. SejaK0 ∈ C(n−1)×(n−1) uma matriz hermítica tal que In(K0) = In(K)−(0, 0, 1).

De acordo com a hipótese de indução, existe uma matriz definida positiva H0 ∈ C(n−1)×(n−1) tal

que In(L0H0 +H0L∗0) = In(K0). Seja H = [1]⊕H0 ∈ Cn×n. Então In(LH +HL∗) = In(K)

e a demonstração para o caso π(L) = 0 fica completa.

� Suponhamos que ν(L) = 0� Este caso demonstra-se de forma análoga ao anterior.

30


� Suponhamos agora que ν(L) > 0 e π(L) > 0� Pelas condições (2.2) e (2.3), ν(K) > 0 e

π(K) > 0. Assim a matriz L é semelhante a uma matriz da forma L+⊕L−, onde L+ ∈ Cn+×n+

é uma matriz não derrogatória e ν(L+) = 0, L− ∈ Cn−×n− é uma matriz não derrogatória e

π(L−) = δ(L−) = 0, com n+ + n− = n. Sejam π+, ν+, δ+, π−, ν− e δ− inteiros definidos por:

π+ = max{1,min{π(K), n+} − 1},

ν+ = min{ν(K), n+ − π+},

δ+ = n+ − π+ − ν+,

ν− = min{ν(K), n−},

π− = min{π(K), n− − ν−},

δ− = n− − π− − ν−.

É fácil verificar que qualquer um dos inteiros π+, ν+, δ+, π−, ν− e δ− é não negativo. Além

disso, as seguintes desigualdades são satisfeitas:

π+ ≥ 1, (2.10)

ν+ ≥ 1, a menos que n+ = 1, (2.11)

ν− ≥ 1, (2.12)

max{π+, π−} ≤ π(K) ≤ min{n+ + π−, n− + π+}, (2.13)

max{ν+, ν−} ≤ ν(K) ≤ min{n+ + ν−, n− + ν+}, (2.14)

π(K)− ν(K) ≤ π+ + π−, (2.15)

ν(K)− π(K) ≤ ν+ + ν−. (2.16)

De acordo com a hipótese de indução, existem matrizes definidas positivas H+ ∈ Cn+×n+ e

H− ∈ Cn−×n− tais que In(L+H++H+L∗+) = (π+, ν+, δ+) e In(L−H−+H−L

∗−) = (π−, ν−, δ−).

Dadas as condições (2.13) a (2.16) e, de acordo com o teorema 1.2.4, existe uma matriz X ∈

Cn+×n− tal que a matriz L+H+ +H+L∗+ X

X∗ L−H− +H−L∗−

∈ Cn×n (2.17)

31


tem a mesma inércia de K. Como as matrizes L+ e L− não têm valores próprios comuns,

podemos supor, sem perda de generalidade, que

L =

L+ XH−1−

0 L−

.Seja H = H+ ⊕H− ∈ Cn×n. Então a matriz LH +HL∗ tem a forma (2.17) e, portanto,

In(LH +HL∗) = In(K).

� caso 2� Suponhamos que K é uma matriz semi-definida positiva e L é uma matriz derrogatória.

Sem perda de generalidade, consideremos a matriz L na sua forma normal companheira e supo-

nhamos que L = L0⊕Lr, com L0 = C(f1)⊕ · · · ⊕C(fr−1) ∈ Cn0×n0 e Lr = C(fr) ∈ Cnr×nr ,

onde f1| · · · |fr são os polinómios invariantes da matriz L e n0 + nr = n. Sejam π0, δ0, πr e δr

inteiros definidos por:

π0 = max{i+(L0), δ(Lr) + π(K)− nr},

δ0 = n0 − π0,

πr = π(K)− π0,

δr = nr − πr.

É fácil verificar que estes inteiros são não negativos. Como K ≥ 0 e ν(K) = 0, pela condição

(2.3), temos que i−(L) = i20(L) = 0. Além disso, como (S) não é válido, δ(L) ≤ δ(K). Não é

difícil verificar que

π0 ≥ i+(L0),

δ0 ≥ δ(L0) ≥ i0(L0) ≥ 2i0(L0)− n0,

πr ≥ i+(Lr),

δr ≥ δ(Lr) ≥ i0(Lr) ≥ 2i0(Lr)− nr.

De acordo com a hipótese de indução, existem matrizes definidas positivas H0 ∈ Cn0×n0 e

Hr ∈ Cnr×nr tais que In(L0H0 + H0L∗0) = (π0, 0, δ0) e In(LrHr + HrL

∗r) = (πr, 0, δr). Seja

H = H0 ⊕Hr ∈ Cn×n. Então In(LH +HL∗) = In(K).

32


O teorema 2.2.6 nem sempre é válido quando L é uma matriz derrogatória e a matriz K não é

semi-definida positiva, como se pode verificar no exemplo seguinte.

Exemplo 2.2.7 Seja L = λ1Ip ⊕ λ2Iq ∈ Cn×n, onde λ1, λ2 ∈ C são tais que λ1 6= λ2 e

<(λ1) = <(λ2) = 0 e p+q = n. Suponhamos que é válido o teorema 2.2.6, ou seja, suponhamos

que existe uma matriz definida positiva

H =

H11 H12

H∗12 H22

∈ Cn×n, com H11 ∈ Cp×p, (2.18)

tal que In(LH +HL∗) = In(K). Então

LH +HL∗ =

0 (λ1 − λ2)H12

(λ2 − λ1)H∗12 0

e pelas condições (iv) e (v) do teorema 1.2.4, π(K) = ν(K).

Suponhamos que n = 5, p = 3 e q = 2 e seja K ∈ C5×5 uma matriz hermítica tal que In(K) =

(2, 1, 2). Então, como 2 = δ(L) = δ(K) e min{π(K), ν(K)} = 1 6= 0, o caso (S) não é válido.

Por outro lado, as condições (2.2) a (2.6) são válidas. E, no entanto, o teorema 2.2.6 não é válido

pois, neste caso, 2 = π(K) 6= ν(K) = 1.

O próximo resultado é o teorema 2.1.5 formulado como corolário do teorema anterior, apresen-

tando assim uma demonstração alternativa à dada em [2, Corolário III].

Corolário 2.2.8 Seja L ∈ Cn×n uma matriz. Então existe uma matriz definida positiva H ∈

Cn×n tal que LH + HL∗ ≥ 0 se e só se a matriz L não tem divisores elementares com raízes

imaginárias múltiplas e ν(L) = 0.

Demonstração. Seja L ∈ Cn×n uma matriz. Suponhamos que existe uma matriz definida

positivaH ∈ Cn×n tal que a matrizK = LH+HL∗ é semi-definida positiva, ou seja, π(K) > 0,

ν(K) = 0 e δ(K) > 0. De acordo com o teorema 2.2.1, max{i−(L), i20(L)} = 0, ou seja:

33


� i−(L) = 0, isto é, ν(L) = 0,

� i20(L)} = 0, isto é, a matriz L não admite divisores elementares com raízes imaginárias

múltiplas.

Reciprocamente, suponhamos que a matriz L não admite divisores elementares com raízes ima-

ginárias múltiplas e ν(L) = 0. Seja K ∈ Cn×n uma matriz hermítica tal que

In(K) = (i+(L), 0, n− i+(L)).

É fácil verificar que as condições (2.2) a (2.6) são válidas e δ(L) ≤ δ(K).

Então, pelo teorema 2.2.6, existe uma matriz definida positiva H ∈ Cn×n tal que

In(LH +HL∗) = In(K).

Donde LH +HL∗ ≥ 0.

2.2.2 L é uma matriz não derrogatória

Nesta secção apresentamos condições para as classes de congruência das matrizesK eH quando

é válida a equação de Lyapunov, L é uma matriz não derrogatória e K é uma matriz indefinida.

O nosso resultado generaliza os resultados obtidos por L. M. DeAlba em [7].

Seguiremos de perto [19].

O próximo resultado é uma generalização do lema 2.2.3.

Lema 2.2.9 Sejam a ∈ R e λ, µ ∈ C. Seja ainda K ∈ C3×3 uma matriz hermítica tal que

In(K) ≥ (1, 1, 0).

Então, para todo z ∈ C \ {0}, existe y ∈ C tal que a matriz

T =

λ 1 y

0 ia z

0 0 µ

∈ C3×3

satisfaz a condição In(T + T ∗) = In(K).

34


Demonstração. Seja S ∈ Cn×n uma matriz definida por:

S =

1 z−1(2<(µ)z−1 − y) −z−1

0 1 0

0 0 1

.Então a matriz T + T ∗ é congruente com a matriz

S(T + T ∗)S∗ =[2<(λ) + 2<(µ)

∣∣z−1∣∣2 − 2<

(yz−1

)]⊕

0 z

z 2<(µ)

.Assim

In(T + T ∗) = In[2<(λ) + 2<(µ)

∣∣z−1∣∣2 − 2<

(yz−1

)]+ In

0 z

z 2<(µ)

e, portanto, é possível escolher o valor de y por forma a que In(T + T ∗) = In(K).

Lema 2.2.10 Sejam L,K ∈ Cn×n matrizes tais que L uma matriz não derrogatória e In(K) ≥

(1, 1, 0). Sejam ainda λ1, . . . , λn os valores próprios de L ordenados por forma a que:

� se λi = λj , para algum i < j, então λi = λk, para todo k ∈ {i, . . . , j},

� se <(λi) < 0, para algum i, então <(λk) < 0, para todo k ∈ {1, . . . , i},

� se <(λi) > 0, para algum i, então <(λk) > 0, para todo k ∈ {i, . . . , n}.

Então existe uma τ -matriz T = [tij] ∈ Cn×n tal que tii = λi, para todo i ∈ {1, . . . , n}, e

In(T + T ∗) = In(K).

Demonstração. Por indução em n. Se n = 1, a demonstração é imediata.

Se n = 2, o resultado é fácil de provar. De facto, In(K) = (1, 1, 0) e, além disso, a matriz L é

semelhante a uma τ -matriz T ∈ C2×2 da forma

T =

λ1 t

0 λ2

, para algum t ∈ C \ {0}.

35


Note-se que as matrizes T e L têm os mesmos valores próprios e são ambas não derrogatórias.

Suponhamos que<(λ1) = 0 ou<(λ2) = 0; então, para todo t ∈ C\{0}, tem-se que In(T+T ∗) =

(1, 1, 0). Suponhamos que <(λ2) < 0, então <(λ1) < 0 e

In(T + T ∗) =

(0, 2, 0) se 0 < |t| < 2

√<(λ1)<(λ2)

(1, 1, 0) se |t| > 2√<(λ1)<(λ2)

(0, 1, 1) se |t| = 2√<(λ1)<(λ2)

.

Basta escolher t de modo a obter a inércia pretendida.

Suponhamos agora que <(λ2) > 0. Se <(λ1) > 0, o raciocínio é análogo ao anterior, ou seja,

In(T + T ∗) =

(2, 0, 0) se 0 < |t| < 2

√<(λ1)<(λ2)

(1, 1, 0) se |t| > 2√<(λ1)<(λ2)

(1, 0, 1) se |t| = 2√<(λ1)<(λ2)

.

e basta escolher t de modo a obter a inércia pretendida.

Se<(λ1) < 0, atendendo à definição de valores próprios, concluímos que In(T+T ∗) = (1, 1, 0).

Suponhamos agora que n ≥ 3. Se π(L) = 0 ou ν(L) = 0, obtemos casos particulares

do lema 2.2.4 e do lema 2.2.5, respectivamente. Note-se que o caso (S′) não é válido pois

min{π(K), ν(K)} ≥ 1 e as condições (2.2) a (2.6) são satisfeitas uma vez que

i+(L), i−(L), i0(L), i20(L) ∈ {0, 1}.

Suponhamos então que π(L) > 0 e ν(L) > 0.

Como n ≥ 3, π(L) + δ(L) ≥ 2 ou ν(L) + δ(L) ≥ 2. Sem perda de generalidade, suponhamos

que π(L) + δ(L) ≥ 2.

Sejam n− = ν(L) e n+ = π(L) + δ(L). Então a matriz L é semelhante a uma matriz da forma

L− ⊕ L+ ∈ Cn×n, onde L− ∈ Cn−×n− é uma matriz não derrogatória e tem valores próprios

λ1, . . . , λn− e L+ ∈ Cn+×n+ é uma matriz não derrogatória e tem valores próprios λn−+1, . . . , λn.

Desta construção resulta que ou <(λn−+1) > 0 ou <(λn−+1) = 0.

36


�caso 1� Suponhamos que <(λn−+1) > 0. Sejam π+, ν+, δ+, π−, ν− e δ− inteiros definidos por:

ν− = min{n−, ν(K)},

ν+ = ν(K)− ν−, (2.19)

π+ = min{π(K), n+ − ν+}, (2.20)

π− = π(K)− π+, (2.21)

δ− = n− − ν− − π−, (2.22)

δ+ = n+ − ν+ − π+. (2.23)

Não é difícil verificar que ν−, π+ são inteiros positivos e ν+, π−, δ−, δ+ são inteiros não negativos.

Do lema 2.2.4, vem que existe uma τ -matriz T− ∈ Cn−×n− com diagonal principal λ1, . . . , λn−

tal que In(T− + T ∗−) = (π−, ν−, δ−). Analogamente, pelo lema 2.2.5, existe uma τ -matriz T+ ∈

Cn+×n+ com diagonal principal λn−+1, . . . , λn tal que In(T+ + T ∗+) = (π+, ν+, δ+).

Suponhamos que

T− =

∗ t−

0 λn−

∈ Cn−×n− para algum t− ∈ C(n−−1)×1, (2.24)

T+ =

λn−+1 t+

0 ∗

∈ Cn+×n+ para algum t+ ∈ C1×(n+−1).

Sejam X− ∈ Cn−×n− e X+ ∈ Cn+×n+ matrizes definidas, respectivamente, por

X− =

In−−1 −(2<(λn−))−1t−

0 1

(2.25)

X+ =

1 0

−(2<(λn−+1))−1t∗+ In+−1

.Então a matriz T− + T ∗− é congruente com a matriz

X−(T− + T ∗−)X∗− = S− ⊕ [2<(λn−)], (2.26)

37


para alguma matriz S− ∈ C(n−−1)×(n−−1).

E a matriz T+ + T ∗+ é congruente com a matriz

X+(T+ + T ∗+)X∗+ = [2<(λn−+1)]⊕ S+,

para alguma matriz S+ ∈ C(n+−1)×(n+−1).

Donde In(S−) = (π−, ν− − 1, δ−) e In(S+) = (π+ − 1, ν+, δ+).

Sejam T,X ∈ Cn×n matrizes definidas por X = X− ⊕X+ e

T =

T−(2<(λn−))−1t− (4<(λn−)<(λn−+1))

−1t−t+

1 (2<(λn−+1))−1t+

0 T+

.Então a matriz T + T ∗ é congruente com a matriz

X(T + T ∗)X∗ = S− ⊕

2<(λn−) 1

1 2<(λn−+1)

⊕ S+.

Logo In(T + T ∗) = In(S−) + (1, 1, 0) + In(S+) = In(K), ou seja, existe uma τ -matriz T nas

condições pretendidas.

�caso 2� Suponhamos agora que <(λn−+1) = 0. Definam-se os inteiros π+, ν+, δ+, π−, ν− e δ−

da forma a seguir indicada.

Se ν(K) = 1, sejam ν− = 1, ν+ = 1, defina-se π+ como em (2.20), seja

π− = max{0, π(K)− π+ − 1},

e defina-se δ− e δ+ como em (2.22) e (2.23), respectivamente.

Se ν(K) ≥ 2, seja

ν− = min{n−, ν(K)− 1}

e defina-se ν+, π+, π−, δ− e δ+ como em (2.19) a (2.23), respectivamente.

Novamente, não é difícil verificar que, em qualquer um dos casos, ν−, ν+, π+ são inteiros posi-

tivos e π−, δ−, δ+ são inteiros não negativos.

Analogamente ao caso anterior, aplicando o lema 2.2.4 e o lema 2.2.5, respectivamente, existe

uma τ -matriz T− ∈ Cn−×n− com diagonal principal λ1, . . . , λn− tal que In(T−+T ∗−) = (π−, ν−, δ−)

38


e existe uma τ -matriz T+ ∈ Cn+×n+ com diagonal principal λn−+1, . . . , λn tal que In(T++T ∗+) =

(π+, ν+, δ+).

Suponhamos que a matriz T− é particionada tal como em (2.24) e suponhamos que

T+ =

T11 T12

0 T22

∈ Cn+×n+ , onde T11 ∈ C2×2.

Como <(λn−+1) = 0 e a entrada (1, 2) da matriz T11 é não nula, vem que In(T11 + T ∗11) =

(1, 1, 0).

Defina-se a matriz X− como em (2.25) e seja X+ ∈ Cn+×n+ a matriz definida por:

X+ =

I2 0

−T ∗12(T11 + T ∗11)−1 In+−2

.Então a matriz T− + T ∗− é congruente com a matriz definida em (2.26) e a matriz T+ + T ∗+ é

congruente com a matriz

X+(T+ + T ∗+)X∗+ = (T11 + T ∗11)⊕ S+,

para alguma matriz S+ ∈ C(n+−2)×(n+−2).

Donde In(S−) = (π−, ν− − 1, δ−) e In(S+) = (π+ − 1, ν+ − 1, δ+).

De acordo com o lema anterior (lema 2.2.9), existe y ∈ C tal que a matriz

R =

λn− 1 y

0 T11

∈ C3×3

satisfaz a condição In(R +R∗) = In(K)− In(S−)− In(S+) ≥ (1, 1, 0).

Seja M = [ 1 y ] ∈ C1×2 e seja

T =

T−(2<(λn−))−1t−M (2<(λn−))−1t−M(T11 + T ∗11)

−1T12

M M(T11 + T ∗11)−1T12

0 T+

∈ Cn×n.

Seja ainda X = X− ⊕X+ ∈ Cn×n. Então a matriz T + T ∗ é congruente com a matriz

X(T + T ∗)X∗ = S− ⊕ (R +R∗)⊕ S+.

e, portanto, In(T + T ∗) = In(K).

39


Observe-se que as matrizes L e T definidas no lema anterior são semelhantes. De facto, pelo

lema 2.2.2, T é uma matriz não derrogatória e, além disso, tem os mesmos valores próprios que

a matriz L; logo é semelhante à matriz L.

O próximo teorema é o resultado principal desta secção e apresenta uma solução do problema 1

para o caso em que L é uma matriz não derrogatória e K é uma matriz indefinida.

Teorema 2.2.11 Sejam L,K ∈ Cn×n matrizes tais que L é uma matriz não derrogatória e

In(K) ≥ (1, 1, 0). Sejam ainda πh e νh inteiros não negativos tais que πh+νh = n. Então existe

uma matriz hermítica H ∈ Cn×n tal que In(H) = (πh, νh, 0) e In(LH +HL∗) = In(K).

Demonstração. Sejam L,K ∈ Cn×n matrizes tais que L é uma matriz não derrogatória e

In(K) ≥ (1, 1, 0).

� demonstração se δ(L) = n� Sejam λ1, . . . , λn os valores próprios da matriz L, ordenados

de acordo com o lema 2.2.10. Escolha-se um número real negativo h tal que, para todo i ∈

{1, . . . , n}, se λi 6= 0 então hλi não é valor próprio da matriz L. De acordo com o lema 2.2.10,

existe uma τ -matriz T ∈ Cn×n cuja diagonal principal é

hλ1, . . . , hλνh, λνh+1, . . . , λn

e tal que In(T + T ∗) = In(K). Seja H = (hIνh) ⊕ Iπh

∈ Cn×n. Então In(H) = (πh, νh, 0), a

matriz TH−1 é semelhante à matriz L e

In((TH−1)H +H(TH−1)∗) = In(K). (2.27)

�demonstração se δ(L) =0� Vamos considerar dois casos: νh ≤ π(L) e νh > π(L).

�caso 1 � Suponhamos que νh ≤ π(L). Sejam λ1, . . . , λn os valores próprios da matriz L, or-

denados de acordo com o lema 2.2.10. Analogamente à demonstração anterior, escolha-se um

número real negativo h tal que, para todo i ∈ {1, . . . , n}, hλi não é valor próprio da matriz L.

De acordo com o lema 2.2.10, existe uma τ -matriz T ∈ Cn×n cuja diagonal principal é

λ1, . . . , λν(L), hλν(L)+1, . . . , hλν(L)+νh, λν(L)+νh+1, . . . , λn,

e tal que In(T + T ∗) = In(K).

40


Seja

H = Iν(L) ⊕ (hIνh)⊕ Iπ(L)−νh

∈ Cn×n.

Então In(H) = (πh, νh, 0), a matriz TH−1 é semelhante à matriz L e a condição (2.27) é válida.

�caso 2� Suponhamos agora que νh > π(L). Então πh = n− νh < n− π(L) = ν(L) = π(−L).

De acordo com o caso anterior, existe uma matriz X ∈ Cn×n semelhante à matriz −L e existe

uma matriz hermítica H ∈ Cn×n tal que In(H) = (νh, πh, 0) e In(XH+HX∗) = In(K). Então

a matriz −X é semelhante à matriz L, In(−H) = (πh, νh, 0) e

In((−X)(−H) + (−H)(−X∗)) = In(K).

�demonstração se 0< δ(L) < n� A matriz L é semelhante a uma matriz da forma L0⊕L1, onde

L0 ∈ Cn0×n0 é uma matriz não derrogatória tal que δ(L0) = n0, com 0 < n0 < n, e L1 ∈ Cn1×n1

é uma matriz não derrogatória tal que δ(L1) = 0.

Sem perda de generalidade, suponhamos que π(K) ≥ ν(K). O caso π(K) ≤ ν(K) é análogo.

Escolham-se inteiros não negativos p0, n0, p1, n1 tais que p0+n0 = n0, p1+n1 = n1, p0+p1 = πh

e n0 + n1 = νh. Definam-se ainda os inteiros não negativos π0, ν0, δ0, π1, ν1, δ1 e as matrizes

hermíticas H0 ∈ Cn0×n0 e H1 ∈ Cn1×n1 da forma a seguir indicada.

Se n0 = 1, escolha-se h0 ∈ {1,−1} tal que a matriz H0 = [h0] satisfaz a condição

In(H0) = (p0, n0, 0) (2.28)

e sejam π0, ν0, δ0 inteiros que satisfaçam a condição

In(L0H0 +H0L∗0) = (π0, ν0, δ0). (2.29)

Se n0 ≥ 2, definam-seπ0 = min{π(K), n0 − 1},

ν0 = min{ν(K), n0 − π0},

δ0 = n0 − π0 − ν0.

Então min{π0, ν0} > 0 e δ0 ≥ 0; como δ(L0) = n0, pela demonstração do caso δ(L) = n, existe

uma matriz hermítica H0 ∈ Cn0×n0 tal que são válidas as condições (2.28) e (2.29).

41


Se n1 = 1, escolha-se h1 ∈ {1,−1} tal que a matriz H1 = [h1] satisfaz a condição

In(H1) = (p1, n1, 0), (2.30)

e sejam π1, ν1, δ1 inteiros que satisfazem a condição

In(L1H1 +H1L∗1) = (π1, ν1, δ1). (2.31)

Se n1 ≥ 2, definam-seπ1 = min{π(K), n1 − 1},

ν1 = min{ν(K), n1 − π1},

δ1 = n1 − π1 − ν1.

Então min{π1, ν1} > 0 e δ1 ≥ 0; como δ(L1) = 0, pela demonstração do caso δ(L) = 0, existe

uma matriz hermítica H1 ∈ Cn1×n1 tal que as condições (2.30) e (2.31) são válidas.

Em qualquer dos casos, pelo teorema 1.2.4, existe uma matriz X ∈ Cn0×n1 tal que

In

L0H0 +H0L∗0 X

X∗ L1H1 +H1L∗1

= In(K).

Note-se que:

π(K) + ν(K) ≤ n,

max{π0, π1} ≤ π(K) ≤ min{n0 + π1, n1 + π0},

max{ν0, ν1} ≤ ν(K) ≤ min{n0 + ν1, n1 + ν0},

π(K)− ν(K) ≤ π0 + π1,

ν(K)− π(K) ≤ ν0 + ν1.

Como as matrizes L0 e L1 não têm valores próprios em comum, a matriz L é semelhante à matriz L0 XH−11

0 L1

∈ Cn×n.

Sem perda de generalidade, suponhamos que a matriz L tem essa forma.

Seja H = H0 ⊕H1 ∈ Cn×n. Então In(H) = (πh, νh, 0) e In(LH +HL∗) = In(K).

42

Capítulo 3

Equação de Stein

“Research means going out into the unknown

with the hope of finding something new to bring home.

If you know what you are going to do, or even to find there,

then it is not research at all, then it is only a kind of honourable occupation.”

A. Szent-Gyorgyi

O objectivo deste capítulo é apresentar um estudo análogo ao do capítulo anterior mas para a

equação de Stein. Este estudo é feito tendo por base uma relação entre a equação de Lyapunov

e a equação de Stein, que permite generalizar para o caso discreto os resultados obtidos no caso

contínuo.

Os principais teoremas deste capítulo podem ser encontrados em [18, 19].

3.1 Motivação

Nesta secção, introduzimos a teoria e os resultados que motivam a formulação do problema para

a equação de Stein e apresentamos também soluções parciais desse mesmo problema.

43

3.1 Motivação

Tal como é referido no primeiro capítulo, em 1952, Stein publica um resultado análogo ao de

Lyapunov mas relativo à estabilidade de sistemas discretos em termos de equações matriciais.

Uma das demonstrações possíveis desse resultado é referida no Capítulo 1 e baseia-se numa

definição específica da matriz H dada por (1.2). Outra demonstração, mais imediata, tem por

base o teorema de Lyapunov e a relação entre as duas equações (teorema 1.3.5), envolvendo a

transformada de Cayley, anteriormente definida.

Teorema 3.1.1 (Teorema de Stein) [12] Sejam S,K ∈ Cn×n matrizes tais que K é uma matriz

definida positiva. A matriz S é estável relativamente ao círculo unitário se e só se existe uma

matriz definida positiva H ∈ Cn×n que satisfaz a equação de Stein H − SHS∗ = K.

Demonstração. Sejam S,K ∈ Cn×n matrizes tais que K é uma matriz definida positiva.

Suponhamos que a matriz S é estável relativamente ao círculo unitário. Então, pelo corolário

1.3.4, a sua transformada de Cayley C(S) é estável positiva e, pelo teorema de Lyapunov, existe

matriz definida positiva H ∈ Cn×n tal que

C(S)H +HC(S)∗ = 2−1(In + S)K(In + S)∗.

Logo H − SHS∗ = K, pelo teorema 1.3.5.

Reciprocamente, suponhamos que existe uma matriz definida positivaH ∈ Cn×n tal que é válida

a equação de Stein H − SHS∗ = K > 0. Então existe uma matriz não singular X ∈ Cn×n

tal que C(S)H + HC(S)∗ = XKX∗ > 0. Aplicando o teorema de Lyapunov, a matriz C(S)

é estável positiva e, consequentemente, a matriz S é estável relativamente ao círculo unitário

(corolário 1.3.4).

Observe-se que aplicando a transformada de Cayley, podemos transferir para a equação de Stein

resultados relativos à equação de Lyapunov desde que−1 não seja valor próprio da matriz S. Por

exemplo, o teorema geral da inércia pode ser reescrito para o caso discreto da seguinte forma:

44

3.1 Motivação

Teorema 3.1.2 (Teorema geral da inércia relativamente ao círculo unitário) [12] Sejam S,K ∈

Cn×n matrizes tais que K é uma matriz definida positiva. Então existe uma matriz hermítica

H ∈ Cn×n tal que H − SHS∗ = K se e só se δ1(S) = 0. Além disso, se existir uma matriz

hermítica H ∈ Cn×n tal que H − SHS∗ = K então In1(S) = In(H).

Demonstração. Seja S ∈ Cn×n uma matriz. Suponhamos que existe uma matriz hermítica

H ∈ Cn×n tal que H − SHS∗ > 0. Pelo teorema 1.3.5, a matriz C(S)H + HC(S)∗ também é

definida positiva. Aplicando o teorema geral da inércia, δ(C(S)) = 0, ou seja, δ1(S) = 0, pelo

teorema 1.3.3.

O recíproco é análogo. Se δ1(S) = 0 então δ(C(S)) = 0 e, pelo teorema geral da inércia,

C(S)H +HC(S)∗ > 0, ou seja, a matriz H − SHS∗ é definida positiva.

Além disso, se C(S)H +HC(S)∗ > 0, pelo teorema geral da inércia, In(C(S)) = In(H) e, pelo

teorema 1.3.3, In1(S) = In(C(S)); donde In1(S) = In(H).

Tal como já vimos a inércia relativamente ao círculo unitário é invariante para a semelhança.

Além disso, para toda a matriz não singular R ∈ Cn×n, H − SHS∗ = K é equivalente a

RHR∗ − (RSR−1)(RHR∗)(RSR−1)∗ = RKR∗. (3.1)

Atendendo a esta observação podemos formular o teorema anterior da seguinte forma:

Teorema 3.1.3 Sejam S,H ∈ Cn×n matrizes tais que H é uma matriz hermítica. Então existe

uma matriz S ′ ∈ Cn×n semelhante a S e existe uma matriz H ′ ∈ Cn×n congruente com H tais

que H ′ − S ′H ′S ′∗ é definida positiva se e só se δ1(S) = 0 e In1(S) = In(H).

Demonstração. Sejam S,H ∈ Cn×n matrizes tais que H é uma matriz hermítica. Suponhamos

que existe uma matriz S ′ ∈ Cn×n semelhante a S e existe uma matriz H ′ ∈ Cn×n congruente

com H tais que H ′ − S ′H ′S ′∗ > 0. Pelo teorema 3.1.2, δ1(S ′) = 0 e In(S ′) = In(H ′). Pelas

propriedades da inércia relativamente ao círculo unitário (teorema 1.2.1) e pelo corolário 1.2.3,

δ1(S) = 0 e In1(S) = In(H).

45

3.1 Motivação

Reciprocamente, suponhamos que δ1(S) = 0 e In1(S) = In(H). Pelo teorema 3.1.2, existe uma

matriz hermíticaH ′ ∈ Cn×n tal queH ′−SH ′S∗ > 0 e In1(S) = In(H ′). Logo In(H ′) = In(H),

ou seja, a matriz H ′ é congruente com a matriz H , pelo corolário 1.2.3.

Atendendo a (3.1), existe uma matriz S ′ ∈ Cn×n semelhante a S tal queH ′′−S ′H ′′S ′∗ é definida

positiva, onde H ′′ ∈ Cn×n é uma matriz congruente às matrizes H e H ′.

Este resultado sugere o problema correspondente para equação de Stein e análogo ao anterior-

mente formulado para a equação de Lyapunov:

Problema 2 Encontrar um sistema completo de relações entre a classe de semelhança da matriz

S e as classes de congruência das matrizes H e de K quando é válida a equação de Stein

H − SHS∗ = K.

Note-se que o teorema geral da inércia relativamente ao círculo unitário é uma solução parcial

para este problema, para o caso em que K é uma matriz definida positiva: fornece um sistema

completo de relações entre a classe de semelhança da matriz S e a classe de congruência da

matriz H , quando K é uma matriz semi-definida positiva. O próprio teorema de Stein é uma

solução parcial do problema, para o caso em que K e H são matrizes definidas positivas. De

facto, o teorema de Stein pode ser enunciado do seguinte modo:

Teorema 3.1.4 Sejam S,H ∈ Cn×n matrizes tais que H é uma matriz definida positiva. Então

existe uma matriz S ′ ∈ Cn×n semelhante à matriz S e existe uma matriz definida positiva H ′ ∈

Cn×n congruente com a matriz H tais que a matriz H ′ − S ′H ′S ′∗ é definida positiva se e só se

π1(S) = n.

Demonstração. Sejam S,H ∈ Cn×n matrizes tais que H é uma matriz definida positiva.

Suponhamos que existe uma matriz S ′ ∈ Cn×n semelhante à matriz S e que existe uma matriz

definida positiva H ′ ∈ Cn×n congruente com a matriz H tais que H ′ − S ′H ′S ′∗ > 0. Pelo

teorema de Stein, S ′ é uma matriz estável relativamente ao círculo unitário, ou seja, π1(S′) = n.

Donde, pelas propriedades da inércia (teorema 1.2.1), vem que π1(S) = n.

46

3.1 Motivação

O recíproco é aplicação directa do teorema anterior. De facto, se π1(S) = n então δ1(S) = 0,

ou seja, pelo teorema 3.1.3, existe uma matriz S ′ ∈ Cn×n semelhante à matriz S e existe uma

matriz definida positiva H ′ ∈ Cn×n congruente com a matriz H tais que H ′ − S ′H ′S ′∗ > 0.

Os resultados apresentadas em [6] e [7] também relacionam as inércia das matrizes que compõem

a equação de Stein dentro de certas condições sendo, portanto, resultados associados a uma

variante do problema 2.

Em [6, Teorema 3], L. M. DeAlba e C. R. Johnson, supondo que K é uma matriz indefinida,

provam que qualquer conjunto de inércias In1(S), In(H) e In(K) pode ocorrer quando é válida

a equação de Stein, desde que sejam satisfeitas certas condições.

Teorema 3.1.5 [6, Teorema 3] Sejam πk, νk ,δk, πh, νh, δh, π, ν e δ inteiros não negativos tais

que πk + νk + δk = πh + νh + δh = π + ν + δ = n, πk > 0 e νk ≤ πh + νh. Então existe uma

matriz não singular S ∈ Cn×n e existem matrizes hermíticas K,H ∈ Cn×n tais que

In(K) = (πk, νk, δk), In(H) = (πh, νh, δh) e In1(S) = (π, ν, δ).

Em [7], L. M. DeAlba resolve o problema 2 para o caso em que K é uma matriz indefinida, S é

uma matriz não derrogatória de um certo tipo que apenas admite valores próprios cujo módulo é

1 e H é uma matriz não singular.

Num primeiro resultado, mostra que se S é uma matriz não derrogatória com n valores próprios

distintos de módulo igual a 1 não só é possível escolher a inércia da matriz K como não existe

nenhuma relação entre In1(S) e In(H).

Teorema 3.1.6 [7, Teorema 1] Seja S ∈ Cn×n uma matriz não derrogatória com n valores

próprios distintos todos de módulo igual a 1. Sejam πh, νh, πk, νk e δk inteiros não negativos

tais que πh + νn = n = πk + νk + δk e min{πk, νk} > 0. Então existe uma matriz hermítica

H ∈ Cn×n tal que In(H) = (πh, νh, 0) e In(H − SHS∗) = (πk, νk, δk).

O segundo teorema estuda o caso em que S é uma matriz não derrogatória e é um bloco de Jordan

de tamanho n associado a uma valor próprio de módulo é 1.

47


Neste caso, as inércias possíveis para a matrizK são aquelas que permitem característica máxima

ou igual a n− 1 e novamente não existe nenhuma relação entre In1(S) e In(H).

Teorema 3.1.7 [7, Teorema 2] Seja S = Jn(λ) ∈ Cn×n, para algum λ ∈ C tal que |λ| = 1.

Sejam ainda πh, νh, πk, νk e δk inteiros não negativos tais que πh + νh = n = πk + νk + δk,

min{πk, νk} > 0 e δk = 0 ou δk = 1. Então existe uma matriz hermítica H ∈ Cn×n tal que

In(H) = (πh, νh, 0) e In(H − SHS∗) = (πk, νk, δk).

Por fim, no último resultado, L. M. DeAlba considera S uma matriz não derrogatória e soma

directa de dois blocos de Jordan de tamanho 1 e n−1 associados a dois valores próprios distintos

de módulo igual a 1. As conclusões são idênticas ao teorema anterior.

Teorema 3.1.8 [7, Teorema 3] Seja S = [λ1] ⊕ Jn−1(λ2) ∈ Cn×n, com λ1, λ2 ∈ C tais que

λ1 6= λ2 e |λ1| = |λ2| = 1. Sejam πh, νh, πk, νk e δk inteiros não negativos tais que πh + νh =

n = πk + νk + δk, min{πk, νk} > 0 e δk = 0 ou δk = 1. Então existe uma matriz hermítica

H ∈ Cn×n tal que In(H) = (πh, νh, 0) e In(H − SHS∗) = (πk, νk, δk).

Estes três resultados são generalizados na próxima secção.


3.2.0 Lemas Preliminares

Nesta secção demonstramos lemas que permitem reformular as soluções do problema 1, expostas

no Capítulo 2, em soluções para o problema 2.

Atendendo à utilidade da transformada de Cayley de uma matriz na generalização de resultados

(cf. [7]), surge a necessidade de alargar esse conceito por forma a aplicá-lo sem qualquer restri-

ção. Recorde-se que a relação entre a equação de Lyapunov e a equação de Stein que envolve a

transformada de Cayley só é válida se −1 não é valor próprio da matriz em causa.

48


Nesta secção, consideramos S ∈ Cn×n uma matriz e θ ∈ C um número complexo tais que o

módulo de θ é 1 e a matriz θIn + S ∈ Cn×n é não singular.

Chamamos transformada generalizada de Cayley da matriz S, e denotamos por Cθ(S), à matriz

definida por

Cθ(S) = (θIn + S)−1(θIn − S) ∈ Cn×n.

Algumas relações importantes entre a matriz S e a sua transformada generalizada de Cayley são

apresentadas nos próximos lemas.

Lema 3.2.1 Sejam f1, . . . , fn ∈ C[x] polinómios invariantes da matriz S tais que f1| · · · |fn e

fi(x) = (x− µ1)qi,1 · · · (x− µt)qi,t ,

com qi,j ∈ N0, para todo i ∈ {1, . . . , n} e para todo j ∈ {1, . . . , t}. Então a matriz Cθ(S) tem

polinómios invariantes g1, . . . , gn ∈ C[x] tais que g1| · · · |gn e

gi(x) = (x− λ1)qi,1 · · · (x− λt)qi,t , para todo i ∈ {1, . . . , n},

onde λj = (θ + µj)−1(θ − µj), para todo j ∈ {1, . . . , t}.

Demonstração. Sejam f1| · · · |fn os polinómios invariantes da matriz S tais que

fi(x) = (x− µ1)qi,1 · · · (x− µt)qi,t ,

com qi,j ∈ N0, para todo i ∈ {1, . . . , n} e para todo j ∈ {1, . . . , t}.

Então µ1, . . . , µt são os valores próprios da matriz S, sem repetições.

Seja J = Jp1(µk1) ⊕ · · · ⊕ Jps(µks) a forma normal de Jordan da matriz S onde, para cada

r ∈ {1, . . . , s}, Jpr(µkr) é um bloco de Jordan de ordem pr × pr associado ao valor próprio µkr ,

com kr ∈ {1, . . . , t}.

Então existe uma matriz não singular X ∈ Cn×n tal que J = X−1SX . Donde

X−1Cθ(S)X = X−1(θIn + S)−1XX−1(θIn − S)X

= (θIn +X−1SX)−1(θIn −X−1SX)

= (θIn + J)−1(θIn − J) = Cθ(J)

= Cθ (Jp1(µk1))⊕ · · · ⊕ Cθ (Jps(µks)) .

49


Para cada r ∈ {1, . . . , s}, a matriz xIpr − Cθ (Jpr(µkr)) ∈ Cpr×pr [x] é equivalente à matriz

(θIpr + Jpr(µkr))x− θIpr + Jpr(µkr) ∈ Cpr×pr [x]. (3.2)

De facto, θIpr + Jpr(µkr) ∈ Cpr×pr [x] é uma matriz não singular e

(θIpr + Jpr(µkr)) (xIpr − Cθ (Jpr(µkr))) Ipr

= (θIpr + Jpr(µkr))x− θIpr + Jpr(µkr).

A matriz representada em (3.2) tem duas submatrizes de ordem (pr − 1) × (pr − 1) com deter-

minantes (x+1)pr−1 e ((θ+µkr)x− (θ−µkr))pr−1: basta eliminar a primeira linha e a primeira

coluna ou eliminar a última linha e a última coluna, respectivamente. Estes determinantes são

primos relativos. O que permite concluir que a matriz Cθ(Jpr(µkr)) tem pr − 1 polinómios

invariantes constantes, ou seja, os seus polinómios invariantes são 1, . . . , 1, (x − λkr)pr , com

λkr = (θ + µkr)−1(θ − µkr).

Logo os divisores elementares da matriz Cθ(S) são

(x− λk1)p1 , . . . , (x− λks)ps

e, portanto, os seus polinómios invariantes g1| · · · |gn, onde

gi(x) = (x− λ1)qi,1 · · · (x− λt)qi,t , para todo i ∈ {1, . . . , n} .

com λj = (θ + µj)−1(θ − µj), para todo j ∈ {1, . . . , t}.

Observe-se que, se µ1, . . . , µn são os valores próprios da matriz S, então λ1, . . . , λn são os valo-

res próprios da matriz Cθ(S), onde λk = (θ + µk)−1(θ − µk), para todo k ∈ {1, . . . , n}.

O próximo teorema permite concluir que a inércia da matriz S relativamente ao círculo unitário

e a inércia da sua transformada generalizada de Cayley Cθ(S) são iguais.

Lema 3.2.2 Seja µ ∈ C tal que θ + µ 6= 0 e seja λ = (θ + µ)−1(θ − µ) ∈ C.

Então |µ| < 1 (respectivamente, |µ| = 1, |µ| > 1) se e só se <(λ) > 0 (respectivamente,

<(λ) = 0, <(λ) < 0).

50


Demonstração. Sejam µ, λ ∈ C tais que λ = (θ+µ)−1(θ−µ). Suponhamos que µ = a+ib ∈ C,

com a, b ∈ R. Então:

λ = (θ + µ)−1(θ − µ)

= |θ + µ|−2(θ + µ)(θ − µ)

= |θ + µ|−2(1− |µ|2 + 2i(a=(θ)− b<(θ))

)Assim <(λ) = |θ+µ|−2(1− |µ|2). Como |θ+µ|−2 > 0, <(λ) > 0 (respectivamente, <(λ) = 0,

<(λ) > 0) se e só se |µ| < 1 (respectivamente, |µ| = 1, |µ| > 1).

Corolário 3.2.3 A inércia da transformada generalizada de Cayley da matriz S é igual à inércia

da matriz S relativamente ao círculo unitário. Simbolicamente, In(Cθ(S)) = In1(S).

A demonstração do próximo resultado garante que uma matriz S satisfaz a equação de Stein

H − SHS∗ = K se e só se a sua transformada generalizada de Cayley Cθ(S) satisfaz a equação

da Lyapunov Cθ(S)H −HCθ(S)∗ = K ′, onde K ′ é uma matriz congruente com a matriz K.

Lema 3.2.4 Para toda a matriz hermítica H ∈ Cn×n,

In(H − SHS∗) = In(Cθ(S)H +H(Cθ(S))∗).

Demonstração. Sejam S,H ∈ Cn×n matrizes tais que H é uma matriz hermítica. Seja ainda

X ∈ Cn×n a matriz definida por X = 2−12 (θIn + S). Então X é uma matriz não singular e

H − SHS∗ = X (Cθ(S)H +H(Cθ(S))∗)X∗,

ou seja, as matrizes H − SHS∗ e Cθ(S)H + H(Cθ(S))∗ são congruentes. Pelo corolário 1.2.3,

concluímos que

In(H − SHS∗) = In(Cθ(S)H +H(Cθ(S))∗).

Já estamos em condições de generalizar para a equação de Stein os resultados do Capítulo 2.

51


3.2.1 H é uma matriz definida positiva

Nesta secção apresentamos condições necessárias e suficientes que relacionam a classe de seme-

lhança da matriz S e a classe de congruência da matriz K quando é válida a equação de Stein,

sabendo que H é uma matriz definida positiva e ou S é uma matriz não derrogatória ou K é uma

matriz semi-definida positiva.

Seja S ∈ Cn×n uma matriz. Ao longo desta secção, consideramos θ ∈ C um número complexo

cujo módulo é 1 e tal que a matriz θIn + S ∈ Cn×n é não singular.

Denotamos por i(S) o número de polinómios invariantes não constantes de S. Seja i⊕(S) (res-

pectivamente, i(S), i1(S)) o número de polinómios invariantes da matriz S com pelo menos

uma raiz com módulo inferior (respectivamente, superior, igual) a 1. Denotamos ainda por i21(S)

o número de polinómios invariantes da matriz S com pelo menos uma raiz com módulo igual a 1

e multiplicidade superior ou igual a 2. Pelo lema 3.2.1 e pelo lema 3.2.2, podemos concluir que:

i⊕(S) = i+(Cθ(S)), i(S) = i−(Cθ(S)), i1(S) = i0(Cθ(S)) e i21(S) = i20(Cθ(S)).

O próximo resultado apresenta condições necessárias para a solução do problema 2 quando H é

uma matriz definida positiva.

Teorema 3.2.5 Sejam S,K,H ∈ Cn×n matrizes tais que K é uma matriz hermítica e H é uma


Se H − SHS∗ = K então são válidas as seguintes condições:

π(K) ≥ max{i⊕(S), i21(S)} (3.3)

ν(K) ≥ max{i(S), i21(S)} (3.4)

δ(K) ≥ 2i1(S)− n (3.5)

π(K) + δ(K) ≥ i1(S) (3.6)

ν(K) + δ(K) ≥ i1(S) (3.7)

52


e o seguinte caso não é válido:

(S1) δ1(S) > δ(K), i21(S) = 0 e min{π(K), ν(K)} = 0.

Demonstração. Sejam S,H,K ∈ Cn×n matrizes tais que K é uma matriz hermítica e H é uma


Se H − SHS∗ = K então, pelo lema 3.2.4, existe uma matriz não singular X ∈ Cn×n tal que

Cθ(S)H + H(Cθ(S))∗ = XKX∗. Logo, como In(K) = In(XKX∗), pelo teorema 2.2.1 vem

que:

π(K) ≥ max{i+(Cθ(S)), i20(Cθ(S))} = max{i⊕(S), i21(S)}

ν(K) ≥ max{i−(Cθ(S)), i20(Cθ(S))} = max{i(S), i21(S)}

δ(K) ≥ 2i0(Cθ(S))− n = 2i1(S)− n

π(K) + δ(K) ≥ i0(Cθ(S)) = i1(S)

ν(K) + δ(K) ≥ i0(Cθ(S)) = i1(S).

E provamos que são válidas as condições (3.3) a (3.7).

Além disso, o caso (S1) não é válido. De facto, como (S) não é válido, então também não

é válido que δ1(S) = δ(Cθ(S)) > δ(K), i21(S) = i20(Cθ(S)) = 0 e min{π(K), ν(K)} =

min{π(XKX∗), ν(XKX∗)} = 0.

Repare-se que, pelo lema 3.2.1, se S é uma matriz não derrogatória então também a matriz Cθ(S)

é não derrogatória. E, portanto, usando os mesmos argumentos da última demonstração, o lema

2.2.4 e o lema 2.2.5 podem ser adaptados para a equação de Stein.

Lema 3.2.6 Seja S ∈ Cn×n uma matriz não derrogatória tal que π1(S) = 0. Seja K ∈ Cn×n

uma matriz hermítica. Sejam ainda µ1, . . . , µn os valores próprios da matriz S ordenados por

forma a que:

� se µi = µj , para algum i < j, então µi = µk, para todo k ∈ {i, . . . , j};

� se |µi| = 1, para algum i, então |µk| = 1, para todo k ∈ {1, . . . , i}.

Suponhamos ainda que o seguinte caso não é válido:

53


(S′1) n ≥ 2, δ1(S) > 0 e min{π(K), ν(K)} = 0.

Se são válidas as condições (3.3) a (3.7) então a matriz S é semelhante a uma τ -matriz da forma

T =

µ1 ∗

. . .

0 µn

∈ Cn×n (3.8)

e In(In − TT ∗) = In(K).

Demonstração. Seja S ∈ Cn×n uma matriz não derrogatória tal que π1(S) = 0. Então Cθ(S) é

uma matriz não derrogatória e π(Cθ(S)) = 0. Se µ1, . . . , µn são os valores próprios da matriz S

então λ1, . . . , λn são os valores próprios da matriz Cθ(S), onde λk = (1 + µk)−1(1 − µk), para

todo k ∈ {1, . . . , n}, e claramente, pelo lema 3.2.2, estão ordenados de acordo com o lema 2.2.4.

Além disso, como (S′1) não é válido então também não é válido (S′).

Se são válidas as condições (3.3) a (3.7) também são válidas as condições (2.2) a (2.6) con-

siderando a matriz L = Cθ(S).

Então, pelo lema 2.2.4, a matriz Cθ(S) é semelhante a uma τ -matriz da forma

Cθ(T ) =

λ1 ∗

. . .

λn

∈ Cn×n, onde T =

µ1 ∗

. . .

µn

∈ Cn×n

e In(Cθ(T ) + Cθ(T )∗) = In(K).

Mas, pelo lema 3.2.4, In(Cθ(T )+Cθ(T )∗) = In(In−TT ∗). Além disso, a matriz S é semelhante

à matriz T , uma vez que são ambas não derrogatórias e têm os mesmo valores próprios.

Analogamente, se mostra que:

Lema 3.2.7 Seja S ∈ Cn×n uma matriz não derrogatória tal que ν1(S) = 0. Seja K ∈ Cn×n

uma matriz hermítica. Sejam ainda µ1, . . . , µn os valores próprios da matriz S ordenados de

acordo com o lema 3.2.6. Suponhamos que não é válido o caso (S′1).

54


Se são válidas as condições (3.3) a (3.7) então a matriz S é semelhante a uma τ -matriz da forma

(3.8) e In(In − TT ∗) = In(K).

O próximo teorema é uma das soluções parciais do problema 2 a apresentar nesta tese. Este

teorema apresenta as relações entre a classe de semelhança da matriz S e a classe de congruência

da matriz K quando H > 0 e ou i(S) = 1 ou K ≥ 0.

Teorema 3.2.8 Sejam S,K ∈ Cn×n matrizes tais que K é uma matriz hermítica. Suponhamos

que ou S é uma matriz não derrogatória ou K é uma matriz semi-definida positiva. Suponhamos

ainda que não é válido o caso (S1).

Então existe uma matriz definida positiva H ∈ Cn×n tal que

In(H − SHS∗) = In(K)

se e só se são válidas as condições (3.3) a (3.7).

Demonstração. Seja S ∈ Cn×n uma matriz e suponhamos que o caso (S1) não é válido. Então

o caso (S) não é válido, considerando L = Cθ(S).

Suponhamos que S é uma matriz não derrogatória. Então a matriz Cθ(S) também é não der-

rogatória. Pelo lema 3.2.4, In(H − SHS∗) = In(Cθ(S)H + HCθ(S)∗). Por outro lado, pelo

teorema 2.2.6, existe uma matriz definida positiva H ∈ Cn×n tal que

In(Cθ(S)H +HCθ(S)∗) = In(K)

se e só se são válidas as condições (2.2) a (2.6), considerando L = Cθ(S), ou seja, se e só se se

verificam as condições (3.3) a (3.7).

Se K é uma matriz semi-definida positiva e S é uma matriz derrogatória, o raciocínio é análogo.

O teorema 3.2.8 nem sempre é válido quando S é uma matriz derrogatória e a matriz K não é

semi-definida positiva, como se pode verificar no exemplo apresentado a seguir.

55


Exemplo 3.2.9 Seja S = µ1Ip ⊕ µ2Iq ∈ Cn×n, onde ν1, ν2 ∈ C são tais que ν1 6= ν2 e |µ1| =

|µ2| = 1 e p+ q = n. Suponhamos que é válido o teorema 3.2.8, ou seja, suponhamos que existe

uma matriz definida positiva

H =

H11 H12

H∗12 H22

∈ Cn×n, com H11 ∈ Cp×p (3.9)

tal que In(H − SHS∗) = In(K). Então

H − SHS∗ =

0 (1− µ1µ2)H12

(1− µ1µ2)H∗12 0

e, pelas condições (iv) e (v) do teorema 1.2.4, π(K) = ν(K).

Suponhamos que p = 3 e q = 2 e seja K ∈ C5×5 uma matriz hermítica tal que In(K) = (2, 1, 2).

Então, como 2 = δ1(S) = δ(K) e min{π(K), ν(K)} = 1 6= 0, o caso (S1) não é válido. Por

outro lado, as condições (3.3) a (3.7) são válidas. E, no entanto, o teorema 3.2.8 não é válido

pois, neste caso, 2 = π(K) 6= ν(K) = 1.

O próximo resultado é um corolário do teorema 3.2.8 e a sua demonstração aplica raciocínios

análogos aos efectuadas nas demonstrações feitas ao longo desta secção.

Corolário 3.2.10 Seja S ∈ Cn×n uma matriz. Então existe uma matriz definida positiva H ∈

Cn×n tal que a matrizH−SHS∗ é semi-definida positiva se e só se a matriz S não tem divisores

elementares com raízes múltiplas com módulo igual a 1 e ν1(S) = 0.

Demonstração. Suponhamos que existe uma matriz definida positiva H ∈ Cn×n tal que H −

SHS∗ ≥ 0. Pelo lema 3.2.4, a matriz Cθ(S)H + HCθ(S)∗ também é semi-definida positiva e,

aplicando o corolário 2.2.8, a matriz Cθ(S) não tem divisores elementares com raízes imaginárias

múltiplas e ν(Cθ(S)) = 0. Logo, pelo corolário 3.2.3 e pelo lema 3.2.1, respectivamente, ν1(S) =

0 e a matriz S não tem divisores elementares com raízes múltiplas com módulo igual a 1. Para o

recíproco, o raciocínio é análogo.

56


3.2.2 S é uma matriz não derrogatória

Nesta secção resolvemos o problema 2 para o caso em que S é uma matriz não derrogatória,

H é uma matriz não singular e K é uma matriz com pelo menos um valor próprio com módulo

inferior a 1 e um valor próprio com módulo superior a 1.

Este resultado generaliza resultados obtidos por L. M. DeAlba em [7].

Sejam S,K,H ∈ Cn×n matrizes tais que K e H são matrizes hermíticas.

É possível adaptar o lema 2.2.10 obtido para a equação de Lyapunov quando foi resolvido o caso

particular análogo do problema 1.

Lema 3.2.11 Sejam S,K ∈ Cn×n matrizes tais que S é uma matriz não derrogatória e In(K) ≥

(1, 1, 0). Sejam ainda µ1, . . . , µn os valores próprios da matriz S ordenados por forma a que:

� se µi = µj , para algum i < j, então µi = µk, para todo k ∈ {i, . . . , j},

� se |µi| > 1, para algum i, então |µk| > 1, para todo k ∈ {1, . . . , i},

� se |µi| < 1, para algum i, então |µk| < 1, para todo k ∈ {i, . . . , n}.

Então existe uma τ -matriz T = [tij] ∈ Cn×n tal que tii = µi, para todo i ∈ {1, . . . , n}, e

In(In − TT ∗) = (πk, νk, δk).

Demonstração. Sejam µ1, . . . , µn os valores próprios da matriz S ordenados de acordo com

o enunciado. Então, pelo lema 3.2.2, os valores próprios da matriz Cθ(S) são λ1, . . . , λn, com

λk = (θ + µk)−1(θ − µk), para todo k ∈ {1, . . . , n} e estão ordenados de acordo com o lema

2.2.10. Logo existe uma τ -matriz T = [tij] ∈ Cn×n tal que tii = µi, para todo i ∈ {1, . . . , n}, e

In(Cθ(T ) + Cθ(T )∗) = In(K). Por outro lado, pelo lema 3.2.4,

In(Cθ(T ) + Cθ(T )∗) = In(In − TT ∗).

Logo existe uma τ -matriz T nas condições pretendidas.

O próximo teorema é o resultado principal desta secção e fornece uma solução parcial para o

problema 2 para o caso em que S é uma matriz não derrogatória e In(K) ≥ (1, 1, 0).

57


Teorema 3.2.12 Sejam S,K ∈ Cn×n matrizes tais que S é uma matriz não derrogatória e

In(K) ≥ (1, 1, 0). Sejam ainda πh e νh inteiros não negativos tais que πh+νh = n. Então existe

uma matriz hermítica H ∈ Cn×n tal que In(H) = (πh, νh, 0) e In(H − SHS∗) = In(K).

Demonstração. Sejam S,K ∈ Cn×n matrizes tais que S é uma matriz não derrogatória e

In(K) ≥ (1, 1, 0). Pelo lema 3.2.1, a matriz Cθ(S) é não derrogatória. Como min{π(K), ν(K)} >

0, pelo teorema 2.2.11, existe uma matriz hermítica H ∈ Cn×n tal que In(H) = (πh, νh, 0) e

In(Cθ(S)H +HCθ(S)∗) = In(K).

Por outro lado, pelo lema 3.2.4, In(Cθ(S)H +HCθ(S)∗) = In(H − SHS∗) e provamos assim o

pretendido.

58

Bibliografia

[1] B. E. Cain, E. M. Sá, The inertia of a Hermitian matrix having prescribed complementary

principal submatrices, Linear Algebra Appl. 37 (1981), 161–171. {9}

[2] D. Carlson, H. Schneider, Inertia theorems for matrices: the semidefinite case, J. Math.

Anal. Appl. 6 (1963), 430–446. {18,33}

[3] C. T. Chen, A generalization of the inertia theorem, SIAM J. Appl. Math. 25 (1973), 158–

161. {−}

[4] B. N. Datta, Matrix equations, matrix polynomial, and the number of zeros of a polynomial

inside the unit circle, Linear and Multilinear Algebra 9 (1980), 63–68. {−}

[5] B. N. Datta, Stability and Inertia, Linear Algebra Appl. 302-303 (1999), 563–600. {10,11}

[6] L. M. DeAlba, C. R. Johnson, Possible inertia combinations in the Stein and Lyapunov

equations, Linear Algebra Appl. 222 (1995), 227–240. {18,47}

[7] L. M. DeAlba, Inertia of the Stein transformation with respect to some nonderogatory ma-

trices, Linear Algebra Appl. 241/243 (1996), 191–201. {34,47,48,57}

[8] F. Gantmacher, The Theory of Matrices, Volume One, Chelsea Publishing ·New York; 1977{2,10}

[9] T. Haynes, Stable matrices, the Cayley transform, and convergent matrices, Internat. J.

Math. Math. Sci. 14 (1991), 77–81. {−}

59

Bibliografia

[10] R. Horn, C. Johnson, Topics in Matrix Analysis, Cambridge University Press · Cambridge;

1991. {2}

[11] R. Horn, C. Johnson, Matrix Analysis, Cambridge University Press · Cambridge; 1994.{2,4,10}

[12] P. Lancaster, M. Tismenetsky, The Theory of Matrices with Applications · Second Edition,

Academic Press, Inc. · California; 1985. {2,5,6,9,16,44,45}

[13] R. Loewy, On the ranges of Lyapunov Transformations II, Linear and Multilin. Algebra 2

(1974), 227–237. {−}

[14] R. Loewy, An inertia theorem for Lyapunov’s equation and the dimension of a controllabi-

lity space, Linear Algebra Appl. 260 (1997), 1–7. {−}

[15] G. N. Oliveira, E. M. Sá and J. A. Dias da Silva, On the eigenvalues of the matrix A +

XBX−1, Linear Multilin. Algebra 5 (1977), 119–128. {23}

[16] A. Ostrowski, H. Schneider, Some theorems on the inertia of general matrices, J. Math.

Anal. Appl. 4 (1962), 72–84. {16}

[17] P. Stein, On the ranges of two functions of positive matrices, J. Algebra 2 (1965), 350–353.{13}

[18] F. C. Silva, R. Simões, On the Lyapunov and the Stein Equations, Linear Algebra Appl. 420

(2007), 329–338. {15,19,43}

[19] F. C. Silva, R. Simões, On the Lyapunov and the Stein Equations, II Linear Algebra Appl.

426 (2007), 305–311. {15,34,43}

[20] O. Taussky, A generalization of a theorem of Lyapunov, SIAM J. Appl. Math. 9 (1961),

640–643. {16}

[21] O. Taussky, Matrices C with Cn → 0, J. Algebra 1 (1964), 5–10. {13}

60

Bibliografia

[22] H. Wimmer, On the Ostrowski-Schneider inertia theorem, J. Math. Anal. Appl. 42 (1973),

164–169. {−}

[23] H. Wimmer, Inertia theorem for matrices, controllability and linear vibrations, Linear Al-

greba Appl. 8 (1974), 337–343. {−}

[24] H. Wimmer, A. Ziebur, Remarks on inertia theorems for matrices, Czech. Math. J. 25

(1975), 556–561. {−}

[25] F. Zhang, Matrix Theory: Basics Results and Techniques, Springer-Verlarg · New York;

1999. {2,3}

61

Índice remissivo

Cayley

transformada de, 13

transformada generalizada de, 49

divisor

determinantal, 4

elementar, 4

espectro, 3

estável

matriz, 12

sistema contínuo, 10

sistema discreto, 11

factor invariante, 4

forma normal

companheira, 5

de Jordan, 6

inércia, 8

relativamente ao círculo unitário, 8

relativamente ao eixo imaginário, 8

Jordan

bloco de, 5

forma normal de, 6

Lyapunov

equação de, 11

teorema de, 16

matriz

τ , 23

companheira, 5

de permutação, 3

definida negativa, 7

definida positiva, 7

derrogatória, 3

estável, 12

estável positiva, 12

estável relativamente ao círculo unitário, 13

hermítica, 4

indefinida, 7

não derrogatória, 3

semi-definida negativa, 7

semi-definida positiva, 7

matrizes

congruentes, 3

equivalentes, 2

62

Índice remissivo

semelhantes, 3

semelhantes por permutação, 3

multiplicidade

algébrica, 3

geométrica, 3

polinómio

característico, 3

invariante, 4

Schur

decomposição de, 3

Stein

equação de, 12

teorema de, 44

Sylvester

teorema da inércia de, 9

valores próprios, 3

entrelaçamento dos, 4

63

Documents

} z | y>repositorio.ul.pt/bitstream/10451/1597/1/17293... · k, ao máximo divisor comum mónico de todos os determinantes das submatrizes de ordem kda matriz xI n A. Convenciona-se