Notas Prob

Embed Size (px)

DESCRIPTION

Notas Prob

Citation preview

  • Notas de aula: Probabilidade I

    Augusto Teixeira

    27 de maio de 2015

  • Licena

    Esse trabalho licenciado nos termos da licena Creative Commons Atribuio-NoComercial-CompartilhaIgual 3.0 No Adaptada (CC BY-NC-SA 3.0). Assim,qualquer um pode usar, distribuir e modificar o contedo em obras derivadaslivremente desde que para fim no-comercial e com a devida citao da fonte.Qualquer violao dos termos da licena citada ser considerado uso ilegal.

    i

  • Sumrio

    Prefcio ii

    1 Fundamentos 11.1 Espaos mensurveis . . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Espaos de probabilidade . . . . . . . . . . . . . . . . . . . . . . 31.3 Sistemas -pi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

    1.3.1 Igualdade de probabilidades . . . . . . . . . . . . . . . . 71.4 Elementos aleatrios . . . . . . . . . . . . . . . . . . . . . . . . . 8

    1.4.1 Distribuio de elementos aleatrios . . . . . . . . . . . . 9

    2 Construo de espaos de probabilidade 112.1 Caso enumervel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11Tpico: Mtodo Probabilstico . . . . . . . . . . . . . . . . . . . . . . . 132.2 Caso absolutamente contnuo . . . . . . . . . . . . . . . . . . . . 142.3 Funes acumuladas de distribuio . . . . . . . . . . . . . . . . 142.4 Espaos produto finito . . . . . . . . . . . . . . . . . . . . . . . . 162.5 Independncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    2.5.1 Colees de eventos . . . . . . . . . . . . . . . . . . . . . 172.5.2 Independncia de -lgebras . . . . . . . . . . . . . . . . 18

    Tpico: Lei dos pequenos nmeros . . . . . . . . . . . . . . . . . . . . . 212.6 Espaos produto infinito . . . . . . . . . . . . . . . . . . . . . . . 26

    2.6.1 Recordar viver... . . . . . . . . . . . . . . . . . . . . . . . 262.6.2 Teorema da Extenso de Kolmogorov . . . . . . . . . . . 27

    Tpico: Percolao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312.7 Distribuies conjuntas . . . . . . . . . . . . . . . . . . . . . . . . 342.8 Probabilidades condicionais . . . . . . . . . . . . . . . . . . . . . 34

    2.8.1 Regra de Bayes . . . . . . . . . . . . . . . . . . . . . . . . 372.9 Ncleos de transio . . . . . . . . . . . . . . . . . . . . . . . . . 38

    iii

  • SUMRIO

    iv

  • SUMRIO

    2.10 Espaos cannicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 432.10.1 Espaos poloneses . . . . . . . . . . . . . . . . . . . . . . 45

    Tpico: Cadeias de Markov . . . . . . . . . . . . . . . . . . . . . . . . 49Tpico: Urna de Plya . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

    3 Somas de variveis independentes 573.1 Esperana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

    3.1.1 Desigualdade de Markov . . . . . . . . . . . . . . . . . . 603.1.2 Esperana e independncia . . . . . . . . . . . . . . . . . . 61

    3.2 Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 613.3 Lei fraca dos grandes nmeros . . . . . . . . . . . . . . . . . . . 64Tpico: Contando tringulos . . . . . . . . . . . . . . . . . . . . . . . 663.4 Lei forte dos grandes nmeros . . . . . . . . . . . . . . . . . . . 683.5 Lei {0, 1} de Kolmogorov . . . . . . . . . . . . . . . . . . . . . . 703.6 Momentos exponenciais . . . . . . . . . . . . . . . . . . . . . . . 733.7 Princpio de Grandes Desvios . . . . . . . . . . . . . . . . . . . . 753.8 O Teorema Central do Limite . . . . . . . . . . . . . . . . . . . . . 81

    3.8.1 A distribuio normal . . . . . . . . . . . . . . . . . . . . . 813.8.2 Convergncia fraca . . . . . . . . . . . . . . . . . . . . . . 853.8.3 Convergncia fraca em R . . . . . . . . . . . . . . . . . . 873.8.4 O TCL para uma sequncia i.i.d. . . . . . . . . . . . . . . 88

    Tpico: O Teorema de Portmanteau . . . . . . . . . . . . . . . . . . . . 91

    4 Esperana condicional 934.1 Esperana condicional . . . . . . . . . . . . . . . . . . . . . . . . 934.2 Propriedades bsicas da esperana condicional . . . . . . . . . . 964.3 Probabilidade Condicional Regular . . . . . . . . . . . . . . . . . 1024.4 Princpio da substituio . . . . . . . . . . . . . . . . . . . . . . . 105

    5 Solues de exerccios 111

    Referncias Bibliogrficas 113

    Index 116

    ndice Remissivo 116

    v

  • SUMRIO

    vi

  • Captulo 1

    Fundamentos

    A probabilidade moderna se baseia fortemente na Teoria da Medida e supomosdurante esse curso que o leitor esteja bem familiarizado com conceitos tais como:Medida de Lebesgue, extenses de medida e teoremas de convergncia. Iremosagora justificar brevemente a escolha da Teoria da Medida para o estudo deprobabilidade.

    No incio da Teoria da Probabilidade, a maioria dos fenmenos estudadosapresentava apenas um nmero finito de resultados possveis, como por exem-plo ao se jogar um dado de seis lados ou sortear uma carta em um baralho. Emtais casos desnecessrio o uso de ferramentas sofisticadas pra modelar taissituaes. Por exemplo, podemos simplesmente dizer que a probabilidade dese obter cada um dos lados do dado igual a 1/6.

    Mas digamos por exemplo que queremos um modelo para estudar o vo-lume de chuva em uma cidade durante um ano. Obviamente, esse volumepoderia ser qualquer nmero real positivo e no podemos simplesmente atri-buir valores positivos de probabilidade a cada nmero real (lembramos quesomas no enumerveis de termos positivos so sempre infinitas). Mas comopodemos continuar nossa modelagem se nem ao menos podemos dizer qual a probabilidade de chover um determinado volume esse ano, por exemplo(pi/19)mm?

    A soluo para tal dilema, se baseia no fato de que na verdade nunca estamosinteressados no exato resultado do nosso experimento. Gostaramos sim deresponder perguntas do tipo: qual a probabilidade de que chova entre zero e37mm? Estamos portanto interessados em atribuir probabilidades no a valoersexatos do experimento, mas a certos conjuntos de possveis valores. Chamamostais conjuntos de eventos.

    Voltando ao caso do dado de seis lados, poderamos nos interessar porexemplo pela probabilidade dos seguintes eventos: o lado sorteado foi mpar

    1

  • CAPTULO 1. FUNDAMENTOS

    (P({1, 3, 5}) = 1/2) ou o lado serteado foi dois (P({2}) = 1/6). E percebemosrapidamente que para eventos disjuntos a probabilidade de sua unio a somade suas probabilidades (no caso acima, P({1, 2, 3, 5}) = 1/2+ 1/6 = 2/3). Essecarter aditivo da probabilidade certamente nos remete aos conceitos bsicos deTeoria da Medida. Vamos agora formalizar a discusso acima com mais calma,sob a tica dessa teoria.

    1.1 Espaos mensurveis

    Denotaremos sempre por o nosso espao amostral ( princpio qualquer con-junto). Um ponto nesse espao corresponde por exemplo a um possvel resul-tado do nosso experimento aleatrio.

    Exemplo 1.1.1. Possveis exemplos de espao amostral

    a) 1 = {1, 2, . . . , 6},b) 2 = R+,

    c) 3 = { f : [0, 1] R; f contnua}.Os exemplos acima poderiam ser usados em modelar por exemplo: o resul-

    tado de um dado, o volume anual de chuva em uma cidade e o comportamentoao longo do dia do preo de uma ao na bolsa de valores.

    Consideraremos sempre s equipados com uma -lgebra denotada por F .Mais precisamente

    Definio 1.1.1. Dizemos que F P() uma -lgebra sea) F ,b) A F implica que Ac F ec) se A1, A2, F , ento i Ai F .Nesse caso, dizemos que (,F ) um espao mensurvel e os elementos

    A F so chamados de eventos.Se G P() (que chamamos de uma classe ou famlia), denotamos por

    (G) a -lgebra gerada por G , que a menor -lgebra contendo G. Um exemploimportante dado pela -lgebra de Borel , gerada pelos abertos de uma topologiaem .

    Exemplo 1.1.2. Tpicos exemplos de -lgebra correspondentes aos espaos amostraisdo Exemplo 1.1.1

    a) F1 = P(1),b) F2 = B([0, 1]) ec) F3 = B(C[0, 1]).

    2

  • 1.2. ESPAOS DE PROBABILIDADE

    Exemplo 1.1.3. Alguns eventos de F1,F2 e F3 acimaa) {x mpar}, {1} 1b) [0, 1/2], {0}, (Q [0, 1]) 2 ec) { f : [0, 1] R; f (1) > 0} 3.

    Exerccio 1.1.4. Mostre que { f : [0, 1] R; f (t) 0 para todo t [0, 1]} 3 um evento (ou seja, pertence a F3).Notao 1.1.2. Se Q for uma condio qualquer sobre candidatos , escreveremos[ satisfaz Q] para denotar { ; satisfaz Q}.

    Por exemplo, { f : [0, 1] R; f (1) > 0} pode ser escrita simplesmente como[ f (1) > 0].

    1.2 Espaos de probabilidade

    Agora estamos prontos para introduzir o conceito moderno do que umaprobabilidade.

    Definio 1.2.1. Dado (,F ) espao mensurvel, dizemos que P : F [0, 1] umaprobabilidade se

    a) P() = 1 e

    b) sempre que A1, A2, F forem disjuntos (Ai Aj = se i 6= j), temos

    P(

    i Ai)=

    iP(Ai). (1.1)

    Obviamente, isso nada mais que uma medida que associa massa um aoespao todo.

    Exemplo 1.2.1. Probabilidades nos espaos do Exemplo 1.1.1

    a) P1(A) = (#A)/6 em (1,F1). Ou mais geralmente P1(A) = iA pi, ondepi 0 e i pi = 1.

    b) P2 pode ser a medida de Lebesgue em ([0, 1],B([0, 1])). Mais geralmente tambmpodemos ter P2(A) =

    A (x)dx, onde : [0, 1] R+, chamada densidade,

    tal que[0,1] (x)dx = 1.

    c) P3 = 0, que atribui o valor um se o evento contm a funo identicamente nula( f 0) e zero caso contrrio.

    Obviamente o terceiro exemplo bastante artificial (e intil). Mas futura-mente, estaremos protos para introduzir medidas bem interessantes no espao(3,F3).

    3

  • CAPTULO 1. FUNDAMENTOS

    Proposio 1.2.2. Valem as afirmativas

    a) Se A B ento P(A) = P(B) P(B \ A) P(B),b) A cota da unio:

    P(

    i Ai)

    iP(Ai) (1.2)

    c) e o que chamamos de princpio da incluso e excluso

    P(

    in Ai)=

    n

    k=1

    (1)k1 1i1

  • 1.3. SISTEMAS -pi

    Exerccio 1.2.4. Seja n 1 um nmero inteiro e considere = {0, 1}n, o hipercubode dimenso n (cada pode ser visto como uma funo : {1, . . . , n} {0, 1}).Para cada i {1, . . . , n}, definimos o evento Ai = { ;(i) = 1}. Dadasduas probabilidades P e P em (,P()), mostre que se P(B) = P(B) para todosconjuntos B dados por intersees de Ais, ento P = P.

    Proposio 1.2.3. Toda probabilidade P contnua, isto :

    a) Se A1 A2 F , ento limn P(An) = P(n An).b) Tambm, se A1 A2 F , temos limn P(An) = P(n An).

    Demonstrao. a) Observe que

    m=1

    An =

    n=1

    (An \

    ( n1i=1

    Ai))

    , (1.8)

    que so disjuntos. Logo

    P(

    n=1 An)=

    n=1

    P(

    An \(n1

    i=1 Ai))

    = limn

    P(n

    i=1 Ai) = limn P(An).(1.9)

    b) A prova anloga de 1.

    Lema 1.2.4 (Borel-Cantelli - primeira parte). Sejam A1, A2, F satisfazendoi=1 P(Ai) < . Ento

    P[Ai para infinitos i] := P(

    n=1(

    in Ai))= 0. (1.10)

    Demonstrao. Estimamos

    P(

    n=1

    (in Ai

    ))= lim

    nP(

    in Ai) lim

    n

    inP(Ai) = 0. (1.11)

    O que termina a prova do lemma.

    Imagine que jogamos todos os dias em uma loteria e que nossa probabilidadede ganhar no dia i pi. Ento se i pi < , sabemos que certamente noganharemos infinitas vezes.

    1.3 Sistemas -pi

    Uma importante ferramenta para provar fatos tericos sobre probabilidades o Teorema de Dynkin que apresentaremos nessa seo. Ele trata de classes deeventos que no so necessariamente -lgebras, mas sistemas ou pi comodefinidos abaixo.

    5

  • CAPTULO 1. FUNDAMENTOS

    Definio 1.3.1. Dizemos que uma classe A P() um pi-sistema se for fechadopor intersees finitas, isto : para todos A, B A temos A B A.Definio 1.3.2. Dizemos que A P() um -sistema, se

    a) A,b) Sempre que A A temos Ac A ec) para A1, A2, A disjuntos dois a dois, temos i Ai A.

    Exerccio 1.3.1. D um exemplo de -sistema que no seja uma -lbebra.

    Definimos para A P( W), o menor -sistema contendo A, ou seja

    (A) = B -sistemaAB

    B. (1.12)

    fcil ver que (A) sempre um -sistema.Teorema 1.3.3 (Dynkin). Se A um pi-sistema, ento (A) = (A).

    Note pelo Exerccio 1.3.1 que a hiptese de queA um pi-sistema necessriaem geral.

    Demonstrao. Obviamente, basta mostrar que (A) fechado por unies nonecessariamente disjuntas. Na verdade, vamos ver que suficiente provar que

    (A) um pi-sistema. (1.13)

    De fato, caso isso seja provado teremos que (A) fechado por diferenas(pois A \ B = A Bc). Assim, podemos mostrar que (A) fechado porunies enumerveis, pois se A1, A2, (A), definimos Bn = ni=1 Ai =(ni=1 Aci )c (A) e escrevemos

    nAn =

    n

    (An \ Bn1

    ), (1.14)

    que uma unio disjunta de termos em (A), logo est em (A). Isso mostraque (A) uma -lgebra e que de fato suficiente demonstrar (1.13).

    Vamos primeiramente mostrar que (A) fechado por intersees comA. Para tanto, definimos B = {B (A); B A (A) para todo A A)} everemos que

    B = (A). (1.15)Obviamente, A B, pois A um pi-sistema. Ento basta mostrar que B um-sistema.

    a) obviamente pertence a B.

    6

  • 1.3. SISTEMAS -pi

    b) Se B B e A A, ento Bc A = A \ (B A) = (Ac (B A))c. Mascomo B B, (B A) (A) e usando o fato que -sistemas so fechadospor complementos e unies disjuntas, Bc A (A). Como isso valepara todo A A, temos Bc B por definio.

    c) Se B1, B2, B so disjuntos e A A, ento(i Bi) A =

    i

    (Bi A

    ) (A), (1.16)pois a unio acima disjunta. Logo

    i Bi B.

    Isso mostra que B um -sistema com A B (A), mostrando (1.15).No prximo passo, definimos B = {A (A); B A (A), B (A)}

    e mostraremos queB = (A), (1.17)

    que vai na direo de provar (1.13).Primeiramente, observe que A B pois B = (A) (veja a definio de B).

    Mostraremos agora queB um -sistema. (1.18)

    Para tanto, verificaremos

    a) B, que claro.b) Tomando A B e B (A), Ac B = B \ (A B) = (Bc (A B))c

    (A), por um argumento anlogo ao apresentado para B. Logo Ac B.c) Tambm o caso de unies disjuntas bastante anlogo ao feito para B.

    Isso mostra que B um -sistema com A B (A), estabelecendo (1.18).Finalmente mostraremos que

    B um pi-sistema. (1.19)De fato, sejam A1, A2 B e B (A). Ento (A1 A2) B = (A1 B) A2 (A), donde A1 A2 pertence a B. Logo temos por (1.19) e (1.18) que (A) um pi-sistema, ou seja (1.13), terminando a prova do teorema.

    1.3.1 Igualdade de probabilidades

    Proposio 1.3.4. Se P1 e P2 so probabilidades em (,F ), tais que P1(A) = P2(A)para todo A A e A um pi-sistema, ento P1(B) = P2(B) para todo B (A).Demonstrao. Seja B = {A F ; P1(A) = P2(A)}. fcil ver que B um-sistema. Logo B contm (A) que igual a (A) por Dynkin.Corolrio 1.3.5. Se P1 e P2 so probabilidades em (1 2,F1 F2), tais que

    P1(A1 A2) = P2(A1 A2), para todos A1 F1, A2 F2, (1.20)ento P1 = P2.

    7

  • CAPTULO 1. FUNDAMENTOS

    Demonstrao. Obviamente as caixas do tipo A1 A2 formam um pi-sistemaque gera F1 F2 (por definio).Exemplo 1.3.2. Observe portanto que importante que A seja um pi-sistema naProposio 1.3.4. Imagine por exemplo que = {0, 1}2 e P1 = 14 x x e P2 =12 ((0,0) + (1,1)). Nesse caso

    P1(A) = P2(A) = 1/2 = P1(B) = P2(B), (1.21)

    com A = {(0, 0), (0, 1)} e B = {(0, 0), (1, 0)}. Contudo, P1 6= P2, mesmo tendoP() = ({A, B}).

    1.4 Elementos aleatrios

    Muitas vezes no estamos interessados no resultado exato do nosso experimentoaleatrio, mas sim em uma determinada medio ou funo de . Porexemplo, no caso do Exemplo 1.1.1 c), talvez no nos interesse toda a funo f ,mas apenas o seu valor no fim do dia f (1). Essas medies so ditas elementosaleatrios que definimos seguir.

    Seja (E,A) um espao mensurvel. Nesse caso, se X : E uma funo(F ,A)-mensurvel, dizemos que X um elemento aleatrio em (,F ) tomandovalores em E, ou um E-elemento aleatrio.

    Exemplo 1.4.1. Consideramos os casos

    a) X : R mensurvel dita varivel aleatria.b) X : Rd mensurvel dito vetor aleatrio (d-dimensional).c) X : C[0, 1] mensurvel dita funo aleatria.Seguindo a motivao do Exemplo 1.1.1 c), poderia ser que, por exemplo,

    estivssemos interessados apenas na varivel aleatria X : 3 R dada porX( f ) = f (1).

    Exerccio 1.4.2. Mostre que X : 3 R dada por X( f ) = f (1) uma varivelaleatria.

    Citando Kingman em seu livro Poisson Processes: a random elephant is afunction from into a suitable space of elephants.

    Relembrando a nossa notao: P[X A] = P({ ; X() A}).Proposio 1.4.1. Seja X : E onde (E,A) um espao mensurvel comA = (G). Ento para verificar que X um elemento aleatrio, basta provar queX1(G) F para todo G G.Demonstrao. Teoria da Medida.

    Exemplo 1.4.3. Se e E so espaos topolgicos dotados das correspondentes -lgebras de Borel, ento toda funo contnua um E-elemento aleatrio.

    8

  • 1.4. ELEMENTOS ALEATRIOS

    1.4.1 Distribuio de elementos aleatriosDefinio 1.4.2. Se X : E um elemento aleatrio e dotado de umaprobabilidade P, ento denotamos por X P, a chamada distribuio de X , a medidade probabilidade

    (X P)(A) := P({ ; X() A}) = P[X A]. (1.22)no espao mensurvel (E,A).

    Fica como exerccio verificar que X P de fato uma probabilidade em E.Exerccio 1.4.4. Seja X : [0, 1] {0, 1} dada por X() = 1A(). Nesse caso,mostre que X P = Ber(p) para algum p [0, 1]. Calcule o valor de p.

    Duas notaes importantes nesse contexto so:

    a) Dizemos que X d Y, quando X P = Y P. Note que X e Y nemao menos precisam pertencer ao mesmo espao de probabilidade paradizermos que so igualmente distribudos, mas precisam ser elementosaleatrios de mesmo tipo (ou seja, possuir o mesmo contradomnio).

    b) Escrevemos X d , que l-se X distribuda como , onde uma proba-bilidade em E, caso X P = .

    Exerccio 1.4.5. Sejam X e Y variveis aleatrias tais que X nula quase certamente.Mostre que X +Y tem a mesma distribuio de Y.

    O exerccio acima bastante simples, mas o usaremos para fazer uma im-portante observao sobre como so enunciados tipicamente os resultados deprobabilidade.

    Raramente encontramos teoremas que explicitam qual o espao de proba-bilidades em questo. Como no exerccio acima, o contexto de um teoremafrequentemente dado apenas em termos de elementos aleatrios em ede suas distribuies. Dessa forma, podemos utilizar o resultado em vrioscontextos diferentes, desde que possamos encontrar elementos aleatrios quesatisfaam as hipteses. Com o tempo, passamos at mesmo a considerar menosrelevante a escolha especfica do espao amostral, focando cada vez mais nadistribuio de seus elementos aleatrios.

    9

  • CAPTULO 1. FUNDAMENTOS

    10

  • Captulo 2

    Construo de espaos de probabilidade

    Nessa seo descreveremos diversas maneiras diferentes de construir um espaode probabilidade, dando diversos exemplos de como elas podem ser usadas namodelagem de diferentes processos reais.

    2.1 Caso enumervel

    Quando finito ou enumervel, tipicamente definimos sobre a -lgebradas partes, ou seja F = P() = ({}). Alm disso podemos definirprobabilidades sobre (,F ) de maneira simples tomando (p) tais que

    a) p 0 para todo eb) p = 1.

    De fato, nesse caso definimos P(A) = A p que claramente define umaprobabilidade.

    Exerccio 2.1.1. Mostre que se finito ou enumervel, toda probabilidade sobre(,P()) dada como na descrio acima.Exemplo 2.1.2.

    a) Dado p [0, 1], definimos a medida Ber(p) (em homenagem a Bernoulli) em{0, 1} com p1 = p, p0 = 1 p.

    b) Dados n 1 e p [0, 1], definimos a medida Bin(n, p) (binomial) em ={0, 1, . . . , n} com

    pi =(

    ni

    )pi(1 p)ni, para i . (2.1)

    11

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    c) Dado p (0, 1], em = {0, 1, . . . } definimos a medida Geo(p) (geomtrica)em induzida pelos pesos

    pi = (1 p)i p, para i 1. (2.2)

    Exerccio 2.1.3. Seja = {0, 1}n e p = 12n para todo (ou seja a proba-bilidade uniforme). Considere X : {0, 1, . . . , n} dada por X(1, . . . ,n) =ni=1 i. Obtenha a distribuio X P. D um exemplo de medida em para a qual adistribuio de X seja Bin(n, p).

    12

  • TPICO: MTODO PROBABILSTICO

    Tpico: Mtodo Probabilstico

    Uma importante ferramenta em vrias reas da matemtica, tais como Teoriados Nmeros, Combinatria e Teoria da Computao o que chamamos deMtodo Probabilstico.

    Em vrias situaes, ns precisamos de mostrar a existncia de objetos satis-fazendo determinadas propriedades, mas no temos informao suficiente oucapacidade para constru-los explicitamente. Nesse caso, podemos recorrer aoMtodo Probabilstico, que simplesmente nos sugere tomar um objeto aleatriode uma maneira esperta e mostrar que com probabilidade positiva as propri-edades desejadas sero satisfeitas. Esse mtodo, apesar de muito ingnuo, muito eficiente e em diversos casos prov os melhores exemplos conhecidos decertos objetos (para embarao da comunidade cientfica).

    Nessa seo daremos um exemplo em Teoria dos Nmeros provido primei-ramente por Erds1.

    Teorema 2.1.1 (Erds). Para todo conjunto finito A N, existe um sub-conjuntoB A satisfazendo

    a) #B #A3 e tal queb) no existem x, y e z B com x + y = z.

    A propriedade b) acima o que chamamos de um conjunto ser livre de somas.

    Certamente no temos muita informao sobre A, ento vamos usar o m-todo probabilstico para a prova desse teorema.

    Demonstrao. Fixamos p um nmero primo maior que trs vezes o maior ele-mento de A e considere o espaoZp dos inteiros mdulo p. Seja X um elementoaleatrio de Zp com distribuio uniforma, isto U{0,...,p1}.

    Exerccio 2.1.4. Mostre que para todo a A, a multiplicao por a uma bijeo emZp, ou seja

    Zp a = Zp. (2.3)onde o produto Zp a entendido elemento a elemento. Conclua que

    P[

    X a [ p3 , 2p3 )] 13 . (2.4)Definimos o conjunto aleatrio B = (X A) [ p3 , 2p3 ), que obviamente livre

    de somas. Basta portanto mostrar que com probabilidade positiva #B #A3 ,que segue do seguinte argumento.

    #B dP =

    aA1[

    Xa[p/3,2p/3)] dP =

    aAP[

    X a [ p3 , 2p3 )] #A3 ,mas para qualquer varivel aleatria,

    X dP x implica que P[X x] > 0.

    1Somos gratos a Robert Morris por sugerir esse teorema como exemplo do Mtodo Probabilstico.

    13

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    2.2 Caso absolutamente contnuo

    Uma outra maneira simples de definir um espao de probabilidade, partindode um espao de medida. Seja (,F , ) um espao de medida e : R+ uma funo mensurvel com

    (x)(dx) = 1. Ento podemos definir a

    probabilidade induzida

    P(A) =

    A(x)(dx). (2.5)

    Nesse caso, chamamos de a densidade de P com respeito a . Uma outrapossvel notao para a equao acima dP = (x)d (lembrando a derivadade Radon-Nikodim).

    Observe que o caso discreto pode ser definido em termos de uma densidade,onde () = p e a medida da contagem em .

    Exemplo 2.2.1. Vrios exemplos podem ser obtidos via (2.5) se tomamos R e amedida de Lebesgue restrita a . Nesses casos, escrevemos P = (x)dx em . Algunsexemplos importantes so:

    a) Para a < b R, definimos a medida U[a, b] usando (x) = 1ba1[a,b](x).b) Para > 0, definimos a medida Exp() (chamada exponencial de parmetro )

    por meio da densidade (x) = exp{x} em [0,).Podemos tambm usar a distribuio de um elemento aleatrio para cons-

    truir outras probabilidades, como mostra o seguinte exemplo.

    Exemplo 2.2.2. Considere por exemplo X : [0, 2pi] C dada por X(t) = exp{it}.A distribuio X P de X segundo U[0,2pi] o que chamamos de distribuio uniformeem S1, tambm denotada por US1 .

    Exerccio 2.2.3. Mostre que US1 no absolutamente contnua com respeito medidade Lebesgue em C R2.Exerccio 2.2.4. Mostre que US1 invariante por rotaes rgidas de C, isto , seT : C C uma isometria linear, ento T US1 = US1 .Exerccio 2.2.5. Construa uma probabilidade em S2 invariante por rotaes.

    2.3 Funes acumuladas de distribuio

    Um caso muito importante de espao amostral = R, principalmente por nosajudar a entender distribuies de variveis aleatrias. Para tanto, precisaremosde uma boa ferramenta para descrever probabilidades em R.

    Definio 2.3.1. Dada P em R, definimos FP : R [0, 1] por FP(x) = P((, x]).

    Essa funo chamada a funo de distribuio acumulada de P.

    14

  • 2.3. FUNES ACUMULADAS DE DISTRIBUIO

    Notao 2.3.2. Se X : R uma varivel aleatria num espao (,F , P),denotamos por FX a funo de distribuio acumulada correspondente distribuioX P.

    Lembramos que uma probabilidade em R uma funo P : B(R) [0, 1]e o domnio dessa funo bastante complicado. Por exemplo se quisermosrepresentar uma distribuio de uma varivel aleatria no computador atravzdessa funo P, teramos problemas. Contudo, a funo FP (ou FX) muito maissimples de ser compreendida ou representada, por seu domnio ser R.

    Exemplo 2.3.1. No difcil verificar que

    Fx0 =

    {0 se x < x0,1 se x x0

    (2.6)

    e que

    FU[0,1] =

    0 se x 0,x se x [0, 1] e1 se x 1.

    (2.7)

    Exerccio 2.3.2. Calcule FExp().

    Proposio 2.3.3. FP (e obviamente FX) satisfazem:

    a) limxF(x) = 0, limxF(x) = 1,

    b) F montona no-decrescente e

    c) F contnua direita e possui limite esquerda (cdlg, do francs).

    Demonstrao. a) Se xn monotonamente, ento An = (, xn] soencaixados e de interseo vazia. Logo, pela Proposio 1.2.3, temosP(An) 0. O outro caso anlogo.

    b) Se x x ento (, x] (, x], donde F(x) F(x).c) Continuidade direita (cd) - Se xn x monotonamente, ento An =

    (, xn] (, x] (eles so encaixados). Logo F(xn) F(x).Limite esquerda (lg) - Segue do fato de F ser montona e limitada.

    Teorema 2.3.4. Se F satisfaz as trs propriedades listadas na Proposio 2.3.3, entoexiste uma nica P em (R,B(R)) tal que F = FP.

    Poderamos usar o Teorema da Extenso de Caratheodory para provar talresultado, de maneira similar ao que foi feito no caso da Medida de Lebesgue.Mas escolhemos abaixo um mtodo mais simples, que parte da existncia deU[0,1].

    15

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    u

    u

    S(u)

    S(u)

    Figura 2.1: Ilustrao da definio de S(u).

    Demonstrao. A unicidade de tal P segue da Proposio 1.3.4 (consequcia doTeorema de Dynkin), pois se P e P so tais que FP = FP , ento temos queP((, x]) = P((, x]). Mas a classe de intervalos semi-infinitos da forma

    (, x] forma um pi-sistema que gera a -lgebra dos borelianos, logo P = P.Para construir uma P tal que FP = F, definiremos S : (0, 1) R, a inversa

    generalizada de F, por

    S(u) = sup{x R; F(x) < u}. (2.8)

    Seja P = S U[0,1], isto P(A) = U[0,1](S1(A)) e mostraremos que FP = F.Para tanto, basta ver que

    {u [0, 1]; S(u) x} = {u [0, 1]; u F(x)}, para todo x R. (2.9)Pois isso implicaria que FP(x) = U[0,1][S x] = U[0,1][u F(x)] = F(x).

    Vamos agora checar (2.9) observando que:

    a) Se u F(x) ento todo x tal que F(x) < u menor que x. Logo S(u) x.b) Por outro lado, se u > F(x) ento existe x > x tal que F(x) < u (pois F

    cd), donde S(u) > x.

    Isos prova (2.9), terminando a prova da proposio.

    Exerccio 2.3.3. Mostre o resultado acima usando o Teorema de Extenso de Caratheo-dory.

    2.4 Espaos produto finito

    Dados espaos1, . . . ,n com suas respectivas -lgebrasF1, . . . ,Fn, podemosdefinir o espao mensurvel produto (,F ) da seguinte forma

    =ni=1i e F =

    (A1 An; Ai Fi, para i n

    ). (2.10)

    16

  • 2.5. INDEPENDNCIA

    Proposio 2.4.1. Se (1,F1, P1), . . . , (n,Fn, Pn) so espaos de probabilidade,ento existe uma nica probabilidade P no espao mensurvel (,F ) tal que

    P(A1 ,An) =n

    i=1

    Pi(Ai), para todos Ai Fi, i n. (2.11)

    Essa probabilidade chamada probabilidade produto.

    Demonstrao. Teoria da Medida.

    Note que a unicidade do produto pode ser concluda por exemplo usando oCorolrio 1.3.5.

    Exerccio 2.4.1. Mostre que o produto de n cpias de ({0, 1},P({0, 1}), Ber(1/2)) a distribuio uniforme em {0, 1}n.

    2.5 Independncia

    Nossa intuio nos diz que quando jogamos duas moedas, o resultado de cadauma delas no deve depender um do outro. Dessa forma, a probabilidade deobtermos um determinado resultado (como por exemplo duas caras) deve serum quarto, ou seja meio vezes meio.

    Em geral, definimos dois eventos como independentes da seguinte forma.

    Definio 2.5.1. Dizemos que dois eventos A, B F , so independentes seP(A B) = P(A)P(B). (2.12)

    Exemplo 2.5.1. Se = {1, . . . , 6} dotada da -lgebra das partes e e P(A) =#A/6, ento os eventos A = [ impar] e B = [ 5] satisfazem

    P(A B) = P({5}) = 1/6 = (1/2)(1/3) = P(A)P(B). (2.13)Logo tais eventos so independentes.

    Exerccio 2.5.2. Seja = {0, 1}n com P(A) = #A/2n e Xi(1, . . . ,n) = i parai = 1, . . . , n. Mostre que

    P[Xi = a, Xj = b] = P[Xi = A]P[Xj = B], (2.14)

    onde [A, B] denota a interseo [A] [B].

    2.5.1 Colees de eventosDefinio 2.5.2. Sejam A1, A2, . . . , Ak eventos. Dizemos que eles formam uma coleoindependente se para todo I {1, . . . , k} no vazio

    P(

    iI Ai)=

    iIP(Ai). (2.15)

    17

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    Vale observar que independncia dois a dois no implica independncia.Mais precisamente

    Exemplo 2.5.3. Seja = {1, 2, 3, 4} com P(A) = #A/4 e sejam os seguinteseventos: A1 = {1, 2}, A2 = {2, 3} e A3 = {1, 3}. Nesse caso,

    a) P(Ai) = 1/2 para i = 1, 2, 3,

    b) P(Ai Aj) = 1/4 para todo i 6= j masc) P(A1 A2 A3) = 0 6= 1/8 = P(A1)P(A2)P(A3).

    Definio 2.5.3. Dizemos que uma coleo infinita de eventos A1, A2, . . . indepen-dente se toda sub-coleo finita de tais eventos forem independentes.

    Lema 2.5.4. Se A1, A2, . . . forem independentes, ento

    P(

    iAi)=

    iP(Ai). (2.16)

    Demonstrao. De fato,

    P(

    iAi)= lim

    nP( n

    i=1Ai)= lim

    n

    n

    i=1

    P(Ai) =i

    P(Ai).

    Exerccio 2.5.4. Mostre que se A F , ento {B F ; B independente de A} um-sistema.

    Exerccio 2.5.5. Mostre que se B independente de A para todo B B, com B umpi-sistema, ento B independente de A para todo B (B).

    2.5.2 Independncia de -lgebras

    Definio 2.5.5. Dadas -algebras F1, . . . ,Fk F . Dizemos que elas so indepen-dentes se todos A1 F1, . . . , Ak Fk o so. Nessa definio podemos tomar umacoleo infinita.

    Exerccio 2.5.6. Em um espao produto (1 2,F1 F2, P1 P2), podemos defi-nir

    F 1 = {A2; A F1},F 2 = {2 B; B F2}.

    (2.17)

    Mostre que essas -lgebras so independentes.

    Podemos extender esse conceito a elementos aleatrios, ou seja:

    Definio 2.5.6. Dizemos que X1, . . . , Xk so elementos aleatrios independentes seas respectivas -lgebras (X1), . . . , (Xk) o forem.

    18

  • 2.5. INDEPENDNCIA

    Quando X1, . . . , Xk so elementos aleatrios independentes e com a mesmadistribuio, escrevemos que Xi so i.i.d. (independentes e identicamente distri-budos).

    Exerccio 2.5.7. Com a notao do exerccio anterior, mostre que as funes Xi :1 2 i dadas por

    X1(x, y) = x e X2(x, y) = y, (2.18)

    so elementos aleatrios e so independentes.

    Exerccio 2.5.8. Mostre que as coordenadas cannicas do exerccio anterior no casoXi : R2 R no so independentes segundo a medida US1 . Mas o so segundo U[0,1]2(que a medida de Lebesgue em R2 restrita a [0, 1]2).

    Exerccio 2.5.9. Seja = {0, 1}n com P(A) = #A/2n e Xi(1, . . . ,n) = i parai = 1, . . . , n. Mostre que os Xi so independentes.

    Exerccio 2.5.10. Sejam (Xi)i1 elementos aleatrios independentes tomando valoresem espaos (Ei)i1, respectivamente. Mostre que para funes mensurveis ( fi)i1temos que ( fi(Xi))i1 so independentes.

    Exerccio 2.5.11. Mostre que se X, Y so elementos aleatrios e se X constante quasecertamente ento X e Y so independentes.

    Exerccio 2.5.12. Sejam X e Y variveis aleatrias independentes com distribuioExp(1), calcule a distribuio de

    a) min{X, Y} eb) X +Y.

    Exerccio 2.5.13. Seja um espao produto de medidas (1 2,F1 F2, 1 2)e defina a probabilidade P atravz de

    dP = (x, y)d(1 2). (2.19)Mostre nesse caso que as coordenadas cannicas X1 e X2 so independentes se e somentese existem 1 e 2 em 1 e 2 respectivamente, tais que (x, y) = 1(x)2(y) quasecertamente com respeito a 1 2.Exerccio 2.5.14. Sejam X, Y variveis aleatrias tais que

    P[X x, Y y] ={

    0 if x < 0,

    (1 ex)(

    12 +

    1pi tan

    1 y)

    , if x 0. (2.20)

    a) Mostre que a distribuio conjunta (X,Y) absolutamente contnua com relao medida de Lebesgue em R2.

    b) Mostre que X e Y so independentes.

    19

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    Exerccio 2.5.15. Mostre que se X, Y so variveis aleatrias independentes com distri-buies X d fX(x)dx e Y d fY(y)dy, ento X+Y tem distribuio absolutamentecontnua com respeito a Lebesgue e

    fX+Y(z) =

    fY(z x) fX(x)dx. (2.21)

    Lema 2.5.7 (Borel-Cantelli - segunda parte). Se A1, A2, F so independentese pi = P(Ai) satisfazem i pi = , ento

    P[Ai infinitas vezes] = 1. (2.22)

    Demonstrao. Queremos mostrar que

    P((

    n

    i=n

    Ai)c)

    = 0, (2.23)

    masP((

    n

    i=n

    Ai)c)

    = P(

    n

    i=n

    Aci)

    nP(

    i=nAci)

    . (2.24)

    Logo basta mostrar que a probabilidade direita zero para todo n. Mas

    P(

    i=nAci)=

    i=n

    P(Aci ) =

    i=n

    (1 pi)

    i=n

    exp{pi} = exp{

    i=npi}= 0.

    (2.25)

    Terminando a prova do lemma.

    20

  • TPICO: LEI DOS PEQUENOS NMEROS

    Tpico: Lei dos pequenos nmeros

    Nessa seo estudaremos como se comportam limites de algumas variveisaleatrias bastante importantes, mas primeiramente, uma breve intuio.

    Apesar de que descreveremos a nossa motivao a partir desse exemplo doestudo de um material radioativo, podemos encontrar aplicaes com justificati-vas bastante semelhantes para outros problemas, como: chegada de carros emum sinal de trnsito, nmero de mutaes em um gene, nmero de mortes porano em uma faixa etria...

    Digamos que estamos observando um material radioativo que esporadica-mente emite ftons que podemos detectar atravz de um aparelho. A razodessas emisses pode ser aproximada pelo seguinte modelo. Na amostra temosum nmero n grande de tomos instveis (n 1023) e em um determinadotempo de observao, cada um deles tem probabilidade muito baixa de de-cair emitindo um fton (digamos p 1023). Nesse caso, supondo que todosdecidam emitir de maneira independente, temos para p [0, 1],

    n = {0, 1}n, Fn = P() e Pp = ni=1Ber(p). (2.26)Dessa forma, o nmero total de emisses observadas para = (1, . . . ,n)

    Xn() =n

    i=1

    i. (2.27)

    E gostaramos de entender como se comporta essa distribuio, que nada mais que Bin(n, p).

    Uma primeira tentativa seria modelar esse processo dizendo que o nmerode tomos n to grande, que somente estamos interessados no comportamentoassimttico quando n vai para infinito. Mas para manter o nmero de emissessob controle, tambm gostaramos que p = pn, que converge a zero. Poderamospor exemplo escolher

    pn =

    n. (2.28)

    Mas a discusso que se segue muito mais geral que essa escolha especfica.Como estaremos interessados em um regime assimttico da distribuio de

    Xp (lembre que apesar do espao amostral de Xn variar com n, sua distribuio sempre uma probabilidade em N). Mas para falar de regimes assimtticos,precisamos de definir uma noo de distncia entre duas distribuies emN.

    Definio 2.5.8. Dadas duas distribuies 1 e 2 em (,A), definimos1 2VT = sup

    AA|1(A) 2(A)|, (2.29)

    chamada de distncia em variao total entre 1 e 2.

    No nosso caso, enumervel. Vamos ver que nesse caso possvelreescrever a definio acima de modo a ver mais facilmente que se trata de umadistncia no espao de probabilidades em .

    21

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    Lema 2.5.9. Se = {x1, x2, . . . }, ento podemos escrever

    1 2VT = 12i|1(xi) 2(xi)|. (2.30)

    Demonstrao. Para mostrar que o lado esquerdo maior ou igual ao direito,escolhemos A = {x ; 2(x) 1(x)}. Assim

    xA

    1(x) 2(x) = |1(A) 2(A)|

    = |1(Ac) 2(Ac)| = xAc

    2(x) 1(x),(2.31)

    donde

    1 2VT |1(A) 2(A)| = 12i|1(xi) 2(xi)|. (2.32)

    Na outra direo, observe que para todo B ,

    i|1(xi) 2(xi)|

    xB1(x) 2(x) +

    xBc1(x) 2(x)

    = 1(B) 2(B) + (1 2(B)) (1 1(B))= 2(1(B) 2(B)).

    (2.33)

    O que termina a prova do lema.

    Fica agora claro que 1 2VT determina uma distncia.Exerccio 2.5.16. Mostre um lema anlogo ao anterior para (,A) qualquer, desdeque 1 e 2 sejam absolutamente contnuas com relao uma medida fixa nesse espaomensurvel. Nesse caso utilizaremos as derivadas de RadonNikodym.

    Como estaremos interessados em variveis independentes, precisamos deum resultado que relacione a distncia em variao total com produtos demedida. Isso parte do seguinte

    Lema 2.5.10. Sejam 1, 2 distribuies em e 1, 2 distribuies em y ambosenumerveis. Ento

    1 1 2 2VT 1 2VT + 1 2VT. (2.34)Demonstrao. Basta expandir

    1 1 2 2VT = x,yy

    |1(x)1(y) 2(x)2(y)|

    x,yy

    |1(x)1(y) 1(x)2(y)|+ |1(x)2(y) 2(x)2(y)|

    21 2VT + 21 2VT.

    (2.35)

    Onde acima ns usamos que 1 e 2 so probabilidades. Isso termina a provado lema.

    22

  • TPICO: LEI DOS PEQUENOS NMEROS

    Finalmente, gostaramos de entender como a distncia de variao total secomporta com respeito soma de variveis independentes. Isso estar ligado convoluo de distribuies:

    Definio 2.5.11. Dadas, e distribuies em Z, definimos a distribuio

    ( ? )(x) := yZ

    (x y)(y). (2.36)

    Essa definio se relaciona com a soma de variveis independentes graasao seguinte

    Exerccio 2.5.17. Se X d e Y d so variveis aleatrias inteiras e independentes,ento X + Y d ? . Dica: particione o espao amostral nos eventos [X = j], paraj Z, como na prova do Lema 2.5.15 abaixo.Corolrio 2.5.12. Se e so distribuies em Z, ento ? = ? .

    Como prometido, obtemos a seguinte relao entre a convoluo e a distnciade variao total.

    Lema 2.5.13. Sejam 1, 2, 1, 2 distribuies em Z. Ento,

    1 ? 1 2 ? 2VT 1 1 2 2VT (2.37)Demonstrao. Como de costume, basta estimar

    xZ

    yZ

    1(x y)1(y) yZ

    2(x y)2(y)

    x,yZ

    1(x y)1(y) 2(x y)2(y)

    x,zZ

    1(z)2(y) 2(z)2(y)= 21 1 2 2VT,

    (2.38)

    provando o lema.

    Para enunciar o resultado principal dessa seo, vamos apresentar umadistribuio emN bastane importante, que em particular se comporta muitobem com respeito a somas de variveis independentes, como veremos.

    Definio 2.5.14. Uma varivel aleatria X dita ter distribuio de Poisson comparmetro , se

    P[X = k] =ke

    k!, para k 0 inteiro. (2.39)

    Denotamos isso por X d Poisson().A distribuio de Poisson se comporta bem com respeito a somas indepen-

    dentes, como mostra o seguinte

    23

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    Lema 2.5.15. Sejam X d Poisson(1) e Y d Poisson(2) independentes, entoX +Y d Poisson(1 + 2).Demonstrao. Basta calcular

    P[X +Y = k] =k

    j=0

    P[X = j, Y = k j] =k

    j=0

    j1e1kj2 e

    2j!(k j)!

    = e(1+2) 1k!

    k

    j=0

    k!j!(k j)!

    j1

    kj2 =

    e(1+2)(1 + 2)k

    k!,

    (2.40)

    mostrando o resultado.

    Nossa prxima tarefa estimar a distncia entre uma varivel aleatria comdistribuio Ber(p) e uma Poisson(p), como segue.

    Lema 2.5.16. Para p [0, 1], seja 1 = Ber(p) e 2 = Poisson(p), ento,1 2VT p2. (2.41)

    Demonstrao. Sabemos que

    1 2VT = 12x|1(x) 2(x)|

    =12

    (|1(0) 2(0)|+ |1(1) 2(1)|+

    x22(x)

    )=

    12

    (ep (1 p) + p(1 ep) + (1 ep pep)

    )=

    22

    p(1 ep) p2,

    (2.42)

    terminando a prova.

    O teorema principal de convergncia dessa seo concerne a soma de vari-veis Bernoulli.

    Teorema 2.5.17 (Lei dos Pequenos Nmeros). Dado, n 1 e p [0, 1], suponhaque n, Fn e Pp sejam dados como em (2.26). Ento,

    Bin(n, p) Poisson(pn)VT np2. (2.43)Demonstrao. Basta observar que

    Xn Pp Poisson(pn)VT Lema 2.5.15= Ber(p)?n Poisson(p)?nVTLema 2.5.13 Ber(p)n Poisson(p)nVTLema 2.5.10 nBer(p) Poisson(p)VT

    Lema 2.5.16 np2,

    (2.44)

    provando o teorema.

    24

  • TPICO: LEI DOS PEQUENOS NMEROS

    Corolrio 2.5.18. No mesmo contexto do teorema acima, se p = /n, ento temos

    Bin(n, p) Poisson(pn)VT 2/n, (2.45)que converge a zero com n.

    Exerccio 2.5.18. Fixado > 0, seja N uma varivel aleatria com distribuioPoisson(), isto

    P[N = k] =ke

    k!para k = 0, 1, . . . (2.46)

    Considere no mesmo espao de probabilidade uma sequncia de variveis aleatriasX1, X2, . . . que sejam i.i.d. , com distribuio Ber(1/2) e independentes de N.

    a) Calcule a distribuio de Z = Ni=1 Xi.

    b) Mostre que Z e N Z so independentes.

    25

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    2.6 Espaos produto infinito

    Nessa seo estudaremos que so dados por produtos enumerveis de outrosespaos de probabilidade. Mas antes iremos recordar o Teorema da Extenso deCaratheodory.

    2.6.1 Recordar viver...

    Vamos lembrar o enunciado do Teorema da Extenso de Caratheodory . Antes,vamos relembrar uma definio definio importante. Uma famlia G P() dita uma lgebra de conjuntos se valem

    a) G,b) se A G, ento Ac G ec) para todo n 1, se A1, . . . , An G, ento ni=1 Ai G.

    Teorema 2.6.1 (Teorema da Extenso de Caratheodory). Seja G P() umalgebra de conjuntos em e suponha que : G R+ satisfaa a seguinte propriedade

    sempre que A1, A2, G forem disjuntos e tais que i Ai G,temos (i Ai) = i (Ai). (2.47)

    Nesse caso, existe uma medida : (G) R+ tal que (A) = (A) para todoA G.

    Mostraremos agora uma pequena simplificao do teorema acima, que muito utilizada em probabilidade.

    Lema 2.6.2 (Extenso por continuidade no vazio). Seja G P() uma lgebrade conjuntos em e suponha que P : G R+ satisfaa as seguintes propriedades

    a) P() = 1,

    b) P finitamente aditiva e

    c) sempre que B1 B2 G forem tais que iBi = (denotamos isso porBi ), temos que limi (Bi) = 0.

    Ento existe uma nica medida P : (G) R+ tal que P(A) = P(A) para A G.Observe que P() = 1 somente necessrio para provar a unicidade de

    P, ento poderamos tentar mostrar uma verso mais geral desse lema. Masno contexto de medidas infinitas, no de se esperar que Bi impliquelimi (Bi) = 0, como foi assumido acima (veja tambm a Proposio 1.2.3).Portanto resolvemos escrever o enunciado com probabilidades.

    Exerccio 2.6.1. D um exemplo de medida que no satisfaz a segunda hiptese doLema 2.6.2.

    26

  • 2.6. ESPAOS PRODUTO INFINITO

    Demonstrao. Primeiro observe que a unicidade segue da Proposio 1.3.4, jque G um pi-sistema. Iremos agora mostrar que a propriedade (2.47) vlidapara P, logo tome A1, A2, G disjuntos e tais que A = i Ai G. Definimoso resto da unio por

    Bn = A \n

    i=1Ai. (2.48)

    Claramente

    a) Bn eb) Bn G, pois G uma lgebra.

    Logo podemos escrever A como a unio disjunta A =n

    i=1 Ai Bn e j queP finitamente aditiva,

    P(A) =n

    i=1

    P(Ai) + P(Bn), (2.49)

    mas como limn P(Bn) = 0, temos P(i Ai) = i P(Ai), mostrando a proprie-dade (2.47) e concluindo o teorema.

    2.6.2 Teorema da Extenso de Kolmogorov

    O objetivo desta seo provar um resultado que nos permitir construir pro-babilidades em espaos produtos infinitos. Antes precisaremos de introduziralgumas notaes.

    Dada uma coleo de espaos E1, E2, . . . , definimos o espao produto

    = i1Ei ={(1,2, . . . );i Ei para todo i 1

    }. (2.50)

    e os mapas Xi : Ei, definidos para i = 1, 2, . . . porXi(1,2, . . . ) = i, (2.51)

    que chamamos de coordenadas cannicas associadas ao produto .Se cada Ei dotado de uma -lgebra Ai, ento definimos

    F = (Xi; i 1), (2.52)que claramente uma a -lgebra em . Chamamos F de -lbegra cannica.Exerccio 2.6.2. Mostre que em (RN,F ) temos que os conjuntos

    a) A = {lim infn Xn existe},b) B = {limn Xn = 4} ec) C = {limn 1n Xn existe}

    27

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    so todos mensurveis (eventos) com respeito a F . Alm disso Y = 1A lim infn Xn uma varivel aleatria em (,F ).Exerccio 2.6.3. Verifique que,

    a) F = (A1 Ak Ek+1 Ek+2 . . . ; k 1, Ai Ai, i k), oschamados eventos retangulares e

    b) F = (A Ek+1 Ek+2 . . . ; k 1, A Ai Ak), conhecidos comoeventos cilndricos.

    Definio 2.6.3. Seja = Ei um espao produto (infinito ou finito) dotado de umaprobabilidade P. Se Xi uma coordenada cannica, ento chamamos a probabilidadeXi P de distribuio marginal de P na coordenada i.Teorema 2.6.4 (Extenso de Kolmogorov). Seja para cada n 1 uma medida deprobabilidade Pn em Rn tal que seja satisfeita a seguinte condio de compatibilidade

    Pn+1(AR) = Pn(A), para todo A B(Rn). (2.53)Ento existe uma nica probabilidade P no espao produto infinito (,F ) tal queP(AR . . . ) = Pn(A) para todo n e todo boreliano A de Rn.Demonstrao. Considere a classe de conjuntos

    Sl ={ k

    i=1[a1, b1) [al , bl) Rl ; onde ai R {}, bi R {}

    }.

    Que obviamente uma lgebra em Rl e seja tambm

    S = {AR . . . ; onde l 1 e A Sl}. (2.54)Claramente, S tambm uma lgebra.

    Se B = AR S com A Sl como acima, definimosP(B) = Pl(A). (2.55)

    Note que por (2.53) essa definio independe da escolha da escolha de l queusamos na definio de B.

    Gostaramos agora de utilizar o Lemma 2.6.2. Para tanto, tome uma sequn-cia encaixada B1 B2 S e, supondo que P(Bn) > 0 para todon 1, temos de mostrar que sua interseo no pode ser vazia.

    Como Bn S , podemos escreverBn = An R . . . , onde An Sln e n 1. (2.56)

    Podemos obviamente supor que

    ln so estritamente crescentes. (2.57)

    28

  • 2.6. ESPAOS PRODUTO INFINITO

    A fim de obter um ponto na interseo de Bn, gostaramos de aproxim-lousando conjuntos compactos encaixados. Para tanto definimos os conjuntos

    Cn = Cn R . . . , com Cn Sln (2.58)de forma que Cn seja pr-compacto, Cn An e

    P(Bn \ Cn) 2ln+1 , (2.59)o que pode ser feito graas continuidade de Pln , que uma probabilidade.

    Temos ainda um problema, pois os conjuntos Cn no so encaixados, e issonos impede de utilizar resultados sobre intersees de compactos. Introduzimospois Dn =

    ni=1 Ci, que obviamente pertence lgebra S , e estimamos

    P(Bn \ Dn) = P(n

    i=1(Bn \ Ci)) n

    i=1P(Bn \ Ci) 2 , (2.60)

    donde P(Dn) = P(Bn) P(Bn \Dn) /2. De forma que os Dn so encaixadose no vazios.

    Nosso prximo obstculo vem do fato de que os conjuntos Dn esto definidosem RN, e gostaramos de ter conjuntos em espaos de dimenso finita. Issopode ser feito observando que podemos escrever Dn = Dn RR . . . , ondeDn Sln e

    Dn = Cnpr-compacto

    ( n1i=1

    Ci Rlnli)

    , (2.61)

    de forma que os Dn Rln so pr-compactos e no vazios.Para cada n 1 considere um n Dn Rln . Usando um argumento de

    diagonal de Cantor, podemos obter um e uma sub-sequncia de nj queconvirja para coordenada a coordenada (observe que nj Rlnj ).

    Para concluir a prova, veremos que m Bm. Mais ainda, veremos quepara todo m 1, temos = (1,2, . . . ) Cm = Cm R Bm.

    Mas como os pontos (1, . . . ,lm) so o limite de (nj1 , . . . ,

    njlm) Cm (com

    nj m), ento bvio que Cm, terminando a prova do teorema.Observe que usamos muito poucos atributos de R na prova. Poderamos na

    verdade substituir R por um espao mtrico que satisfaa certas propriedades,como por exemplo a existncia de uma lgebra cujos conjuntos possam seraproximados por pr-compactos. Contudo, decidimos no apresentar essaverso mais geral aqui porque muito em breve obteremos uma verso bem maisgeral do Teorema de Kolmogorov usando apenas o resultado para R.

    Exerccio 2.6.4. Mostre que a hiptese (2.53) pode ser substituida por

    Pn+1(I1 . . . ,In R) = Pn(I1 In), (2.62)para todo n 1 e Ii = (, bi], onde bi R, i n.

    29

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    Um importante exemplo do uso deste teorema o seguinte.

    Exemplo 2.6.5. Se Pi so probabilidades em (R,B(R)), podemos definir Pn =ni=1 Pi (relembrando, Pn a nica distribuio emR

    n tal que Pn(A1 An) =ni=1 Pi(Ai)). No difcil verificar que essa lei satisfaz as equaes de consistncia(2.53). Desta forma, podemos construir uma nica P emRN para os quais as coordena-das cannicas Xi so independentes e possuem distribuies marginais Pi. Denotamosnesse caso P =

    i1 Pi.

    Mais adiante no texto daremos outros exemplos bastante interessantes douso do Teorema 2.6.4.

    Exerccio 2.6.6. Mostre que se p > 0 e P =

    i1 Ber(p) em RN, ento

    lim supn

    Xn = 1 quase certamente. (2.63)

    Exerccio 2.6.7. Mostre que se P =

    i1 U[0,1] em RN, ento

    lim supn

    Xn = 1 quase certamente. (2.64)

    Exerccio 2.6.8. Mostre que se P =

    i1 Exp(i) em RN, ento

    lim supn

    Xn < quase certamente. (2.65)

    30

  • TPICO: PERCOLAO

    Tpico: Percolao

    Imagine que gostaramos de modelar o movimento de um lquido em um meioporoso, como uma rocha ou uma esponja. A primeira tarefa nesse estudo seriamodelar esse meio poroso de maneira matematicamente rigorosa, que o quefaremos a seguir.

    Fixamos uma dimenso d 1 e consideramos o seguinte grafo G = (Zd, E),onde a rede quadrada Zd o conjunto de vrtices de G e o conjunto de elos dado por

    E ={{x, y} Zd; |x y| = 1},

    onde | | representa a distncia euclideana em Rd.No nosso modelo, esse grafo pode ser entendido como um cristal peridico

    onde cada vrtice representa uma cavidade do material poroso e os elos sopotenciais conexes entre poros vizinhos.

    At agora nosso grafo G apenas uma rede peridica, mas as coisas come-am a ficar interessantes partir de agora. Imaginamos que nosso materialporoso est sujeito a variaes durante sua formao. Isso se reflete no fato quealguns elos de E podem estar abertos ou no aleatoriamente.

    Para o nosso modelos, fixamos um p [0, 1] e definimos uma coleode variveis aleatrias Xe, para e E, que sejam i.i.d. e com distribuioBer(p). Essas variveis aleatrias induzem um novo subgrafo (Zd, E) de G quecorresponde a abrir apenas os elos e com Xe = 1. Mais precisamente

    E = {e E; Xe = 1}. (2.66)Podemos ver na Figura 2.2 algumas simulaes desse grafo aleatrio.

    Figura 2.2: Trs simulaes do grafo aleatrio (Zd, E), para valores de p = 0, 4(esquerda), p = 0, 5 (centro) e p = 0, 6 (direita). Tente imaginar como seria caminharnesse grafo como se ele fosse um labirinto.

    Agora que temos um modelo de meio poroso bem definido, precisamospensar em quais perguntas nos interessam sobre G = (Zd, E). Sendo esse ummodelo poara passagem de fluido, as primeiras perguntas que faremos concernea conectividade de G.Exerccio 2.6.9. Mostre que quase certamente G desconexo. Mais precisamente,mostre que existem quase certamente infinitos vrcices isolados em G.

    31

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    Como no podemos esperar que G seja conexo, podemos nos perguntar algomais fraco, como por exemplo se a componente conexa da origem 0 Zd em G infinita.

    Voltando Figura 2.2 vemos que, dependendo do valor de p [0, 1], podeser bem difcil ou bem fcil encontrar um caminho longo partir da origem.Isso uo que estudaremos em mais detalhes no que segue.

    Mais precisamente estamos interessados em:

    A ={ ; a componente conexa de 0 Zd em G infinita}. (2.67)

    Para estudar A, vamos fazer uma aproximao de A por eventos maissimples

    An ={ ; a componente conexa de 0 sai da caixa [n, n]d}, (2.68)

    para n 1.Exerccio 2.6.10. Mostre que A = n An e consequentemente que A de fato mensu-rvel e P(A) = limn P(An).

    Definimos portanto a funo : [0, 1] [0, 1] por

    (p) = Pp(A), (2.69)

    onde Pp denota a probabilidade correspondente ao valor escolhido de p [0, 1].

    Exerccio 2.6.11. Mostre que (p) (1 p)2d.Nosso objetivo entender algumas das propriedades de . A nossa intuio

    diz que quanto maior o valor de p, mais elos sero abertos em G e portanto maiorser o valor de , ou em outras palavras, deve ser montona no decrescente.

    Exerccio 2.6.12. Construiremos nosso modelo de uma maneira alternativa num espaode probabilidade P. Sejam Ye, para e E, variveis aleatrias i.i.d. com distribuioU[0, 1] e definimos para cada p [0, 1]

    Xpe = 1[Yep]. (2.70)

    Mostre que para todo p [0, 1] a distribuio conjunta de (Xe)eE sob a lei Pp a mesma que a de (Xpe )eE sob P. Use isso para concluir que montona nodecrescente.

    Iremos agora mostrar a existncia de um regime para o qual a componenteconexa da origem no infinita.

    Teorema 2.6.5. Para p < 1/(2d), temos que (p) = 0.

    Antes da prova, alguns exerccios.

    32

  • TPICO: PERCOLAO

    Exerccio 2.6.13. Definimos um caminho como sendo uma sequncia x1, . . . , xk(k N), tal que {xi, xi+1} E para todo i = 1, . . . , k 1. Tal caminho dito abertose X{xi ,xi+1} = 1 para todo i k 1. E dizemos que ele auto-evitante se xi 6= xjpara todo 1 i < j < k. Mostre que

    An ={ ; existe um caminho aberto (xi)ki=1 com x1 = 0 e xk 6 [n, n]d

    }An =

    { ; existe um caminho auto-evitante como acima}.

    Demonstrao. Dado p < 1/(2d) e n N, lembramos que

    (p) Pp(An) = Pp[ existe k N e um caminho auto-evitante (xi)ki=1

    aberto e com x1 = 0 e xk 6 [n, n]d]

    kn

    (xi)ki=1 auto-evit.

    Pp[(xi)ki=1 aberto] = kn

    (xi)ki=1 auto-evit.

    pk

    kn

    (xi)ki=1 caminho

    Pp[(xi)ki=1 aberto] = kn

    (2d)k pk.

    Como p < 1/(2d), a soma acima finita e converge a zero quando n diverge,provando o teorema.

    Notas - O teorema acima ajuda a compreender o comportamento que ob-servamos no lado esquerdo da Figura 2.2. Mais precisamente, ele nos diz quepara valores de p baixos (na verdade 0, 4 no baixo o suficiente para podermosaplicar esse teorema) difcil encontrar um caminho aberto do centro bordada caixa.

    Na verdade, possvel mostrar que para d = 2,

    (p) = 0 para todo p 1/2 e(p) > 0 para todo p > 1/2,

    (2.71)

    como foi mostrado por Harris e Kesten, veja por exemplo [Gri99] e [BR06]. Defato, algo bastante interessante est acontecendo nesse modelo para p = 1/2,como nos mostrou o trabalho de grandes matemticos, como: Oded Schramm,Wendelin Werner, Stanislav Smirnov, entre outros.

    33

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    2.7 Distribuies conjuntas

    Um caso bastante importante de distribuio de um elemento aleatrio ocaso de vetores. Digamos por exemplo que temos dois elementos aleatriosX : E e Y : E. J sabemos a definio de PX e PY que nada mais soque as distribuies de X e Y respectivamente.

    Mas podemos considerar o vetor (X, Y) que ser um elemento aleatriotomando valores em E E e possui tambm sua prpria distribuio dadapor (X, Y) P (tambm denotada por P(X,Y)). A essa probabilidade em E Edamos o nome de distribuo conjunta deste par. .

    Vejamos as relaes que existem entre PX , PY e P(X,Y). Primeiramente, fcilver que a distribuo conjunta nos fornece as demais, pois para todo A Emensurvel

    P(X,Y)(A E) = P[(X, Y) A E] = P[X A] = PX(A) (2.72)e analogamente para PY. De acordo com a Definio 2.6.3, as distribuies PX ePY nada mais so do que as marginais da distribuio conjunta.

    Apesar de podermos extrair as marginais PX e PY de P(X,Y), o contrrio no sempre possvel como mostra o seguinte exemplo.

    Exemplo 2.7.1. Sejam X, Y i.i.d. com distribuio Ber(1/2). Ento (X, Y) no tem amesma distribuio de (X, X), apesar de que esses vetores possuem as mesmas margi-nais.

    Exerccio 2.7.2. Mostre que se X e Y so independentes, ento P(X,Y) = PX PY.Exerccio 2.7.3. Sejam X, Y i.i.d. com distribuio U[0,1] e calcule P(X,X+Y).

    Note que a discusso acima se extende naturalmente para colees maioresde elementos aleatrios. Mais precisamente, considere um conjunto I qualquer(finito, enumervel ou no enumervel) de ndices e seja (Xi)iI uma coleo deelementos aleatrios tomando valores em (Ei)iI . Ento a distribuio conjuntadestes elementos aleatrios P(Xi)iI .

    Exerccio 2.7.4. Mostre que no caso acima, se P(Xi)iJ = P(Xi )iJ para todo J Ifinito, ento P(Xi)iI = P(Xi )iI .

    2.8 Probabilidades condicionais

    Uma outra maneira de se construir espaos de probabilidade atravz decondicionamento, como mostra a seguinte definio.

    Definio 2.8.1. Se (,F , P) espao de probabilidade e B F tal que P(B) > 0,ento definimos a probabilidade P(|B) : F [0, 1] por

    P(A|B) = P(A B)P(B)

    , (2.73)

    chamada probabilidade condicional dado o evento B.

    34

  • 2.8. PROBABILIDADES CONDICIONAIS

    Obviamente P(|B) uma probabilidade em (,F ) e podemos entend-lade duas formas: como uma normalizao ou como uma tentativa de sucesso.Explicaremos abaixo cada uma dessas interpretaes.

    Quando restringimos o espao amostral ao conjunto B (e associamos aA F o valor P(A B)), temos uma sub-probabilidade, isto possivelmenteP( B) < 1. Logo podemos entender o denominador de (2.73) como umanormalizao para obtermos novamente uma probabilidade.

    Mas a interpretao mais natural de (2.73) dada pela seguinte proposio.Para enunci-la, considere (,F , P) um espao de probabilidade e defina oproduto

    =i=1, F =

    i=1F e P =

    i=1

    P. (2.74)

    Na verdade somente definimos esse produto para = R, mas como menciona-mos abaixo do Teorema da Extenso de Kolmogorov, isso pode ser fcilmentegeneralizado e o faremos posteriormente.

    Proposio 2.8.2. Na situao acima, seja B F com P(B) > 0 e defina T : Npor T() = inf{n 1; Xn() B}, onde os Xn so as coordenadas cannicas. EntoT < quase certamente e

    XT()() um elemento aleatrio em com distribuio P(|B). (2.75)A intuio desta proposio que se repetimos o experimento (,F , P)

    independentemente at obter uma amostra em B, essa ter a distribuio condi-cional.

    Demonstrao. Sejam os eventos An = [Xn B], n 1 que so claramenteindependentes segundo P. Logo, como n P(An) = n P(B) = , temos peloLema de Borel-Cantelli (segunda parte) que P(An infinitas vezes) = 1, logoT < quase certamente.

    Para ver que XT()() um elemento aletrio, basta escrever

    [XT A] =

    t=1[Xt A, T = t], (2.76)

    e observar que tanto [Xt A] quanto [T = t] = [X1 6 B, . . . , Xt1 6 B, Xt B]so mensurveis.

    Finalmente podemos usar a decomposio (disjunta) acima para calcular

    P[XT A] =

    t=1

    P[Xt A, T = t]

    =

    t=1

    P[Xt A, Xt B, Xs 6 B for s < t]

    =

    t=1

    P(A B)P(Bc)t1 = P(A B)1 P(Bc) = P(A|B),

    (2.77)

    terminando a prova da proposio.

    35

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    Exerccio 2.8.1. Seja > 0 e X d Exp() (lembrando a definio da distribuioexponencial: d(X P) = exp{x}dx). Mostre que as variveis com distribuioexponencial no possuem memria, ou seja:

    P[X > t + s|X > t] = P[X > s], para todo s, t > 0. (2.78)Ou em outras palavras, sabendo que X maior que t, a distribuio condicional deX t ainda Exp().

    Definimos a distribuio geomtrica de parmetro p (0, 1] por

    Geo(p) =

    i=1

    i(1 p)i p. (2.79)

    Exerccio 2.8.2. Inspirado no exerccio anterior, mostre que a distribuio geomtricaGeo(p) tambm satisfaz (2.78) para todos t, s N. Mostre que essas so as nicasdistribuies com suporte emN satisfazendo tal propriedade

    Exerccio 2.8.3. Sejam Yi, para i 1 i.i.d. com distribuio Ber(p) e definaT = inf{i; Yi = 1}. (2.80)

    Mostre que T d Geo(p).Exerccio 2.8.4. Barry James: Cap. 2-5, Ex: 5, 10, 21, 22 (a) e (b).

    Exerccio 2.8.5 (Porta dos desesperados). Nas tardes da dcada de 80, as crianastinham poucas opes de entretenimento alm de assistir Srgio Malandro, que todosos dias apresentava o seguinte jogo. O participante era apresentado a trs portas( = {1, 2, 3}) e apenas uma delas (chamada de X) continha um prmio X d U e ojogo seguia trs fases:

    a) O participante escolhia uma porta arbitrariamente (digamos y ),b) o Srgio Malandro abria uma porta X que no fosse a escolhida nem a premiada

    (X d U\{y,X})c) ao participante era dada a oportunidade de trocar sua porta X pela porta restante

    em \ {X, X}.Mostre que o participante sempre aumenta suas chances ao trocar sua escolha. Tenteinterpretar esse aparente paradoxo tomando o nmero de portas para infinito.

    Exerccio 2.8.6. Emlio e Cristina tiveram dois filhos cujos sexos X, X so i.i.d. edistribuidos como U{,}. Calcule

    a) P[X, X = | pelo menos um ] eb) P[X, X = | pelo menos um e nasceu em uma segunda-feira].

    36

  • 2.8. PROBABILIDADES CONDICIONAIS

    Interprete esses resultados trocando segunda-feira por primeiro de abril. 2

    Exerccio 2.8.7. Supondo que P(A B) > 0, mostre que P(|A|B) = P(|B|A).Exerccio 2.8.8. Sejam X, Y variveis aleatrias em um espao (,F , P), independen-tes e com distribuio U[0,1].

    a) Calcule (X +Y) P.b) Considere P() = P( |X +Y 1) e calcule X P.

    2.8.1 Regra de BayesFrequentemente definimos um espao de probabilidade atravz de probabilida-des condicionais. Consideramos por exemplo um exame mdico para detectaruma doena, nesse caso temos

    = {(doente,+), (doente,), (saudvel,+), (saudvel,)}, (2.81)com obviamente a -lgebra das partes.

    Contudo, ao contrrio do que fizemos anteriormente, no daremos probabi-lidades p [0, 1] para cada . Poderamos por exemplo fornecer

    P(doente) = 0.005, P(+|saudvel) = 0.01, P(|doente) = 0.05. (2.82)Obviamente podemos obter as probabilidades dos complementos dos eventosacima. As probabilidades acima podem ser facilmente estimadas num labora-trio e as duas ltimas so chamadas respectivamente de probabilidades defalso positivo e falso negativo. Outra vantagem da representao em (2.82) queas probabilidades descritas so mais compartimentadas no seguinte sentido.Note que P(doente) somente depende da populao em questo, enquanto asoutras duas dependem apenas do exame e no da populao. Isso no pode serdito das probabilidades de pontos individuais em .

    Agora fica fcil construir nosso espao de probabilidade escrevendo, parar {+,} e e {saudvel, doente},

    P(r e) = P(r|e)P(e). (2.83)E as probabilidades do lado direito da equao acima esto todas determinadasem (2.82) (possivelmente tomando complementos).

    Contudo, o que estamos interessado muitas vezes em como interpretarresultados de um exame. Por exemplo, quanto vele P(doente|+)? Isso nos fornecido em geral pela regra de Bayes enunciada na seguinte

    Proposio 2.8.3. Se A1, A2, . . . formam uma partio (finita ou no) de e B Ftem probabilidade positiva, ento

    P(Ai|B) = P(Ai)P(B|Ai)j P(Aj)P(B|Aj). (2.84)

    2Gratos ao Ricardo Misturini por sugerir esse problema

    37

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    Demonstrao. Basta notar que

    P(Ai|B) = P(Ai)P(B|Ai)P(B) =P(Ai)P(B|Ai)j P(B Aj)

    =P(Ai)P(B|Ai)j P(Aj)P(B|Aj)

    . (2.85)

    Exerccio 2.8.9. Utilize a frmula acima para calcular P(doente|+) com os dados em(2.82). Comente o resultado.

    Exerccio 2.8.10. Barry James: Cap. 1, Ex: 18 e 19.

    2.9 Ncleos de transio

    J focamos bastante energia em variveis aleatrias independentes. Por exemplo,estudamos em detalhes o que acontece com a soma de tais variveis. Agorapassaremos a estudar elementos aleatrios dependentes e o primeiro passo paraisso obter um mtodo geral de constru-los.

    Definiremos agora um ncleo de transio. Intuitivamente, ele nos duma maneira de usar um elemento aleatrio em um espao para induzir umaprobabilidade em outro espao. Um exemplo em que poderamos utilizar essaconstruo seria o seguinte.

    Digamos que estamos preocupados com a possibilidade de um deslizamentode terra em uma determinada regio. A ocorrncia desse deslizamento algoaleatrio, mas que certamente depende da quantidade de chuva no perodo,que tambm podemos modelar como sendo aleatria.

    Aps estudarmos alguns trabalhos anteriores, descobrimos uma funoF : R+ [0, 1] que nos d a probabilidade de um deslizamento ocorrer, comofuno da quantidade de chuva em milmetros.

    Lendo o histrico pluvial da regio, podemos estimar a distribuio Q emR+correspondente quantidade de chuva naquele perodo. A lei F Q (tambmchamada de QF) uma lei em [0, 1] que nos d a distribuio da probabilidadede deslizamento, mas como seguimos em frente para obter a probabilidade dedeslizamento (um nmero entre zero e um)? Saberemos como fazer isso aoterminar essa seo.

    Sejam (E1,A1) e (E2,A2) espaos mensurveis.Definio 2.9.1. Um ncleo de transio entre E1 e E2 uma funo

    K : E1 A2 [0, 1], (2.86)

    tal que

    a) para todo y E1, K(y, ) uma probabilidade em (E2,A2) eb) para todo A A2, a funo K(, A) : E1 [0, 1] A1-mensurvel.

    38

  • 2.9. NCLEOS DE TRANSIO

    Exemplo 2.9.1. Daremos agora o exemplo da probabilidade de deslizamento comofuno de F (que ser possivelmente uma varivel aleatria). Nesse caso, seja E1 = [0, 1]e E2 = {0, 1} com as -lgebras naturais e defina

    K(p, A) =((1 p)0 + p1

    )(A). (2.87)

    Vamos verificar que K definido acima um ncleo. De fato,

    i) K(p, ) a distribuio Bernoulli com parmetro p, que obviamente uma probabilidade,

    ii) alm disso, K(,) = 1, K(,) = 1 e K(, {0}) = 1 p = 1 K(, {1}),que obviamente so mensurveis. Isso prova que esse K especfico umncleo

    Exemplo 2.9.2 (Discreto). Seja E1 = {yi}i1 e E2 = {zj}j1. Se p : E1 E2 [0, 1] tal que para todo y E1 temos j p(y, zj) = 1, ento

    K(y, A) := jA

    p(y, zj) um ncleo de transio entre E1 e E2. (2.88)

    Nesse caso p(y, z) representa a probabilidade que a segunda coordenada seja z, se aprimeira y.

    Exerccio 2.9.3. Mostre que se E1 e E2 so enumerveis ento todo ncleo entre E1 eE2 pode ser escrito na forma do exemplo acima.

    Exemplo 2.9.4 (Absolutamente contnuo). Digamos que E1 e E2 sejam dotados demedidas 1 e 2 -finitas. Seja : E1 E2 R+ mensurvel e tal que para 1-quasetodo y E1, tenhamos que

    E2(y, z)2(dz) = 1. Ento

    K(y, A) :=

    A(y, z)2(dz) um ncleo de transio entre E1 e E2. (2.89)

    Note que K(, A) est bem definido para 2-quase todo ponto por Fubini.Exerccio 2.9.5. Prove que os dois exemplos acima de fato definem um ncleo.

    Tipicamente, definimos os ncleos de transio introduzindo K(y, ) comosendo uma medida que depende de y. Nesse caso, uma das condies para queK seja um ncleo est automaticamente satisfeita, restando apenas mostrar queK(, A) mensurvel para quaisquer A A2. Mas obviamente o conjunto A2pode ser muito complexo, ento gostaramos de apenas verificar que K(, A) mensurvel para os conjuntos A em uma classe rica o suficiente.

    Proposio 2.9.2. Seja K : E1 A2 [0, 1], tal que K(y, ) uma medida para todoy E1. Se K(, A) mensurvel para dodo A G, onde G um pi-sistema que geraA2, ento K um ncleo de transio.

    39

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    Demonstrao. Como de costume, vamos definir

    B = {B A2; K(, B) A1-mensurvel}. (2.90)Obviamente, como K(y, ) uma probabilidade, vale que

    a) B, pois a funo constante igual a um mensurvel.b) Se B B, ento Bc B, pois 1 f mensurvel se f o .c) E se B1, B2, B so disjuntos, ento i Bi B, pois a soma de funes

    mensurveis tambm mensurvel.

    A discusso acima mostra que B um -sistema que contm o pi-sistema G.Da, vemos pelo Teorema 1.3.3 queA2 = (G) B, provando a proposio.Exerccio 2.9.6. Seja K : RB(R) [0, 1] dada por K(y, ) = U[y1,y+1]. Mostreque K define um ncleo de transio.

    Apesar de interessante, a definio acima ainda no nos permitiu definirespaos de probabilidade novos. Isso ser possibilitado pelo prximo resultado,que pode ser visto como uma generalizao do Teorema de Fubini.

    Teorema 2.9.5 (Fubini para Ncleos de Transio). Dado um ncleo de transi-o K de (E1,A1) para (E2,A2) e uma probabilidade P1 em E1, existe uma nicaprobabilidade P em (E1 E2,A1 A2) tal que

    E1E2f dP =

    E1

    E2

    f (y, z)K(y, dz)P1(dy), (2.93)

    para toda f : E1 E2 R+. Em particular, P(A1 A2) =

    A1K(y, A2)P1(dy).

    Nesse caso escrevemos P = P1 ? K.

    Antes de iniciar a prova do teorema, vamos ver que as integrais do ladodireito de (2.93) esto bem definidas. Para isso, definimos para y E1 a funofatiadora y : E2 E1 E2 dada por y(z) = (y, z). Obviamente essa funo mensurvel, pois

    1(A1 A2) ={, se y 6 A1 eA2, se y A1.

    (2.94)

    Dessa forma, para definirmos

    f (y, z)K(y, dz), introduzimos fy : A2 R+dada por f (z) = f (y, z), que mensurvel pois fy = f y.

    Assim, gostaramos de integrar a funo y 7 fy(z)K(y, dz), que estobviamente bem definida. Porm resta a pergunta, ser que essa expressodefine uma funo mensurvel de y?

    Lema 2.9.6. Se K um ncleo de transio, ento para toda f : E1 E2 R+ queseja A1 A2 mensurvel, temos que g f : A1 R+ dada por

    g f (y) =

    fy(z)K(y, dz) (2.95)

    A1-mensurvel.

    40

  • 2.9. NCLEOS DE TRANSIO

    Demonstrao. Se f = 1A1A2 para Ai Ai, i = 1, 2, ento temos que g f (y) =K(y, A2)1A1 , que obviamente mensurvel pois K um ncleo.

    Definimos D = {B A1 A2; g1B A1-mensurvel}. fcil ver que D um -sistema que contm o pi-sistema dos retngulos, logo D = A1 A2.

    Acabamos de ver que g f mensurvel para toda f indicadora, donde omesmo vale para f simples por linearidade e para toda f positiva pelo Teo-rema da Convergncia Montona (lembre que limite de funes mensurveis mensurvel).

    Estamos prontos agora para fornecer a

    Demonstrao do Teorema 2.9.5. J sabemos que a integral do lado direito de(2.93) est bem definida (assumindo possivelmente o valor infinito). A uni-cidade vale obviamente pois a probabilidade de conjuntos do tipo A1 A2definem P de maneira inequvoca.

    S nos resta mostrar que

    P(B) =

    E1

    E21BK(y, dz)P1(dy), (2.96)

    nos define uma probabilidade em (E1 E2,A1 A2).De fato,

    a) obviamente P() =

    E1

    E2

    1K(y, dz)P1(dy) = 1 e

    b) se B1, B2, A1A2 so disjuntos, ento definimos f i = 1Bi e f = i f ie observamos o seguinte. A funo fatiadora fy igual a i f iy, donde

    P(B) =

    E1

    E2

    fy(z)K(y, dz)P1(dy)

    =

    E1

    i

    E2

    f iy(z)K(y, dz)P1(dy) =i

    P(B).(2.97)

    O que demonstra o teorema.

    Exerccio 2.9.7. Considere duas probabilidades Pi em (Ei,Ai) para i = 1, 2 e K :E1 A2 [0, 1] dado por K(y, A) = P2(A). Mostre que K ncleo e que P1 ? K =P1 P2. Relacione esse resultado ao Teorema de Fubini clssico para produtos demedidas.

    Exerccio 2.9.8. Considere o ncleo do Exemplo 2.9.1 e calcule:

    a) U[0,1] ? K[X2 = 1],

    b) P1 ? K[X2 = 1], onde dP1 = 2x dx e

    c) encontre a distribuio de X1 (U[0,1] ? K[ |X2 = 1]

    ). Interprete o resultado.

    41

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    Exerccio 2.9.9. Seja P = P1 ? K como acima e Q() = P[|X2 = 1]. Calcule[0,1]{0,1}

    X1 dQ (2.98)

    Exerccio 2.9.10. Para 0 a < b 1, definimos a probabilidade U[a,b] em ([0, 1],B([0, 1]))atravz da seguinte frmula U[a,b](B) = L(B [a, b])/(b a). Consideramos tam-bm a funo K : [0, 1]B([0, 1]) [0, 1] dada por K(x, ) = U[0,x](), se x > 0 eK(0, ) = 0().

    a) Mostre que K um ncleo de transio.

    b) Calcule U[0,1] ? K[X1 < 1/2] e U[0,1] ? K[X2 < 1/2], onde X1 e X2 so asprojees cannicas em [0, 1]2.

    c) Mostre que U[0,1] ?K absolutamente contnua com respeito medida de Lebesgueem [0, 1]2 e calcule sua densidade.

    Exerccio 2.9.11. Considere K : E1 A2 [0, 1] dada por K(p, ) = Exp(p).Mostre que K ncleo de transio e calcule U[0,1][X2 > 1] ? K.

    Exerccio 2.9.12. Se K um ncleo de transio entre E1 e E2 e {y} A1 satisfazP1({y}) > 0, mostre que

    P1 ? K[X2 |X1 = y] = K(y, ). (2.99)Ou em outras palavras, K nos d a distribuio condicional de X2 dado X1 = y.

    Posteriormente extenderemos o resultado acima para o caso P1({y}) = 0,mas isso demandar algum esforo.

    Vamos introduzir uma ltima notao com respeito a ncleos de transio.Muitas vezes, no estamos interessados na distribuio conjunta de P1 ? K emE1 E2, mas apenas na distribuio marginal da segunda coordenada. No nossoproblema da chuva por exemplo, talvez poderamos estar interessados apenasna probabilidade final de ocorrer um deslizamento. Nesse caso, convenienteescrever

    P1K := X2 (P1 ? K) = (P1 ? K)X2 . (2.100)Exerccio 2.9.13. Seja K : R+ B(R+) [0, 1] dada pela equao K(x, A) =

    A x exp{xt}dt.a) Prove que K um ncleo de transio.

    b) Seja P dada por P = K ? Exp(1). Obtenha P[X2 > x2] para todo x2 0(lembrando que X2 denota a segunda coordenada no espao produto onde estdefinida P). Compare a probabilidade acima com K(1, [x2,)).

    c) Mostre que P[X1 + X2 z] = z

    0 exp{x(z x + 1)}dx + exp{z}.

    42

  • 2.10. ESPAOS CANNICOS

    2.10 Espaos cannicos

    Em vrias reas da matemtica, existe um importante conceito de equivalnciaentre duas estruturas, como por exemplo: homeomorfismos, isometrias e iso-morfismos. Nessa seo estudaremos o caso anlogo para espaos mensurveis,que nos trar uma grande surpresa.

    Definio 2.10.1. Uma funo : E E entre dois espaos mensurveis ditabi-mensurvel quando uma bijeo mensurvel, com inversa mensurvel.

    Vamos agora tentar classificar os espaos a menos de bi-mensurabilidade.Descobriremos que na verdade os borelianos da reta incluem praticamente tudoque podemos estar interessados. Comeamos com a seguinte definio.

    Definio 2.10.2. Dizemos que o espao mensurvel (E,A) cannico se existe umafuno : E B bi-mensurvel para algum B B(R).

    Antes de mostrar que essa classe de espaos cannicos inclui muitssimosexemplos, vamos motivar a definio acima exemplificando como esse conceitopode ser utilizado.

    Teorema 2.10.3 (Extenso de Kolmogorov Extendida). Se E1, E2, . . . espaos men-surveis cannicos, ento o Teorema 2.6.4 (da extenso de Kolmogorov) tambm vlidono espao produto = E1 E2 . . . se a condio de consistncia (2.53) for vlidacom Ij substitudos por eventos da -lgebra de Ej.

    Demonstrao. Sejam i : Ei Bi B(R) bijees bi-mensurveis e definan : E1 En Rn por n(1, . . . ,n) =

    (1(1), . . . , n(n)

    ). Assim

    podemos introduzir as medidas de probabilidade

    Pn = n Pn, em Rn. (2.101)

    fcil verificar que as Pn so consistentes como em (2.53). Logo, existe P em(RN,F ) extendendo Pn.

    Vamos agora definir uma medida em iEi. Para tanto, primeiramentefixamos para cada i 1 um elemento arbitrrio wi de Ei e definimos i : R Eipor

    i(x) =

    {1(x), se x Bi ewi caso contrrio.

    Como Bi B(R), concluimos que i mensurvel.Finalmente, consideramos o mapa : RN dado por

    (x1, x2, . . . ) = (1(x1),2(x2), . . . ). (2.102)

    Resta mostrar que a medida P = P extende as probabilidades Pn. Observeque em concordncia com nossa notao, ns nunca denotamos inversas de

    43

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    funes por f1, deixando essa notao para pr-imagens.

    P(

    A1 AnEn+1 . . .)= P

    (1(A1 An En+1 . . . )

    )= P

    (11 (A1) 1n (An)R . . .

    )= Pn(11 (A1) 1n (An))= Pn

    (11

    (11 (A1)) 1n

    (1n (An)

    ))= Pn(A1 An),

    concluindo a prova do teorema.

    Uma ferramenta importante para construirmos espaos cannicos a se-guinte.

    Lema 2.10.4. Seja (E,A) um espao cannico e A A, ento A tambm cannicoquando dotado da -lgebra {A C; C A} induzida por A em A.Demonstrao. Seja : E B B(R) uma funo bi-mensurvel que mostraque E cannico. Consideramos : A R dada pela restrio de a A eprecisamos mostrar as seguintes afirmativas:

    a) injetiva

    b) mensurvel

    c) (A) mensurvel e

    d) a inversa : (A) A mensurvel.Vejamos,

    a) ser injetiva implica que tambm o .

    b) dado D B(R), 1(D) = A 1(D) {A C; C A}.c) denotando por : B E a inversa de , temos que (A) = 1(A) B(B) pois mensurvel e

    d) finalmente, se D B(A), ento 1(D) = 1(D) B(B), novamentepela mensurabilidade de .

    Concluindo portanto a bi-mensurabilidade de quando o seu contra-domnio restrito a sua imagem.

    A seguir daremos um exemplo de espao cannico que ser importante naseo seguinte.

    Lema 2.10.5. O espao produto E = NN . . . , dotado da -lgebra produto cannico.

    44

  • 2.10. ESPAOS CANNICOS

    Demonstrao. Primeiramente definimos em E a Mtrica de Hamming:

    dH(x, y) = i1

    12i+1

    1xi 6=yi . (2.103)

    Fica como exerccio mostrar que a -lgebra dos borelianos induzida por essamtrica coincide com a -lgebra produto em E. Definimos agora o mapa : E R dado por

    (n1, n2, . . . ) = 2n1 + 21n1n2 + + 2nni=1 ni + . . . (2.104)

    Tambm deixamos a cargo do leitor mostrar que define um homeomorfismoentre (E, dH) e um boreliano de R.

    2.10.1 Espaos poloneses

    Nessa seo mostraremos que todos espaos chamados poloneses so cannicos.

    Definio 2.10.6. Um espao mtrico (E, d) dito polons se separvel e completo.

    Exemplo 2.10.1.

    a) Todo espao enumervel pode ser feito em um espao mtrico polons de formaque a -lgebra de Borel seja P().

    b) Rn e C([0, 1]) so notoriamente poloneses.

    Exerccio 2.10.2. Se (Ei, di) so espaos mtricos poloneses para i = 1, 2, . . . , mostreque E = iEi com a mtrica

    d(x, y) =i

    12i+1

    di(xi, yi)1+ di(xi, yi)

    (2.105)

    tambm polons. Mostre tambm que a topologia induzida por essa mtrica equiva-lente topologia produto em E.

    Outros exemplos de espaos poloneses so dados pelo seguinte lema, quetambm ser til para provar o resultado principal desta seo.

    Lema 2.10.7. Seja (E, d) um espao polons e G, F E um aberto e um fechado de Erespectivamente. Ento, existe uma mtrica d em F G tal que

    a) d e d so equivalentes em F G (induzem a mesma noo de convergncia),b) d(x, y) d(x, y) para todo x, y F G ec) (F G, d) polons.

    45

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    Demonstrao. A primeira observao que faremos que F G separvel comrespeito a d. Isso segue do fato de separabilidade ser equivalente existncia deuma base enumervel.

    Vamos definir para x, y em G,

    d(x, y) = d(x, y) + 1d(x, Gc)

    1d(y, Gc)

    , (2.106)onde d(x, A) = inf{d(x, x); x A}.

    No difcil ver que com a definio acima (e deixamos como exerccio) que

    a) as mtricas d e d so equivalentes em G,

    b) F G separvel quando dotado da mtrica d,c) (F G, d) completo.

    Isso termina a prova do lema.

    Exemplo 2.10.3. Um importante exemplo dado por espaos produto. Sejam (Ei, di)espaos poloneses para i 1 e introduza em E = iEi a mtrica d definida em (2.105).Ento, se A1 E1, . . . , Ak Ek forem abertos, o retngulo R = A1 Ak Ek+1 . . . aberto. Dessa forma vemos que tanto R como Rc podem ser dotados demtricas com as quais se tornam espaos poloneses. Alm disso tais mtricas podem serescolhidas satisfazendo as hipteses do Lema 2.10.7

    O prximo lema o ingrediente chave para provarmos o resultado principaldessa seo. Ele nos d uma maneira de fatiar um espao polons em umapartio de espaos poloneses pequenos.

    Lema 2.10.8. Seja (E, d) um espao polons e r > 0. Ento existe uma partioA1, A2, . . . de A e mtricas d1, d2, . . . nesses respectivos subconjuntos de forma quepara todo i 1,

    a) (Ai, di) so espaos poloneses disjuntos,

    b) di e d so equivalentes em Ai e di d e finalmentec) o dimetro de Ai (com respeito a d) menor ou igual a r.

    Observe que alguns (possivelmente infinitos) Ai podem ser vazios.

    Demonstrao. Obtemos atravz da separabilidade de E, uma coleo de bolas(Bi)i1 com dimetros limitados por r e cobrindo E. Ento definimos

    A1 = B1, e An = Bn \n1i=0

    Bi para n 1. (2.107)

    Agora podemos dotar cada um dos Ai com a mtrica di obtida atravz doLema 2.10.7 (observe para tanto que os Ai so dados por intersees de umaberto com um fechado). As propriedades enunciadas no lema so trivialmentesatisfeitas.

    46

  • 2.10. ESPAOS CANNICOS

    Terminamos essa seo com esse importante resultado, que confirma nossaafirmao de que quase todos os espaos mensurveis que podemos nos inte-ressar so cannicos.

    Teorema 2.10.9. Todo sub-conjunto boreliano de espao polons (E, d) cannico.

    Demonstrao. Primeiramente, pelo Lema 2.10.4, basta mostrar que todo espaoE polons cannico. Pelo Lema 2.10.5 e novamente o Lema 2.10.4,

    basta construir uma funo bi-mensurvel : E B B(NN) (2.108)e depois comp-la com uma funo bi-mensurvel : B C B(R).

    Para comear, construiremos uma partio encaixada de E. Mais precisa-mente, defina os conjuntos Mn que sero utilizados como ndices

    Mn =Nn para n 1 e M = n Mn. (2.109)Vamos definir borelianos Am de E e mtricas dm em Am para cada m M.

    Faremos isso da seguinte forma:

    a) se m = i M1, ento definimos A1, A2, A3, . . . e d1, d2, d3, . . . como noLema 2.10.8 com r = 1,

    b) se (Am, dm) j foi definido para algum m Mn, ento utilizamos tambmo Lema 2.10.8 com r = 1/n para particionar o conjunto Am (com a mtricadm) em A(m,1), A(m,2), . . . com suas respectivas mtricas d(m,1), d(m,2), . . .

    Obviamente suporemos que so vlidas as propriedades de tais mtricas garan-tidas pelo Lema 2.10.8.

    Podemos desde j definir : E NN e para tanto, considere x E.Indutivamente

    a) como {Am}mM1 formam uma partio de E, definimos 1(x) como onico ndice tal que x A1(x),

    b) se j encontramos 1(x), . . . , n(x) tal que x A(1(x),...n(x)), ento o fatoque particionamos o ltimo conjunto na definio de Am, m Mn+1 nosgarante que podemos definir unicamente n+1(x) de forma a continuar ainduo.

    Da maneira acima j obtivemos (x) = (1(x), 2(x), . . . ). Para terminar, deve-mos mostrar que bi-mensurvel quando seu contra-domnio restrito suaimagem.

    Isso comea com a prova de que injetiva. Se (x) = (y), ento existeuma sequncia mn Mn tal que x, y Amn para todo n. Mas isso no possveldado que o dimetro de Amn+1 menor ou igual a 1/n na mtrica dmn d. Issomostra que x = y.

    Vejamos agora que mensurvel. Seja w NN tal que (x) = w etome G NN com G = {(w1, . . . , wl)} NN (esses conjuntos geram a -lgebra cannica emNN). Claramente, 1(G) = A(1(x),...,l(x)), de forma quemostramos que mensurvel.

    47

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    Para mostrar que sua inversa : (E) E mensurvel, veremos que ela de fato contnua com respeito Mtrica de Hamming definida em (2.103). Dadon 1, tomamos < 2n. Se w, w (E) so tais que dH(w, w) < emNN,ento wi = wi para todo i n, de forma que 1(w) e 1(w) pertencem aA(w1,...,wn). A continuidade de

    1 segue do fato que o dimetro de A(w1,...,wn) no mximo 1/n (com respeito a d(w1,...,wn) e portanto com respeito a d).

    Mas ateno, apesar de que parece que provamos o teorema, ainda faltamostrar que (E) mensurvel. Para tanto, afirmamos que

    (E) =NN \(

    k,w1,...,wk

    {w1} {wk} N . . .)

    , (2.110)

    onde a unio acima tomada sobre todos k 1 e w1, . . . , wk tais que Aw1,...,wk vazio. A igualdade acima ser mostrada no que segue.

    Dado w (E) existe x E tal que (x) = w. Como x Aw1,...,wn para todon 1, esses conjuntos no so vazios. Logo w no pertence unio em (2.110),mostrando o lado () da incluso. Finalmente, suponha que w = (w1, w2, . . . ) tal que para todo k 1, Aw1,...,wk 6= . Tomamos portanto para todo k 1 umponto xk Aw1,...,wk .

    Afirmamos que

    para todo n, (xk)kn Cauchy em (Aw1,...,wn , dw1,...,wn). (2.111)

    De fato, para todo k n, xk Aw1,...,wk (cujo dw1,...,wn -dimetro menor que1/k), logo xk uma sequncia de Cauchy em Aw1,...,wn com sua respectivadistncia. Tomamos x = limn xk com respeito distncia d e para terminar aprova do teorema, basta motrar que (x) = w, ou em outras palavras,

    x n Aw1,...,wn , para todo n 1. (2.112)Mas claramente

    a) x A = E eb) se x Aw1,...,wn , ento como xk Cauchy em Aw1,...,wn+1 , temos que xk

    converge a um certo x Aw1,...,wn+1 na mtrica dw1,...,wn+1 . Como essamtrica equivalente a tanto dw1,...,wn quanto d em Aw1,...,wn , temos quex = x Aw1,...,wn+1 .

    Isso conclui por induo a prova de (2.112) e consequentemente do teorema.

    48

  • TPICO: CADEIAS DE MARKOV

    Tpico: Cadeias de Markov

    Um exemplo de como usar ncleos de transio a construo de Cadeias deMarkov. Esse tipo de processo bastante til em diversas aplicaes, desde abiologia at a computao.

    Considere um espao mensurvel cannico fixo (E,A) e seja K um ncleo deE nele mesmo. Seria bastante intuitivo agora iterar K (j que ele est no mesmoespao) e obter uma medida em = i=1E com a -lgebra cannica.

    Para comear esse procedimento, seja 0 uma medida inicial em (E,A).Podemos ento definir 1 = 0 ?K o que o primeiro passo da nossa construo,porm observe que no podemos escrever 2 = 1 ? K, pois 1 ? K umamedida em (E2,A2). Vamos com calma ento.

    Observe que

    1(A0 A1) =

    A0

    A1

    K(x0, dx1)0(dx0), (2.113)

    ou em outras palavras o valor de x0 determina a distribuio de x1. Gostaramosagora que x1 determinasse a distribuio de x2 via K, como por exemplo assim

    2(A0 A1 A2) =

    A0

    A1

    A2

    K(x1, dx2)K(x0, dx1)0(dx0). (2.114)

    Mas essa notao fica bastante carregada medida que iteramos.Para tornar essa notao mais simples, definimos a projeo n : En E

    por n(x0, . . . , xn1) = xn1. Tambm precisamos de Kn : En A [0, 1] dadopor

    Kn(~x, A) = K(n(~x), A

    ) (= K(xn1), A)

    ). (2.115)

    O fato de Kn ser um ncleo de transio segue imediatamente dessa propriedadepara K.

    Note que, nessa notao, estamos dizendo que para irmos de En para En+1

    iremos olhar apenas para a ltima coordenada, na qual aplicaremos o ncleoK. Isso o ponto mais importante que caracteriza uma Cadeia de Markov: adistribuio do estado futuro da cadeia depende apenas do estado atual e nodo passado. Em alguns contextos essa propriedade chamada de ausncia dememria.

    Podemos finalmente definir

    n+1 = n ? Kn, para todo n 1. (2.116)

    Mas resta a questo sobre a existncia de uma que ser respondida comajuda do prximo resultado.

    Lema 2.10.10. As probabilidades n definidas em (2.116) so compatveis, mais preci-samente n+1(A E) = n(A) para todo A An.

    49

  • CAPTULO 2. CONSTRUO DE ESPAOS DE PROBABILIDADE

    Demonstrao. Basta observar que

    n+1(A E) = n ? K(A E) =

    AKn(~x, E)

    1

    n(d~x) = n(A). (2.117)

    Provando o lema.

    Logo, o Teorema da Extenso de Kolmogorov (lembre que (E,A) foi supostocannico) nos fornece uma nica P em (,F ) tal que

    (X0, . . . , Xn) P = n, para todo n 0. (2.118)Lembramos que Xi denotam as projees cannicas em =

    i=1E.

    Chamamos o processo X1, X2, . . . sob a lei P da Cadeia de Markov comdistribuio inicial 0 e ncleo de transio K.

    Exemplo 2.10.4. Suponha que E seja enumervel. Nesse caso recordamos do Exem-plo 2.9.2 que o ncleo pode ser representado por uma matriz

    (p(x, y)

    )x,yE que nos

    retorna a probabilidade de saltar de x a y. Alm disso, a distribuio inicial 0 determinada por P({x}) = p0(x), para alguma sequncia

    (p0(x)

    )xE.

    Exerccio 2.10.5. Mostre que no exemplo acima temos

    P(X0 = x0, . . . , Xn = xn) = p0(x0)p(x0, x1) . . . p(xn1, xn). (2.119)

    Exerccio 2.10.6. Defina K : R2 B(R2) [0, 1] dada porK(x, A) = US1(A x). (2.120)

    Nesse contexto,

    a) mostre que K um ncleo de transio e,

    b) considerando a cadeia com distribuio inicial 0 = 0 em R2 e ncleo K, mostreque X2 tem distribuio absolutamente contnua com respeito a Lebesgue e calculesua densidade.

    Exerccio 2.10.7. Mostre que para qualquer ncleo de transio K entre E e E, existeum ncleo de transio K entre E e = i=1, tal que para toda medida inicial 0,temos que 0 ? K a distribuio de uma Cadeia de Markov comeando de 0 e comtransio dada por K. Esse ncleo til se quisermos mudar a distribuio inicial 0 euma notao bastante comum para esse ncleo Px() = K(x, ).

    Vamos terminar essa seo dando uma interpretao bastante interessantepara os ncleos de transio em analogia lgebra linear. Fixe um ncleo detransio K entre E e E, uma medida inicial e uma funo limitada f : E R.Relembre a notao em (2.100) e defina K f : E R dada por

    K f (x) :=

    f (y)K(x, dy), (2.121)

    50

  • TPICO: CADEIAS DE MARKOV

    que obviamente limitada e j vimos ser mensurvel no Teorema de Fubini.Ento temos dois operadores definidos para ncleos, a multiplicao

    esquerda por uma medida em E (K que tambm uma medida em E) e amultiplicao direita por uma funo limitada e mensurvel (K f que tambm uma funo limitada e mensurvel). Podemos pensar em f como um vetorcoluna e como um vetor linha, nesse caso K faria o papel de uma matriz. Essaanalogia real se E for um espao enumervel.

    Exerccio 2.10.8. No contexto de cadeias de