94
Redes Neurais Prof. Aurora Pozo Obs: slides baseados em Prof. Marcílio Souto e Prof. Marley Vellasco

Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

  • Upload
    vandung

  • View
    215

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Redes Neurais

Prof. Aurora PozoObs: slides baseados em

Prof. Marcílio Souto e Prof. Marley Vellasco

Page 2: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

CONTEÚDO

• Introdução– Motivação, Objetivo, Definição, Características Básicas

e Histórico

• Conceitos Básicos– Neurônio Artificial, Modos de Interconexão

• Processamento Neural– Recall e Learning

• Regras de Aprendizado– Regra de Hebb, Perceptron, Back Propagation,

Hopfield e Competitive Learning

2

Page 3: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

MOTIVAÇÃO

3

Page 4: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

4

Page 5: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

5

Page 6: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Objetivo

• Estudar a teoria e a implementação de sistemas massivamente paralelos, que possam processar informação com eficiência comparável ao cérebro.

6

Page 7: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Definição

• Redes Neurais Artificiais são sistemas inspirados nos neurônios biológicos e na estrutura massivamente paralela do cérebro, com capacidade de adquirir, armazenar e utilizar conhecimento experimental.

7

Page 8: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

8

Page 9: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

9

Page 10: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Características Básicas

• Devido à similaridade com a estrutura do cérebro, as Redes Neurais exibem características similares ao do comportamento humano, tais como:

10

Page 11: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Características Básicas

• Procura Paralela e Endereçamento pelo Conteúdo:

O cérebro não possui endereço de memória enão procura a informação seqüencialmente

11

Page 12: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Aprendizado

• A rede aprende por experiência, não necessitando explicitar os algoritmos para executar uma determinada tarefa

12

Page 13: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

13

Page 14: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

14

Page 15: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

15

Page 16: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Características Básicas

• Robustez e Degradação Gradual:

A perda de um conjunto de elementos processadores não causa o mal funcionamento da rede neural

16

Page 17: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

17

Page 18: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

18

Page 19: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

HISTÓRICO

• McCulloch & Pitts (1943):– modelo computacional para o neurônio artificial. Não possuía

capacidade de aprendizado

• Hebb (1949):– modelo de aprendizado (Hebbian Learning Rule)

• Rosenblatt (1957):– Perceptron, com grande sucesso em certas aplicações e

problemas em outras aparentemente similares

• Minsly & Papert ( Perceptrons 1969):– prova matemática de que as redes Perceptron são incapazes de

solucionar problemas simples tipo OU-EXCLUSIVO

• Rumelhart (início da década de 80):– novos modelos que superaram os problemas dos Perceptrons.

19

Page 20: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

CONCEITOS BÁSICOS

• Neurônio Artificial

– (Elemento Processador)

• Estruturas de Interconexão

– FeedForward de 1 camada

– FeedForward de Múltiplas Camadas

– Recorrente (com realimentação)

20

Page 21: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Elemento Processador

21

Page 22: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

22

Page 23: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

23

Page 24: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

24

Page 25: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

25

Page 26: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

26

Page 27: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

27

Page 28: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

28

Page 29: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

CONCEITOS BÁSICOS

• Neurônio Artificial

– (Elemento Processador)

• Estruturas de Interconexão

– FeedForward de 1 camada

– FeedForward de Múltiplas Camadas

– Recorrente (com realimentação)

29

Page 30: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Topologias das Redes

• Neurais

• Redes Feed-Forward:

– redes de uma ou mais camadas de processadores, cujo fluxo de dados é sempre em uma única direção, isto é, não existe realimentação.

• Redes Recorrentes:

– redes com conexões entre processadores da mesma camada e/ou com processadores das camadas anteriores (realimentação).

30

Page 31: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Redes Feed-Forward

31

Page 32: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Redes Recorrentes

32

Page 33: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Processamento Neural

33

O processamento de uma Rede Neural

pode ser dividido em duas fases:

Page 34: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Recuperação de Dados

• Assumindo que um conjunto de padrões tenha sido armazenado, a Rede Neural pode executar as seguintes tarefas:

34

Page 35: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

35

Page 36: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

36

Page 37: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

37

Page 38: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

38

Page 39: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

39

Page 40: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

40

Page 41: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

41

Page 42: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

42

Page 43: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

43

Page 44: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

44

Page 45: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

45

Page 46: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

46

Page 47: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

47

Page 48: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

48

Page 49: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

49

Page 50: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

50

Page 51: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

51

Page 52: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

52

Page 53: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

53

Page 54: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

54

Page 55: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

55

Page 56: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

56

Page 57: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

57

Page 58: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

58

Page 59: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Redes Neurais Artificiais

Perceptrons e Adalines

Page 60: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Unidades de Processamento

• Função: receber entradas, computar função sobre entradas e enviar resultado para as unidades seguintes

• Entrada total

60

u x wj jj

N

1

f (xw)

x1

x2

xN

y

w1

w2

wN

f (u)

Page 61: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Funções de ativação

• Funções de ativação mais comuns

– a(t ) = u(t) (linear)

– a(t ) =

– a(t ) = 1/(1 + e- u(t)) (sigmoide logística)

– a(t) = (1 - e-u(t)) (tangente hiperbólica)

(1 +e-u(t))

61

1 , se u(t)

0, se u(t) (threshold ou

limiar)

Page 62: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Função linear

62

F[u(t)]

u(t)

F[u(t)] = u(t)

Page 63: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Função limiar unipolar

63

u(t)

F[u(t)] =0, se u(t)

1, se u(t)

F[u(t)]

Page 64: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Função limiar bipolar

64

F[u(t)]

u(t)

F[u(t)] = sinal [u(t)]

Page 65: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Função piecewise linear

65

F[u(t)]

u(t)

F[u(t)] =

-1, se u(t) -

+1, se u(t) >

- u(t)

1

-1

Page 66: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Função sigmoide logística (bipolar)

66

F[u(t)]

F[u(t)] = 1/(1 + e- u(t)

)

1

Função de limiar diferenciável

Page 67: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Função sigmoid bipolar

67

F[u(t)]

+1

-1

Função de limiar diferenciável

F[u(t)] =(1 +e

-u(t))

(1 - e-u(t)

)

Page 68: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Função Gaussiana

68

F[u(t)]

u(t)

F[u(t)] = e

-(x-xm)2

[ ]

Page 69: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Perceptrons e Adalines

Regras Simples de Aprendizado

Page 70: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Perceptrons e Adalines

• Redes de uma única camada

– Unidades Lineares com Threshold (TLUs)• Perceptron => Rosenblatt, 1958

– Unidades Lineares (ULs)• Adaline => Widrow e Hoff, 1960

• Problemas de classificação

– Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto?

70

Page 71: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

TLU - Threshold Linear Unit

71

y =0, se a

1, se a

a x wii

N

i

1

Page 72: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Algoritmo de aprendizado do Perceptron (1/2)

1. Inicializar e o vetor de pesos w

2. Repetir

– Para cada par do conjunto de treinamento (x,t)

– Atualizar o vetor de pesos para cada um dos nós darede segundo a regra wi(t+1)= wi(t) + (t - o)xi

3. Até o=t para todos os vetores

72

Page 73: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Algoritmo de aprendizado do Perceptron (2/2)

• Teorema da convergência (Minsky e Papert, 1969)

– O algoritmo converge dentro de um número finito de passos para um vetor de pesos que classifica corretamente todo o conjunto de treinamento

• Dado que o conjunto de treinamento é linearmente separável

73

Page 74: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Gradiente Descendente e a Regra Delta

• Widrow e Hoff (1960) para Adalines

• Uso do gradiente descendente para buscar o vetor de pesos que melhor se ajuste ao conjunto de treinamento

– Independentemente do conjunto de treinamento ser linearmente separável

74

Page 75: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Regra Delta

• Considere a tarefa de treinar um perceptron sem limiar (unthresholded), i.e., uma Unidade Linear (UL):

– y=w.x (1)

• Especifique uma medida de erro (função de custo) para o treinamento

– E(w)=1/2 dD (td - od)2 (2)

75

Page 76: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Função de Custo (1/2)

• E(w)=1/2 dD (td - od)2 , em que

– D é o conjunto de treinamento

– td é a saída desejada para o exemplo d

– od é a saída da UL para o exemplo d

• Caracterizamos E como uma função dos pesos w e não da saída linear o

– o=w.x

– D é fixo durante o treinamento

76

Page 77: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Função de Custo (2/2)

77

Page 78: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Minimização do custo (1/3)

• A função E é uma medidade objetiva do erro preditivo para uma escolha especifíca de vetor de pesos

• Objetivo: encontrar um vetor w que minimize E

• Solução: usar técnicas de gradiente descendente

78

Page 79: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Minimização do custo (2/3)

1. Escolha valores iniciais arbitrários para os pesos

2. Calcule o gradiente da função de custo com respeito a cada peso

3. Mude os pesos tal que haja um deslocamento pequeno na direção de –G

-G => Maior taxa de diminuição do erro

1. Repita passos 2 e 3 até que erro se aproxime de zero

Como este algoritmo funciona?

79

Page 80: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Minimização do custo (3/3)

• Uma busca basedada no gradiente descente determina o vetor de peso que minimiza E, começando com um vetor arbitrario inicial

• Modique o vetor repetidamente, em passos pequenos

• Em cada paso, o vetor é alterado na direção que produz a descida mais acentuada (steepest descent) ao longo da superfíie do erro

• Continue até que um mínimo global seja encontrado

80

Page 81: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Derivação da regra do gradiente descendente (1/3)

• Como podemos calcular a direção da descida mais acentuada ao longo da superfície do erro?

– Calcule a derivada de E com respeito a cada componente do vetor w

– Gradiente E com respeito wE(w) [E/w0 , E/w1 , ..., E/w0 ] (3)

• Vetor de derivadas parciais

• Especifica a direção que produz o aumento mais acentuado em E

81

Page 82: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Derivação da regra do gradiente descendente (2/3)

• Visto que o gradiente especifica a direção de maior crescimento de E, a regra do gradiente é:

– w w + w, onde

– w = -E(w) (4), onde

• é uma constante positiva - taxa de aprendizado

• O sinal negativo força o deslocamento do vetor de peso na direção que E decresce

– wi (t+1) wi(t) + wi

– wi = - (E/wi) (5)

82

Page 83: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Derivação da regra do gradiente descendente (3/3)

– O vetor de derivadas E/wi que forma o gradiente pode ser obtido derivando E:

– E/wi = /wi 1/2 dD (td - od)2

– = 1/2 dD /wi (td - od)2

– = 1/2 dD 2 (td - od) /wi (td - od)

– = dD (td - od) /wi (td - w.xd)

– E/wi = dD (td - od)(-xid) (6), onde

• xid denot um único componente de entrada xi do exemplo de treinamento d

– wi (t+1) wi (t) + (td - od)xi (6) em (5) (7)

83

Page 84: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Algoritmo de Widrow e Hoff

• Inicializar e o vetor de pesos w

• Repetir

• Inicializar wi com zero

• Para cada par do conjunto de treinamento (x,t)

– Calcule a saída o

– Para cada peso wi das LUs

• Calcule wi wi + (t - o)xi

• Para cada peso wi das LUs

– wi wi + wi

• Até que uma condição de término seja satisfeita

84

Page 85: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Observações (1/2)

• A estratégia do gradiente descendente pode ser aplicada sempre que:

1. O espaço de hipóteses contém hipóteses parametrizadas contínuas (e.g. os pesos wde uma LU)

2. O erro pode ser diferenciável com relação a estes parâmetros das hipóteses

85

Page 86: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Observações (2/2)

• Dificuldades prática da estratégia do gradiente descendente:

1. Convergência para um mínimo local pode ser muita lenta (várias iterações)

2. Se existir vários mínimos locais na superfície de erro, não haverá garantia que o algoritmo encontrará o mínimo

86

Page 87: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Aproximação estocástica

• Gradiente descendente incremental ou gradiente descendente estocástico

– Aproxima a busca do gradiente descendente atualizando os pesos a cada exemplo individual

• wi = (t - o)xi

87

Page 88: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Gradiente descendente estocástico

• Inicializar e o vetor de pesos w

• Repetir

• Inicializar wi com zero

• Para cada par do conjunto de treinamento (x,t)

– Calcule a saída o

– Para cada peso wi das LUs

• Calcule wi wi + (t - o)xi

• {Para cada peso wi das Lus wi wi + wi }

• Até que uma condição de término seja satisfeita

88

Page 89: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Gradiente descendente Padrão X Estocástico

• O erro de cada exemplo é acumulado antes da atualização dos pesos X Os pesos são atualizados após a apresentação de cada exemplo

• O gradiente padrão requer mais computação por cada passo de atualização dos pesos

– Um taxa maior de aprendizagem pode ser utilizada

• Em problemas com vários mínimos locais, o gradiente estocástico pode evitar a queda em um desses mínimos

89

Page 90: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Perceptrons/Adalines (1/2)

• Poder Computacional

– Representam uma superfície de decisão através de um hiperplano

• o=1 para exemplos situados em um lado

• o=0 para exemplos situados no outro lado

• Exemplos linearmente separáveis

– Apenas funções linearmente separáveis (Minsky e Papert, 1969)

90

Page 91: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Perceptrons/Adalines (2/2)

• Poder Computacional

– Podem representar todas as funções Booleanas primitivas (AND, OR, NAND e NOR)

• Não podem representar o XOR

– Qualquer função booleana pode ser representada por um perceptron de duas camadas

• Forma normal disjuntiva

• Regressão Linear

91

Page 92: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Regra do Perceptron xRegra Delta (1/3)

• Atualização dos pesos

1. baseada no erro da saída da rede após a aplicação do limiar (thresholded output)

2. baseada no erro da saída da rede sem a aplicação do limiar (unthresholded output)

92

Page 93: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Regra do Perceptron xRegra Delta (2/3)

• Convergência

1. Converge dentro de um número finito de passos para um vetor de pesos que classifica corretamente todo o conjunto de treinamento

– Dado que o conjunto de treinamento seja linearmente separável

93

Page 94: Nondestructive Testing – Emergent Technologies - inf.ufpr.br · –Dado um conjunto pré-especificado de entradas, uma certa entrada pertence ou não a este conjunto? 70. TLU -

Regra do Perceptron x Regra Delta (3/3)

• Convergência

1. Converge apenas assintoticamente para um vetor de pesos com um erro mínimo, possivelmente requererendo um número ilimitado de pasos

• Independentemente de o conjunto de treinamento ser linearmente separável

94