16
Aprendizagem de m´ aquina Fabr´ ıcio Jailson Barth Mar¸co de 2013

Fabr cio Jailson Barth

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Fabr cio Jailson Barth

Aprendizagem de maquina

Fabrıcio Jailson Barth

Marco de 2013

Page 2: Fabr cio Jailson Barth

Sumario

• O que e Aprendizagem de Maquina?

• Hierarquia de aprendizado.

• Exemplos de aprendizagem supervisionada (modelos

preditivos).

• Exemplos de aprendizagem nao supervisionada

(modelos descritivos).

• Referencias e exercıcios.

Aprendizagem de maquina — Sumario 2

Page 3: Fabr cio Jailson Barth

Contexto e exemplos

• Data Mining: grandes bases de dados tem crescido

com a automatizacao de alguns processos e com o

advento da Web, por exemplo: web click data,

registros medicos, dados biologicos, dados capturados

a partir de sensores.

• Aplicacoes que nao podem ser programadas “na

mao”: por exemplo, helicopteros autonomos,

reconhecedor de escrita, processadores de linguagem

natural e sistemas de visao computacional.

• Aplicacoes personalizaveis: Amazon, Netflix.

• Compreensao do aprendizado humano.

Aprendizagem de maquina — Contexto e exemplos 3

Page 4: Fabr cio Jailson Barth

O que e Aprendizagem de Maquina?

• Area de estudo que fornece aos computadores a

habilidade de aprender sem serem explicitamente

programados [Arthur Samuel (1959)].

• Definicao bem formada: A computer program is said

to learn from experience A with respect to some task

T and some performance measure P, if its performance

on T, as measured by P, improves with experience E

[Tom Mitchell (1998)].

Aprendizagem de maquina — O que e Aprendizagem de Maquina? 4

Page 5: Fabr cio Jailson Barth

Exercıcio

O que cada uma das sentencas abaixo descreve segundo a

definicao do Tom Mitchell?

• Classificar e-mails como spam ou nao spam.

• Verificar quais e-mails o usuario classifica como spam.

• O numero (ou fracao) de e-mails corretamente

classificados como spam ou nao spam.

Aprendizagem de maquina — Exercıcio 5

Page 6: Fabr cio Jailson Barth

Hierarquia de aprendizado

Classificação Regressão

Supervisionada

Modelos preditivos

AssociaçãoSumarização Agrupamento

Não supervisionada

Modelos descritivos

Aprendizagem

Aprendizagem de maquina — Hierarquia de aprendizado 6

Page 7: Fabr cio Jailson Barth

Exemplos de aprendizagem supervisionada

• Estimar o preco de uma casa.

? atributos: tamanho, posicao geografica, material.

? classe: preco (regressao).

• Determinar se uma pessoa tem cancer benigno ou

maligno.

? atributos: tamanho do tumor, formato do tumor,

idade do paciente.

? classe: tumor benigno ou tumor maligno

(classificacao).

Aprendizagem de maquina — Exemplos de aprendizagem supervisionada 7

Page 8: Fabr cio Jailson Barth

• Determinar se e um texto publicado em uma rede

social e inadequado ou nao.

? atributos: quantidade de palavras encontradas no

texto, quantidade de palavras proibidas

encontradas no texto, quantidade de textos ja

criados pelo usuario, idade do usuario no sistema,

quantidade de textos criados pelo usuario e

moderados, ...

? classe: texto adequado ou nao (classificacao).

? classes: texto adequado, texto inadequado, texto

com propaganda (classificacao com multiplas

classes).

Aprendizagem de maquina — Exemplos de aprendizagem supervisionada 8

Page 9: Fabr cio Jailson Barth

Exemplo de dataset com classe

Idade Miopia Astigmat. Lacrimej. Lentes

jovem mıope nao reduzido nenhuma

jovem mıope nao normal fraca

jovem mıope sim reduzido nenhuma

jovem mıope sim normal forte

· · · · · · · · · · · · · · ·

adulto mıope nao reduzido nenhuma

Aprendizagem de maquina — Exemplo de dataset com classe 9

Page 10: Fabr cio Jailson Barth

Exercıcios

Que problema deve ser tratado como problema de

regressao e que problema deve ser tratado como problema

de classificacao?

• A sua empresa possui 1.000 itens identicos em

estoque. Voce quer predizer quantos destes itens serao

vendidos nos proximos tres meses.

• Voce quer examinar clientes seus e para cada um

decidir se ele ira pagar todo o financiamento ou nao.

Aprendizagem de maquina — Exercıcios 10

Page 11: Fabr cio Jailson Barth

Exemplos de aprendizagem naosupervisionada

• Dado conjuntos de itens adquiridos na mesma compra,

identificar padroes de compra.

• Identificar padroes de navegacao em sites.

• Agrupar notıcias semelhantes publicadas por varias

fontes de informacao.

• Numa rede social, identificar sub-grupo de pessoas.

Aprendizagem de maquina — Exemplos de aprendizagem nao supervisionada 11

Page 12: Fabr cio Jailson Barth

Exemplos de aprendizagem naosupervisionada

Table 1: Exemplo de tabela com as transacoes dos usuarios

usuario categoria1 categoria2 categoria3 · · · categoriam

user1 0 2 0 · · · 1

user2 1 1 0 · · · 0

user3 2 0 1 · · · 0

user4 0 1 0 · · · 0

· · · · · · · · · · · · · · · · · ·usern 1 1 0 · · · 1

Aprendizagem de maquina — Exemplos de aprendizagem nao supervisionada 12

Page 13: Fabr cio Jailson Barth

Exemplo de identificacao de grupos emredes sociais

Aprendizagem de maquina — Exemplo de identificacao de grupos em redes sociais 13

Page 14: Fabr cio Jailson Barth

Exercıcios

Quais dos problemas abaixo voce iria resolver com uma

abordagem nao supervisionada de aprendizagem?

• Dado e-mails rotulados como spam e nao spam,

desenvolver um filtro de spam.

• Dado um conjunto de notıcias encontradas na

Internet, agrupa-las em conjunto de notıcias que

tratam do mesmo assunto.

Aprendizagem de maquina — Exercıcios 14

Page 15: Fabr cio Jailson Barth

• Dado uma base de clientes, descobrir segmentos de

clientes.

• Dado uma base de pacientes diagnosticados com

diabetes ou nao, aprender a classificar novos pacientes

com diabetes ou nao.

Aprendizagem de maquina — Exercıcios 15

Page 16: Fabr cio Jailson Barth

Material de consulta

• Tom Mitchell. Machine Learning, 1997.

• Iah H. Witteh and Eibe Frank. Data Mining: Practical

Machine Learning Tools and Techniques (Third

Edition), 2011.

• Andrew Ng. http://www.ml-class.org

• Faceli, Lorena, Gama, Carvalho. Inteligencia Artificial:

uma abordagem de aprendizado de maquina, 2011.

Aprendizagem de maquina — Material de consulta 16