Machine Learning
Conceitos sobre aprendizagem de Máquina
A ideia
Problema Solução
Perguntas Respostas
Concept
Machine Learning (Aprendizado de Máquina) é uma área de
IA cujo objetivo é o desenvolvimento de técnicas
computacionais sobre o aprendizado bem como a construção
de sistemas capazes de adquirir conhecimento de forma
automática.
Um sistema de aprendizado é um programa de computador
que toma decisões baseado em experiências acumuladas
através da solução bem sucedida de problemas anteriores.
Definição
É a área de estudo que dá aos computadores a capacidade de
aprender sem serem explicitamente programados.
Diz-se que é um problema de Machine Learning quando:
Um programa de computador (P) aprende a partir da experiência
(E) na realização de uma determinada tarefa (T) e com uma
determinada medida de performance (Pe).
Se sua Pe aumenta na realização de T, aumenta E.
A inferência indutiva
A indução é a forma de inferência lógica que permite obter conclusões genéricas sobre um conjunto particular de
exemplos.
Na indução, um conceito é aprendido efetuando-se inferência indutiva sobre os exemplos apresentados.
Portanto, as hipóteses geradas através da inferência indutiva podem ou não preservar a verdade.
Arquimedes KeplerDarwin
Formas de Aprendizado Indutivo
• SUPERVISIONADO
No aprendizado supervisionado é fornecido ao algoritmo de aprendizado, ou indutor, um conjunto de
exemplos de treinamento para os quais o rótulo da classe associada é conhecido.
• NÃO SUPERVISIONADO
No aprendizado não-supervisionado, o indutor analisa os exemplos fornecidos e tenta
determinar se alguns deles podem ser agrupados de alguma maneira, formando
agrupamentos ou clusters
Fluxograma
Aprendizado
Indutivo
Aprendizado
Supervisionado
Classificação Regressão
Aprendizado
Não
Supervisionado
SUPERVISIONADO
Requisitos:
Deve haver dados de treino. Todos os algoritmos supervisionados devem ser “treinados” com dados previamente
separados para esse fim.
• Regressão Logística: Faz previsão de dados contínuos (Preços, quantidades, temperaturas, etc)
• Classificação: Faz previsão de dados discretos. (Verificar spam, operações fraudulentas online, tipo de imagem, etc)
Não Supervisionado
Deixamos o computador aprender por si.
Através de um conjuntos de dados, o algoritmo deve ser capaz de identificar clusters (grupos distintos)
Ex. Agrupar notícias sobre o mesmo assunto
Modelos
Exemplos
Regressão Logística
Prever o valor de venda de casas, sabendo o tamanho em m², o número de quartos e a respectiva idade.
Classificação
Detecção de SPAM. Analisa-se e-mails e classifica-os como sendo spam ou não
Detecção de Anomalias/Fraudes: Analisa os indicadores de um equipamento e classifica-o como tendo uma
anomalia ou não. Analisa o comportamento do utilizador num website e classifica a possibilidade de atividade
fraudulenta.
Exemplos
Não supervisionado
• Catalogar e agrupar automaticamente fotos sobre o mesmo tema
• Identificar segmentos do mercado através de elementos recolhidos do perfil dos consumidores e do tipo de
consumo, para fazer promoções ou publicidade dirigida.
Algoritmos
A fim de retornar os melhores resultados, os algoritmos
desempenha uma função crucial para isso.
Ainda que AM seja uma ferramenta poderosa para a
aquisição automática de conhecimento, deve ser
observado que não existe um único algoritmo que
apresente o melhor desempenho para todos os
problemas.
Algoritmos
Escolha a vontade!!!
• K-means clustering
• Cobweb clustering
• DBScan
• Single-linkage clustering
• Neighbor joining
• Self-organizing maps
• Etc.....
Coeficiente de Linearidade
Regressão Linear
Investimento Lucro Tendência
30 430
21 335
35 520
42 490
37 470
20 210
8 195
17 270
35 400
25 480
Média 380
Investimento X Lucro
y = 9.7381x + 117.07
R² = 0.7385
0
100
200
300
400
500
600
0 5 10 15 20 25 30 35 40 45
Regressão Linear
Investimento Lucro Tendência
30 430 409,213
21 335 321,5701
35 520 457,9035
42 490 526,0702
37 470 477,3797
20 210 311,832
8 195 194,9748
17 270 282,6177
35 400 457,9035
25 480 360,5225
Média 380 379,9987
Investimento X Lucro
y = 9.7381x + 117.07
R² = 0.7385
0
100
200
300
400
500
600
0 5 10 15 20 25 30 35 40 45
Vídeo - Watson
CLIQUE NA IMAGEM PARA ASSISTIR AO VÍDEO
ou acesse: https://www.youtube.com/watch?v=Zct7M5j3Bls
Estudo de Caso
Cursos online:
Pergunta: Qual aluno desistirá antes de
concluir o curso?
Hipóteses de desistência:
O aluno está:
1. Desmotivado
2. Desiludido
3. Decepcionado
4. Contente ....
Questionamentos e agrupamentos
O que posso fazer para evitar que o aluno desista?
Alunos = []
Alunos << [12, 150, 3, 15]
Alunos << [4, 170,12, 25]
Alunos << [1, 10, 3, 25]
Alunos << [ 12, 20, 31, 15]
Labels = [1, 1, 0, 0]
Juremo = [6, 140, 25, 10]
Model.predict(Node.feature(Juremo))
MeetUp
Café com DadosAté a próxima
http://www.alfaconcursos.com.br/cafe-com-dados
Saiba mais sobre o Café Com Dados