Upload
leandro-de-castro
View
93
Download
0
Embed Size (px)
Citation preview
Persona Virtual:O que as Mídias Sociais podem revelar
sobre o comportamento humano
Leandro Nunes de [email protected], @lndecastro
Faculdade de Computação e Informática &
Programa de Pós-Graduação em Engenharia Elétrica e Computação
Laboratório de Computação Natural e Aprendizagem de Máquina (LCoN)
www.mackenzie.br/lcon.html
1
• Introdução: Mídias Sociais e a Análise de Dados Não Estruturados
• PARTE 1: ESTUDOS DE CASO– Estudo de Caso 01: A Importância das Reclamações Sociais
– Estudo de Caso 02: Análise de Sentimento em Tweets
– Estudo de Caso 03: Recomendação em Comércio Eletrônico
– Estudo de Caso 04: A TV Social
• PARTE 2: ASPECTOS PSICOLÓGICOS– A Tríade da Persona Virtual
– Análise de Sentimento: Polaridade e Estados Emocionais
– Predição de Personalidade
– Predição de Perfil Psicológico e Temperamento
2
Agenda
Artificial ImmuneSystems: A New ComputationalIntelligenceApproach
A NATCOMP + Fundamentals of Natural Computing: Basic Concepts, Algorithms andApplications
LCoN (laboratório de Computação Natural), Mackenzie
TUILUX (Recomendação para E-commerce)
TTV (TV Social)
Uma Breve História no Tempo
1998-2002
2006-2009
2009-hoje
2010-2012
2012-2014
2016
NATSOFT
4
1980-2000Web 1.0
Infraestrutura:- Comunicação- Compartilhamentode dados- Informações estáticas
2000-2008Web 2.0
- SaaS- Colaboratividade- Escalabilidade- Fontes convergentes e mutáveis- Múltiplos dispositivos
2009-20…Web 3.0
- Personalização- Analytics- IoT- Automação- Inteligência- Big Data
Big Data
Dados(4 V’s)
Infraestrutura de Software
Infraestrutura de Hardware
5
Armazenagem e Processamento
Modelagem e Analytics
VelocidadeVariedadeVolumeVeracidade
HumanaNegócios Ciência
6
7
Dados Estruturados Dados Não Estruturados
8
O Processo de Análise de Dados Não Estruturados
• Extração de características• Preparação de dados• Processamento de sinais
• Associação• Classificação • Agrupamento• Detecção de anomalias
• APIs• Crawlers• Câmeras • Gravadores• Sensores
• Especialistas de domínio• Medidas de avaliação• Benchmarking
Estudo de Caso 01A Importância das Reclamações Sociais
Dados do Reclame Aqui
Panorama Geral do Setor de Construção Civil
7%
30%
19%
24%
20%
Status das Reclamações
Nao Respondido
Respondido
Replicas
Finalizada - Resolvido
Média Geral Média ">0"
3,9
5,3
0,5
2,6
Média das Notas
Finalizada - Resolvido Finalizada - Nao Resolvido
Panorama Geral do Setor
2% 2% 2% 2% 2% 2% 2% 3% 3%4% 4% 5% 5% 5% 5% 5% 6%
10%
13%
17%
Construção Civil - Reclamações
Panorama Geral do Setor
17%
13%
9%
6% 6% 6% 6%4% 4% 4% 4% 3% 3% 2% 2% 2% 2% 2% 2% 2%
Construção Civil - Soluções
Estudo de Caso 02Análise de Sentimento em Tweets
Dados da Rede Globo
• Para realizar as análises a serem apresentadas foram utilizados 206.259 tweets de 127.945 usuários entre os dias 1 e 31 de dezembro de 2010.
• Os atributos disponíveis para essa análise foram: Cliente, Avaliação, Termo, Usuário, Texto e Data.
Base de Análise
InfluenciadoresId Usuários
Qtde de Tweets
Percentual de Tweets (%)
Qtde de Seguidores
Qtde de Seguidos
1 adnoticia 253 0,12% 175 219
2 annoticia 256 0,12% 271 350
3 comuniquebrinde 170 0,08% 1.211 1.967
4 feedrssreader 192 0,09% 350 245
5 g1 389 0,19% 467.484 21
6 mariana_viips 155 0,08% 694 67
7 news_mundo_ 224 0,11% 281 895
8 novinhabru 320 0,16% 2.992 1.963
9 romariontv 177 0,09% - -
10 segundoplanobr 151 0,07% 347 7
11 siteg1 207 0,10% 60 -
12 sjodiel_indica 262 0,13% 855 615
13 standupbot 384 0,19% 386 -
14 tudodoesporte 522 0,25% 894 366
15 tweets24hs 158 0,08% 2.940 3.258
16 vidasemglobo 147 0,07% 600 177
17 waldeterossi 313 0,15% 70 13
18 zocialtv_br 242 0,12% 338 115
19 _invo 720 0,35% 342 22
TOTAL: 5.242 2,54%
Segmentando os Influenciadores
Segmentando os Influenciadores
Grupo 1
adnoticia
annoticia
g1
news_mundo_
siteg1
waldeterossi
_invo
Grupo 2
comuniquebrinde
feedrssreader
segundoplanobr
sjodiel_indica
tweets24hs
Grupo 3
mariana_viips
novinhabru
romariontv
standupbot
tudonoesporte
vidasemglobo
zocialtv_br
Análise dos Grupos
Grupo Palavras
1Rio, Brasil, Paulo, chuva, lula, mundial, policia, governo, sul, natal, pais, wikileaks, brasileiros, Dilma, feira, alemão, sudeste, estados, justiça, preso.
2Rio, Paulo, Brasil, chuva, insensato, pais, governo, natal, wikileaks, Dilma, mundial, justiça, policia, brasileiros, segurança, temporais, projeto, risco, Cielo, prisão.
3Programa, gosta, assista, Faustão, cine, peça, hoje, ajuda, vídeo, twitteado, amore, marcos, noticias, castro, Araguaia, Ana, comedy, zilza, vote, malhação.
Estudo de Caso 03:Sistema de Recomendação para
Comércio Eletrônico
Desenvolvido para a empresa NATLUX Informática e Consultoria LTDA
20
“Os sistemas de recomendação personalizada formam um guia no processo
de escolha de produtos em um comércio eletrônico e objetivam recomendar o
produto mais atrativo a cada cliente, em cada contexto, antes de perder sua
atenção. Essa sugestão pode ser feita por meio de janelas específicas na loja virtual ou enviando e-mails personalizados para
cada cliente.”*
* Artigo publicado na revista E-Commerce Brasil, Ano 2, Edição 1, 2012.
21
Visão Geral de um Sistema de Recomendação
1. Captura de informações dos
produtos
2. Captura de informações sobre
o comportamento dos usuários
3. Aplicação dos algoritmos de
recomendação
4. Apresentação dos produtos
selecionados
5. Monitoramento e análise das
recomendações22
Nossa Solução
Representação das regras:
Ab (1)
(2)
(3)
(4)
Ab{d}(8)
Maturate
Select
Clone
Ab{n}
C
C*
Re-select
f
f*
(7)
(6)
(5)
Ab{n}
Fluxo do algoritmo:
Recomendações personalizadas.
Estudo de Caso 04:TV Social
O que é TV SocialCriança Esperança
Análise de Valor de MarcasBig Brother Brasil
• Mídias Sociais: Aplicações de Internet baseadas na criação e troca de conteúdogerado pelos próprios usuários.
• TV Social: Terminologia empregada para se referir à convergência entre a TV e as MídiasSociais.
Fonte: Adaptado de http://bit.ly/12yQjfN25
26...E muito mais...
Cobertura do TTV
TTV Analytics
• Conhecer o engajamento, envolvimento e sentimento das pessoas sobre os programas da TV brasileira nas mídias sociais.
Objetivos
• Fornecer estudos quantitativos e qualitativossobre a TV Social.
Foco
• Uso da plataforma analítica do TTV.
• Elaboração de relatórios customizados.Metodo-
logia
27
Emissoras• Saiba o que estão falando
sobre todos os programas da TV brasileira
• Analise o engajamento
• Busque episódios, fatos e dados que interagem e/ou motivam a audiência
• Compare com outras emissoras/programas
• Tenha atualização diária para toda a grade
Agências e Anunciantes• Crie novos formatos de
análise de audiência de TV
• Desenvolva planos de mídia com maior potencial de engajamento
• Amplie as análises possíveis na seleção de programas de TV
28
Para quem?
Tela Principal
29
Menu Principal Dashboard Geral Gráficos Gerais
30
Tipos de Tag Cloud
Exportação XLS da Tag Cloud
Exemplo de Context Cloud
Sem Considerar Sentimento Sentimento Negativo
Criança Esperança 2013: 30/08 – 01/09
Sentimento Positivo
Nota-se uma influência maior dos
termos vinculados a sentimento
negativo na Context Cloud dos assuntos
sem considerar Sentimento
Big Brother Brasil 13- Análise Quantitativa e Qualitativa -
Janeiro de 2013
Base de Análise
08 a 12/01/2013: Primeira semana de exibição
82.541 posts qualificados e sem repetiçãoFontes: Twitter e Facebook
Participantes
O Kleber Bambam tem umarepercussão substancialmente maiorque os demais participantes da casa, dificultando uma visualização dadistribuição na Tag Cloud.
Frequência na base:Aline: 1601 Anamara: 548André: 618 Andressa: 100Aslan: 117 Dhomini: 741Eliezer: 47 Fani: 765Fernanda: 374 Ivan: 76Kamilla: 123 Bambam: 2898Marcello: 321 Marien: 57Nasser: 335 Natalia: 251Yuri: 940
Adjetivos, Qualificadores e Afins
De forma geral os adjetivos associados ao programa têmconotação negativa.
Análise de ContextoO contexto do BBB gira em torno de conflitosentre quem gosta e quem não gosta, sexo, intelectualidade, redes sociais, audiência, premiações, personagens, etc.
Distribuição e Perfil dos GruposCluster 0
16%
Cluster 1
14%
Cluster 210%
Cluster 36%
Cluster 415%
Cluster 53%
Cluster 67%
Cluster 717%
Cluster 85%
Cluster 97%
Grupo 0: Defensores do BBB
Grupo 1: Repercussão da baixa audiência da estreia
Grupo 2: Comparações com novelas
Grupo 3: Twitter como mídia para o BBB
Grupo 4: Críticos à inteligência dos telespectadores do BBB e seus defensoresGrupo 5: Foco no BBB e seus participantesGrupo 6: Usuários do FacebookGrupo 7: Novos fãs e interessados no BBBGrupo 8: Críticos da sexualidade do BBBGrupo 9: Críticos aos homens do programa
PARTE 2A Tríade da Persona Virtual
As Mídias Sociais e o Comportamento Humano
38
• “Eles são mais felizes e têm vidas melhores que eu: O impacto do uso do Facebook sobre a percepção dos outros” (Chou & Edge, 2012).
• “Mais informação do que eu sempre quis: O Facebook desperta o monstro da inveja?”, Muise et al. (2009)
• “Socialnomics: Como as mídias sociaistransformam a maneira com que vivemos e fazemos negócios”, E. Qualman (2010)
• “O poder político das mídias sociais: Tecnologia, a esfera pública, e a mudançapolítica”, C. Shirky (2011)
39
Imagem formada a partir de como as pessoas se apresentam e se comportam nas mídias sociais, o que envolve desde seu perfil, sua identidade social, até seus comportamentos.
40
A Persona Virtual
41
O Que Já Fizemos?
Análise de Sentimento
Sentiment (Polarity) Analysis
42
ANÁLISE DE SENTIMENTO
Área que visa criar processos automáticos de
identificação das emoções e/ou sentimentos presentes
na forma como as pessoas se expressam textualmente.
Pode envolver a identificação da polaridade, estado
emocional (categorias e dimensão) e força.
Universidade Presbiteriana Mackenzie [email protected]
• Uma Plataforma para Análise de Polaridade (Sentiment Analysis Framework)
44
SAFRA
A SAFRA é uma plataforma automática de classificação de sentimento que não requer a intervenção humana para operar!
Mensagem (tweet) Polaridade'odeio voc temer pblico feliz improvisa no show de caetano e gil url' -1'michelmiguel eliastemerlulia temer vai se dar mal no tenho provas mas tenho convico'
-1
'kiko matarazzo publicitrio escritor marceneiro nas horas vagas cerveja artesanal wanderlust fora temer odeio coxinha'
-1
'veja o momento em que manifestantes ato contra o governo temer atacam usernameannoyedyoutubezufgdpwq'
-1
'fica de cara com lula tretando com os concurseiro mas pagapau para temer que nem concurso mais quer fazer foratemer'
1
'zorra zuando dilma e temer morrendo de rir' 1
46
Análise de Polaridade
#temer
Classificados + Classificados -
Tema: #temerPeriodo Coleta 2016-09-18 a 2016-09-24Total de tweets 105Classificados + 41Classificados - 64
Emoção é uma resposta discreta, por tempo limitado, a um evento interno ou
externo que acarreta características sincronizadas, incluindo experiência
subjetiva, expressão, resposta corporal e tendência a ações (PHELPS, 2009).
47
Estados Emocionais
48
O Modelo das 6
Emoções de P.
Ekman.
① ② ③
④ ⑤ ⑥
Tema: #olimpiadas2016Período Coleta 03-28/08/2016Total de tweets 849Classificados Anger 26Classificados Disgust 0Classificados Fear 50Classificados Happiness 495Classificados Sadness 263Classificados Surprise 15
49
Estados Emocionais
3% 0%
6%
58%
31%
2%
#Olimpiadas2016
Classificados
Anger
Classificados
Disgust
Classificados Fear
Classificados
Happiness
Classificados
Sadness
Mensagem (tweet) Estado Emocional
'olha selecaoolimpica vexame vai ser mais uma derrota nessas olimpiadas2016'
Tristeza
'orgulho dessas meninas muito respeito pelo futebol feminino bra rio2016 olimpiadas2016 futebol'
Alegria
'parabens selecao feminina time assim que da orgulho rio2016 martarainha olimpiadas2016 guerreiras'
Alegria
'nao e mais surpresa veja parte ensaio geral da abertura da rio USER_NUMBER olimpiadas2016 URL'
Surpresa
'meu sincero foda se essa palhacada vergonha rio2016 olimpiadas2016 pic twitter com nzucqcf1gs'
Tristeza
'o triste vai ser que se o futebol masculino ganhar o ouro todas conquistas dos outros atletas serao ignoradas olimpiadas2016'
Tristeza
'nenhum governo golpista ira calar nossa voz foratemer olimpiadas2016 itaipava arena URL'
Raiva
'olimpiadas2016 eles estao nos subestimando mas na verdade estao e com medo URL'
Medo50
Estados Emocionais
Predição de Personalidade
Personality Prediction
51
PREDIÇÃO DE PERSONALIDADE
Consiste em determinar os traços de personalidade de
um indivíduo baseado em seu comportamento, seguindo
um modelo de personalidade.
Atualmente, o modelo CGF (Cinco Grandes Fatores) é o
mais usado devido as pesquisas que relacionam
características léxicas com os traços presentes no
modelo. Universidade Presbiteriana Mackenzie [email protected]
PREDIÇÃO DE PERSONALIDADE
Universidade Presbiteriana Mackenzie [email protected]
ExtroversãoEmoções positivas. Tendência a procurar estimulação e a
companhia dos outros
NeuroticismoTendência a experimentar emoções negativas, como
raiva, ansiedade ou depressão
Amabilidade(Socialização)
Tendência a ser compassivo e cooperativo em vez de suspeitoso. Indivíduos “amáveis” valorizam a boa relação
com os outros.
Conscienciosidade Tendência em mostrar autodisciplina
Abertura à Experiência
Interesse pela arte, emoção, aventura, ideias fora do comum, imaginação, curiosidade e variedade de
experiências
• Uma plataforma para Predição de Personalidade
Universidade Presbiteriana Mackenzie [email protected] 54
PERSOMA
56
Personalidades
Extrovertido Neuroticismo Socialização Conscienciosidade Abertura
Election2016 0 1 1 0 0
iPhone7 0 1 1 0 0
Galaxys7 0 1 0 0 0
Hillary 1 1 0 0 0
Trump 1 1 1 1 0
Economy 1 0 1 0 0
NFL 0 1 1 0 0
NBA 0 1 1 0 0
Science 1 0 1 0 0
Predição de Perfil Psicológico e Temperamento
Usando Dados de Mídias Sociais
Solução Stand-Alone
57
PREDIÇÃO DE TEMPERAMENTO
Consiste em determinar o temperamento (conjunto de
características inatas que influenciam fortemente o
comportamento) de um indivíduo no ambiente familiar e
profissional.
Atualmente, o modelo de temperamento de Keirsey é
uma teoria focada nas funções cerebrais que tem sido
amplamente usado em processos de recrutamento.58
59
Artesão
Voltadas a trabalhos relacionados a inteligência corporal e cinestésica, espacial, musical e interpessoal. São preocupadas com técnicas e aperfeiçoamentos constantes, pois
visam o virtuosismo.
Guardião
Têm um relacionamento julgador com o mundo externo e, por isso, são cuidadosos, obedecem
às leis, seguem as regras e respeitam os direitos dos outros.
IdealistaConfiam mais na intuição do que nos sentidos e preferem tomar decisões com base em valores
humanos.
RacionalEmbora intuitivos como os idealistas, submetem
tudo à razão
Predição de Temperamento
• Um framework para Predição de Temperamento
• O TECLA recebe como entrada um conjunto de tweets (mensagens) de um dado usuário e retorna como saída um dos quatro tipos de temperamento de Keirsey.
60
TECLA
Classificação de Expressão de Gênero
Genre Expression Classification
61
• Problema de Classificação de Gênero no Twitter: o Problema de classificação binária:
Dadas duas classes, masculino e feminino, atribuir um tweet anônimo, ou conjunto de tweets, a uma dessas classes, sem a existência de autores candidatos;
Estudos examinaram desde o uso de palavras ou termos específicos (características psicolinguísticas), nome do usuário, nome completo, localização, linksURL, dentre outros;
Já foi mostrado que mulheres e homens adotam padrões diferentes, quase únicos, de comportamento quando da comunicação, se baseada em gênero (LAKOFF, 1975; EAGLY e STEFFEN, 1984; SCHWARTZ et al., 2013).
Classificação de Gênero
Figura 1 - Processo de identificação e classificação de gênero.
GENEC - Uma Metodologia para Classificação de Expressão de Gênero
• Os meta-atributos a serem extraídos são baseados em:
o Caracteres e Sintaxe: características estilométricas, utilizadas anteriormente para a resolução de problemas de atribuição de autoria;
o Palavras: incluem medidas estatísticas, conhecidas como medidas de riqueza de vocabulário (do inglês, vocabulary richness measures);
o Estrutura: incluem pontuação regular (como vírgula e dois pontos), além dos pontos de interrogação e exclamação utilizados de maneira excessiva (???, !!!);
o Morfologia: representam a maneira com a qual autor organiza a estrutura (do inglês, layout) de uma mensagem;
o Psicolinguística
Metodologia Baseada em Meta-Atributos
Como Dados Viram Negócios
65
66
Ações Internas ao Ambiente
67
Levando as Ações ao Cliente
68
Oportunidades e Qualificações
LCoN: Leandro Nunes de Castro
Venha fazer pesquisa conosco!
Oportunidades de
Iniciação Científica,
Mestrado, Doutorado e
Pós-Doutorado.
Contato: [email protected]
/lcon.mack
@lcon_mackenzie
Leandro Nunes de Castro