31
Análise de Mensagens de Segurança Postadas no Twitter Autores: Este trabalho de Luiz Arthur Feitosa Santos, Rodrigo Campiolo, Daniel Macêdo Batista e Marco Aurélio Gerosa foi licenciado com uma Licença Creative Commons - Atribuição – Não Comercial 3.0 Não Adaptada. Luiz Arthur F. Santos [email protected] Rodrigo Campiolo [email protected] Daniel Macêdo Batista [email protected] Marco Aurélio Gerosa [email protected]

Análise de Mensagens de Segurança Postadas no Twitter

Embed Size (px)

Citation preview

Page 1: Análise de Mensagens de Segurança Postadas no Twitter

Análise de Mensagens de Segurança Postadas no Twitter

Autores:

Este trabalho de Luiz Arthur Feitosa Santos, Rodrigo Campiolo, Daniel Macêdo Batista e Marco Aurélio Gerosa foi licenciado com uma Licença Creative Commons - Atribuição – Não Comercial 3.0 Não Adaptada.

Luiz Arthur F. [email protected]

Rodrigo [email protected]

Daniel Macêdo [email protected]

Marco Aurélio [email protected]

Page 2: Análise de Mensagens de Segurança Postadas no Twitter

Introdução:

● Problema de pesquisa:

Demora na propagação de informação de novas ameaças (Vulnerabilidades dia zero).

Aplicativos especializados não são totalmente eficazes contra novas ameaças.

● Possíveis soluções:

O problema pode ser amenizado por meio da propagação rápida de alertas.

Uso de redes sociais.

2

Page 3: Análise de Mensagens de Segurança Postadas no Twitter

Objetivo:

Analisar um conjunto de mensagens do Twitter para verificar se as mensagens ajudam na identificação e alerta antecipado de possíveis problemas de segurança.

Contribuições:

Confirmação de colaboração em redes sociais em relação à segurança computacional.

Caracterização das mensagens de segurança.

3

Page 4: Análise de Mensagens de Segurança Postadas no Twitter

Hipóteses:

H1 - Há informações sobre segurança de computadores nas mensagens do Twitter.

H2 - As mensagens do Twitter com conteúdo sobre segurança indicam ameaças potenciais.

H3 - O Twitter informa antes de sítios especializados os problemas relacionados à segurança da informação.

H4 - Os usuários no Twitter se preocupam em alertar outros usuários sobre problemas de segurança.

4

Page 5: Análise de Mensagens de Segurança Postadas no Twitter

Comparar os tweets com as notíciasdos sítios para constatar se o tweet

é importante

Tweettweet

TWEETTwEet

TwitterObter tweetsSegurança

IndexarLucene

Agrupar porSimilaridade

Gerar listatweets maisrelevantes

Sítios Segurança

Obter notíciasSegurança

IndexarLucene

<html...Notícia/html>

TweetTWEET

Obter tweetsSegurança

IndexarLucene

Agrupar porSimilaridade

Gerar listatweets maisrelevantes

Tweets considerados importantes

Internet

Notíciassegurançade sítios

especializadosTweets

relevantes

1

3

2

4

Métodos:

5

Page 6: Análise de Mensagens de Segurança Postadas no Twitter

Comparar os tweets com as notíciasdos sítios para constatar se o tweet

é importante

Tweettweet

TWEETTwEet

TwitterObter tweetsSegurança

IndexarLucene

Agrupar porSimilaridade

Gerar listatweets maisrelevantes

Sítios Segurança

Obter notíciasSegurança

IndexarLucene

<html...Notícia/html>

TweetTWEET

Obter tweetsSegurança

IndexarLucene

Agrupar porSimilaridade

Gerar listatweets maisrelevantes

Tweets considerados importantes

Internet

Notíciassegurançade sítios

especializadosTweets

relevantes

1

3

2

4

Métodos:

6

1. Obter tweets

a. … Problema X …b. ...PROBLEMA Y … http...c. ... Problema … X … http...d. Ameaça Y ... #viruse. … @user … Problema X …f. Novo Malware Z...g. X Solução... http

Buscas no intervalo de 1 minuto durante 21 dias:

security AND (virus OR worm OR attack OR intrusion OR invasion OR ddos OR hacker OR cracker OR exploit OR malware)

Page 7: Análise de Mensagens de Segurança Postadas no Twitter

Comparar os tweets com as notíciasdos sítios para constatar se o tweet

é importante

Tweettweet

TWEETTwEet

TwitterObter tweetsSegurança

IndexarLucene

Agrupar porSimilaridade

Gerar listatweets maisrelevantes

Sítios Segurança

Obter notíciasSegurança

IndexarLucene

<html...Notícia/html>

TweetTWEET

Obter tweetsSegurança

IndexarLucene

Agrupar porSimilaridade

Gerar listatweets maisrelevantes

Tweets considerados importantes

Internet

Notíciassegurançade sítios

especializadosTweets

relevantes

1

3

2

4

Métodos:

7

Tweettweet

TWEETTwEet

1. Obter tweets

a. … Problema X …b. ...PROBLEMA Y … http...c. ... Problema … X … http...d. Ameaça Y ... #viruse. … @user … Problema X …f. Novo Malware Z...g. X Solução... http

3. Similaridade e agrupamento

1a. … Problema X …1c. ... Problema … X … http...1e. … @user … Problema X …

2d. Ameaça Y ... #virus2b. ...PROBLEMA Y … http...

3f. Novo Malware Z...

4g. X Solução... httpGrau de similaridade:

0,5 – tweets com tweets

Page 8: Análise de Mensagens de Segurança Postadas no Twitter

Comparar os tweets com as notíciasdos sítios para constatar se o tweet

é importante

Tweettweet

TWEETTwEet

TwitterObter tweetsSegurança

IndexarLucene

Agrupar porSimilaridade

Gerar listatweets maisrelevantes

Sítios Segurança

Obter notíciasSegurança

IndexarLucene

<html...Notícia/html>

TweetTWEET

Obter tweetsSegurança

IndexarLucene

Agrupar porSimilaridade

Gerar listatweets maisrelevantes

Tweets considerados importantes

Internet

Notíciassegurançade sítios

especializadosTweets

relevantes

1

3

2

4

Métodos:

8

2. Obter Feeds

a. Problema X... novo exploit...b. Problema Z...

Buscas durante 2 meses utilizando 30 websites

de segurança.

Também foi utilizado um web crawler.

3. Similaridade e agrupamento

1a. … Problema X …1c. ... Problema … X … http...1e. … @user … Problema X …

2d. Ameaça Y ... #virus2b. ...PROBLEMA Y … http...

3f. Novo Malware Z...

4g. X Solução... http

1. Obter tweets

a. … Problema X …b. ...PROBLEMA Y … http...c. ... Problema … X … http...d. Ameaça Y ... #viruse. … @user … Problema X …f. Novo Malware Z...g. X Solução... http

Page 9: Análise de Mensagens de Segurança Postadas no Twitter

Comparar os tweets com as notíciasdos sítios para constatar se o tweet

é importante

Tweettweet

TWEETTwEet

TwitterObter tweetsSegurança

IndexarLucene

Agrupar porSimilaridade

Gerar listatweets maisrelevantes

Sítios Segurança

Obter notíciasSegurança

IndexarLucene

<html...Notícia/html>

TweetTWEET

Obter tweetsSegurança

IndexarLucene

Agrupar porSimilaridade

Gerar listatweets maisrelevantes

Tweets considerados importantes

Internet

Notíciassegurançade sítios

especializadosTweets

relevantes

1

3

2

4

Métodos:

9

2. Obter Feeds

a. Problema X... novo exploit...b. Problema Z...

3. Similaridade e agrupamento

1a. … Problema X …1c. ... Problema … X … http...1e. … @user … Problema X …

2d. Ameaça Y ... #virus2b. ...PROBLEMA Y … http...

3f. Novo Malware Z...

4g. X Solução... http

4. Mensagens Importantes

1a. … Problema X …

3f. Novo Malware Z...

Grau de similaridade:0,2 – notícias com tweets

1. Obter tweets

a. … Problema X …b. ...PROBLEMA Y … http...c. ... Problema … X … http...d. Ameaça Y ... #viruse. … @user … Problema X …f. Novo Malware Z...g. X Solução... http

Page 10: Análise de Mensagens de Segurança Postadas no Twitter

Coleta de Dados:

Twitter - Dados coletados de 28/04/2012 a 19/05/2012

Feeds - Dados coletados de 01/04/2012 a 30/05/2012

10

Busca tweets usuários com link # @

Vírus (pt) 223 198 177 46 96

Vírus (eng) 2.070 1.473 1.690 587 452

Termos (pt) 817 666 708 161 400

Termos (eng) 11.492 7.710 10.104 4.218 4.109

Total* 12.309 8.376 10.812 4.379 4.509

Total Ausência de Descrição Ausência de data

Feeds 3.988 31 121

* Termos (pt) e Termos (eng)

Page 11: Análise de Mensagens de Segurança Postadas no Twitter

Coleta de Dados:

Twitter - Dados coletados de 28/04/2012 a 19/05/2012

Feeds - Dados coletados de 01/04/2012 a 30/05/2012

11

Busca tweets usuários com link # @

Vírus (pt) 223 198 177 46 96

Vírus (eng) 2.070 1.473 1.690 587 452

Termos (pt) 817 666 708 161 400

Termos (eng) 11.492 7.710 10.104 4.218 4.109

Total* 12.309 8.376 10.812 4.379 4.509

Total Ausência de Descrição Ausência de data

Feeds 3.988 31 121

~38 msg/dia

~547 msg/dia~88%

* Termos (pt) e Termos (eng)

Page 12: Análise de Mensagens de Segurança Postadas no Twitter

Análise dos Dados:

Palavras mais usadas pelos tweets de segurança

12

Português Inglês Principais Termos

Qtd Termos Qtd Termos Qtd Termos

219 hacker 3.459 malware 704 cyber

147 vírus 3.078 attack 702 infosec

120 invasão 1.392 hacker 590 anti

108 malware 1.188 exploit 550 android

95 ataque 1.076 virus 457 apple/flash

Page 13: Análise de Mensagens de Segurança Postadas no Twitter

Análise dos Dados:

Palavras mais usadas pelos tweets de segurança

13

Português Inglês Principais Termos

Qtd Termos Qtd Termos Qtd Termos

219 hacker 3.459 malware 704 cyber

147 vírus 3.078 attack 702 infosec

120 invasão 1.392 hacker 590 anti

108 malware 1.188 exploit 550 android

95 ataque 1.076 virus 457 apple/flash

Page 14: Análise de Mensagens de Segurança Postadas no Twitter

Análise dos Dados:

Amostra de tweets relevantes (Inglês):

14

Pos tweets Trechos da Mensagem

1 347 ...Religious Sites Carry More Malware Than Porn Sites...

2 266 Adobe releases Flash exploit. Update yours now!...

3 263 ...ARE WE PREPARED FOR CYBERWAR?...

4 229 Adobe issues security update for Flash player, warns...IE exploit...

5 205 Flashback malware exposes big gaps in Apple...10 134 About AVG...Anti-Virus Software...24 84 Android Trojan copies PC drive-by malware attack...32 61 Obama Defends Attack On Romney...

278 10 ...Ancient Microsoft Word malware threat returns...

Page 15: Análise de Mensagens de Segurança Postadas no Twitter

Análise dos Dados:

Amostra de tweets relevantes (Inglês):

15

Pos tweets Trechos da Mensagem

1 347 ...Religious Sites Carry More Malware Than Porn Sites...

2 266 Adobe releases Flash exploit. Update yours now!...

3 263 ...ARE WE PREPARED FOR CYBERWAR?...

4 229 Adobe issues security update for Flash player, warns...IE exploit...

5 205 Flashback malware exposes big gaps in Apple...10 134 About AVG...Anti-Virus Software...24 84 Android Trojan copies PC drive-by malware attack...32 61 Obama Defends Attack On Romney...

278 10 ...Ancient Microsoft Word malware threat returns...

Page 16: Análise de Mensagens de Segurança Postadas no Twitter

Análise dos Dados:

Classificação dos tweets após agrupamento

16

Tweets* Similaridade Alta** Similaridade Baixa**

Importantes 119 69 50

Irrelevantes 88 31 57

Spams 30 15 15

Outros 41 8 33

Total 278 123 155

* Classificação manual.** Correlação com os feeds.

Page 17: Análise de Mensagens de Segurança Postadas no Twitter

Análise dos Dados:

Classificação dos tweets após agrupamento

17

Tweets* Similaridade Alta** Similaridade Baixa**

Importantes 119 69 50

Irrelevantes 88 31 57

Spams 30 15 15

Outros 41 8 33

Total 278 123 155

~74% relacionados com segurança

~26% fora de contexto

* Classificação manual.** Correlação com os feeds.

Page 18: Análise de Mensagens de Segurança Postadas no Twitter

Análise dos Dados:

Classificação dos tweets após agrupamento

18

Tweets* Similaridade Alta** Similaridade Baixa**

Importantes 119 69 50

Irrelevantes 88 31 57

Spams 30 15 15

Outros 41 8 33

Total 278 123 155

~74% relacionados com segurança

* Classificação manual.** Correlação com os feeds.

~26% fora de contexto

~43% sãoAlertas

Page 19: Análise de Mensagens de Segurança Postadas no Twitter

Análise dos Dados:

● Avaliação dos Procedimentos:

Seleção aleatória de 60 amostras de 278 tweets.

Comparação direta com feeds e busca Web.

Resultados:➢ 62% alertas de segurança.➢ 22% irrelevantes.➢ 10% spams.➢ 7% informações relacionadas com segurança.

19

Page 20: Análise de Mensagens de Segurança Postadas no Twitter

Avaliação das Hipóteses:

● H1 - Há informações sobre segurança de computadores nas mensagens do Twitter:

12.309 tweets em 21 dias, média de 586 tweets por dia.

75% tweets abordam assuntos de segurança.

H2 - As mensagens do Twitter com conteúdo sobre segurança indicam ameaças potenciais:

42% tweets se relacionam com alertas de segurança.

20

Page 21: Análise de Mensagens de Segurança Postadas no Twitter

Avaliação das Hipóteses:

● H1 - Há informações sobre segurança de computadores nas mensagens do Twitter:

12.309 tweets em 21 dias, média de 586 tweets por dia.

75% tweets abordam assuntos de segurança.

H2 - As mensagens do Twitter com conteúdo sobre segurança indicam ameaças potenciais:

42% tweets se relacionam com alertas de segurança.

21

Page 22: Análise de Mensagens de Segurança Postadas no Twitter

Avaliação das Hipóteses:

● H1 - Há informações sobre segurança de computadores nas mensagens do Twitter:

12.309 tweets em 21 dias, média de 586 tweets por dia.

75% tweets abordam assuntos de segurança.

● H2 - As mensagens do Twitter com conteúdo sobre segurança indicam ameaças potenciais:

42% tweets se relacionam com alertas de segurança.

22

Page 23: Análise de Mensagens de Segurança Postadas no Twitter

Avaliação das Hipóteses:

● H1 - Há informações sobre segurança de computadores nas mensagens do Twitter:

12.309 tweets em 21 dias, média de 586 tweets por dia.

75% tweets abordam assuntos de segurança.

● H2 - As mensagens do Twitter com conteúdo sobre segurança indicam ameaças potenciais:

42% dos tweets se relacionam com alertas de segurança.

23

Page 24: Análise de Mensagens de Segurança Postadas no Twitter

Avaliação das Hipóteses:

● H3 - O Twitter informa antes de sítios especializados os problemas relacionados à segurança da informação:

45% dos tweets apresentam data mais recente. Exemplo:

PHP-CGI query string parameter vulnerability

Publicada em 03/05/2012 no CERT.

Postada no Twitter em 04/05/2012.

Catalogada no NIST em 11/05/2012.

24

Page 25: Análise de Mensagens de Segurança Postadas no Twitter

Avaliação das Hipóteses:

● H3 - O Twitter informa antes de sítios especializados os problemas relacionados à segurança da informação:

45% dos tweets apresentam data mais recente.

Exemplo:

PHP-CGI query string parameter vulnerability

➢ Publicada em 03/05/2012 no CERT.➢ Postada no Twitter em 04/05/2012.➢ Catalogada no NIST em 11/05/2012.

25

Page 26: Análise de Mensagens de Segurança Postadas no Twitter

Avaliação das Hipóteses:

● H4 - Os usuários no Twitter se preocupam em alertar outros usuários sobre problemas de segurança:

Tempo médio de propagação 12 dias.Uma mensagem com 10 retweets atinge ~10.000 usuários.A mensagem mais propagada atingiu ~347.000 pessoas.

26

Page 27: Análise de Mensagens de Segurança Postadas no Twitter

Avaliação das Hipóteses:

● H4 - Os usuários no Twitter se preocupam em alertar outros usuários sobre problemas de segurança:

27

Page 28: Análise de Mensagens de Segurança Postadas no Twitter

Avaliação das Hipóteses:

● H4 - Os usuários no Twitter se preocupam em alertar outros usuários sobre problemas de segurança:

28

Tempo médio de propagação, 12 dias.10 retweets atingem ~10.000 usuários.A mensagem mais propagada atingiu ~347.000 pessoas.

Page 29: Análise de Mensagens de Segurança Postadas no Twitter

Considerações Finais:

● Dificuldades para selecionar tweets (conteúdo e tamanho).

● Redes sociais propagam alertas de segurança.

● Os alertas alcançam alta e rápida disseminação.

29

Page 30: Análise de Mensagens de Segurança Postadas no Twitter

Trabalhos futuros:

● Efetuar novas consultas usando outros termos da área de segurança.

● Melhorar o filtro para spams e de mensagens fora de contexto.

● Avaliação de alertas de segurança em outras redes sociais.

● Desenvolver um sistema automatizado de alertas antecipados de segurança baseado em redes sociais.

30

Page 31: Análise de Mensagens de Segurança Postadas no Twitter

31

Luiz Arthur F. Santos

[email protected]

Rodrigo Campiolo

[email protected]

Daniel Macêdo Batista

[email protected]

Marco Aurélio Gerosa

[email protected]

Obrigado!

Perguntas?