20
{ Közösségi spammelés felismerése és eliminálása Kivonat – Pletser József

Közösségi spammelés felismerése és eliminálása

  • Upload
    said

  • View
    33

  • Download
    0

Embed Size (px)

DESCRIPTION

Közösségi spammelés felismerése és eliminálása. Kivonat – Pletser József. Közösségi mézesmadzagok Profilok statisztikai analízise Közösségi spammerek a Twitteren és a MySpace-en . Mézesmadzag alapú felderítő rendszerek Statisztika a spammerekről. Absztrakt. - PowerPoint PPT Presentation

Citation preview

Page 1: Közösségi  spammelés  felismerése és eliminálása

{

Közösségi spammelés felismerése és eliminálása

Kivonat – Pletser József

Page 2: Közösségi  spammelés  felismerése és eliminálása

Közösségi mézesmadzagok Profilok statisztikai analízise Közösségi spammerek a Twitteren

és a MySpace-en. Mézesmadzag alapú felderítő

rendszerek Statisztika a spammerekről

Absztrakt

Page 3: Közösségi  spammelés  felismerése és eliminálása

Az internethasználók több időt töltenek közösségi oldalakon

A cégeknek máshol kell megtalálni a célközönségüket

Közösségi média rendszerek függenek a felhasználóktól

Spammerek azonosíthatók viselkedésük és profilképük alapján

Bevezetés

Page 4: Közösségi  spammelés  felismerése és eliminálása

Facebook

500 millió felhasználó 14 millió közösségi oldal különféle

témákban Videó, fénykép, és oldalmegosztás Felhasználói kultúra A cikk írásakor a legnépszerűbb oldalnak

500000 rajongója volt

Page 5: Közösségi  spammelés  felismerése és eliminálása

Felhasználók 80%-a kapott kéretlen ismerős felkérést

Óvatlan felhasználók kiadják az adataikat Nem feltétlenül csak reklámozás céljából

spammelnek Felderítésükhöz HIL adatbővítés

szükséges Mindig visszajönnek

Szomorú tények

Page 6: Közösségi  spammelés  felismerése és eliminálása

Emberi interakció nélkül Közösségi oldalak spamprofiljainak a

begyűjtésére Statisztikai felhasználói modell

fejlesztése Nulla napos spammerek kiszűrése

Mézesmadzag alapú felderítés

Page 7: Közösségi  spammelés  felismerése és eliminálása

Online közösség modellezése

Page 8: Közösségi  spammelés  felismerése és eliminálása

Kép hisztogramja alapján (illetve emberi logika alapján)

Szövegek alapján (URL a szövegben, kulcsszavak)

Felhasználói profilok alapján (spammer profilok jellemzői – kevés ismerős)

Jellemzők kinyerése

Page 9: Közösségi  spammelés  felismerése és eliminálása

A közösségi spam felismerési probléma megállapítani egy c osztályozó egységen keresztül, hogy melyik ui a spammer, úgy, hogy pi adott. Egy osztályozó

c: ui {spammer, törvényes felhasználó} halmazba képző függvény, megállapítja,

hogy ui spammer, vagy sem. C-hez szükség van különböző jellemzőket

tartalmazó halmazra. F= {f1, f2, … , fm}, mely U elemeire

hivatkozik.A probléma meghatározása

Page 10: Közösségi  spammelés  felismerése és eliminálása

Megoldás megközelítése

Page 11: Közösségi  spammelés  felismerése és eliminálása

A profilok spammelő viselkedése különböző jól elkülöníthető mintákra épülnek.

A legnépszerűbb spammelési célpontok a középnyugati állapok, és a legtöbb spam profil Californiában lakik.

A spammer profilok 57.2%-a egy másik profilról másolta a „Rólam” részt.

Sok spam profil megkülönböztethető demográfiai jellemzőket alakítottak ki (pl. kor, kapcsolat, stb.)

MySpace megfigyelések

Page 12: Közösségi  spammelés  felismerése és eliminálása

Click traps Friend Infiltrators Pornographic storytellers Japanese Pill pushers Winnies

Spammer profilok statisztikái

Page 13: Közösségi  spammelés  felismerése és eliminálása

Duplicate spammers Pornographic spammers Promoters Phisers Friend infiltrators

Twitter megfigyelések

Page 14: Közösségi  spammelés  felismerése és eliminálása

{A spammerek azonnali kiküszöbölése

Research Study 2

Page 15: Közösségi  spammelés  felismerése és eliminálása

A kivehető spammelésre utaló jelek a begyűjtött spammer profilokból használhatóak-e arra, hogy automatikusan megkülönböztethessük a spammereket a törvényes felhasználóktól.

Ha biztos mintáink vannak (ahogy a megfigyelések az előző fejezetben kimutattak bizonyos mintákat), akkor az osztályozó egység megfigyelhet jeleket, amik alapján megjósolhatunk egy új spamet

Probléma megfogalmazása

Page 16: Közösségi  spammelés  felismerése és eliminálása

Felhasználói demográfia: kor, nem, lakóhely és egyéb a felhasználót jellemző információk

A felhasználó által megosztott információk: például a „Rólam” mező, blog bejegyzések, kommentek.

Felhasználói aktivitás jellemzői: Posztolási gyakoriság, csirip gyakoriság

Felhasználói kapcsolatok: barátok száma, követők, illetve követett személyek.

Osztályozó egység megközelítése és metrikája

Page 17: Közösségi  spammelés  felismerése és eliminálása

104 törvényes felhasználó 168 spammer (spammer és hirdető) Minden felhasználó adata Cél: a felhasználó törvényes, spammer,

vagy hirdető?

Twitter spammerek osztályozása

Page 18: Közösségi  spammelés  felismerése és eliminálása
Page 19: Közösségi  spammelés  felismerése és eliminálása

Követők és a követettek átlaga, és a kétirányú barátságok (követettek ∩ követők) / követettek

Csiripek és az azokból levonható tanulságok:

A linkek számának aránya A különböző linkek száma A @<felhasználónév> kifejezések aránya Az egyedi @<felhasználónév> kifejezések

aránya

Támpontok a Twitteren

Page 20: Közösségi  spammelés  felismerése és eliminálása

A spammereknek saját taktikáik vannak Azonosításuk nem lehetetlen Profilok alapján beskatulyázhatóak Különböző jellemzők segítenek.

Összegzés