27
DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI Thực hiện: Tiêu Thị Phương Ngô Quang Hiểu Nguyễn Anh Vũ 1

DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

  • Upload
    haley

  • View
    69

  • Download
    0

Embed Size (px)

DESCRIPTION

DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI. Thực hiện : Tiêu Thị Phương Ngô Quang Hiểu Nguyễn Anh Vũ. Phân công công việc và đánh giá. Nội dung. Đặt vấn đề Định nghĩa cơ bản Bài toán xác định sự kiện liên quan đến bùng nổ sự kiện từ truyền thông xã hội . - PowerPoint PPT Presentation

Citation preview

Page 1: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

1

DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

Thực hiện: Tiêu Thị Phương Ngô Quang Hiểu Nguyễn Anh Vũ

Page 2: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

2

Tên thành viên

Nhiệm vụ Đánh giá

Tiêu Thị Phương

Tìm hiểu vấn đề xác định các sự kiện liên quan đến bùng nổ sự kiện trong hoạt động truyền thông xã hội.

Ngô Quang Hiểu

Tìm hiểu về nghiên cứu dự đoán/dự báo sử dụng truyền thông xã hội

Nguyễn Anh Vũ

Tìm hiểu về sự phát triển của bùng nổ sự kiện trong mạng xã hội trực tuyến.

Phân công công việc và đánh giá

Page 3: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

3

1. Đặt vấn đề2. Định nghĩa cơ bản3. Bài toán xác định sự kiện liên quan đến bùng nổ sự kiện từ

truyền thông xã hội. * Bài toán tính xác suất xảy ra 1 phần tử trong chuỗi trạng

thái * Bài toán đo độ mịn của chuỗi trạng thái * Bài toán xác định bùng nổ từ 1 luồng hoạt động * Bài toán xác định bùng nổ từ nhiều luồng hoạt động

5. Kết quả thực nghiệm.6. Định hướng nghiên cứu tiếp theo

Nội dung

Page 4: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

4

Các chủ đề hoạt động truyền thông xã hội: thị trường, bầu cử, kinh tế vĩ mô, Movie box-office, thông tin phổ biến => truyền thông xã hội giúp xác định bùng nổ sự kiện xảy ra bên ngoài thế giới thực.

Đặt vấn đề

Page 5: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

5

Đặc điểm của truyền thông xã hội Gồm số lương lớn các loai hoat đông khác nhau diễn ra

trong thời gian thực. Tính không thường xuyên, tính không đoán trước, tính giả

mạo.=> cần xác định chính xác đâu là bùng nổ sự kiện

Đặt vấn đề (tt)

Page 6: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

6

Ví dụ bùng nổ sự kiện trong Twitter

Đặt vấn đề (tt)

Page 7: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

7

Hoạt động: một hoạt động mà đề cập đến một số loại hành động mà người sử dụng thực hiện khi họ quan tâm đến một số chủ đề hoặc sư kiện.

Luồng hoat động: một luồng hoạt động có độ dài N và loại m là 1 chuỗi số (n1

m ,n2m , …, nN

m ) ở đó mỗi nim biểu thị số

lượng hoạt động loại m mà xảy ra trong khoảng thời thứ i Truy vấn: một truy vấn Q là một chuỗi các quan hệ q1, …,

q|Q| nó có thể biểu diễn nhu cầu thông tin của người sử dụng.

Định nghĩa cơ bản

Page 8: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

8

Event-related Burst: cho một truy vấn Q, môt sự kiện liên quan đến vụ nổ được định nghĩa như trong khoảng thời gian [ts ,te] có 1 số sự kiện quan hệ với Q, ở đó ts và te là thời gian bắt đầu và thời gian kết thúc của sư kiện tương ứng với chuỗi thời gian.

Định nghĩa cơ bản

Page 9: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

9

• Bài toán tính xác suất xảy ra 1 phần tử trong chuỗi trạng thái.• Bài toán đo độ mịn của chuỗi trạng thái.• Bài toán xác định bùng nổ từ 1 luồng hoạt

động.• Bài toán xác định bùng nổ từ nhiều luồng

hoạt động.

Bài toán xác định bùng nổ sư kiện thông qua truyền thông xã hội

Page 10: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

10

Input: Cho một luồng hoạt động (n1m , …., nT

m) trong khoảng thời gian T.

Output: sác xuất xảy ra phần tử zi trong chuỗi trạng thái z = (z1

m,…,zTm)

Bài toán tính xác suất xảy ra một phần tử trong chuỗi trạng thái

Page 11: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

11

Phân phối Possion đồng nhất: Xác suất của phần tử thứ i là zi = 0 hay zi =1 được tính như

sau:

ʎ0 là số lượng các hoạt động trong một khoảng thời gian.

Bài toán tính xác suất xảy ra một phần tử trong chuỗi trạng thái (tt)

Page 12: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

12

Input: Cho chuỗi trạng thái z1 , z2…. zT

Output: độ mịn của chuỗi. Công thức:

ở đó: T là độ dài của chuỗi trạng thái I(.) là một hàm mà nó chỉ trả về giá trị 1 nếu zi # zi+1

Ví dụ: chuỗi trạng thái “0000100000” => g1 = 10 - 2 = 8 chuỗi trạng thái “0000000000” => g1 = 10 – 0 = 10

Bài toán đo độ mịn của chuỗi trạng thái

Page 13: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

13

Với chuỗi “0000111100” có giá trị g1=8

Chuỗi “0000100000” có giá trị g1= 8

=> Cùng giá trị g1 nhưng không phải cả 2 đều là bùng nổ sự kiện => g1 chưa phát hiện rõ ràng tính chất của chuỗi => ảnh hưởng đến việc xác định chính xác vụ nổ có ý nghĩa.

Bài toán đo độ mịn của chuỗi trạng thái (tt)

Page 14: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

14

Giải pháp: g1 được cải tiến thành g2:

si và ei là vị trí bắt đầu và chỉ số kết thúc của chuỗi con tương ứng thứ i.

Ràng buộc: Ví dụ: g2(0000111100) = 42 + 42 + 22 = 36.

g2 (0000100000) = 42 + 12 + 52 = 42

Bài toán đo độ mịn của chuỗi trạng thái(tt)

Page 15: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

15

Input: Cho một luồng hoạt động (n1m , …., nT

m) trong khoảng thời gian T.

Output: chuỗi trạng thái z = (z1m,…,zT

m) có thể xảy ra nhất. => chuỗi trạng thái z = (z1

m,…,zTm) có thể xảy ra nhất là

chuỗi phải chịu chi phí thấp nhất.

Bài toán xác định bùng nổ từ một luồng hoạt động

Page 16: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

16

Hàm tính tổng chi phí được xác định:

ở đó γ1 là một hệ số tỉ lệ. Φ(.) là hàm xác định độ min, có thể thiết lập giá trị cho nó

là giá trị của g1(.) hoặc g2(.). f(.) là hàm được tính theo phân phối Possion

Bài toán xác định bùng nổ từ một luồng hoạt động

Page 17: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

17

Thay vì tính độ mịn của cả chuỗi => tính đô mịn của tất cả các chuỗi con có chiều dài L gọi là “local smoothness” theo công thức:

Bài toán xác định bùng nổ từ một luồng hoạt động

Page 18: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

18

Bài toán xác định bùng nổ từ một luồng hoạt động

Thuật toán xác định chuỗi có chi phí nhỏ nhất theo (4)

Page 19: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

19

Input: Cho các luồng hoạt động {(n1m , …., nT

m)}m=1M

trong khoảng thời gian T. Output: M chuỗi trạng thái có thể xảy ra

nhất. => M chuỗi trạng thái có thể xảy ra nhất là các chuỗi mà làm cho hàm chi phí có giá trị bé nhất.=> Chuỗi trạng thái toàn cục

Bài toán xác định bùng nổ từ nhiều luồng hoạt động

Page 20: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

20

Hàm tính tổng chi phí của M chuỗi trạng thái được tính theo công thức:

γ2 là chi phí cho 1 cặp trạng thái cho 2 luồng hoat động khác nhau trong cùng 1 thời gian

Bài toán xác định bùng nổ từ nhiều luồng hoạt động

Page 21: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

21

Thuật toán xác định M chuỗi có chi phí nhỏ nhất theo (5)

Bài toán xác định bùng nổ từ nhiều luồng hoạt động

Page 22: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

22

Từ M chuỗi trạng thái cục bộ để tạo ra một chuỗi trạng thái toàn cục ta có các cách sau: CONJUNCT: trạng thái toàn cầu zi là bùng nổ nếu tất cả

trạng thái cục bộ là bùng nổ DISJUNCT: trạng thái toàn cầu zi là bùng nổ nếu một

trong các trạng thái địa phương là bùng nổ BELIEF: : trạng thái toàn cầu zi mang trạng thái của một

trạng thái cục bộ nếu trạng thái cục bộ đó có độ tin tưởng cao nhất

ở đó :

Bài toán xác định bùng nổ từ nhiều luồng hoạt động

Page 23: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

23

Thực hiện trên tập dữ liệu gồm 200 triệu tweets với 3 luồng hoạt động trong Twitter St đại diện cho bài posting tweet Sr đại diện cho retweet Su là tweet có nhúng URL

Kết quả thực nghiệm

Page 24: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

24

Bài toán xác định bùng nổ từ một luồng hoat động.thiết lập hàm Φ trong phương trình 4 tương ứng như g1 và g2, áp dung cho 3 luồng (St, Sr, Su).Þ Thực nghiệm cho ra kết quả của độ đo F như bảng sau:

Kết quả thực nghiệm

Page 25: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

25

Bài toán xác định bùng nổ từ nhiều luồng hoat động

cho kết quả thực hiện tốt nhất

Kết quả thực nghiệm

Page 26: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

26

L là tham số được xác định trước và không thể thay đổi khi chạy chương trình.

L lớn làm tăng độ phức tạp của thuật toán. Không cần L có giá trị lớn cho tất cả các trang thái. => thiết lập L là biến thay có giá trị thay đổi để xác định

chính xác chiều dài cho mỗi trạng thái

Định hướng nghiên cứu tiếp theo

Page 27: DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

27

[ZSJSL12] Wayne Xin Zhao, Baihan Shu, Jing Jiang, Yang Song, Hongfei Yan and Xiaoming Li (2012). Identifying Event-related Bursts via Social Media Activities, EMNLP-CoNLL'12:1466-1477, 2012

[GZRSW12]. Sabrina Gaito, Matteo Zignani, Gian Paolo Rossi, Alessandra Sala, Xiao Wang, Haitao Zheng, Ben Y. Zhao: On the Bursty Evolution of Online Social Networks CoRR abs/1203.6744: (2012)

Tài liệu tham khảo