2
Câu hỏi ôn tập: 1. Các dạng dữ liệu trong thực tế? 2. Tại sao phải rời rạc hóa dữ liệu 3. Rút gọn dữ liệu có làm mất thông tin ko? 4. Xấp xỉ trên, xấp xỉ dưới, miền khẳng định 5. Chứng minh các tính chất của xấp xỉ 6. Tính ma trận phân biệt đc, hàm phân biệt dc 7. Tìm tập lõi, rút gọn 8. Ý nghĩa của tập lõi, rút gọn, có tối đa bao nhiêu tập rút gon? 9. Khai phá luật quyết định dựa vào lí thuyết tập thô 10. Phân biệt giữa luật kết hợp và luật quyết định 11. CHứng minh hàm dấu là 1 độ đo tương tự 12. Các chỉ số tương tự của Russel và Rao; Jaccard; Sokal và Michener có phải là các độ đo tương tự ko? 13. Phân biệt các mô hình phân lớp 14. Các p2 nào tính khoảng cách giữa 2 nhóm chỉ phụ thuộc vào ma trận khoảng cách ban đầu? Phương pháp nào phụ thuộc vào cả dữ liệu ban đầu? 15. Kết quả phân cụm có phụ thuộc vào việc chọn lựa phương pháp tính khoảng cách giữa 2 cụm ko? 16. Nhược điểm của thuật toán K-mean là gi? 17. Cho ví dụ thực tế sử dụng từng phương pháp phân lớp dữ liệu phù hợp. 18. Tập luật có độ tin cậy lớn hơn hoặc bằng Min_conf=29% bao gồm những luật nào? 19. Độ hỗ trợ của tập mục. dộ hỗ trợ và độ tin cậy của luật kết hợp: ý nghĩa và cách tìm

Co giao

Embed Size (px)

Citation preview

Page 1: Co giao

Câu hỏi ôn tập:

1. Các dạng dữ liệu trong thực tế?2. Tại sao phải rời rạc hóa dữ liệu3. Rút gọn dữ liệu có làm mất thông tin ko?4. Xấp xỉ trên, xấp xỉ dưới, miền khẳng định5. Chứng minh các tính chất của xấp xỉ6. Tính ma trận phân biệt đc, hàm phân biệt dc7. Tìm tập lõi, rút gọn8. Ý nghĩa của tập lõi, rút gọn, có tối đa bao nhiêu tập rút gon?9. Khai phá luật quyết định dựa vào lí thuyết tập thô10.Phân biệt giữa luật kết hợp và luật quyết định11.CHứng minh hàm dấu là 1 độ đo tương tự12.Các chỉ số tương tự của Russel và Rao; Jaccard; Sokal và Michener có phải

là các độ đo tương tự ko?13. Phân biệt các mô hình phân lớp14.Các p2 nào tính khoảng cách giữa 2 nhóm chỉ phụ thuộc vào ma trận khoảng

cách ban đầu? Phương pháp nào phụ thuộc vào cả dữ liệu ban đầu?15. Kết quả phân cụm có phụ thuộc vào việc chọn lựa phương pháp tính khoảng

cách giữa 2 cụm ko?16. Nhược điểm của thuật toán K-mean là gi?17.Cho ví dụ thực tế sử dụng từng phương pháp phân lớp dữ liệu phù hợp.18.Tập luật có độ tin cậy lớn hơn hoặc bằng Min_conf=29% bao gồm những

luật nào?19. Độ hỗ trợ của tập mục. dộ hỗ trợ và độ tin cậy của luật kết hợp: ý nghĩa và

cách tìm20. Số lượng luật sinh ra có phụ thuộc vào giá trị minsupp và minconf ko?Có,

vì giá trị càng nhỏ thì tập luật sinh ra càng nhiều21. Chứng minh các tính chất của độ hỗ trợ và độ tin cậy.22. Thuật toán Apriori; độ phức tạp thuật toán.23.Nếu cố định vế phải của luật, thuật toán sẽ thay đổi ntn? Liên tưởng gì đến

bài toán tìm phụ thuộc hàm?24. Miền giá trị và ý nghĩa của Entropy, Gain.25. Hệ thống đc xcem là ổn định với iá trị nào của Entropy? =1 vì không phân

nhánh nữa 26. Ưu và nhược điểm khi xây đựng cây quyết định dựa vào Entropy?27. Các luật quyết định sinh ra từ cây quyết định?