Co giao

Preview:

Citation preview

Câu hỏi ôn tập:

1. Các dạng dữ liệu trong thực tế?2. Tại sao phải rời rạc hóa dữ liệu3. Rút gọn dữ liệu có làm mất thông tin ko?4. Xấp xỉ trên, xấp xỉ dưới, miền khẳng định5. Chứng minh các tính chất của xấp xỉ6. Tính ma trận phân biệt đc, hàm phân biệt dc7. Tìm tập lõi, rút gọn8. Ý nghĩa của tập lõi, rút gọn, có tối đa bao nhiêu tập rút gon?9. Khai phá luật quyết định dựa vào lí thuyết tập thô10.Phân biệt giữa luật kết hợp và luật quyết định11.CHứng minh hàm dấu là 1 độ đo tương tự12.Các chỉ số tương tự của Russel và Rao; Jaccard; Sokal và Michener có phải

là các độ đo tương tự ko?13. Phân biệt các mô hình phân lớp14.Các p2 nào tính khoảng cách giữa 2 nhóm chỉ phụ thuộc vào ma trận khoảng

cách ban đầu? Phương pháp nào phụ thuộc vào cả dữ liệu ban đầu?15. Kết quả phân cụm có phụ thuộc vào việc chọn lựa phương pháp tính khoảng

cách giữa 2 cụm ko?16. Nhược điểm của thuật toán K-mean là gi?17.Cho ví dụ thực tế sử dụng từng phương pháp phân lớp dữ liệu phù hợp.18.Tập luật có độ tin cậy lớn hơn hoặc bằng Min_conf=29% bao gồm những

luật nào?19. Độ hỗ trợ của tập mục. dộ hỗ trợ và độ tin cậy của luật kết hợp: ý nghĩa và

cách tìm20. Số lượng luật sinh ra có phụ thuộc vào giá trị minsupp và minconf ko?Có,

vì giá trị càng nhỏ thì tập luật sinh ra càng nhiều21. Chứng minh các tính chất của độ hỗ trợ và độ tin cậy.22. Thuật toán Apriori; độ phức tạp thuật toán.23.Nếu cố định vế phải của luật, thuật toán sẽ thay đổi ntn? Liên tưởng gì đến

bài toán tìm phụ thuộc hàm?24. Miền giá trị và ý nghĩa của Entropy, Gain.25. Hệ thống đc xcem là ổn định với iá trị nào của Entropy? =1 vì không phân

nhánh nữa 26. Ưu và nhược điểm khi xây đựng cây quyết định dựa vào Entropy?27. Các luật quyết định sinh ra từ cây quyết định?