25
Ra quyết định với thông tin không chắc chắn bằng việc ứng dụng mô hình cây quyết định Vũ Thị Phương Thảo Trường Đại hc Công nghLuận văn Thạc sĩ ngành: Hệ thông thông tin; Mã số: 60 48 05 Người hướng dẫn: PGS. TS. Đỗ Văn Thành Năm bảo vệ: 2011 Abstract: Tổng quan về mô hình cây quyết định và thông tin không chắc chắn, giới thiệu khái niệm về cây quyết định, phân loại cây quyết định, ưu nhược điểm của cây quyết định trong việc giải quyết bài toán về phân loại, ra quyết định và phương pháp xây dựng cây quyết định. Trình bày khái niệm, phân loại, cách biểu diễn và ứng dụng của thông tin không chắc chắn. Phân tích những công cụ hỗ trợ xây dựng mô hình cây quyết định và lập kế hoạch sản xuất kinh doanh doanh nghiệp, trình bày tóm lược nội dung và quá trình ra quyết định với thông tin không chắc chắn; giới thiệu PrecisionTree 5.7, là công cụ để xây dựng cây quyết định nhằm xử lý thông tin không chắc chắn, hỗ trợ quá trình ra quyết định trong việc lập kế hoạch. Ra quyết định với thông tin không chắc chắn trong lập kế hoạch sản xuất kinh doanh của doanh nghiệp, ứng dụng mô hình cây quyết định trong lập kế hoạch sản xuất kinh doanh dựa trên tập dữ liệu giả định và trên tập dữ liệu thực tế được thu thập từ Công ty cổ phần May Thăng Long. Keywords: Công nghệ thông tin; Hệ thống thông tin; Mô hình cây quyết định Content MỞ ĐẦU Lập kế hoạch phát triển sản xuất kinh doanh là một trong những hoạt động rất quan trọng của doanh nghiệp. Thực tiễn cho thấy trong bối cảnh hoạt động của nền kinh tế thị trường có sự hội nhập kinh tế toàn cầu ngày càng sâu rộng, cạnh tranh ngày càng sâu sắc như ở nước ta hiện nay thì việc lập kế hoạch sản xuất kinh doanh doanh nghiệp càng trở lên quan trọng và trở thành yếu tố có ý nghĩa quyết định đến sự thành công hay thất bại của doanh nghiệp. Để nâng cao chất lượng kế hoạch sản xuất kinh doanh doanh nghiệp điều quan trọng là doanh nghiệp cần nắm bắt đầy đủ, kịp thời và xử lý, khai thác có hiệu quả các thông tin liên quan đến hoạt động sản xuất kinh doanh của doanh nghiệp, đến thị trường tiêu thụ sản phẩm hàng hoá và dịch vụ do doanh nghiệp tạo r a. Quá trình toàn cầu hoá và thông tin hoá diễn ra mạnh mẽ đã làm công tác lập kế hoạch phát triển sản xuất kinh doanh doanh nghiệp ngày càng phức tạp. Trong quá trình lp kế

Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

Embed Size (px)

Citation preview

Page 1: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

Ra quyết định với thông tin không chắc chắn

bằng việc ứng dụng mô hình cây quyết định

Vũ Thị Phương Thảo

Trường Đại học Công nghệ

Luận văn Thạc sĩ ngành: Hệ thông thông tin; Mã số: 60 48 05

Người hướng dẫn: PGS. TS. Đỗ Văn Thành

Năm bảo vệ: 2011

Abstract: Tổng quan về mô hình cây quyết định và thông tin không chắc chắn, giới

thiệu khái niệm về cây quyết định, phân loại cây quyết định, ưu nhược điểm của cây

quyết định trong việc giải quyết bài toán về phân loại, ra quyết định và phương pháp

xây dựng cây quyết định. Trình bày khái niệm, phân loại, cách biểu diễn và ứng dụng

của thông tin không chắc chắn. Phân tích những công cụ hỗ trợ xây dựng mô hình cây

quyết định và lập kế hoạch sản xuất kinh doanh doanh nghiệp, trình bày tóm lược nội

dung và quá trình ra quyết định với thông tin không chắc chắn; giới thiệu

PrecisionTree 5.7, là công cụ để xây dựng cây quyết định nhằm xử lý thông tin không

chắc chắn, hỗ trợ quá trình ra quyết định trong việc lập kế hoạch. Ra quyết định với

thông tin không chắc chắn trong lập kế hoạch sản xuất kinh doanh của doanh nghiệp,

ứng dụng mô hình cây quyết định trong lập kế hoạch sản xuất kinh doanh dựa trên tập

dữ liệu giả định và trên tập dữ liệu thực tế được thu thập từ Công ty cổ phần May

Thăng Long.

Keywords: Công nghệ thông tin; Hệ thống thông tin; Mô hình cây quyết định

Content

MỞ ĐẦU

Lập kế hoạch phát triển sản xuất kinh doanh là một trong những hoạt động rất quan

trọng của doanh nghiệp. Thực tiễn cho thấy trong bối cảnh hoạt động của nền kinh tế thị

trường có sự hội nhập kinh tế toàn cầu ngày càng sâu rộng, cạnh tranh ngày càng sâu sắc như

ở nước ta hiện nay thì việc lập kế hoạch sản xuất kinh doanh doanh nghiệp càng trở lên quan

trọng và trở thành yếu tố có ý nghĩa quyết định đến sự thành công hay thất bại của doanh

nghiệp.

Để nâng cao chất lượng kế hoạch sản xuất kinh doanh doanh nghiệp điều quan trọng là

doanh nghiệp cần nắm bắt đầy đủ, kịp thời và xử lý, khai thác có hiệu quả các thông tin liên

quan đến hoạt động sản xuất kinh doanh của doanh nghiệp, đến thị trường tiêu thụ sản phẩm

hàng hoá và dịch vụ do doanh nghiệp tạo ra.

Quá trình toàn cầu hoá và thông tin hoá diễn ra mạnh mẽ đã làm công tác lập kế hoạch

phát triển sản xuất kinh doanh doanh nghiệp ngày càng phức tạp. Trong quá trình lập kế

Page 2: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

2

hoạch, các doanh nghiệp phải xử lý một số lượng rất lớn thông tin, trong số đó có nhiều thông

tin được biết không chắc chắn, để rút ra những tri thức mới và ra quyết định từ những tri thức

này. Như vậy ngày càng có nhiều thông tin với tốc độ thay đổi rất nhanh để trợ giúp việc ra

quyết định và ngày càng có nhiều câu hỏi mang tính chất định tính cần phải trả lời dựa trên

một khối lượng dữ liệu khổng lồ đã có, đặc biệt trong đó có nhiều dữ liệu không chắc chắn.

Các phương pháp quản trị và khai thác, phân tích dữ liệu truyền thống đã không đáp

ứng được thực tế bùng nổ của thông tin và dữ liệu, đòi hỏi phải có phương pháp, kỹ thuật mới

để tổng hợp, lưu trữ, xử lý và khai thác thông tin, dữ liệu. Lĩnh vực phát hiện tri thức từ các

cơ sở dữ liệu đã được hình thành, trong đó khai phá dữ liệu (data mining) được xem là trung

tâm của lĩnh vực nghiên cứu và ứng dụng này.

Hiện tại, người ta đã xây dựng được khá nhiều kỹ thuật khai phá dữ liệu như phân cụm

phân lớp dữ liệu, mạng nơtron, giải thuật di truyền, luật kết hợp, mạng Bayes, ....Trong các kỹ

thuật này cây quyết định được coi là công cụ mạnh và phổ biến nhất, nó đặc biệt thích hợp cho

những vấn đề khai phá dữ liệu nhằm hỗ trợ quá trình ra quyết định.

Cây quyết định thực chất là công cụ hỗ trợ quyết định, có thể biểu diễn dữ liệu phức

tạp theo một cấu trúc đơn giản hơn rất nhiều dưới dạng cây. Cây quyết định cũng có thể được

sử dụng để xử lý thông tin không chắc chắn.

Luận văn này nằm trong hướng khảo cứu, ứng dụng cây quyết định trong việc xử lý

thông tin không chắc chắn nhằm rút ra tri thức mới, phục vụ ra quyết định trong quá trình lập

kế hoạch phát triển sản xuất kinh doanh của doanh nghiệp.

Không kể các phần mở đầu, kết luận, mục lục, danh mục bảng, hình và tài liệu tham

khảo, luận văn gồm 3 chương nội dung chính, trong đó:

Chƣơng 1: Tổng quan về mô hình cây quyết định và thông tin không chắc chắn sẽ

giới thiệu một số khái niệm và vấn đề chung nhất về những vấn đề này. Cụ thể Chương I sẽ

giới thiệu khái niệm về cây quyết định, phân loại cây quyết định, ưu nhược điểm của cây

quyết định trong việc giải quyết bài toán về phân loại, ra quyết định và phương pháp xây dựng

cây quyết định. Chương 1 cũng giới thiệu khái niệm, phân loại, cách biểu diễn và ứng dụng

của thông tin không chắc chắn. Đó là những kiến thức cơ bản nhất, làm cơ sở để tìm khảo cứu

và ứng dụng mô hình cây quyết định trong việc xử lý thông tin không chắc chắn nhằm hỗ trợ

quá trình lập kế hoạch phát triển sản xuất kinh doanh doanh nghiệp ở các chương tiếp sau.

Chƣơng 2: Công cụ hỗ trợ xây dựng mô hình cây quyết định và lập kế hoạch sản xuất

kinh doanh doanh nghiệp sẽ trình bầy tóm lược nội dung và quá trình ra quyết định với thông

tin không chắc chắn; giới thiệu PrecisionTree 5.7, là công cụ được luận văn sử dụng để xây

dựng cây quyết định nhằm xử lý thông tin không chắc chắn, hỗ trợ quá trình ra quyết định

trong việc lập kế hoạch. Chương này cũng trình bày khái niệm, lợi ích, quy trình, phân loại

các hoạt động lập kế hoạch, các yếu tố chính tác động đến hoạt động lập kế hoạch và một số

nội dung chủ yếu cần được ra quyết định trong quá trình lập kế hoạch sản xuất kinh doanh của

doanh nghiệp.

Page 3: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

3

Như đã biết, công việc của các nhà lập kế hoạch trước hết phải đánh giá được tính chất

và mức độ không chắc chắn của môi trường kinh doanh để xác định giải pháp phản ứng của

doanh nghiệp, xây dựng và triển khai các kế hoạch thích hợp. Luận văn khảo cứu quá trình

lập kế hoạch sản xuất kinh doanh doanh nghiệp và đề xuất ứng dụng mô hình cây quyết định

trong quá trình đó.

Chƣơng 3: Ra quyết định với thông tin không chắc chắn trong lập kế hoạch sản xuất

kinh doanh của doanh nghiệp sẽ trình bầy việc ứng dụng mô hình cây quyết định trong lập kế

hoạch sản xuất kinh doanh dựa trên tập dữ liệu giả định và trên tập dữ liệu thực tế được thu

thập từ Công ty cổ phần May Thăng Long.

CHƢƠNG 1: TỔNG QUAN VỀ MÔ HÌNH CÂY QUYẾT ĐỊNH VÀ THÔNG TIN

KHÔNG CHẮC CHẮN

Chương này giới thiệu tổng quan về mô hình cây quyết định và thông tin không chắc

chắn. Luận văn trước hết trình bày lý thuyết chung nhất về cây quyết định như giới thiệu cây

quyết định, phân loại, xây dựng và ứng dụng của cây quyết định. Sau đó trình bày về thông tin

không chắc chắn, gồm khái niệm cơ bản, các cách biểu diễn thông tin không chắc chắn với lý

thuyết xác suất, định lý Bayes, lý thuyết về yếu tố chắc chắn Standford và tập mờ.

1.1 Tổng quan về mô hình cây quyết định

1.1.1 Giới thiệu cây quyết định

Trong lĩnh vực học máy, cây quyết định là một kiểu mô hình dự báo (predictive

model), nghĩa là một ánh xạ từ các quan sát về một sự vật/hiện tượng tới các kết luận về giá

trị mục tiêu của sự vật/hiện tượng[3,12]

. Mỗi một nút trong (internal nút) tương ứng với một

biến; đường nối giữa nó với nút con của nó thể hiện một giá trị cụ thể cho biến đó. Mỗi nút lá

đại diện cho giá trị dự báo của biến mục tiêu, cho trước các giá trị của các biến được biểu diễn

bởi đường đi từ nút gốc tới nút lá đó. Kỹ thuật học máy dùng trong cây quyết định được gọi là

học bằng cây quyết định, hay chỉ gọi với cái tên ngắn gọn là cây quyết định.

Học bằng cây quyết định là phương pháp thông dụng trong khai phá dữ liệu. Khi đó,

cây quyết định mô tả một cấu trúc cây, trong đó, các lá đại diện cho các phân loại còn cành

đại diện cho các kết hợp của các thuộc tính dẫn tới phân loại đó. Một cây quyết định có thể

được học bằng cách chia tập hợp nguồn thành các tập con dựa theo một kiểm tra giá trị thuộc

tính. Quá trình này được lặp lại một cách đệ qui cho mỗi tập con dẫn xuất. Quá trình đệ qui

hoàn thành khi không thể tiếp tục thực hiện việc chia tách được nữa, hay khi một phân loại

đơn có thể áp dụng cho từng phần tử của tập con dẫn xuất. Một bộ phân loại rừng ngẫu nhiên

(random forest) sử dụng một số cây quyết định để có thể cải thiện tỉ lệ phân loại[12]

.

Giải thuật học cây quyết định gồm 2 bước lớn: xây dựng cây (Top-down), cắt nhánh

(Bottom-up) để tránh học vẹt. Quá trình xây dựng cây được làm như sau:

- Bắt đầu nút gốc, tất cả các dữ liệu học ở nút gốc,

Page 4: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

4

- Nếu dữ liệu tại 1 nút có cùng lớp thì nút được cho là nút lá, nhãn của nút lá là nhãn của

các phần tử trong nút lá (hay luật bình chọn số đông nếu nút lá có chứa các phần tử có lớp

khác nhau),

- Nếu dữ liệu ở nút quá hỗn loạn (các phần tử có lớp rất khác nhau) thì nút được cho là

nút trong, tiến hành phân hoạch dữ liệu một cách đệ quy bằng việc chọn 1 thuộc tính để thực

hiện phân hoạch tốt nhất có thể.

Quá trình xây dựng cây chủ yếu phụ thuộc vào việc chọn thuộc tính tốt nhất để phân

hoạch dữ liệu. Chọn thuộc tính phân hoạch tốt theo nghĩa, cho ra kết quả là cây nhỏ nhất.

Việc lựa chọn này dựa vào các heuristics: chọn thuộc tính sinh ra các nút thuần khiết nhất.

1.1.2 Các kiểu cây quyết định

Theo tiêu chí phân loại dựa vào giá trị thuộc tính của cây, cây quyết định được chia

thành 2 loại chính:

1.1.2.1 Cây hồi quy: ước lượng các hàm giá có giá trị là số thực thay vì được sử dụng

cho các nhiệm vụ phân loại.

Giá trị thuộc tính liên tục A cần được rời rạc hóa trong cây quyết định. Với các cách

tiếp cận thông thường: ta coi thuộc tính chỉ có một cách rời rạc trong khoảng [ -∞,t] , [t,+∞]

. Cần lựa chọn ngưỡng t: để với mỗi trường hợp của t tính toán độ tăng thông tin của A do sự

rời rạc của t. Chọn t với độ tăng thông tin lớn nhất (t có thể biến đổi với các trường hợp của

A trên cây). Các giá trị của t được xem xét: giá trị của A trong một số trường hợp của dữ liệu [3,8].

Nói cách khác với thuộc tính liên tục (thuộc tính dạng số) thì tập giá trị là không xác

định trước. Chính vì vậy, trong quá trình phát triển cây, cần sử dụng kiểm tra dạng nhị phân:

value(A) ≤ θ. Với θ là hằng số ngưỡng được lần lượt xác định dựa trên từng giá trị riêng biệt

hay từng cặp giá trị liền nhau (theo thứ tự đã sắp xếp) của thuộc tính liên tục đang xem xét

trong tập dữ liệu [8].

1.1.2.2 Cây phân loại

Nếu biến phụ thuộc nhận giá trị phân loại, tức giá trị biểu trưng (symbol) được sắp

thứ tự. Chẳng hạn như: giới tính (nam hay nữ), kết quả của một trận đấu (thắng hay thua),

trình độ học lực (xuất sắc, giỏi, khá, trung bình, yếu) .... Khi đó các thuộc tính có giá trị rời

rạc [3, 12].

Một cây quyết định phân loại là một mô hình phân loại (bộ phân loại) cho một biến

lớp T khi biết các thuộc tính A. Để phân lớp mẫu dữ liệu chưa biết, giá trị các thuộc tính của

mẫu được đưa vào kiểm tra trên cây quyết định. Mỗi mẫu tương ứng có một đường đi từ gốc

đến lá và lá biểu diễn dự báo giá trị phân lớp mẫu đó.

Ngoài hai loại trên, một cây quyết định có thể được thể hiện gọn như một sơ đồ ảnh

hưởng, tập trung sự chú ý vào các vấn đề và mối quan hệ giữa các sự kiện.

Page 5: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

5

1.1.3 Ƣu điểm của cây quyết định

So với các phương pháp khai phá dữ liệu khác, cây quyết định là phương pháp có một

số ưu điểm chính sau:

- Cây quyết định dễ hiểu. Người ta có thể hiểu mô hình cây quyết định sau khi được

giải thích ngắn.

- Việc chuẩn bị dữ liệu cho một cây quyết định là đơn giản hoặc không cần thiết, trong

khi các kỹ thuật khác thường đòi hỏi phải chuẩn hóa dữ liệu, tạo thêm các biến giả và loại bỏ

các giá trị khuyết thiếu.

- Cây quyết định có thể xử lý cả dữ liệu có giá trị bằng số và dữ liệu có giá trị là tên

thể loại (giá trị phân loại).

- Cây quyết định là một mô hình hộp trắng. Nếu có thể quan sát một tình huống cho

trước trong một mô hình, thì có thể dễ dàng giải thích điều kiện đó bằng logic Boolean. Mạng

nơ-ron là một ví dụ về mô hình hộp đen, do lời giải thích cho kết quả quá phức tạp để có thể

hiểu được.

1.1.4 Nhƣợc điểm của cây quyết định

Cây quyết định khó giải quyết được những vấn đề có dữ liệu phụ thuộc thời gian liên

tục, không thích hợp lắm với những bài toán với mục tiêu là dự báo giá trị của các thuộc tính

như lãi suất ngân hàng, tín dụng, ….[3]

* Dễ xẩy ra lỗi khi có quá nhiều lớp

* Chi phí tính toán để xây dựng mô hình cây quyết định cao:

1.1.5 Ứng dụng của cây quyết định

Một trong những ứng dụng của cây quyết định là được sử dụng để phân lớp dữ liệu.

Tuy có nhiều kỹ thuật phân lớp khác đã được đề xuất như: phân lớp Bayes, phân lớp K -

hàng xóm gần nhất, mạng nơron, phân tích thống kê,…, nhưng phân lớp cây quyết định vẫn

được coi là công cụ mạnh, phổ biến và đặc biệt thích hợp cho khai phá dữ liệu [4].

1.1.5.1 Sử dụng để phân lớp dữ liệu

Để phân lớp mẫu dữ liệu chưa biết, giá trị các thuộc tính của mẫu được đưa vào kiểm

tra trên cây quyết định. Mỗi mẫu tương ứng có một đường đi từ gốc đến lá và lá biểu diễn dự

báo giá trị phân lớp mẫu đó.

1.1.5.2 Sử dụng trong các mô hình dự báo

Cây quyết định có thể xử lý tốt các thuộc tính có giá trị liên tục. Do đó có thể được sử

dụng để xây dựng mô hình với các hàm nhận giá trị liên tục.

1.1.5.3 Sử dụng để biểu diễn các vấn đề ra quyết định

Page 6: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

6

1.1.6 Xây dựng và ứng dụng cây quyết định

Xây dựng và ứng dụng cây quyết định là quá trình nhiều bước gồm: tạo lập, cắt tỉa cây

quyết định, sau đó trích rút ra các luật, sử dụng các thủ tục suy diễn để rút ra tri thức thu được.

Sau đây luận văn trình bày về các quá trình trên.

1.1.6.1 Thủ tục tạo lập cây quyết định

Quá trình tạo cây quyết định gồm hai giai đoạn [3, 12]

* Giai đoạn thứ nhất phát triển cây quyết định:

Giai đoạn này phát triển bắt đầu từ gốc, đến từng nhánh và phát triển quy nạp theo

cách thức chia để trị cho tới khi đạt được cây quyết định với tất cả các lá được gán nhãn lớp.

Thuật toán xây dựng cây quyết định

Luận văn trình bày giải thuật quy nạp xây dựng cây quyết định ID3 (gọi tắt là ID3) là

một giải thuật học đơn giản nhưng rất thành công trong nhiều lĩnh vực. ID3 là một giải thuật

hay vì cách biểu diễn tri thức học được của nó, vì cách tiếp cận của nó trong việc quản lý tính

phức tạp, vì cách sử dụng phương pháp heuristic để chọn lựa các ứng viên, và tiềm năng của

nó đối với việc xử lý dữ liệu nhiễu [3, 12].

Đầu vào: Một tập hợp các mẫu. Mỗi mẫu bao gồm các thuộc tính mô tả một tình

huống, hay một đối tượng nào đó, và một giá trị phân loại của nó.

Đầu ra: Cây quyết định có khả năng phân loại đúng đắn các mẫu trong tập dữ liệu

huấn luyện, và hy vọng là phân loại đúng cho cả các ví dụ chưa gặp trong tương lai.

* ID3 xây dựng cây quyết định theo giải thuật sau:

Function induce_tree(tập_mẫu, tập_thuộc_tính)

begin

if mọi mẫu trong tập_mẫu đều nằm trong cùng một lớp

then

return một nút lá được gán nhãn bởi lớp đó

else if tập_thuộc_tính là rỗng then

return nút lá được gán nhãn bởi tuyển của tất cả các lớp trong tập_mẫu

else

begin

chọn một thuộc tính P, lấy nó làm gốc cho cây hiện tại;

xóa P ra khỏi tập_thuộc_tính;

với mỗi giá trị V của P

begin

Page 7: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

7

tạo một nhánh của cây gán nhãn V;

Đặt vào phân_vùngV các ví dụ trong tập_mẫu có giá trị V

tại thuộc tính P;

Gọi induce_tree(phân_vùngV, tập_thuộc_tính), gắn kết

quả vào nhánh V

end

end

end

Sau khi xây dựng được cây quyết định, bước tiếp theo là cắt tỉa nhánh của cây.

* Giai đoạn thứ hai cắt, tỉa bớt các cành nhánh trên cây quyết định:

1.1.6.2 Ứng dụng trích rút luật từ cây quyết định

Tri thức trong cây quyết định có thể được chiết xuất và trình bày dưới dạng các luật

phân loại IF-THEN. .

Luật suy diễn

Một công thức H được xem là hệ quả logic (logical consequence) của một tập công

thức G ={G1,.....,Gm} nếu trong bất kỳ minh họa nào mà {G1,.....,Gm} đúng thì H cũng đúng,

hay nói cách khác bất kỳ mô hình nào của G cũng là mô hình của H [4]

.

. Trong các hệ dựa trên luật, có hai phương pháp luận lập luận cơ bản: Lập luận tiến,

và lập luận lùi

Lập luận tiến

Tư tưởng cơ bản của lập luận tiến là áp dụng luật suy diễn Modus Ponens tổng quát.

Trong mỗi bước của thủ tục lập luận tiến, người ta xét một luật trong cơ sở luật. Đối sánh mỗi

điều kiện của luật với các sự kiện trong cơ sở sự kiện, nếu tất cả các điều kiện của luật đều

được thoả mãn thì sự kiện trong phần kết luận của luật được xem là sự kiện được suy ra. Nếu

sự kiện này là sự kiện mới (không có trong bộ nhớ làm việc), thì nó được đặt vào bộ nhớ làm

việc. Quá trình trên được lặp lại cho tới khi nào không có luật nào sinh ra các sự kiện mới.

Lập luận lùi

Trong lập luận lùi, người ta đưa ra các giả thuyết cần được đánh giá. Sử dụng lập luận lùi, giả

thuyết đưa ra hoặc là được chứng minh, hoặc là bị bác bỏ (bởi các sự kiện trong bộ nhớ làm

việc). Lập luận lùi cho phép ta tìm ra các phép thế biến mà giả thuyết đưa ra trở thành đúng

(là hệ quả logic của cơ sở tri thức). Do đó trong hệ dựa trên luật chúng ta có thể sử dụng lập

luận lùi để tìm ra các câu trả lời cho các câu hỏi được đặt ra bởi người sử dụng.

procedure Backward_Chaining (Hyp, );

begin

H giả thuyết đầu tiên trong danh sách Hyp;

Page 8: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

8

for mỗi luật R = (Conds, Q) do

if H hợp nhất với Q bởi phép thế 1 then

1. Loại H khỏi danh sách Hyp;

2. Thêm các điều kiện của luật Conds vào danh sách Hyp;

3. áp dụng phép thế 1 vào các giả thuyết trong danh sách Hyp;

4. Lấy hợp thành của các phép thế và 1 để nhận được phép thế mới, tức là

1;

if Hyp = [ ] then cho ra

else Backward_Chaining (Hyp, );

end;

1.2 Tổng quan về thông tin không chắc chắn

Sự không chắc chắn là một thuật ngữ được sử dụng theo những cách khác nhau trong

một số lĩnh vực, bao gồm vật lý, triết học, thống kê, kinh tế, tài chính, bảo hiểm, tâm lý học,

xã hội học, kỹ thuật, và khoa học thông tin. Áp dụng đối với dự báo của các sự kiện trong

tương lai, các phép đo vật lý đã được thực hiện, hoặc chưa biết.

1.2.1 Khái niệm

Sự không chắc chắn: là trạng thái có hiểu biết hạn chế về những hiện tượng tự nhiên-

kinh tế -xã hội, không thể mô tả chính xác tình trạng hiện hành cũng như kết quả trong tương

lai của chúng[1,7]

.

1.2.2 Phân loại sự không chắc chắn

Sự không chắc chắn có thể được chia thành các bộ phận được xác định rõ và không rõ

nét, gồm đối tượng và chủ thể không chắc chắn. Không chắc chắn cũng được xác định có thể

được phân tích với lý thuyết xác suất. Sự thiếu rõ ràng có thể được chia thành đặc trưng

không và bất hòa. Đặc trưng không thể được phân tích với lý thuyết khả năng và bất hòa có

thể được phân tích với bản thể học.

Không chắc chắn

(uncertainty)

Đối tượng không chắc chắn

(objective uncertainty)

Chủ thể không chắc chắn

(subjective uncertainty)

Nhận thức không chắc chắn

(epistemological uncertainty)

Bản thế không chắc chắn

(ontological uncertainty)

Đạo đức không chắc chắn

( moral uncertainty)

Quy tắc không chắc chắn (rule

uncertainty)

Tri thức hướng dẫn quyết định

(knowledge guided decision)

Lý trí hướng dẫn quyết định

(Quasi-rational decision)

Quy tắc hướng dẫn quyết định

(rule guided decision)

Trực giác hướng dẫn quyết định

(intuition guiđe decision)

Page 9: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

9

Hình 4 : Phân loại tư duy của sự không chắc chắn

1.2.3 Ứng dụng thông tin không chắc chắn

Trên thực tế có rất nhiều lĩnh vực có sử dụng các thông tin không chắc chắn vào giải quyết

vấn đề như:

- Sự không chắc chắn được tham gia vào tất cả các đo lường, chẳng hạn như đo

khoảng cách, nhiệt độ, mức độ phụ thuộc vào công cụ hoặc kỹ thuật được sử dụng để làm cho

đo lường. Sự không chắc chắn được sử dụng thiết kế các trò chơi, đáng chú ý nhất là trò chơi

về cờ bạc, nơi mà “cơ hội” là trọng tâm trò chơi.

- Trong khoa học, dự báo các sự kiện trong tương lai nên được hiểu là có một loạt các

giá trị dự kiến, giá trị không chắc chắn.

- Trong dự báo thời tiết hiện nay bao gồm dữ liệu về mức độ sự không chắc chắn trong

thông tin để dự báo thời tiết.

- Trong đánh giá rủi ro và quản lý rủi ro.

1.2.4 Đo lƣờng không chắc chắn

Đo lường không chắc chắn là một khái niệm trung tâm xác định số lượng phân tán hợp

lý của thuộc tính đến một kết quả đo lường. Như vậy không chắc chắn cũng có thể được gọi là

một phép đo lỗi.

1.2.5 Biểu diễn thông tin không chắc chắn

Luận văn trình bày việc biểu diễn thông tin theo hai hướng tiếp cận.Tiếp cận thứ nhất

là tiếp cận thống kê, trong hướng tiếp cận này sẽ trình bày hai phương pháp: lý thuyết xác

suất Bayesian và lý thuyết về đại số hệ số chắc chắn. Tiếp cận thứ hai là biểu diễn thông tin

không chắc chắn theo logic mờ[4,7]

.

1.2.5.1 Tiếp cận thống kê đối với tính không chắc chắn.

Ở đây, luận văn trình bày lý thuyết xác suất như là cơ sở toán học cho sự biểu diễn

tri thức không chắc chắn.

Người ta sử dụng số p, 0 p 1, là xác suất của một sự kiện hoặc xác suất của một

mệnh đề để biểu diễn khả năng một sự kiện có thể xảy ra hoặc khả năng một mệnh đề có thể

đúng.

* Công thức Bayes đƣợc phát biểu nhƣ sau:

Ký hiệu P(h | e) là xác suất khẳng định giả thuyết h đúng cho trước bằng chứng e.

Page 10: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

10

Điểm quan trọng của lý thuyết Bayes là các con số ở vế phải của công thức dễ

dàng xác định, ít nhất là khi so sánh với vế trái

*Công thức Bayes tổng quát

Trong thực tế có nhiều giả thuyết cạnh tranh nhau, vì vậy công thức Bayes tổng quát nhất

là:

* Mạng xác suất

Mô hình được đề suất là mạng xác suất: mạng xác suất là một đồ thị có hướng, không

có chu trình và thoả mãn các điều kiện sau:

- Các đỉnh của đồ thị là các biến ngẫu nhiên;

- Mỗi cung từ đỉnh X đến đỉnh Y biểu diễn sự ảnh hưởng trực tiếp của biến ngẫu

nhiên X đến biến ngẫu nhiên Y (hay Y phụ thuộc trực tiếp vào X). Đỉnh X

được gọi là đỉnh cha của Y;

- Tại một đỉnh được cho phân phối xác suất có điều kiện của đỉnh đó khi cho

trước các cha của nó. Các xác suất này biểu diễn hiệu quả mà các cha tác dụng

vào nó.

Mô hình tổng quát hơn để biểu diễn vấn đề quyết định là mạng quyết định (decision

network hay còn gọi là influence diagram). Mạng quyết định là mở rộng của mạng xác suất

bằng cách đưa thêm vào các đỉnh quyết định và các đỉnh lợi ích.

1.2.5.2 Đại số hệ số chắc chắn Stanford

Khi suy luận với tri thức heuristic, các chuyên gia có thể đưa ra các ước lượng niềm

tin hữu ích về các kết luận. Họ ước lượng các kết luận bằng các thuật ngữ như “có nhiều khả

năng”, “không chắc”, “hầu như chắc chắn” hay “có thể”. * Lý thuyết về đại số hệ số chắc

chắn Stanford

Lý thuyết về độ chắc chắn Stanford [7,13]

đưa ra một số giả thiết đơn giản cho việc tạo

ra các độ đo niềm tin và có một số quy tắc đơn giản tương đương cho việc kết hợp những

niềm tin này khi chương trình tiến đến kết luận của nó. Giả thiết thứ nhất là tách “niềm tin

ủng hộ” ra khỏi “niềm tin chống lại” một quan hệ:

Gọi MB(H | E) là độ đo của niềm tin và MD(H | E) là độ đo của sự hoài nghi vào khả

năng đúng của giả thuyết H, khi có bằng chứng E

Giá trị của các độ đo này chỉ rơi vào một trong hai trường hợp:

0 < MB(H | E) < 1 trong khi MD(H | E) = 0,

hoặc: 0 < MD(H | E) < 1 trong khi MB(H | E) = 0

hệ số chắc chắn CF:

Page 11: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

11

CF (H | E) = MB(H | E) - MD(H | E)

* Phƣơng pháp suy luận với thông tin không chắc chắn

Như vậy, ở đây có hai loại thông tin không chắc chắn: một là dữ liệu ban đầu được cho

là không chắc chắn, không đủ, không đáng tin cậy,… hai là các luật sử dụng để suy luận không

hợp logic, suy luận ngược từ kết luận về điều kiện, hay có thể gọi là suy luận theo kiểu phỏng

đoán.

Suy luận phỏng đoán thường được ứng dụng trong thực tế để tìm hiểu các hiện tượng xảy

ra, ví dụ:

If hàng hóa áo sơ mi nam bán không đạt chỉ tiêu Then chỉ tiêu quá cao hoặc thị hiếu đã

thay đổi;

1.2.5.2 Tiếp cận theo hƣớng logic mờ

Lý thuyết tập mờ là một công cụ toán học chính xác để mô tả các thông tin không chính

xác, mang tính nhập nhằng, mờ (vagueness, ambiguity).

* Khái niệm về tập mờ:

Cho S là một tập hợp và x là một phần tử của tập hợp đó. Một tập con mờ F của S được

định nghĩa bởi một hàm thành viên μF(x) đo “mức độ” mà theo đó x thuộc về tập F. Hàm A

được gọi là hàm thuộc (hoặc hàm đặc trưng) của tập mờ A còn A(x) được gọi là mức độ thuộc

của x vào tập mờ A. Trong đó, 0 ≤ μF(x) ≤ 1.

Khi μF(x) = 0 nghĩa là x hoàn toàn không thuộc tập F.

Khi μF(x) = 1 nghĩa là x thuộc F hoàn toàn.

Nếu μF(x) = 0 hoặc 1 thì tập F được xem là “giòn”

Như vậy tập mờ là sự tổng quát hoá tập rõ bằng cách cho phép hàm thuộc lấy giá trị bất

kỳ trong khoảng [0,1], trong khi hàm thuộc của tập rõ chỉ lấy hai giá trị 0 hoặc 1.

Người ta biểu diễn tập mờ A trong vũ trụ U bởi tập tất cả các cặp phần tử và mức độ

thuộc của nó: A = {(x, A(x))| x U}

Luật mờ

Một luật mờ là một biểu thức if- then được phát biểu ở dạng ngôn ngữ tự nhiên thể

hiện sự phụ thuộc nhân quả giữa các biến.

Ví dụ : if mẫu hàng là đẹp và giá là rẻ then mua hàng nhiều.

Trong đó: - „mẫu hàng‟, „giá ‟ và „mua hàng ‟ là các biến

- „đẹp‟, „rẻ‟, „nhiều‟ là các giá trị hay chính là các tập mờ.

Thủ tục ra quyết định mờ

Để hệ thống mờ có thể suy luận bằng các luật mờ và đưa ra kết luận từ các số liệu chính

xác ở đầu vào, hệ thống thực hiện 3 bước:

Page 12: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

12

1. Mờ hóa: Tính toán các giá trị mờ từ các giá trị chính xác ở đầu vào.

2. Suy luận mờ: Áp dụng tất cả các luật mờ có thể áp dụng để tính ra giá trị mờ cho

kếtluận, sau đó kết hợp các kết quả đầu ra.

3. Phi mờ hóa: Xác định giá trị chính xác từ kết quả mờ có được ở bước 2. Có nhiều

kỹ thuật phi mờ hóa có thể áp dụng được, phương pháp thông dụng nhất là phương pháp trọng

tâm (centriod method).

1.3 Kết luận chƣơng 1.

Trong chương này, luận văn trình bày tổng quan về cây quyết định và thông tin không

chắc chắn, là cơ sở để nghiên cứu, tìm hiểu các ứng dụng mô hình cây quyết định phục vụ quá

trình ra quyết định với thông tin không chắc chắn ở các chương sau.

Có thể sử dụng công thức Bayes để tính xác suất của một giả thuyết khi dữ liệu thuộc

tính của cây quyết định là thông tin không chắc chắn. Luật Bayes dựa trên lý thuyết xác suất

hình thức cho phép sử dụng tri thức về nguyên nhân để suy ra kết luận. Lý thuyết về yếu tố

chắc chắn Standford đưa ra khái niệm hệ số chắc chắn CF cho phép các chuyên gia kết hợp

những niềm tin của mình vào dữ liệu và các luật khi phát biểu. Đồng thời đại số chắc chắn

Standford cũng cung cấp các quy tắc và công thức sử dụng để tính các giá trị CF cho các kết

luận trong quá trình suy luận. Hoặc có thể biểu diễn thông tin không chắc chắn dựa theo lý

thuyết mờ. Lý thuyết mờ đưa ra khái niệm tập mờ và hàm thành viên thể hiện mức độ một

thành viên thuộc vào tập mờ.

Để ra quyết định với thông tin không chắc chắn trong lập kế hoạch sản xuất kinh

doanh doanh nghiệp bằng việc ứng dụng cây quyết định, các chương tiếp theo sẽ tìm hiểu về

công cụ hỗ trợ xây dựng cây quyết định và ứng dụng của nó với nội dung việc lập kế hoạch

sản xuất kinh doanh trong doanh nghiệp.

CHƢƠNG 2: CÔNG CỤ HỖ TRỢ XÂY DỰNG MÔ HÌNH CÂY QUYẾT ĐỊNH VÀ

KẾ HOẠCH SẢN XUẤT KINH DOANH DOANH NGHIỆP

Trong chương này, luận văn trước hết giới thiệu vấn đề ra quyết định với thông tin

không chắc chắn, ở đây chủ yếu là ra quyết định trong lập kế hoạch sản xuất kinh doanh bằng

ứng dụng cây quyết định. Để có thể xây dựng một ứng dụng của cây quyết định, chương này

đã khảo cứu công cụ hỗ trợ, cụ thể là phần mềm PrecisionTree5.7, một Add-in trên Micsoft

Excel, đồng thời trình bày một cách khá hệ thống lý thuyết của quá trình lập kế hoạch sản

xuất kinh doanh trong doanh nghiệp cũng như một số nội dung chủ yếu cần được ra quyết

định trong quá trình này.

2.1 Ra quyết định với thông tin không chắc chắn bằng ứng dụng mô hình cây quyết

định

2.2 Công cụ hỗ trợ xây dựng mô hình cây quyết định

Hiện nay có nhiều công cụ hỗ trợ xây dựng mô hình cây quyết định như Simple

Page 13: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

13

Decision Tree, và PrecisionTree, của Palisade Corporation. Trong luận văn nay sử dụng

công cụ PrecisionTree5.7 của Palisade Corporation.

2.2.1 Giới thiệu PrecisionTree

PrecisionTree 5.7 do công ty Palisade có trụ sở chính tại Mỹ và chi nhánh tại nhiều

nơi trên thế giới phát triển, được giới thiệu vào tháng 9 năm 2010, bản mới nhất

PrecisionTree 5.7.1 giới thiệu vào tháng 6 năm 2011.

2.3 Kế hoạch phát triển sản xuất, kinh doanh của doanh nghiệp

2.4 Một số nội dung chủ yếu cần ra quyết định khi lập kế hoạch phát triển sản xuất,

kinh doanh của doanh nghiệp

2.5 Kết luận chƣơng 2

Trong chương này, luận văn giới thiệu tổng quát về công cụ PresicionTree5.7 được sử

dụng trong luận văn để xây dựng mô hình cây quyết định. Đồng thời giới thiệu về lý thuyết

lập kế hoạch sản xuất kinh doanh trong doanh nghiệp, các vấn đề cần ra quyết định trong quá

trình lập kế hoạch sản xuất. Là lý thuyết cơ sở để áp dụng mô hình cây quyết định nhằm rút ra

tri thức từ dữ liệu thực tiễn phục vụ công tác lập kế hoạch sản xuất của doanh nghiệp.

Nhằm ứng dụng lý thuyết trên vào thực tiễn sản xuất của một doanh nghiệp, chương

tiếp theo trình bày việc sử dụng công cụ hỗ trợ xây dựng cây quyết định để giải quyết các bài

toán liên quan đến việc ra quyết định với thông tin không chắc chắn trong lập kế hoạch sản

xuất kinh doanh doanh nghiệp.

CHƢƠNG 3

RA QUYẾT ĐỊNH VỚI THÔNG TIN KHÔNG CHẮC CHẮN TRONG LẬP KẾ

HOẠCH SẢN XUẤT KINH DOANH DOANH NGHIỆP

Chương này đề cập tới vấn đề ra quyết định với thông tin không chắc chắn trong lập

kế hoạch sản xuất kinh doanh của doanh nghiệp bằng việc ứng dụng mô hình cây quyết định.

Luận văn tìm hiểu quá trình đánh giá tính chất và mức độ không chắc chắn của môi trường

kinh doanh để xác định giải pháp của doanh nghiệp và triển khai các kế hoạch thích hợp. Từ

đó áp dụng lập kế hoạch sản xuất kinh doanh cho một sản phẩm của Công ty cổ phần May

Thăng Long với dữ liệu mẫu được thu thập và giả định.

Bằng việc chia nhỏ các tình huống xảy ra khi lập kế hoạch sản xuất cho một sản phẩm

thành các bài toán nhỏ hơn, và sử dụng công cụ PrecisionTree 5.7 để tạo cây quyết định giải

quyết các bài toán nhỏ. Sau đó tổng hợp các kết quả thu được để tạo thành bảng kế hoạch sản

xuất cho sản phẩm đó. Như vậy, việc xây dựng các cây quyết định trực quan hóa các dữ liệu

tình huống và xử lý dữ liệu không chắc chắn thu được trong các tình huống trên góp phần hỗ

trợ quá trình ra quyết định của nhà quản lý trong việc lập kế hoạch sản xuất sản phẩm.

Page 14: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

14

3.1 Lƣợc sử vấn đề nghiên cứu

Phân tích ra quyết định với điều kiện không chắc chắn diễn ra thường xuyên ở hầu hết

các mức độ chiến lược của quá trình ra quyết định của các công ty và thường liên quan đến

đội ngũ các nhà quản lý cấp cao. Việc chính thức sử dụng phân tích ra quyết định bắt đầu từ

những năm 1960, nhưng vì thiếu công nghệ thông tin và sự thiếu tin tưởng của các phương

thức của quản lý mức độ cao, nó không bao giờ thực sự tìm được địa vị xứng đáng.

Điều này được khẳng định trong báo cáo bởi hai chuyên gia phân tích ra quyết định

liên quan đến bản thân công ty Du Pont, Krumm and Rolle, trong bài báo của họ “Quản lý và

ứng dụng của quyết định và phân tích rủi ro trong Du Pont” . Việc Du Pont lập kế hoạch sản

xuất kinh doanh dài hạn vào năm 1949 đã khơi mào cho một phong trào “tạo dựng kế hoạch”

tại các công ty. Cho tới năm 1960, toàn bộ 500 công ty được tạp chí Fortune bình chọn đều có

“Giám đốc kế hoạch” và các “Hiệp hội các nhà xây dựng kế hoạch dài hạn cho doanh

nghiệp”, hoạt động ở cả Anh quốc và Hoa Kỳ [9]

.

3.2. Xác định vấn đề nghiên cứu

Có thể thấy quá trình lập và thực hiện kế hoạch sản xuất kinh doanh chịu sự ảnh

hưởng của tính không chắc chắn của môi trường kinh doanh, được thể hiện dưới ba hình thức

sau:

- Tình trạng không chắc chắn: xảy ra khi toàn bộ hay một phần của môi trường kinh

doanh được coi là không thể tiên đoán được.

- Hậu quả không chắc chắn: là trường hợp mặc dù đã cố gắng nhưng nhà quản lý

không thể tiên đoán được những hậu quả do sự thay đổi của môi trường tác động đến các

doanh nghiệp, do vậy mà dẫn đến sự không chắc chắn.

- Sự phản ứng không chắc chắn: là tình trạng không thể tiên đoán được những hệ quả

của một quyết định cụ thể, sự phản ứng của doanh nghiệp đối với những biến động của môi

trường kinh doanh.

Vì vậy công việc của các nhà lập kế hoạch là phải đánh giá tính chất và mức độ

không chắc chắn của môi trường kinh doanh để xác định giải pháp phản ứng của doanh

nghiệp và triển khai các kế hoạch thích hợp.

Luận văn khảo cứu quá trình lập kế hoạch và thực hiện lập kế hoạch sản xuất kinh

doanh cho Công ty cổ phần May Thăng Long với dữ liệu mẫu được thu thập năm 2006

bằng ứng dụng mô hình cây quyết định. Cụ thể Chương này nhằm giải quyết bài toán đặt

ra là:

Với thực trạng lập kế hoạch sản xuất kinh doanh của công ty May Thăng Long

hiện nay, cần ra quyết định về kế hoạch nhằm đạt sản lượng đề ra trong điều kiện môi

trường kinh doanh và thông tin thu được là không chắc chắn bằng việc ứng dụng mô hình

cụ cây quyết định.

Page 15: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

15

3.3. Dữ liệu phục vụ lập kế hoạch sản xuất kinh doanh của doanh nghiệp

3.3.1 Dữ liệu phục vụ lập kế hoạch sản xuất kinh doanh:

- Các bảng dữ liệu trong phần Phụ lục (Nguồn phòng kế hoạch vật tư năm 2005 -

2006).

- Các thông tin kinh tế, thị trường được dự báo bởi các nhà quản lý;

3.3.2 Đánh giá về kế hoạch sản xuất kinh doanh hiện nay của công ty

Dựa theo thực trạng quá trình sản xuất kinh doanh của công ty năm 2005 -2006, kế

hoạch sản xuất kinh doanh được đánh giá.

3.4. Ứng dụng mô hình cây quyết định trong công tác lập kế hoạch sản xuất kinh doanh

3.3.1 Ứng dụng mô hình cây quyết định trong việc ra quyết định với thông tin không

chắc chắn

Trong việc lập kế hoạch sản xuất kinh doanh tại công ty may Thăng Long, có nhiều

tình huống xảy ra, yêu cầu phải xử lý các thông tin không chắc chắn thu thập được trong các

tình huống đó. Yêu cầu này được luận văn giải quyết bằng việc ứng dụng mô hình cây quyết

định.

Đầu vào: các dữ liệu đã thu thập được là các thông tin không chắc chắn như nhu cầu

thị trường, giá cả nguyên vật liệu, nhân công, chi phí phát triển thị trường…

Đầu ra: Số lượng sản phẩm được sản xuất trong năm tới của nhà máy.

Để giải quyết bài toán này, việc trước hết là chia vấn đề thành các bài toán nhỏ. Sử

dụng cây quyết định để giải quyết các bài toán nhỏ trên, sau đó tổng hợp các kết quả tình

huống để đáp ứng yêu câu. Trong khuôn khổ luận văn này, sẽ tìm hiểu các bài toán nhỏ cần

thiết trong việc lập kế hoạch sản xuất như sau:

Bài toán 1

Chi phí phát triển một sản phẩm tại một thị trường thử nghiệm (một địa điểm nào đó

thuộc một địa phương) được đánh giá qua 2 phương án sau:

Phương án 1 Phương Án 2

ĐV (triệu

đồng) Xác suất

ĐV(triệuđồ

ng) Xác suất

Chi phí mở đại lý 25 55% 35 65%

Chi phí quản lý 15 35% 25 20%

Chi phí phát sinh 8 10% 15 15%

(nguồn giả định)

Bảng 3: Số liệu chi phí phát triển sản phẩm trên thị trường thử nghiệm

Giải pháp: Xây dựng cây quyết định bằng phần mềm Precisiontree 5.7 từ các dữ liệu bảng

trên.

Kết quả thu được như hình 8:

Page 16: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

16

Hình 11: Kết quả xây dựng mô hình cây quyết định cho bài toán 1

Đánh giá kết quả:

Theo kết quả mô hình cây quyết định như trên, giá trị kỳ vọng lớn nhất của phương án

1 là 19,8 (triệu đồng), của phương án 2 là 30 (triệu đồng). Giá trị kỳ vọng lớn nhất của cây là

30 triệu đồng.

Để đạt giá trị kỳ vọng lớn nhất là 30 triệu đồng, ta có đường đi trên cây là từ nút gốc,

đến nút TRUE như hình vẽ.

Ở bài toán này, giả thuyết nhận giá trị thử nghiệm cho thị trường địa phương là 30

triệu đồng. Số liệu này được ứng dụng để giải quyết bài toán 2 sau đây.

Bài toán 2

Công ty cổ phần may Thăng Long lập kế hoạch về việc đưa một sản phẩm ra thị

trường. Như trong nhiều tinh huống của sản phẩm mới, có nhiều sự không chắc chắn về liệu

sản phẩm mới liệu có thể bắt kịp thị trường không. Công ty may Thăng Long tin rằng đó có

thể là một quyết định khôn ngoan khi giới thiệu 1 sản phẩm mới tới một thì trường địa

phương để kiểm tra trước khi giới thiệu nó ra phạm vi quốc gia. Do vậy, quyết định đầu tiên

của công ty là liệu có thực hiện cuộc kiểm tra thị trường không. Công ty may Thăng Long

định lượng rằng giá cố định tại thị trường thử nghiệm là 30 triệu đồng, theo như kết quả bài

toán 1. Nếu nó quyết định thực hiện thử nghiệm đó, Công ty may Thăng Long sau đó phải đợi

kết quả. Dựa vào kết quả của cuộc thử nghiệm, có thể quyết định có nên tung sản phẩm ra thị

trường quốc gia, trong trường hợp nó sẽ phải chịu một chi phí cố định là 900 triệu đồng.

Ngược lại, nếu quyết định ban đầu là không hiệu lực trên thị trường thử nghiệm, thì sau đó

Page 17: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

17

quyết định cuối cùng là liệu có tung sản phẩm ra thị trường quốc gia hay không có thể được

thực hiện một cách không trì hoãn. Lợi nhuận đơn vị của Công ty may Thăng Long được tính

bằng sự chênh lệch giữa giá bán sản phẩm và chi phí biến đổi đơn vị, là 18 nghìn đồng (ở thị

trường thử nghiệm và thị trường quốc gia)

Công ty may Thăng Long phân loại kết quả trên thị trường thử nghiệm hoặc thị

trường quốc gia là tốt, khá hay tồi. Một kết quả đi cùng với dự báo về tổng số đơn vị sản

phẩm bán ra. Sản lượng bán ra tương ứng đối với thị trường thử nghiệm là 200, 100, 10 và là

6000, 3000, 900 đối với thị trường quốc gia. Dựa vào kết quả trên thị trường thử nghiệm

trước đó cho sản phẩm tương tự, Công ty may Thăng Long đánh giá rằng xác suất khả năng

đầu ra (hệ số chắc chắn) của 3 thị trường thử nghiệm là 0.3; 0.6 và 0.1. Sau đó căn cứ vào số

liệu lịch sử của các sản phẩm trước đó, công ty này đã đánh giá khả năng đầu ra của thị

trường quốc gia của mỗi thị trường thử nghiệm cụ thể. Nếu kết quả là tốt, xác suất khả năng

đầu ra (hệ số chắc chắn) của thị trường quốc gia là 0.8; 0.15; và 0.05. Nếu kết quả của thị

trường thử nghiệm là khá, những khả năng đầu ra (hệ số chắc chắn) tương ứng của thị trường

quốc gia là 0.3; 0.5 và 0.2. Nếu kết quả của thị trường thử nghiệm là tồi, kết quả tương ứng là

0.05; 0.25 và 0.7 (Chú ý khả năng đầu ra của thị trường quốc ra có xu hướng phản ánh đầu ra

của thị trường thử nghiệm).

Nội dung TT Địa phương TT Toàn quốc

Chi phí cố định 30 triệu đồng 900 triệu đồng

Sản lƣợng bán ra (Sản phẩm) Đơn giá 18 nghìn đồng/sản phẩm

Tốt 200 sp 36 trđ 6000

sp

1080 trđ

Khá 100 sp 18trđ 3000

sp

540 trđ

Tồi 30 sp 5.4trđ 900 sp 162 trd

Xác suất khả năng bán ra sản phẩm

Tốt 0.3

Khá 0.6

Tồi 0.1

Xác suất khả năng bán ra của TT toàn quốc

TT toàn quốc tốt TT toàn quốc khá TT toàn quốc tồi

TT địa phương tốt 0.8 0.15 0.05

TT địa phương khá 0.3 0.5 0.2

TT địa phương tồi 0.05 0.25 0.7

Bảng 4 Dữ liệu bài toán 2

Như vậy bài toán 2 như sau:

Đầu vào: Dữ liệu như Bảng 4.

Page 18: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

18

Đầu ra: Công ty muốn sử dụng cây quyết định để trực quan hóa các giải pháp và giải

pháp tốt nhất trong việc đưa ra sản lượng sản xuất sản phẩm.

Để giải bài toán này, trƣớc hết cần phân tích bài toán:

Phân tích bài toán với ba nhân tố cơ bản của những vấn đề ra quyết định: những chiến

lược có thể, những đầu ra và khả năng có thể, và mô hình giá trị.

Công ty may Thăng Long phải đưa ra quyết định liệu có thực hiện thử nghiệm thị

trường hay không. Sau đó nó phải quyết định liệu có nên giới thiệu sản phẩm đó ra thị trường

quốc gia không. Tuy nhiên, đó là quan trọng để nhận ra rằng nếu Công ty may Thăng Long

quyết định thực hiện thử nghiệm thị trường, quyết định về thị trường quốc gia có thể dựa vào

kết quả của thử nghiệm thị trường. Trong trường hợp này chiến lược cuối cùng của công ty

này sẽ là một kế hoạch ngẫu nhiên, ở đó nó thực hiện thử nghiệm thị trường và sau đó giới

thiệu sản phẩm tới thị trường quốc gia nếu nó nhận được đầy đủ kết quả tích cực từ thị trường

thử nghiệm và từ bỏ sản phẩm nếu nhận được kết quả tiêu cực. Chiến lược tối ưu từ những

vấn đề trong việc ra quyết định liên quan tới những kế hoạch ngẫu nhiên.

Điều quan trọng là không thể đơn giản đánh giá 3 khả năng mới đối với trường hợp

đó. Những khả năng này được suy ra từ những khả năng cụ thể. Điều này tuân theo quy luật

của xác suất điều kiện. nếu chúng ta đặt T1, T2, T3 là kết quả tốt, khá, tồi của thị trường thử

nghiệm và N là kết quả bất kỳ của thị trường quốc gia và sau đó bằng quy tắc cộng xác suất

và công thức xác suất điều kiện:

P(N) = P(N|T1)P(T1) + P(N|T2)P(T2) + P(N|T3)P(T3)

Thay số ta có:Khả năng đầu ra của thị trường toàn quốc khi quyết định triển khai mà không

cần kết quả của thị trường thử nghiệm là 0.425; 0.370; 0.205.

Làm cách nào để người ra quyết định có thể xem xét được tất cả các khía cạnh quan

trọng của vấn đề cùng một lúc: các lựa chọn thay thế quyết định, những kết quả không chắc

chắn và xác suất của chúng, những hậu quả kinh tế, và thứ tự thời gian của các sự kiện, ...

Phương pháp và công cụ tin học hỗ trợ giải quyết bài toán: mô hình cây quyết định và

phần mềm Precision Tree5.7.

. Kết quả bài toán 2 thu được là cây quyết định như hình sau:

Page 19: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

19

Hình 13 : Kết quả bài toán 2

Phân tích kết quả thu đƣợc:

Tất cả các ứng dụng ra quyết định trong điều kiện không chắc chắn được thực hiện

theo những quy trình sau:

Đầu tiên sẽ xác định những khả năng có thể, đánh giá những khả năng có liên quan, và

tính toán giá trị kỳ vọng.

Sau đó sử dụng mô hình cây quyết định để xác định những lựa chọn có giá trị kỳ vọng

lớn nhất và theo đuổi lựa chọn đó với một sự phân tích toàn diện. Phân tích bản tóm tắt rủi ro

cho những lựa chọn khác nhau. Điều đó sẽ hữu dụng nếu những tiêu chí khác được xem xét.

Giải thích của cây này là khá đơn giản nếu ta nhận xét rằng mỗi giá trị chỉ dưới mỗi

tên nút là một giá trị kỳ vọng. 807 ở ô B49 là giá trị kỳ vọng cho toàn bộ vấn đề quyết định,

có nghĩa là Công ty may Thăng Long sẽ nhận kết quả tốt nhất là 8070 triệu đồng. Sản lượng

tốt nhất có thể tiêu thụ là 449.000 sản phẩm.

Các giá trị kỳ vọng đã được tính toán bắt đầu từ bên phải và hoạt động trở lại phía bên

trái. Công ty có thể tối ưu chiến lược bằng cách theo nhánh TRUE từ trái tới phải. Đầu tiên

cho bán thử nghiệm sản phẩm mới tại thị trường địa phương, nếu kết quả là tốt, thì sản phẩm

sẽ được bán trên toàn quốc. Tuy nhiên nếu kết quả là khá hoặc tồi thì sản phẩm có thể bị dừng

sản xuất. Trong trường hợp thị trường toàn quốc ảm đạm, công ty có thể giảm được thua lỗ,

công ty chịu phí 30 triệu đồng để bán thử tại thị trường địa phương nhưng thu lại được 18

triệu hoặc 5.4 triệu đồng.

Page 20: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

20

Như vậy, cây quyết định ở đây dựa vào suy diễn lùi, nhận giá trị tại các nút lá, và phân

tích ngược lên đến kết quả tại gốc của cây.

Với kết quả bài toán 2, có thể quyết định sản lượng sản phẩm mới được sản xuất tại xí nghiệp

1 của công ty. Tuy nhiên, ngoài sản phẩm mới được công ty ưu tiên sản xuất trong chiến lược

phát triển kinh doanh, xí nghiệp còn sản xuất sản phẩm truyền thống. Căn cứ vào năng lực sản

xuất và chỉ tiêu còn lại sau khi thực hiện sản phẩm mới, sản lượng sản phẩm truyền thống

được sản xuất được quyết định trong bài toán 3.

Bài toán 3

Các giá trị bài toán đầu vào, đầu ra như sau:

Đầu vào:

Để tính toán sản lượng sản xuất của nhà máy 1, ngoài sản lượng sản xuất của sản

phẩm mới, cần xem xét thêm sản phẩm truyền thống được lên kế hoạch sản xuất cho năm tới.

Xác định sản lượng của sản phẩm truyền thống tại Xí nghiệp 1 được sản xuất trong

năm tới là bao nhiêu sản phẩm. Dựa vào các căn cứ để lập kế hoạch sản xuất, nhà quản lý đã

đánh giá xác suất xảy ra của các thông tin không chắc chắn về kinh tế thị trường như bảng 5

Đầu ra: Quyết định sản lượng của sản phẩm truyền thống tại xí nghiệp1 được sản

xuất trong năm tới.

(sản phẩm)

Nhu cầu thị trƣờng xấu

Sản phẩm cạnh tranh bán tốt 300,000

Năng lực sản xuất còn lại 655600 50%

Căn cứ đánh giá tình hình thực hiện kế hoạch năm trước 450000 12%

Căn cứ vào kết quả nghiên cứu và dự báo thị trường 700000 30%

Căn cứ vào chỉ tiêu kế hoạch do Tập Đoàn Dệt –May giao. 750000 8%

Sản phẩm cạnh tranh bán xấu 250,000

Năng lực sản xuất còn lại 655600 60%

Căn cứ đánh giá tình hình thực hiện kế hoạch năm trước 450000 15%

Căn cứ vào kết quả nghiên cứu và dự báo thị trường 500000 20%

Căn cứ vào chỉ tiêu kế hoạch do Tập Đoàn Dệt –May giao. 750000 5%

Nhu cầu thị trƣờng tốt

Sản phẩm cạnh tranh bán tốt 200,000

Năng lực sản xuất còn lại 655600 25%

Căn cứ đánh giá tình hình thực hiện kế hoạch năm trước 450000 12%

Page 21: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

21

Căn cứ vào kết quả nghiên cứu và dự báo thị trường 500000 60%

Căn cứ vào chỉ tiêu kế hoạch do Tập Đoàn Dệt –May giao. 750000 3%

Sản phẩm cạnh tranh bán xấu 150000

Năng lực sản xuất còn lại 655600 20%

Căn cứ đánh giá tình hình thực hiện kế hoạch năm trước 450000 15%

Căn cứ vào kết quả nghiên cứu và dự báo thị trường 700000 60%

Căn cứ vào chỉ tiêu kế hoạch do Tập Đoàn Dệt –May giao. 750000 5%

Bảng 5: Dữ liệu bài toán 3

Bằng việc tự xác định nút gốc, nhánh và các nút là dựa trên bảng trên, sử dụng phần

mềm PrecisionTree 5.7 trực tiếp trên bảng tính dữ liệu trên thu được kết quả:

Page 22: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

22

Hình 14: Kết quả bài toán 3

Đánh giá kết quả thu đƣợc:

Cây quyết định ở đây dựa vào cơ chế suy diễn lùi hay hướng từ mục tiêu, hệ thống sẽ

lần lượt tính toán giá trị kỳ vọng của từng mục tiêu, nhận giá trị tại các nút lá, và phân tích

ngược lên đến kết quả tại gốc của cây

Sản lượng sản phẩm truyền thống nên sản xuất trong năm tới là 506.120 sản phẩm. Để

đạt được kết quả trên, cây quyết định có đường đi từ gốc tới nút TRUE ->TRUE

như mũi tên trong hình 13. Ngoài ra, khi lựa chọn nhánh đi từ gốc tới nút FALSE –>TRUE,

hay nút FALSE –> FALSE thì các sản lượng kỳ vọng sẽ nhận được các giá trị khác nhau.

Như vậy, từ cây quyết định trên, có thể rút ra được một số luật suy diễn sau:

- IF „NCTTtốt = TRUE‟ AND „SPCTBT=TRUE‟ THEN “ SLSX = 506120 sp”

- IF „NCTTtốt = TRUE‟ AND „SPCTBX=FALSE‟ THEN “ SLSX = 30400 sp”

Page 23: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

23

- IF „NCTTxấu = FALSE‟ AND „SPCTBT=TRUE‟ THEN “SLSX = 351800 sp”

- IF „NCTTxấu = FALSE‟ AND „SPCTBX=FALSE‟THEN “ SLSX = 348360sp”

(Với các từ viết tắt: SLSX là số lượng sản xuất, NCTT là nhu cầu thị trường, SPCTBX

là sản phẩm cạnh tranh bán xấu, SPCTBT là sản phẩm cạnh tranh bán tốt, sp là sản phẩm)

Để quyết định sản lượng sản xuất cho xí nghiệp 1 của công ty may Thăng Long, cần

tổng hợp kết quả của bài toán 2 và bài toán 3, với yêu cầu sản lượng dự kiến sản xuất trong

năm tương đương tổng sản lượng của sản phẩm mới (SPM) và sản phẩm truyền thống

(SPTT).

Tổng hợp:

Như vậy tổng hợp các bài toán trên có thể xây dựng được bảng kế hoạch sản xuất kinh

doanh cho sản phẩm của Xí nghiệp 1 năm 2007 như sau:

Đơn vị

SX

Khách hàng

Chủng

loại

Số tổ

SX

Năng

suất 1 tổ

sp /ngày

Sản

lượng

SPM/nă

m

Sản lượng

SPTT/nă

m

Giá bình

quân (đ)

Doanh thu

(1000đ)

/năm Tên

SL dự

kiến/n

nghiệp

1

SAMW

1,000,000

Sơ mi 6 500

449,000 506,120 20.000 2,000,000

Bảng 6: Kế hoạch sản xuất cho một sản phẩm của xí nghiệp 1

3.5 Kết luận chƣơng 3

Chương này đã tìm hiểu quy trình lập kế hoạch sản xuất kinh doanh và thực nghiệm

việc ứng dụng mô hình cây quyết định với thông tin đầu vào là không chắc chắn, để giải quyết

bài toán ra quyết định về sản lượng sản xuất của Xí nghiệp 1 thuộc Công ty May Thăng Long.

Do điều kiện thời gian, Chương này chỉ trình bầy phương pháp giải quyết một trong

những nội dung của bài toán lập kế hoạch sản xuất kinh doanh doanh nghiệp. Kết quả thực

nghiệm cho thấy khả năng có thể ra quyết định với thông tin không chắc chắn bằng việc công

cụ PrecisionTree trên tập dữ liệu thực tế trong quá trình lập kế hoạch.

KẾT LUẬN

Luận văn tập trung khảo cứu lý thuyết về cây quyết định, về thông tin không chắc

chắn, về qui trình lập kế hoạch sản xuất kinh doanh của doanh nghiệp và thực hành việc ra

quyết định trong lập kế hoạch sản xuất kinh doanh doanh nghiệp với thông tin không chắc

chắn bằng việc ứng dụng mô hình cây quyết định.

Page 24: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

24

Do điều kiện thời gian và khuôn khổ cho phép, luận văn mới thực hành xây dựng mô

hình cây quyết định phục vụ ra quyết định trong lập kế hoạch sản xuất kinh doanh của một

sản phẩm thuộc một Công ty, chưa bao quát các sản phẩm cũng như toàn bộ quá trình lập kế

hoạch.

Tuy nhiên, những kết quả thu được chứng tỏ khả năng ứng dụng to lớn của mô hình

cây quyết định trong việc xử lý thông tin không chắc chắn, trong việc giúp chuyển đổi quá

trình ra quyết định mang tính chủ quan của người quản lý sang quyết định mang tính khách

quan, chính xác hơn.

Những kết quả chính mà luận văn thực hiện được là:

- Về lý thuyết: Luận văn tập trung tìm hiểu lý thuyết về cây quyết định, thông tin

không chắc chắn, quá trình ra quyết định và lập kế hoạch sản xuất kinh doanh của doanh

nghiệp.

- Về thực tiễn: Luận văn đã thực nghiệm việc lập một kế hoạch sản xuất cho doanh

nghiệp bằng việc ứng dụng mô hình cây quyết định. Kết quả thu được có thể ứng dụng vào

thực tiễn nhằm cải tiến và nâng cao chất lượng công tác lập kế hoạch sản xuất kinh doanh

trong doanh nghiệp, tư vấn cho hoạt động sản xuất kinh doanh của doanh nghiệp

Hướng phát triển tiếp theo của luận văn có thể là:

- Tiếp tục nghiên cứu quá trình ra quyết định với thông tin không chắc chắn trong lập kế

hoạch phát triển kinh tế xã hội cấp tỉnh và cấp quốc gia bằng việc ứng dụng mô hình cây

quyết định.

- Hoàn thiện quy trình ứng dụng mô hình cây quyết định với thông tin không chắc

chắn trong việc lập kế hoạch sản xuất kinh doanh doanh nghiệp, giải quyết trọn vẹn bài toán

lập kế hoạch sản xuất kinh doanh doanh nghiệp nhằm nâng cao chất lượng công tác lập kế

hoạch và tư vấn, hỗ trợ doanh nghiệp.

References

Tiếng Việt:

1. Cao Hào Thi. Giáo trình xác suất thống kê. . Trung Tâm Viện Công Nghệ Châu Á tại

Việt Nam (AITCV) -2008.

2. Đoàn Thị Thu Hà - Nguyễn Thị Ngọc Huyền, Khoa học quản lý tập 1. NXB Khoa học

Kỹ thuật, 2004.

3. Đỗ Thanh Nghị, Giáo trình khai thác dữ liệu, Đại học Cần Thơ – 2008.

4. Đinh Mạnh Tƣờng, Giáo trình trí tuệ nhân tạo, ĐH Công Nghệ -2007.

5. Nguyễn Thị Hồng Thuỷ -Nguyễn Thị Ngọc Huyền, Lý thuyết quản trị kinh doanh –

NXB Khoa học Kỹ thuật, 1997.

6. Trần Bình Minh Thực trạng lập kế hoạch sản xuất kinh doanh tại công ty cổ phần may

Thăng Long. Báo cáo chuyên đề, Đại học Kinh tế Quốc dân, 2007.

7. Võ Huỳnh Trâm –Trần Ngân Bình, Giáo trình trí tuệ nhân tạo, ĐH Cần Thơ -2008.

Page 25: Ra quyết định với thông tin không chắc chắn ...repository.vnu.edu.vn/bitstream/VNU_123/7676/1/00050000737.pdf · quyết định trong việc giải quyết bài toán

25

Tiếng Anh

8. Breiman, L., Friedman, J., Olshen, R., Stone, C.: Classification and Regression Trees.

Chapman & Hall, New York, 1984.

9. Douglas H., "How to Measure Anything: Finding the Value of Intangibles in Business",

John Wiley & Sons, 2007.

10. Do, T-N., Lenca, P. and Lallich, S., Enhancing network intrusion classification with the

Kolmogorov-Smirnov splitting criterion. in proc. of ICTACS‟10, The 3rd

International

Conference on Theories and Applications of Computer Sciences, Vietnam, 2010.

11. Miheev, V., Vopilov, A., Shabalin, I.: The mp13 approach to the kdd‟99 classifer

learning. SIGKDD Explorations 1(2) (2000) 76–77.

12. Quinlan, J., C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers, 1993.

13. Robert F. Stewart, SWOT analysis modelStandford, Menlo Park, California, 1980.

14. Shannon, C-E., A mathematical theory of communication. Bell System Technological

Journal (27):379–423, 623–656, 1948.

15. Zhang, J., Zulkernine, M., Network intrusion detection using random forests. In: Third

Annual Conference on Privacy, Security and Trust, 2005.