24
1 Ra quyết định với thông tin không chắc chắn bằng việc ứng dụng cây quyết định : Luận văn ThS. Công nghệ thông tin : 60 48 05 Vũ Thị Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thành Lập kế hoạch phát triển sản xuất kinh doanh l à một trong những hoạt động rất quan trọng của doanh nghiệp. Thực tiễn cho thấy trong bối cảnh hoạt động của nền kinh tế thị trường có sự hội nhập kinh tế toàn cầu ngày càng sâu rộng, cạnh tranh ngày càng sâu sắc như ở nước ta hiện nay thì việc lập kế hoạch sản xuất kinh doanh doanh nghiệp càng trở lên quan trọng và trở thành yếu tố có ý nghĩa quyết định đến sự thành công hay thất bại của doanh nghiệp. Để nâng cao chất lượng kế hoạch sản xuất kinh doanh doanh nghiệp điều quan trọng là doanh nghiệp cần nắm bắt đầy đủ, kịp thời và xử lý, khai thác có hiệu quả các thông tin liên quan đến hoạt động sản xuất kinh doanh của doanh nghiệp, đến thị trường tiêu thụ sản phẩm hàng hoá và dịch vụ do doanh nghiệp tạo ra. Quá trình toàn cầu hoá và thông tin hoá diễn ra mạnh mẽ đã làm công tác lập kế hoạch phát triển sản xuất kinh doanh doanh nghiệp ngày càng phức tạp. Trong quá trình lp kế hoch, các doanh nghip phi xlý mt số lượng rt ln thông tin, trong số đó có nhiu thông tin được biết không chc chắn, để rút ra nhng tri thc mi và ra quyết định tnhng tri thức này. Như vậy ngày càng có nhiu thông tin vi tốc độ thay đổi rất nhanh để trgiúp vic ra quyết định và ngày càng có nhiu câu hi mang tính cht định tính cn phi trli da trên mt khối lượng dliu khng lồ đã có, đặc biệt trong đó có nhiều dliu không chc chn. Các phương pháp quản trvà khai thác, phân tích dliu truyn thống đã không đáp ứng được thc tế bùng nca thông tin và dliệu, đòi hi phải có phương pháp, kỹ thut mới để tng hợp, lưu trữ, xlý và khai thác thông tin, dliu. Lĩnh vực phát hin tri thc tcác cơ sở dliệu đã được hình thành, trong đó khai phá dữ liệu (data mining) được xem là trung tâm ca lĩnh vực nghiên cu và ng dng này. Hin tại, người ta đã xây dựng được khá nhiu kthut khai phá dliệu như phân cm phân lp dliu, mạng nơtron, giải thut di truyn, lut kết hp, mng Bayes, ....Trong các kthut này cây quyết định được coi là công cụ mạnh và phổ biến nhất, nó đặc biệt thích hợp cho những vấn đề khai phá dữ liệu nhằm hỗ trợ quá trình ra quyết định. Cây quyết định thực chất là công cụ hỗ trợ quyết định, có thể biểu diễn dữ liệu phức tạp theo một cấu trúc đơn giản hơn rất nhiều dưới dạng cây. Cây quyết định cũng có thể được sử dụng để xlý thông tin không chc chn.

Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

Embed Size (px)

Citation preview

Page 1: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

1

Ra quyết định với thông tin không chắc chắn bằng việc ứng dụng cây quyết định : Luận văn ThS. Công nghệ thông tin : 60 48 05 Vũ Thị Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thành

Lập kế hoạch phát triển sản xuất kinh doanh là một trong những hoạt động rất quan trọng của doanh nghiệp. Thực tiễn cho thấy trong bối cảnh hoạt động của nền kinh tế thị trường có sự hội nhập kinh tế toàn cầu ngày càng sâu rộng, cạnh tranh ngày càng sâu sắc như ở nước ta hiện nay thì việc lập kế hoạch sản xuất kinh doanh doanh nghiệp càng trở lên quan trọng và trở thành yếu tố có ý nghĩa quyết định đến sự thành công hay thất bại của doanh nghiệp.

Để nâng cao chất lượng kế hoạch sản xuất kinh doanh doanh nghiệp điều quan trọng là doanh nghiệp cần nắm bắt đầy đủ, kịp thời và xử lý, khai thác có hiệu quả các thông tin liên quan đến hoạt động sản xuất kinh doanh của doanh nghiệp, đến thị trường tiêu thụ sản phẩm hàng hoá và dịch vụ do doanh nghiệp tạo ra.

Quá trình toàn cầu hoá và thông tin hoá diễn ra mạnh mẽ đã làm công tác lập kế hoạch phát triển sản xuất kinh doanh doanh nghiệp ngày càng phức tạp. Trong quá trình lập kế hoạch, các doanh nghiệp phải xử lý một số lượng rất lớn thông tin, trong số đó có nhiều thông tin được biết không chắc chắn, để rút ra những tri thức mới và ra quyết định từ những tri thức này. Như vậy ngày càng có nhiều thông tin với tốc độ thay đổi rất nhanh để trợ giúp việc ra quyết định và ngày càng có nhiều câu hỏi mang tính chất định tính cần phải trả lời dựa trên một khối lượng dữ liệu khổng lồ đã có, đặc biệt trong đó có nhiều dữ liệu không chắc chắn.

Các phương pháp quản trị và khai thác, phân tích dữ liệu truyền thống đã không đáp ứng được thực tế bùng nổ của thông tin và dữ liệu, đòi hỏi phải có phương pháp, kỹ thuật mới để tổng hợp, lưu trữ, xử lý và khai thác thông tin, dữ liệu. Lĩnh vực phát hiện tri thức từ các cơ sở dữ liệu đã được hình thành, trong đó khai phá dữ liệu (data mining) được xem là trung tâm của lĩnh vực nghiên cứu và ứng dụng này.

Hiện tại, người ta đã xây dựng được khá nhiều kỹ thuật khai phá dữ liệu như phân cụm phân lớp dữ liệu, mạng nơtron, giải thuật di truyền, luật kết hợp, mạng Bayes, ....Trong các kỹ thuật này cây quyết định được coi là công cụ mạnh và phổ biến nhất, nó đặc biệt thích hợp cho những vấn đề khai phá dữ liệu nhằm hỗ trợ quá trình ra quyết định.

Cây quyết định thực chất là công cụ hỗ trợ quyết định, có thể biểu diễn dữ liệu phức tạp theo một cấu trúc đơn giản hơn rất nhiều dưới dạng cây. Cây quyết định cũng có thể được sử dụng để xử lý thông tin không chắc chắn.

Page 2: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

2 Luận văn này nằm trong hướng khảo cứu, ứng dụng cây quyết định trong việc xử lý

thông tin không chắc chắn nhằm rút ra tri thức mới, phục vụ ra quyết định trong quá trình lập kế hoạch phát triển sản xuất kinh doanh của doanh nghiệp.

Không kể các phần mở đầu, kết luận, mục lục, danh mục bảng, hình và tài liệu tham khảo, luận văn gồm 3 chương nội dung chính, trong đó:

Chương 1: Tổng quan về mô hình cây quyết định và thông tin không chắc chắn sẽ giới thiệu một số khái niệm và vấn đề chung nhất về những vấn đề này. Cụ thể Chương I sẽ giới thiệu khái niệm về cây quyết định, phân loại cây quyết định, ưu nhược điểm của cây quyết định trong việc giải quyết bài toán về phân loại, ra quyết định và phương pháp xây dựng cây quyết định. Chương 1 cũng giới thiệu khái niệm, phân loại, cách biểu diễn và ứng dụng của thông tin không chắc chắn. Đó là những kiến thức cơ bản nhất, làm cơ sở để tìm khảo cứu và ứng dụng mô hình cây quyết định trong việc xử lý thông tin không chắc chắn nhằm hỗ trợ quá trình lập kế hoạch phát triển sản xuất kinh doanh doanh nghiệp ở các chương tiếp sau.

Chương 2: Công cụ hỗ trợ xây dựng mô hình cây quyết định và lập kế hoạch sản xuất kinh doanh doanh nghiệp sẽ trình bầy tóm lược nội dung và quá trình ra quyết định với thông tin không chắc chắn; giới thiệu PrecisionTree 5.7, là công cụ được luận văn sử dụng để xây dựng cây quyết định nhằm xử lý thông tin không chắc chắn, hỗ trợ quá trình ra quyết định trong việc lập kế hoạch. Chương này cũng trình bày khái niệm, lợi ích, quy trình, phân loại các hoạt động lập kế hoạch, các yếu tố chính tác động đến hoạt động lập kế hoạch và một số nội dung chủ yếu cần được ra quyết định trong quá trình lập kế hoạch sản xuất kinh doanh của doanh nghiệp.

Như đã biết, công việc của các nhà lập kế hoạch trước hết phải đánh giá được tính chất và mức độ không chắc chắn của môi trường kinh doanh để xác định giải pháp phản ứng của doanh nghiệp, xây dựng và triển khai các kế hoạch thích hợp. Luận văn khảo cứu quá trình lập kế hoạch sản xuất kinh doanh doanh nghiệp và đề xuất ứng dụng mô hình cây quyết định trong quá trình đó.

Chương 3: Ra quyết định với thông tin không chắc chắn trong lập kế hoạch sản xuất kinh doanh của doanh nghiệp sẽ trình bầy việc ứng dụng mô hình cây quyết định trong lập kế hoạch sản xuất kinh doanh dựa trên tập dữ liệu giả định và trên tập dữ liệu thực tế được thu thập từ Công ty cổ phần May Thăng Long.

Page 3: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

3

CHƯƠNG 1: TỔNG QUAN VỀ MÔ HÌNH CÂY QUYẾT ĐỊNH VÀ THÔNG TIN KHÔNG CHẮC CHẮN

Chương này giới thiệu tổng quan về mô hình cây quyết định và thông tin không chắc chắn. Luận văn trước hết trình bày lý thuyết chung nhất về cây quyết định như giới thiệu cây quyết định, phân loại, xây dựng và ứng dụng của cây quyết định. Sau đó trình bày về thông tin không chắc chắn, gồm khái niệm cơ bản, các cách biểu diễn thông tin không chắc chắn với lý thuyết xác suất, định lý Bayes, lý thuyết về yếu tố chắc chắn Standford và tập mờ.

1.1 Tổng quan về mô hình cây quyết định

1.1.1 Giới thiệu cây quyết định

Trong lĩnh vực học máy, cây quyết định là một kiểu mô hình dự báo (predictive model), nghĩa là một ánh xạ từ các quan sát về một sự vật/hiện tượng tới các kết luận về giá trị mục tiêu của sự vật/hiện tượng[3,12]. Mỗi một nút trong (internal nút) tương ứng với một biến; đường nối giữa nó với nút con của nó thể hiện một giá trị cụ thể cho biến đó. Mỗi nút lá đại diện cho giá trị dự báo của biến mục tiêu, cho trước các giá trị của các biến được biểu diễn bởi đường đi từ nút gốc tới nút lá đó. Kỹ thuật học máy dùng trong cây quyết định được gọi là học bằng cây quyết định, hay chỉ gọi với cái tên ngắn gọn là cây quyết định.

Học bằng cây quyết định là phương pháp thông dụng trong khai phá dữ liệu. Khi đó, cây quyết định mô tả một cấu trúc cây, trong đó, các lá đại diện cho các phân loại còn cành đại diện cho các kết hợp của các thuộc tính dẫn tới phân loại đó. Một cây quyết định có thể được học bằng cách chia tập hợp nguồn thành các tập con dựa theo một kiểm tra giá trị thuộc tính. Quá trình này được lặp lại một cách đệ qui cho mỗi tập con dẫn xuất. Quá trình đệ qui hoàn thành khi không thể tiếp tục thực hiện việc chia tách được nữa, hay khi một phân loại đơn có thể áp dụng cho từng phần tử của tập con dẫn xuất. Một bộ phân loại rừng ngẫu nhiên (random forest) sử dụng một số cây quyết định để có thể cải thiện tỉ lệ phân loại[12].

Giải thuật học cây quyết định gồm 2 bước lớn: xây dựng cây (Top-down), cắt nhánh (Bottom-up) để tránh học vẹt. Quá trình xây dựng cây được làm như sau:

- Bắt đầu nút gốc, tất cả các dữ liệu học ở nút gốc,

- Nếu dữ liệu tại 1 nút có cùng lớp thì nút được cho là nút lá, nhãn của nút lá là nhãn của các phần tử trong nút lá (hay luật bình chọn số đông nếu nút lá có chứa các phần tử có lớp khác nhau),

- Nếu dữ liệu ở nút quá hỗn loạn (các phần tử có lớp rất khác nhau) thì nút được cho là nút trong, tiến hành phân hoạch dữ liệu một cách đệ quy bằng việc chọn 1 thuộc tính để thực hiện phân hoạch tốt nhất có thể.

Page 4: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

4 Quá trình xây dựng cây chủ yếu phụ thuộc vào việc chọn thuộc tính tốt nhất để phân

hoạch dữ liệu. Chọn thuộc tính phân hoạch tốt theo nghĩa, cho ra kết quả là cây nhỏ nhất. Việc lựa chọn này dựa vào các heuristics: chọn thuộc tính sinh ra các nút thuần khiết nhất.

1.1.2 Các kiểu cây quyết định

Theo tiêu chí phân loại dựa vào giá trị thuộc tính của cây, cây quyết định được chia thành 2 loại chính:

1.1.2.1 Cây hồi quy: ước lượng các hàm giá có giá trị là số thực thay vì được sử dụng cho các nhiệm vụ phân loại.

Giá trị thuộc tính liên tục A cần được rời rạc hóa trong cây quyết định. Với các cách tiếp cận thông thường: ta coi thuộc tính chỉ có một cách rời rạc trong khoảng [ -∞,t] , [t,+∞] . Cần lựa chọn ngưỡng t: để với mỗi trường hợp của t tính toán độ tăng thông tin của A do sự rời rạc của t. Chọn t với độ tăng thông tin lớn nhất (t có thể biến đổi với các trường hợp của A trên cây). Các giá trị của t được xem xét: giá trị của A trong một số trường hợp của dữ liệu [3,8].

Nói cách khác với thuộc tính liên tục (thuộc tính dạng số) thì tập giá trị là không xác định trước. Chính vì vậy, trong quá trình phát triển cây, cần sử dụng kiểm tra dạng nhị phân: value(A) ≤ θ. Với θ là hằng số ngưỡng được lần lượt xác định dựa trên từng giá trị riêng biệt hay từng cặp giá trị liền nhau (theo thứ tự đã sắp xếp) của thuộc tính liên tục đang xem xét trong tập dữ liệu [8].

1.1.2.2 Cây phân loại

Nếu biến phụ thuộc nhận giá trị phân loại, tức giá trị biểu trưng (symbol) được sắp thứ tự. Chẳng hạn như: giới tính (nam hay nữ), kết quả của một trận đấu (thắng hay thua), trình độ học lực (xuất sắc, giỏi, khá, trung bình, yếu) .... Khi đó các thuộc tính có giá trị rời rạc [3, 12].

Một cây quyết định phân loại là một mô hình phân loại (bộ phân loại) cho một biến lớp T khi biết các thuộc tính A. Để phân lớp mẫu dữ liệu chưa biết, giá trị các thuộc tính của mẫu được đưa vào kiểm tra trên cây quyết định. Mỗi mẫu tương ứng có một đường đi từ gốc đến lá và lá biểu diễn dự báo giá trị phân lớp mẫu đó.

Ngoài hai loại trên, một cây quyết định có thể được thể hiện gọn như một sơ đồ ảnh hưởng, tập trung sự chú ý vào các vấn đề và mối quan hệ giữa các sự kiện.

1.1.3 Ưu điểm của cây quyết định

So với các phương pháp khai phá dữ liệu khác, cây quyết định là phương pháp có một số ưu điểm chính sau:

- Cây quyết định dễ hiểu. Người ta có thể hiểu mô hình cây quyết định sau khi được giải thích ngắn.

Page 5: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

5 - Việc chuẩn bị dữ liệu cho một cây quyết định là đơn giản hoặc không cần thiết,

trong khi các kỹ thuật khác thường đòi hỏi phải chuẩn hóa dữ liệu, tạo thêm các biến giả và loại bỏ các giá trị khuyết thiếu.

- Cây quyết định có thể xử lý cả dữ liệu có giá trị bằng số và dữ liệu có giá trị là tên thể loại (giá trị phân loại).

- Cây quyết định là một mô hình hộp trắng. Nếu có thể quan sát một tình huống cho trước trong một mô hình, thì có thể dễ dàng giải thích điều kiện đó bằng logic Boolean. Mạng nơ-ron là một ví dụ về mô hình hộp đen, do lời giải thích cho kết quả quá phức tạp để có thể hiểu được.

1.1.4 Nhược điểm của cây quyết định

Cây quyết định khó giải quyết được những vấn đề có dữ liệu phụ thuộc thời gian liên tục, không thích hợp lắm với những bài toán với mục tiêu là dự báo giá trị của các thuộc tính như lãi suất ngân hàng, tín dụng, ….[3]

* Dễ xẩy ra lỗi khi có quá nhiều lớp

* Chi phí tính toán để xây dựng mô hình cây quyết định cao:

1.1.5 Ứng dụng của cây quyết định

Một trong những ứng dụng của cây quyết định là được sử dụng để phân lớp dữ liệu. Tuy có nhiều kỹ thuật phân lớp khác đã được đề xuất như: phân lớp Bayes, phân lớp K - hàng xóm gần nhất, mạng nơron, phân tích thống kê,…, nhưng phân lớp cây quyết định vẫn được coi là công cụ mạnh, phổ biến và đặc biệt thích hợp cho khai phá dữ liệu [4].

1.1.5.1 Sử dụng để phân lớp dữ liệu

Để phân lớp mẫu dữ liệu chưa biết, giá trị các thuộc tính của mẫu được đưa vào kiểm tra trên cây quyết định. Mỗi mẫu tương ứng có một đường đi từ gốc đến lá và lá biểu diễn dự báo giá trị phân lớp mẫu đó.

1.1.5.2 Sử dụng trong các mô hình dự báo

Cây quyết định có thể xử lý tốt các thuộc tính có giá trị liên tục. Do đó có thể được sử dụng để xây dựng mô hình với các hàm nhận giá trị liên tục.

1.1.5.3 Sử dụng để biểu diễn các vấn đề ra quyết định

1.1.6 Xây dựng và ứng dụng cây quyết định

Xây dựng và ứng dụng cây quyết định là quá trình nhiều bước gồm: tạo lập, cắt tỉa cây quyết định, sau đó trích rút ra các luật, sử dụng các thủ tục suy diễn để rút ra tri thức thu được. Sau đây luận văn trình bày về các quá trình trên.

1.1.6.1 Thủ tục tạo lập cây quyết định

Quá trình tạo cây quyết định gồm hai giai đoạn [3, 12]

Page 6: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

6 * Giai đoạn thứ nhất phát triển cây quyết định:

Giai đoạn này phát triển bắt đầu từ gốc, đến từng nhánh và phát triển quy nạp theo cách thức chia để trị cho tới khi đạt được cây quyết định với tất cả các lá được gán nhãn lớp.

Thuật toán xây dựng cây quyết định

Luận văn trình bày giải thuật quy nạp xây dựng cây quyết định ID3 (gọi tắt là ID3) là một giải thuật học đơn giản nhưng rất thành công trong nhiều lĩnh vực. ID3 là một giải thuật hay vì cách biểu diễn tri thức học được của nó, vì cách tiếp cận của nó trong việc quản lý tính phức tạp, vì cách sử dụng phương pháp heuristic để chọn lựa các ứng viên, và tiềm năng của nó đối với việc xử lý dữ liệu nhiễu [3, 12].

Đầu vào: Một tập hợp các mẫu. Mỗi mẫu bao gồm các thuộc tính mô tả một tình huống, hay một đối tượng nào đó, và một giá trị phân loại của nó.

Đầu ra: Cây quyết định có khả năng phân loại đúng đắn các mẫu trong tập dữ liệu huấn luyện, và hy vọng là phân loại đúng cho cả các ví dụ chưa gặp trong tương lai.

* ID3 xây dựng cây quyết định theo giải thuật sau:

Function induce_tree(tập_mẫu, tập_thuộc_tính)

begin

if mọi mẫu trong tập_mẫu đều nằm trong cùng một lớp

then

return một nút lá được gán nhãn bởi lớp đó

else if tập_thuộc_tính là rỗng then

return nút lá được gán nhãn bởi tuyển của tất cả các lớp trong tập_mẫu else

begin

chọn một thuộc tính P, lấy nó làm gốc cho cây hiện tại;

xóa P ra khỏi tập_thuộc_tính;

với mỗi giá trị V của P

begin

tạo một nhánh của cây gán nhãn V;

Đặt vào phân_vùngV các ví dụ trong tập_mẫu có giá trị V tại thuộc tính P;

Gọi induce_tree(phân_vùngV, tập_thuộc_tính), gắn kết quả vào nhánh V

Page 7: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

7 end

end

end

Sau khi xây dựng được cây quyết định, bước tiếp theo là cắt tỉa nhánh của cây.

* Giai đoạn thứ hai cắt, tỉa bớt các cành nhánh trên cây quyết định:

1.1.6.2 Ứng dụng trích rút luật từ cây quyết định

Tri thức trong cây quyết định có thể được chiết xuất và trình bày dưới dạng các luật phân loại IF-THEN. .

Luật suy diễn

Một công thức H được xem là hệ quả logic (logical consequence) của một tập công thức G ={G1,.....,Gm} nếu trong bất kỳ minh họa nào mà {G1,.....,Gm} đúng thì H cũng đúng, hay nói cách khác bất kỳ mô hình nào của G cũng là mô hình của H [4].

. Trong các hệ dựa trên luật, có hai phương pháp luận lập luận cơ bản: Lập luận tiến, và lập luận lùi

Lập luận tiến

Tư tưởng cơ bản của lập luận tiến là áp dụng luật suy diễn Modus Ponens tổng quát. Trong mỗi bước của thủ tục lập luận tiến, người ta xét một luật trong cơ sở luật. Đối sánh mỗi điều kiện của luật với các sự kiện trong cơ sở sự kiện, nếu tất cả các điều kiện của luật đều được thoả mãn thì sự kiện trong phần kết luận của luật được xem là sự kiện được suy ra. Nếu sự kiện này là sự kiện mới (không có trong bộ nhớ làm việc), thì nó được đặt vào bộ nhớ làm việc. Quá trình trên được lặp lại cho tới khi nào không có luật nào sinh ra các sự kiện mới.

Lập luận lùi

Trong lập luận lùi, người ta đưa ra các giả thuyết cần được đánh giá. Sử dụng lập luận lùi, giả thuyết đưa ra hoặc là được chứng minh, hoặc là bị bác bỏ (bởi các sự kiện trong bộ nhớ làm việc). Lập luận lùi cho phép ta tìm ra các phép thế biến mà giả thuyết đưa ra trở thành đúng (là hệ quả logic của cơ sở tri thức). Do đó trong hệ dựa trên luật chúng ta có thể sử dụng lập luận lùi để tìm ra các câu trả lời cho các câu hỏi được đặt ra bởi người sử dụng.

procedure Backward_Chaining (Hyp, );

begin

H giả thuyết đầu tiên trong danh sách Hyp;

for mỗi luật R = (Conds, Q) do

if H hợp nhất với Q bởi phép thế 1 then

1. Loại H khỏi danh sách Hyp;

Page 8: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

8 2. Thêm các điều kiện của luật Conds vào danh sách Hyp;

3. áp dụng phép thế 1 vào các giả thuyết trong danh sách Hyp;

4. Lấy hợp thành của các phép thế và 1 để nhận được phép thế mới, tức là 1;

if Hyp = [ ] then cho ra

else Backward_Chaining (Hyp, );

end;

1.2 Tổng quan về thông tin không chắc chắn

Sự không chắc chắn là một thuật ngữ được sử dụng theo những cách khác nhau trong một số lĩnh vực, bao gồm vật lý, triết học, thống kê, kinh tế, tài chính, bảo hiểm, tâm lý học, xã hội học, kỹ thuật, và khoa học thông tin. Áp dụng đối với dự báo của các sự kiện trong tương lai, các phép đo vật lý đã được thực hiện, hoặc chưa biết.

1.2.1 Khái niệm

Sự không chắc chắn: là trạng thái có hiểu biết hạn chế về những hiện tượng tự nhiên-kinh tế -xã hội, không thể mô tả chính xác tình trạng hiện hành cũng như kết quả trong tương lai của chúng[1,7].

1.2.2 Phân loại sự không chắc chắn

Sự không chắc chắn có thể được chia thành các bộ phận được xác định rõ và không rõ nét, gồm đối tượng và chủ thể không chắc chắn. Không chắc chắn cũng được xác định có thể được phân tích với lý thuyết xác suất. Sự thiếu rõ ràng có thể được chia thành đặc trưng không và bất hòa. Đặc trưng không thể được phân tích với lý thuyết khả năng và bất hòa có thể được phân tích với bản thể học.

Hình 4 : Phân loại tư duy của sự không chắc chắn

Không chắc chắn

(uncertainty)

Đối tượng không chắc chắn (objective uncertainty)

Chủ thể không chắc chắn (subjective uncertainty)

Nhận thức không chắc chắn (epistemological uncertainty)

Bản thế không chắc chắn (ontological uncertainty)

Đạo đức không chắc chắn

( moral uncertainty)

Quy tắc không chắc chắn (rule uncertainty)

Tri thức hướng dẫn quyết định (knowledge guided decision)

Lý trí hướng dẫn quyết định (Quasi-rational decision)

Quy tắc hướng dẫn quyết định (rule guided decision)

Trực giác hướng dẫn quyết định (intuition guiđe decision)

Page 9: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

9

1.2.3 Ứng dụng thông tin không chắc chắn

Trên thực tế có rất nhiều lĩnh vực có sử dụng các thông tin không chắc chắn vào giải quyết vấn đề như:

- Sự không chắc chắn được tham gia vào tất cả các đo lường, chẳng hạn như đo khoảng cách, nhiệt độ, mức độ phụ thuộc vào công cụ hoặc kỹ thuật được sử dụng để làm cho đo lường. Sự không chắc chắn được sử dụng thiết kế các trò chơi, đáng chú ý nhất là trò chơi về cờ bạc, nơi mà “cơ hội” là trọng tâm trò chơi.

- Trong khoa học, dự báo các sự kiện trong tương lai nên được hiểu là có một loạt các giá trị dự kiến, giá trị không chắc chắn.

- Trong dự báo thời tiết hiện nay bao gồm dữ liệu về mức độ sự không chắc chắn trong thông tin để dự báo thời tiết.

- Trong đánh giá rủi ro và quản lý rủi ro.

1.2.4 Đo lường không chắc chắn

Đo lường không chắc chắn là một khái niệm trung tâm xác định số lượng phân tán hợp lý của thuộc tính đến một kết quả đo lường. Như vậy không chắc chắn cũng có thể được gọi là một phép đo lỗi.

1.2.5 Biểu diễn thông tin không chắc chắn

Luận văn trình bày việc biểu diễn thông tin theo hai hướng tiếp cận.Tiếp cận thứ nhất là tiếp cận thống kê, trong hướng tiếp cận này sẽ trình bày hai phương pháp: lý thuyết xác suất Bayesian và lý thuyết về đại số hệ số chắc chắn. Tiếp cận thứ hai là biểu diễn thông tin không chắc chắn theo logic mờ[4,7].

1.2.5.1 Tiếp cận thống kê đối với tính không chắc chắn.

Ở đây, luận văn trình bày lý thuyết xác suất như là cơ sở toán học cho sự biểu diễn tri thức không chắc chắn.

Người ta sử dụng số p, 0 p 1, là xác suất của một sự kiện hoặc xác suất của một mệnh đề để biểu diễn khả năng một sự kiện có thể xảy ra hoặc khả năng một mệnh đề có thể đúng.

* Công thức Bayes được phát biểu như sau:

Ký hiệu P(h | e) là xác suất khẳng định giả thuyết h đúng cho trước bằng chứng e.

Điểm quan trọng của lý thuyết Bayes là các con số ở vế phải của công thức

Page 10: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

10 dễ dàng xác định, ít nhất là khi so sánh với vế trái

*Công thức Bayes tổng quát

Trong thực tế có nhiều giả thuyết cạnh tranh nhau, vì vậy công thức Bayes tổng quát nhất là:

* Mạng xác suất

Mô hình được đề suất là mạng xác suất: mạng xác suất là một đồ thị có hướng, không có chu trình và thoả mãn các điều kiện sau:

- Các đỉnh của đồ thị là các biến ngẫu nhiên;

- Mỗi cung từ đỉnh X đến đỉnh Y biểu diễn sự ảnh hưởng trực tiếp của biến ngẫu nhiên X đến biến ngẫu nhiên Y (hay Y phụ thuộc trực tiếp vào X). Đỉnh X được gọi là đỉnh cha của Y;

- Tại một đỉnh được cho phân phối xác suất có điều kiện của đỉnh đó khi cho trước các cha của nó. Các xác suất này biểu diễn hiệu quả mà các cha tác dụng vào nó.

Mô hình tổng quát hơn để biểu diễn vấn đề quyết định là mạng quyết định (decision network hay còn gọi là influence diagram). Mạng quyết định là mở rộng của mạng xác suất bằng cách đưa thêm vào các đỉnh quyết định và các đỉnh lợi ích.

1.2.5.2 Đại số hệ số chắc chắn Stanford

Khi suy luận với tri thức heuristic, các chuyên gia có thể đưa ra các ước lượng niềm tin hữu ích về các kết luận. Họ ước lượng các kết luận bằng các thuật ngữ như “có nhiều khả năng”, “không chắc”, “hầu như chắc chắn” hay “có thể”. * Lý thuyết về đại số hệ số chắc chắn Stanford

Lý thuyết về độ chắc chắn Stanford [7,13] đưa ra một số giả thiết đơn giản cho việc tạo ra các độ đo niềm tin và có một số quy tắc đơn giản tương đương cho việc kết hợp những niềm tin này khi chương trình tiến đến kết luận của nó. Giả thiết thứ nhất là tách “niềm tin ủng hộ” ra khỏi “niềm tin chống lại” một quan hệ:

Gọi MB(H | E) là độ đo của niềm tin và MD(H | E) là độ đo của sự hoài nghi vào khả năng đúng của giả thuyết H, khi có bằng chứng E

Giá trị của các độ đo này chỉ rơi vào một trong hai trường hợp:

0 < MB(H | E) < 1 trong khi MD(H | E) = 0,

hoặc: 0 < MD(H | E) < 1 trong khi MB(H | E) = 0

hệ số chắc chắn CF:

Page 11: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

11 CF (H | E) = MB(H | E) - MD(H | E)

* Phương pháp suy luận với thông tin không chắc chắn

Như vậy, ở đây có hai loại thông tin không chắc chắn: một là dữ liệu ban đầu được cho là không chắc chắn, không đủ, không đáng tin cậy,… hai là các luật sử dụng để suy luận không hợp logic, suy luận ngược từ kết luận về điều kiện, hay có thể gọi là suy luận theo kiểu phỏng đoán.

Suy luận phỏng đoán thường được ứng dụng trong thực tế để tìm hiểu các hiện tượng xảy ra, ví dụ:

If hàng hóa áo sơ mi nam bán không đạt chỉ tiêu Then chỉ tiêu quá cao hoặc thị hiếu đã thay đổi;

1.2.5.2 Tiếp cận theo hướng logic mờ

Lý thuyết tập mờ là một công cụ toán học chính xác để mô tả các thông tin không chính xác, mang tính nhập nhằng, mờ (vagueness, ambiguity).

* Khái niệm về tập mờ:

Cho S là một tập hợp và x là một phần tử của tập hợp đó. Một tập con mờ F của S được định nghĩa bởi một hàm thành viên μF(x) đo “mức độ” mà theo đó x thuộc về tập F. Hàm A được gọi là hàm thuộc (hoặc hàm đặc trưng) của tập mờ A còn A(x) được gọi là mức độ thuộc của x vào tập mờ A. Trong đó, 0 ≤ μF(x) ≤ 1.

Khi μF(x) = 0 nghĩa là x hoàn toàn không thuộc tập F.

Khi μF(x) = 1 nghĩa là x thuộc F hoàn toàn.

Nếu μF(x) = 0 hoặc 1 thì tập F được xem là “giòn”

Như vậy tập mờ là sự tổng quát hoá tập rõ bằng cách cho phép hàm thuộc lấy giá trị bất kỳ trong khoảng [0,1], trong khi hàm thuộc của tập rõ chỉ lấy hai giá trị 0 hoặc 1.

Người ta biểu diễn tập mờ A trong vũ trụ U bởi tập tất cả các cặp phần tử và mức độ thuộc của nó: A = {(x, A(x))| x U}

Luật mờ

Một luật mờ là một biểu thức if- then được phát biểu ở dạng ngôn ngữ tự nhiên thể hiện sự phụ thuộc nhân quả giữa các biến.

Ví dụ : if mẫu hàng là đẹp và giá là rẻ then mua hàng nhiều.

Trong đó: - ‘mẫu hàng’, ‘giá ’ và ‘mua hàng ’ là các biến

- ‘đẹp’, ‘rẻ’, ‘nhiều’ là các giá trị hay chính là các tập mờ.

Thủ tục ra quyết định mờ

Để hệ thống mờ có thể suy luận bằng các luật mờ và đưa ra kết luận từ các số liệu chính

Page 12: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

12 xác ở đầu vào, hệ thống thực hiện 3 bước:

1. Mờ hóa: Tính toán các giá trị mờ từ các giá trị chính xác ở đầu vào.

2. Suy luận mờ: Áp dụng tất cả các luật mờ có thể áp dụng để tính ra giá trị mờ cho kếtluận, sau đó kết hợp các kết quả đầu ra.

3. Phi mờ hóa: Xác định giá trị chính xác từ kết quả mờ có được ở bước 2. Có nhiều kỹ thuật phi mờ hóa có thể áp dụng được, phương pháp thông dụng nhất là phương pháp trọng tâm (centriod method). 1.3 Kết luận chương 1.

Trong chương này, luận văn trình bày tổng quan về cây quyết định và thông tin không chắc chắn, là cơ sở để nghiên cứu, tìm hiểu các ứng dụng mô hình cây quyết định phục vụ quá trình ra quyết định với thông tin không chắc chắn ở các chương sau.

Có thể sử dụng công thức Bayes để tính xác suất của một giả thuyết khi dữ liệu thuộc tính của cây quyết định là thông tin không chắc chắn. Luật Bayes dựa trên lý thuyết xác suất hình thức cho phép sử dụng tri thức về nguyên nhân để suy ra kết luận. Lý thuyết về yếu tố chắc chắn Standford đưa ra khái niệm hệ số chắc chắn CF cho phép các chuyên gia kết hợp những niềm tin của mình vào dữ liệu và các luật khi phát biểu. Đồng thời đại số chắc chắn Standford cũng cung cấp các quy tắc và công thức sử dụng để tính các giá trị CF cho các kết luận trong quá trình suy luận. Hoặc có thể biểu diễn thông tin không chắc chắn dựa theo lý thuyết mờ. Lý thuyết mờ đưa ra khái niệm tập mờ và hàm thành viên thể hiện mức độ một thành viên thuộc vào tập mờ.

Để ra quyết định với thông tin không chắc chắn trong lập kế hoạch sản xuất kinh doanh doanh nghiệp bằng việc ứng dụng cây quyết định, các chương tiếp theo sẽ tìm hiểu về công cụ hỗ trợ xây dựng cây quyết định và ứng dụng của nó với nội dung việc lập kế hoạch sản xuất kinh doanh trong doanh nghiệp.

Page 13: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

13

CHƯƠNG 2: CÔNG CỤ HỖ TRỢ XÂY DỰNG MÔ HÌNH CÂY QUYẾT ĐỊNH VÀ KẾ HOẠCH SẢN XUẤT KINH DOANH DOANH NGHIỆP

Trong chương này, luận văn trước hết giới thiệu vấn đề ra quyết định với thông tin

không chắc chắn, ở đây chủ yếu là ra quyết định trong lập kế hoạch sản xuất kinh doanh bằng ứng dụng cây quyết định. Để có thể xây dựng một ứng dụng của cây quyết định, chương này đã khảo cứu công cụ hỗ trợ, cụ thể là phần mềm PrecisionTree5.7, một Add-in trên Micsoft Excel, đồng thời trình bày một cách khá hệ thống lý thuyết của quá trình lập kế hoạch sản xuất kinh doanh trong doanh nghiệp cũng như một số nội dung chủ yếu cần được ra quyết định trong quá trình này.

2.1 Ra quyết định với thông tin không chắc chắn bằng ứng dụng mô hình cây quyết định

2.2 Công cụ hỗ trợ xây dựng mô hình cây quyết định

Hiện nay có nhiều công cụ hỗ trợ xây dựng mô hình cây quyết định như Simple Decision Tree, và PrecisionTree, của Palisade Corporation. Trong luận văn nay sử dụng công cụ PrecisionTree5.7 của Palisade Corporation.

2.2.1 Giới thiệu PrecisionTree

PrecisionTree 5.7 do công ty Palisade có trụ sở chính tại Mỹ và chi nhánh tại nhiều nơi trên thế giới phát triển, được giới thiệu vào tháng 9 năm 2010, bản mới nhất PrecisionTree 5.7.1 giới thiệu vào tháng 6 năm 2011.

2.3 Kế hoạch phát triển sản xuất, kinh doanh của doanh nghiệp

2.4 Một số nội dung chủ yếu cần ra quyết định khi lập kế hoạch phát triển sản xuất, kinh doanh của doanh nghiệp

2.5 Kết luận chương 2

Trong chương này, luận văn giới thiệu tổng quát về công cụ PresicionTree5.7 được sử dụng trong luận văn để xây dựng mô hình cây quyết định. Đồng thời giới thiệu về lý thuyết lập kế hoạch sản xuất kinh doanh trong doanh nghiệp, các vấn đề cần ra quyết định trong quá trình lập kế hoạch sản xuất. Là lý thuyết cơ sở để áp dụng mô hình cây quyết định nhằm rút ra tri thức từ dữ liệu thực tiễn phục vụ công tác lập kế hoạch sản xuất của doanh nghiệp.

Nhằm ứng dụng lý thuyết trên vào thực tiễn sản xuất của một doanh nghiệp, chương tiếp theo trình bày việc sử dụng công cụ hỗ trợ xây dựng cây quyết định để giải quyết các bài toán liên quan đến việc ra quyết định với thông tin không chắc chắn trong lập kế hoạch sản xuất kinh doanh doanh nghiệp.

Page 14: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

14

CHƯƠNG 3 RA QUYẾT ĐỊNH VỚI THÔNG TIN KHÔNG CHẮC CHẮN TRONG LẬP KẾ

HOẠCH SẢN XUẤT KINH DOANH DOANH NGHIỆP

Chương này đề cập tới vấn đề ra quyết định với thông tin không chắc chắn trong lập kế hoạch sản xuất kinh doanh của doanh nghiệp bằng việc ứng dụng mô hình cây quyết định. Luận văn tìm hiểu quá trình đánh giá tính chất và mức độ không chắc chắn của môi trường kinh doanh để xác định giải pháp của doanh nghiệp và triển khai các kế hoạch thích hợp. Từ đó áp dụng lập kế hoạch sản xuất kinh doanh cho một sản phẩm của Công ty cổ phần May Thăng Long với dữ liệu mẫu được thu thập và giả định.

Bằng việc chia nhỏ các tình huống xảy ra khi lập kế hoạch sản xuất cho một sản phẩm thành các bài toán nhỏ hơn, và sử dụng công cụ PrecisionTree 5.7 để tạo cây quyết định giải quyết các bài toán nhỏ. Sau đó tổng hợp các kết quả thu được để tạo thành bảng kế hoạch sản xuất cho sản phẩm đó. Như vậy, việc xây dựng các cây quyết định trực quan hóa các dữ liệu tình huống và xử lý dữ liệu không chắc chắn thu được trong các tình huống trên góp phần hỗ trợ quá trình ra quyết định của nhà quản lý trong việc lập kế hoạch sản xuất sản phẩm.

3.1 Lược sử vấn đề nghiên cứu

Phân tích ra quyết định với điều kiện không chắc chắn diễn ra thường xuyên ở hầu hết các mức độ chiến lược của quá trình ra quyết định của các công ty và thường liên quan đến đội ngũ các nhà quản lý cấp cao. Việc chính thức sử dụng phân tích ra quyết định bắt đầu từ những năm 1960, nhưng vì thiếu công nghệ thông tin và sự thiếu tin tưởng của các phương thức của quản lý mức độ cao, nó không bao giờ thực sự tìm được địa vị xứng đáng.

Điều này được khẳng định trong báo cáo bởi hai chuyên gia phân tích ra quyết định liên quan đến bản thân công ty Du Pont, Krumm and Rolle, trong bài báo của họ “Quản lý và ứng dụng của quyết định và phân tích rủi ro trong Du Pont” . Việc Du Pont lập kế hoạch sản xuất kinh doanh dài hạn vào năm 1949 đã khơi mào cho một phong trào “tạo dựng kế hoạch” tại các công ty. Cho tới năm 1960, toàn bộ 500 công ty được tạp chí Fortune bình chọn đều có “Giám đốc kế hoạch” và các “Hiệp hội các nhà xây dựng kế hoạch dài hạn cho doanh nghiệp”, hoạt động ở cả Anh quốc và Hoa Kỳ [9].

3.2. Xác định vấn đề nghiên cứu

Có thể thấy quá trình lập và thực hiện kế hoạch sản xuất kinh doanh chịu sự ảnh hưởng của tính không chắc chắn của môi trường kinh doanh, được thể hiện dưới ba hình thức sau:

- Tình trạng không chắc chắn: xảy ra khi toàn bộ hay một phần của môi trường kinh doanh được coi là không thể tiên đoán được.

Page 15: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

15 - Hậu quả không chắc chắn: là trường hợp mặc dù đã cố gắng nhưng nhà quản lý

không thể tiên đoán được những hậu quả do sự thay đổi của môi trường tác động đến các doanh nghiệp, do vậy mà dẫn đến sự không chắc chắn.

- Sự phản ứng không chắc chắn: là tình trạng không thể tiên đoán được những hệ quả của một quyết định cụ thể, sự phản ứng của doanh nghiệp đối với những biến động của môi trường kinh doanh.

Vì vậy công việc của các nhà lập kế hoạch là phải đánh giá tính chất và mức độ không chắc chắn của môi trường kinh doanh để xác định giải pháp phản ứng của doanh nghiệp và triển khai các kế hoạch thích hợp.

Luận văn khảo cứu quá trình lập kế hoạch và thực hiện lập kế hoạch sản xuất kinh doanh cho Công ty cổ phần May Thăng Long với dữ liệu mẫu được thu thập năm 2006 bằng ứng dụng mô hình cây quyết định. Cụ thể Chương này nhằm giải quyết bài toán đặt ra là:

Với thực trạng lập kế hoạch sản xuất kinh doanh của công ty May Thăng Long hiện nay, cần ra quyết định về kế hoạch nhằm đạt sản lượng đề ra trong điều kiện môi trường kinh doanh và thông tin thu được là không chắc chắn bằng việc ứng dụng mô hình cụ cây quyết định.

3.3. Dữ liệu phục vụ lập kế hoạch sản xuất kinh doanh của doanh nghiệp

3.3.1 Dữ liệu phục vụ lập kế hoạch sản xuất kinh doanh:

- Các bảng dữ liệu trong phần Phụ lục (Nguồn phòng kế hoạch vật tư năm 2005 -2006).

- Các thông tin kinh tế, thị trường được dự báo bởi các nhà quản lý;

3.3.2 Đánh giá về kế hoạch sản xuất kinh doanh hiện nay của công ty

Dựa theo thực trạng quá trình sản xuất kinh doanh của công ty năm 2005 -2006, kế hoạch sản xuất kinh doanh được đánh giá.

3.4. Ứng dụng mô hình cây quyết định trong công tác lập kế hoạch sản xuất kinh doanh

3.3.1 Ứng dụng mô hình cây quyết định trong việc ra quyết định với thông tin không chắc chắn

Trong việc lập kế hoạch sản xuất kinh doanh tại công ty may Thăng Long, có nhiều tình huống xảy ra, yêu cầu phải xử lý các thông tin không chắc chắn thu thập được trong các tình huống đó. Yêu cầu này được luận văn giải quyết bằng việc ứng dụng mô hình cây quyết định.

Đầu vào: các dữ liệu đã thu thập được là các thông tin không chắc chắn như nhu cầu thị trường, giá cả nguyên vật liệu, nhân công, chi phí phát triển thị trường…

Đầu ra: Số lượng sản phẩm được sản xuất trong năm tới của nhà máy.

Page 16: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

16 Để giải quyết bài toán này, việc trước hết là chia vấn đề thành các bài toán nhỏ. Sử

dụng cây quyết định để giải quyết các bài toán nhỏ trên, sau đó tổng hợp các kết quả tình huống để đáp ứng yêu câu. Trong khuôn khổ luận văn này, sẽ tìm hiểu các bài toán nhỏ cần thiết trong việc lập kế hoạch sản xuất như sau:

Bài toán 1 Chi phí phát triển một sản phẩm tại một thị trường thử nghiệm (một địa điểm nào đó

thuộc một địa phương) được đánh giá qua 2 phương án sau:

Phương án 1 Phương Án 2 ĐV (triệu

đồng) Xác

suất ĐV(triệuđ

ồng) Xác suất

Chi phí mở đại lý 25 55% 35 65% Chi phí quản lý 15 35% 25 20% Chi phí phát sinh 8 10% 15 15%

(nguồn giả định) Bảng 3: Số liệu chi phí phát triển sản phẩm trên thị trường thử nghiệm

Giải pháp: Xây dựng cây quyết định bằng phần mềm Precisiontree 5.7 từ các dữ liệu bảng trên.

Kết quả thu được như hình 8:

Hình 11: Kết quả xây dựng mô hình cây quyết định cho bài toán 1

Đánh giá kết quả:

Page 17: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

17 Theo kết quả mô hình cây quyết định như trên, giá trị kỳ vọng lớn nhất của phương

án 1 là 19,8 (triệu đồng), của phương án 2 là 30 (triệu đồng). Giá trị kỳ vọng lớn nhất của cây là 30 triệu đồng.

Để đạt giá trị kỳ vọng lớn nhất là 30 triệu đồng, ta có đường đi trên cây là từ nút gốc, đến nút TRUE như hình vẽ.

Ở bài toán này, giả thuyết nhận giá trị thử nghiệm cho thị trường địa phương là 30 triệu đồng. Số liệu này được ứng dụng để giải quyết bài toán 2 sau đây.

Bài toán 2

Công ty cổ phần may Thăng Long lập kế hoạch về việc đưa một sản phẩm ra thị trường. Như trong nhiều tinh huống của sản phẩm mới, có nhiều sự không chắc chắn về liệu sản phẩm mới liệu có thể bắt kịp thị trường không. Công ty may Thăng Long tin rằng đó có thể là một quyết định khôn ngoan khi giới thiệu 1 sản phẩm mới tới một thì trường địa phương để kiểm tra trước khi giới thiệu nó ra phạm vi quốc gia. Do vậy, quyết định đầu tiên của công ty là liệu có thực hiện cuộc kiểm tra thị trường không. Công ty may Thăng Long định lượng rằng giá cố định tại thị trường thử nghiệm là 30 triệu đồng, theo như kết quả bài toán 1. Nếu nó quyết định thực hiện thử nghiệm đó, Công ty may Thăng Long sau đó phải đợi kết quả. Dựa vào kết quả của cuộc thử nghiệm, có thể quyết định có nên tung sản phẩm ra thị trường quốc gia, trong trường hợp nó sẽ phải chịu một chi phí cố định là 900 triệu đồng. Ngược lại, nếu quyết định ban đầu là không hiệu lực trên thị trường thử nghiệm, thì sau đó quyết định cuối cùng là liệu có tung sản phẩm ra thị trường quốc gia hay không có thể được thực hiện một cách không trì hoãn. Lợi nhuận đơn vị của Công ty may Thăng Long được tính bằng sự chênh lệch giữa giá bán sản phẩm và chi phí biến đổi đơn vị, là 18 nghìn đồng (ở thị trường thử nghiệm và thị trường quốc gia)

Công ty may Thăng Long phân loại kết quả trên thị trường thử nghiệm hoặc thị trường quốc gia là tốt, khá hay tồi. Một kết quả đi cùng với dự báo về tổng số đơn vị sản phẩm bán ra. Sản lượng bán ra tương ứng đối với thị trường thử nghiệm là 200, 100, 10 và là 6000, 3000, 900 đối với thị trường quốc gia. Dựa vào kết quả trên thị trường thử nghiệm trước đó cho sản phẩm tương tự, Công ty may Thăng Long đánh giá rằng xác suất khả năng đầu ra (hệ số chắc chắn) của 3 thị trường thử nghiệm là 0.3; 0.6 và 0.1. Sau đó căn cứ vào số liệu lịch sử của các sản phẩm trước đó, công ty này đã đánh giá khả năng đầu ra của thị trường quốc gia của mỗi thị trường thử nghiệm cụ thể. Nếu kết quả là tốt, xác suất khả năng đầu ra (hệ số chắc chắn) của thị trường quốc gia là 0.8; 0.15; và 0.05. Nếu kết quả của thị trường thử nghiệm là khá, những khả năng đầu ra (hệ số chắc chắn) tương ứng của thị trường quốc gia là 0.3; 0.5 và 0.2. Nếu kết quả của thị trường thử nghiệm là tồi, kết quả tương ứng là 0.05; 0.25 và 0.7 (Chú ý khả năng đầu ra của thị trường quốc ra có xu hướng phản ánh đầu ra của thị trường thử nghiệm).

Page 18: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

18 Nội dung TT Địa phương TT Toàn quốc

Chi phí cố định 30 triệu đồng 900 triệu đồng Sản lượng bán ra (Sản phẩm) Đơn giá 18 nghìn đồng/sản phẩm

Tốt 200 sp 36 trđ 6000 sp

1080 trđ

Khá 100 sp 18trđ 3000 sp

540 trđ

Tồi 30 sp 5.4trđ 900 sp 162 trd Xác suất khả năng bán ra sản phẩm

Tốt 0.3 Khá 0.6 Tồi 0.1

Xác suất khả năng bán ra của TT toàn quốc TT toàn quốc tốt TT toàn quốc khá TT toàn quốc tồi

TT địa phương tốt 0.8 0.15 0.05 TT địa phương khá 0.3 0.5 0.2 TT địa phương tồi 0.05 0.25 0.7

Bảng 4 Dữ liệu bài toán 2

Như vậy bài toán 2 như sau:

Đầu vào: Dữ liệu như Bảng 4.

Đầu ra: Công ty muốn sử dụng cây quyết định để trực quan hóa các giải pháp và giải pháp tốt nhất trong việc đưa ra sản lượng sản xuất sản phẩm.

Để giải bài toán này, trước hết cần phân tích bài toán:

Phân tích bài toán với ba nhân tố cơ bản của những vấn đề ra quyết định: những chiến lược có thể, những đầu ra và khả năng có thể, và mô hình giá trị.

Công ty may Thăng Long phải đưa ra quyết định liệu có thực hiện thử nghiệm thị trường hay không. Sau đó nó phải quyết định liệu có nên giới thiệu sản phẩm đó ra thị trường quốc gia không. Tuy nhiên, đó là quan trọng để nhận ra rằng nếu Công ty may Thăng Long quyết định thực hiện thử nghiệm thị trường, quyết định về thị trường quốc gia có thể dựa vào kết quả của thử nghiệm thị trường. Trong trường hợp này chiến lược cuối cùng của công ty này sẽ là một kế hoạch ngẫu nhiên, ở đó nó thực hiện thử nghiệm thị trường và sau đó giới thiệu sản phẩm tới thị trường quốc gia nếu nó nhận được đầy đủ kết quả tích cực từ thị trường thử nghiệm và từ bỏ sản phẩm nếu nhận được kết quả tiêu cực. Chiến lược tối ưu từ những vấn đề trong việc ra quyết định liên quan tới những kế hoạch ngẫu nhiên.

Điều quan trọng là không thể đơn giản đánh giá 3 khả năng mới đối với trường hợp đó. Những khả năng này được suy ra từ những khả năng cụ thể. Điều này tuân theo quy luật của xác suất điều kiện. nếu chúng ta đặt T1, T2, T3 là kết quả tốt, khá, tồi của thị trường thử

Page 19: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

19 nghiệm và N là kết quả bất kỳ của thị trường quốc gia và sau đó bằng quy tắc cộng xác suất và công thức xác suất điều kiện:

P(N) = P(N|T1)P(T1) + P(N|T2)P(T2) + P(N|T3)P(T3)

Thay số ta có:Khả năng đầu ra của thị trường toàn quốc khi quyết định triển khai mà không cần kết quả của thị trường thử nghiệm là 0.425; 0.370; 0.205.

Làm cách nào để người ra quyết định có thể xem xét được tất cả các khía cạnh quan trọng của vấn đề cùng một lúc: các lựa chọn thay thế quyết định, những kết quả không chắc chắn và xác suất của chúng, những hậu quả kinh tế, và thứ tự thời gian của các sự kiện, ...

Phương pháp và công cụ tin học hỗ trợ giải quyết bài toán: mô hình cây quyết định và phần mềm Precision Tree5.7.

. Kết quả bài toán 2 thu được là cây quyết định như hình sau:

Hình 13 : Kết quả bài toán 2

Phân tích kết quả thu được:

Tất cả các ứng dụng ra quyết định trong điều kiện không chắc chắn được thực hiện theo những quy trình sau:

Page 20: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

20 Đầu tiên sẽ xác định những khả năng có thể, đánh giá những khả năng có liên quan,

và tính toán giá trị kỳ vọng.

Sau đó sử dụng mô hình cây quyết định để xác định những lựa chọn có giá trị kỳ vọng lớn nhất và theo đuổi lựa chọn đó với một sự phân tích toàn diện. Phân tích bản tóm tắt rủi ro cho những lựa chọn khác nhau. Điều đó sẽ hữu dụng nếu những tiêu chí khác được xem xét.

Giải thích của cây này là khá đơn giản nếu ta nhận xét rằng mỗi giá trị chỉ dưới mỗi tên nút là một giá trị kỳ vọng. 807 ở ô B49 là giá trị kỳ vọng cho toàn bộ vấn đề quyết định, có nghĩa là Công ty may Thăng Long sẽ nhận kết quả tốt nhất là 8070 triệu đồng. Sản lượng tốt nhất có thể tiêu thụ là 449.000 sản phẩm.

Các giá trị kỳ vọng đã được tính toán bắt đầu từ bên phải và hoạt động trở lại phía bên trái. Công ty có thể tối ưu chiến lược bằng cách theo nhánh TRUE từ trái tới phải. Đầu tiên cho bán thử nghiệm sản phẩm mới tại thị trường địa phương, nếu kết quả là tốt, thì sản phẩm sẽ được bán trên toàn quốc. Tuy nhiên nếu kết quả là khá hoặc tồi thì sản phẩm có thể bị dừng sản xuất. Trong trường hợp thị trường toàn quốc ảm đạm, công ty có thể giảm được thua lỗ, công ty chịu phí 30 triệu đồng để bán thử tại thị trường địa phương nhưng thu lại được 18 triệu hoặc 5.4 triệu đồng.

Như vậy, cây quyết định ở đây dựa vào suy diễn lùi, nhận giá trị tại các nút lá, và phân tích ngược lên đến kết quả tại gốc của cây.

Với kết quả bài toán 2, có thể quyết định sản lượng sản phẩm mới được sản xuất tại xí nghiệp 1 của công ty. Tuy nhiên, ngoài sản phẩm mới được công ty ưu tiên sản xuất trong chiến lược phát triển kinh doanh, xí nghiệp còn sản xuất sản phẩm truyền thống. Căn cứ vào năng lực sản xuất và chỉ tiêu còn lại sau khi thực hiện sản phẩm mới, sản lượng sản phẩm truyền thống được sản xuất được quyết định trong bài toán 3.

Bài toán 3

Các giá trị bài toán đầu vào, đầu ra như sau:

Đầu vào:

Để tính toán sản lượng sản xuất của nhà máy 1, ngoài sản lượng sản xuất của sản phẩm mới, cần xem xét thêm sản phẩm truyền thống được lên kế hoạch sản xuất cho năm tới.

Xác định sản lượng của sản phẩm truyền thống tại Xí nghiệp 1 được sản xuất trong năm tới là bao nhiêu sản phẩm. Dựa vào các căn cứ để lập kế hoạch sản xuất, nhà quản lý đã đánh giá xác suất xảy ra của các thông tin không chắc chắn về kinh tế thị trường như bảng 5

Đầu ra: Quyết định sản lượng của sản phẩm truyền thống tại xí nghiệp1 được sản xuất trong năm tới.

(sản phẩm)

Page 21: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

21

Nhu cầu thị trường xấu

Sản phẩm cạnh tranh bán tốt 300,000

Năng lực sản xuất còn lại 655600 50%

Căn cứ đánh giá tình hình thực hiện kế hoạch năm trước 450000 12%

Căn cứ vào kết quả nghiên cứu và dự báo thị trường 700000 30%

Căn cứ vào chỉ tiêu kế hoạch do Tập Đoàn Dệt –May giao. 750000 8%

Sản phẩm cạnh tranh bán xấu 250,000

Năng lực sản xuất còn lại 655600 60%

Căn cứ đánh giá tình hình thực hiện kế hoạch năm trước 450000 15%

Căn cứ vào kết quả nghiên cứu và dự báo thị trường 500000 20%

Căn cứ vào chỉ tiêu kế hoạch do Tập Đoàn Dệt –May giao. 750000 5%

Nhu cầu thị trường tốt

Sản phẩm cạnh tranh bán tốt 200,000

Năng lực sản xuất còn lại 655600 25%

Căn cứ đánh giá tình hình thực hiện kế hoạch năm trước 450000 12%

Căn cứ vào kết quả nghiên cứu và dự báo thị trường 500000 60%

Căn cứ vào chỉ tiêu kế hoạch do Tập Đoàn Dệt –May giao. 750000 3%

Sản phẩm cạnh tranh bán xấu 150000

Năng lực sản xuất còn lại 655600 20%

Căn cứ đánh giá tình hình thực hiện kế hoạch năm trước 450000 15%

Căn cứ vào kết quả nghiên cứu và dự báo thị trường 700000 60%

Căn cứ vào chỉ tiêu kế hoạch do Tập Đoàn Dệt –May giao. 750000 5%

Bảng 5: Dữ liệu bài toán 3

Bằng việc tự xác định nút gốc, nhánh và các nút là dựa trên bảng trên, sử dụng phần mềm PrecisionTree 5.7 trực tiếp trên bảng tính dữ liệu trên thu được kết quả:

Page 22: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

22

Hình 14: Kết quả bài toán 3

Đánh giá kết quả thu được:

Cây quyết định ở đây dựa vào cơ chế suy diễn lùi hay hướng từ mục tiêu, hệ thống sẽ lần lượt tính toán giá trị kỳ vọng của từng mục tiêu, nhận giá trị tại các nút lá, và phân tích ngược lên đến kết quả tại gốc của cây

Sản lượng sản phẩm truyền thống nên sản xuất trong năm tới là 506.120 sản phẩm. Để đạt được kết quả trên, cây quyết định có đường đi từ gốc tới nút TRUE ->TRUE như mũi tên trong hình 13. Ngoài ra, khi lựa chọn nhánh đi từ gốc tới nút FALSE –>TRUE, hay nút FALSE –> FALSE thì các sản lượng kỳ vọng sẽ nhận được các giá trị khác nhau.

Như vậy, từ cây quyết định trên, có thể rút ra được một số luật suy diễn sau:

- IF ‘NCTTtốt = TRUE’ AND ‘SPCTBT=TRUE’ THEN “ SLSX = 506120 sp” - IF ‘NCTTtốt = TRUE’ AND ‘SPCTBX=FALSE’ THEN “ SLSX = 30400 sp”

Page 23: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

23

- IF ‘NCTTxấu = FALSE’ AND ‘SPCTBT=TRUE’ THEN “SLSX = 351800 sp”

- IF ‘NCTTxấu = FALSE’ AND ‘SPCTBX=FALSE’THEN “ SLSX = 348360sp”

(Với các từ viết tắt: SLSX là số lượng sản xuất, NCTT là nhu cầu thị trường, SPCTBX là sản phẩm cạnh tranh bán xấu, SPCTBT là sản phẩm cạnh tranh bán tốt, sp là sản phẩm)

Để quyết định sản lượng sản xuất cho xí nghiệp 1 của công ty may Thăng Long, cần tổng hợp kết quả của bài toán 2 và bài toán 3, với yêu cầu sản lượng dự kiến sản xuất trong năm tương đương tổng sản lượng của sản phẩm mới (SPM) và sản phẩm truyền thống (SPTT).

Tổng hợp:

Như vậy tổng hợp các bài toán trên có thể xây dựng được bảng kế hoạch sản xuất kinh doanh cho sản phẩm của Xí nghiệp 1 năm 2007 như sau:

Khách hàng

Đơn vị SX Tên

SL dự kiến/n

Chủng loại

Số tổ SX

Năng suất 1 tổ sp /ngày

Sản lượng SPM/năm

Sản lượng SPTT/năm

Giá bình quân (đ)

Doanh thu (1000đ)

/năm Xí nghiệp 1

SAMW

1,000,000

Sơ mi 6 500

449,000 506,120 20.000 2,000,000

Bảng 6: Kế hoạch sản xuất cho một sản phẩm của xí nghiệp 1

3.5 Kết luận chương 3 Chương này đã tìm hiểu quy trình lập kế hoạch sản xuất kinh doanh và thực nghiệm

việc ứng dụng mô hình cây quyết định với thông tin đầu vào là không chắc chắn, để giải quyết bài toán ra quyết định về sản lượng sản xuất của Xí nghiệp 1 thuộc Công ty May Thăng Long.

Do điều kiện thời gian, Chương này chỉ trình bầy phương pháp giải quyết một trong những nội dung của bài toán lập kế hoạch sản xuất kinh doanh doanh nghiệp. Kết quả thực nghiệm cho thấy khả năng có thể ra quyết định với thông tin không chắc chắn bằng việc công cụ PrecisionTree trên tập dữ liệu thực tế trong quá trình lập kế hoạch.

Page 24: Phương Thảo; Nghd. : PGS.TS. Đỗ Văn Thànhtainguyenso.vnu.edu.vn/jspui/bitstream/123456789/39244/1/TT...cây quyết định mô tả một cấu trúc cây, trong đó, các

24

KẾT LUẬN

Luận văn tập trung khảo cứu lý thuyết về cây quyết định, về thông tin không chắc chắn, về qui trình lập kế hoạch sản xuất kinh doanh của doanh nghiệp và thực hành việc ra quyết định trong lập kế hoạch sản xuất kinh doanh doanh nghiệp với thông tin không chắc chắn bằng việc ứng dụng mô hình cây quyết định.

Do điều kiện thời gian và khuôn khổ cho phép, luận văn mới thực hành xây dựng mô hình cây quyết định phục vụ ra quyết định trong lập kế hoạch sản xuất kinh doanh của một sản phẩm thuộc một Công ty, chưa bao quát các sản phẩm cũng như toàn bộ quá trình lập kế hoạch.

Tuy nhiên, những kết quả thu được chứng tỏ khả năng ứng dụng to lớn của mô hình cây quyết định trong việc xử lý thông tin không chắc chắn, trong việc giúp chuyển đổi quá trình ra quyết định mang tính chủ quan của người quản lý sang quyết định mang tính khách quan, chính xác hơn.

Những kết quả chính mà luận văn thực hiện được là: - Về lý thuyết: Luận văn tập trung tìm hiểu lý thuyết về cây quyết định, thông tin

không chắc chắn, quá trình ra quyết định và lập kế hoạch sản xuất kinh doanh của doanh nghiệp.

- Về thực tiễn: Luận văn đã thực nghiệm việc lập một kế hoạch sản xuất cho doanh nghiệp bằng việc ứng dụng mô hình cây quyết định. Kết quả thu được có thể ứng dụng vào thực tiễn nhằm cải tiến và nâng cao chất lượng công tác lập kế hoạch sản xuất kinh doanh trong doanh nghiệp, tư vấn cho hoạt động sản xuất kinh doanh của doanh nghiệp

Hướng phát triển tiếp theo của luận văn có thể là: - Tiếp tục nghiên cứu quá trình ra quyết định với thông tin không chắc chắn trong lập

kế hoạch phát triển kinh tế xã hội cấp tỉnh và cấp quốc gia bằng việc ứng dụng mô hình cây quyết định.

- Hoàn thiện quy trình ứng dụng mô hình cây quyết định với thông tin không chắc chắn trong việc lập kế hoạch sản xuất kinh doanh doanh nghiệp, giải quyết trọn vẹn bài toán lập kế hoạch sản xuất kinh doanh doanh nghiệp nhằm nâng cao chất lượng công tác lập kế hoạch và tư vấn, hỗ trợ doanh nghiệp.