48
Chương 7 : Các phương pháp cüc ti”u hóa không ràng buºc Nguy„n Đøc Nghĩa, Vũ Văn Thi»u, Trnh Anh Phúc 1 1 Bº môn Khoa Hc Máy Tính, Vi»n CNTT & TT, Trưng Đ/i Hc Bách Khoa Hà Nºi. Ngày 24 tháng 12 năm 2012 Trnh Anh Phúc ( Bº môn Khoa Hc Máy Tính, Vi»n CNTT & TT, Trưng Đ/i Hc Bách Khoa Hà Nºi. ) Tính toán khoa hc Ngày 24 tháng 12 năm 2012 1 / 48

Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Embed Size (px)

Citation preview

Page 1: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Chương 7 : Các phương pháp cực tiểu hóa không ràngbuộc

Nguyễn Đức Nghĩa, Vũ Văn Thiệu, Trịnh Anh Phúc 1

1Bộ môn Khoa Học Máy Tính, Viện CNTT & TT,Trường Đại Học Bách Khoa Hà Nội.

Ngày 24 tháng 12 năm 2012

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 1 / 48

Page 2: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Giới thiệu

1 Nhắc lại một số khái niệm từ giải tích

2 Bài toán qui hoạch phi tuyến không ràng buộc

3 Các phương pháp cực tiểu một biếnHàm đơn cực trịPhương pháp FibonacciPhương pháp lát cắt vàng

4 Các phương pháp số cực tiểu không ràng buộcCác phương pháp gradientPhương pháp Niu tơn

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 2 / 48

Page 3: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Nhắc lại một số khái niệm từ giải tích

Không gian Euclid n-chiều

Ký hiệu Rn - tập các vec tơ thực n-chiều

Rn = {x = (x1, x2, · · · , xn)T : xi ∈ R, i = 1, 2, · · · , n}

trong đó R là tập số thực. Trên đó ta xác định các phép toán

Phép cộng hai vec tơ u = (u1, u2, · · · , un)T và v = (v1, v2, · · · , vn)T

u + v = (u1 + v1, u2 + v2, · · · , un + vn)

Phép nhân vec tơ với một số thực α

αu = (αu1, αu2, · · · , αun)T

Rn cùng các phép toán vừa định nghĩa lập thành một không gian tuyếntính. Các phần tử của Rn đôi khi là các điểm.

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 3 / 48

Page 4: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Nhắc lại một số khái niệm từ giải tích

Không gian Euclid n-chiều (tiếp)

Nếu ta đưa vào thêm khái niệm tích vô hương của hai vec tơu, v ∈ Rn :

< u, v >=n∑

i=1

ui × vi

thì Rn cùng với tích vô hướng sẽ trở thành không gian Euclid n-chiều.

Độ dài chuẩn của vec tơ u ∈ Rn là số

||u|| =< u, u >1/2=

(n∑

i=1

u2i

)1/2

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 4 / 48

Page 5: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Nhắc lại một số khái niệm từ giải tích

Không gian Euclid n-chiều (tiếp)

Khoảng cách giữa hai điểm u, v ∈ Rn

ρ(u, v) = ||u − v || =

(n∑

i=1

(ui − vi )2

)1/2

Đối với u, v ,w ∈ Rn ta có bất đẳng thức tam giác

||u − v || ≤ ||u − w ||+ ||w − v ||

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 5 / 48

Page 6: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Nhắc lại một số khái niệm từ giải tích

Không gian Euclid n-chiều (tiếp)

Giả sử {uk , k = 1, 2, · · · } dãy điểm trong Rn, nghĩa là uk ∈ Rn,k = 1, 2, · · · , điểm v được gọi là điểm tới hạn của dãy {uk} nếu tìmđược dãy con {uk(i)} hội tụ đến v .

Dãy {uk} được gọi là bị chặn nếu tìm được hằng số M ≥ 0 sao cho||uk || ≤ M, với mọi k = 1, 2, · · ·Tập O(x , ε) = {u ∈ R : ||u − x || < ε} là khối cầu tâm tại x và bánkính ε > 0 được gọi là lân cận ε của x .

Điểm v ∈ R được gọi là điểm tới hạn của tập U ⊂ Rn, nếu mọi lâncận ε của nó luôn chứa điểm của U khác với v .

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 6 / 48

Page 7: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Nhắc lại một số khái niệm từ giải tích

Không gian Euclid n-chiều (tiếp)

Điểm x ∈ X được gọi là điểm trong của tập X nếu tồn tại một ε lâncận của nó nằm trọn trong X . Tập các điểm trong của X được kýhiệu là int(X ).

Điểm x ∈ X được gọi là điểm biên của tập X nếu trong mọi ε lâncận của nó có điểm những điểm thuộc X và không thuộc X . Tập cácđiểm trong của X được ký hiệu là ∂(X ).

Tập X được gọi là tập mở nếu mỗi điểm x ∈ X đều là điểm trongcủa X .

Tập X trong không gian Rn được gọi là bị chặn hay giới nội, nếutìm được hằng số L > 0 sao cho ||u|| ≤ L với mọi u ∈ X .

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 7 / 48

Page 8: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Nhắc lại một số khái niệm từ giải tích

Không gian Euclid n-chiều (tiếp)

Tập X trong không gian Rn được goi là tập đóng nếu nó chứa tất cảcác điểm tới hạn.

Giả sử {xk} là dãy điểm trong tập đóng X và limk→+∞ x = x , khi đóx ∈ X

Tập X được gọi là compact nếu có đóng và giới nội.

Giả sử {xk} là dãy điểm trong tập compact X . Khi đó từ {xk} taluôn có thể trích ra dãy con hội tụ {xk(i)} sao cholimk(i)→+∞ xk(i) = x , khi đó x ∈ X

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 8 / 48

Page 9: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Không gian Euclid n-chiều

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 9 / 48

Page 10: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Nhắc lại một số khái niệm từ giải tích

Vi phân hàm nhiều biến

Định nghĩa 1 : Giả sử hàm f xác định tại lân cận O(x , ε) của điểm x . Tanói hàm f là khả vi tại x nếu tìm được vec tơ f ′(x) ∈ Rn sao cho số giacủa hàm số tại x : ∆f (x) = f (x + ∆x)− f (x), ||∆x || ≤ ε có thể viết dướidạng

∆f (x) =< f ′(x),∆x > +o(x ,∆x)

trong đó o(x ,∆x) là vô cùng bé bậc cao hơn ||∆x ||, nghĩa là

lim||∆x ||→0o(x ,∆x)||∆x || = 0.

Hàm f ′(x) được gọi là gradient của hàm f tại x và thường được ký hiệu là∆f (x).

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 10 / 48

Page 11: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Nhắc lại một số khái niệm từ giải tích

Vi phân hàm nhiều biến (tiếp)

Định nghĩa 2 : Giả sử hàm f xác định tại lân cận O(x , ε) của điểm x . Tanói hàm f là hai lần khả vi tại x nếu cùng với vec tơ f ′(x), tồn tại ma trậnđối xứng f ”(x) ∈ Rn×n sao cho số gia của hàm số tại x có thể viết dướidạng

∆f (x) = f (x+∆x)−f (x) =< f ′(x),∆x > +< f ”(x)∆x ,∆x >

2+o(x ,∆x)

trong đó lim||∆x ||→0o(x ,∆x)||∆x ||2 = 0.

Ma trận f ”(x) được gọi là ma trận đạo hàm cấp hai hay Hessian của hàmf tại x và đôi khi còn được ký hiệu là O2f (x)

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 11 / 48

Page 12: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Nhắc lại một số khái niệm từ giải tích

Vi phân hàm nhiều biến (tiếp)

Định nghĩa 3 : Giả sử hàm f xác định trên tập mở X . Ta nói hàm f làkhả vi liên tục trên tập X nếu f là khả vi tại mọi điểm x của X và

||f ′(x + ∆x)− f ′(x)|| → 0 khi ||∆x || → 0, ∀x , x + ∆x ∈ X

Tập các hàm thỏa mãn tính chất này được ký hiệu là C 1(X ).Định nghĩa 4 : Giả sử hàm f xác định trên tập mở X . Ta nói hàm f làhai lần khả vi liên tục trên tập X nếu f là hai lần khả vi tại mọi điểm xcủa X và

||f ”(x + ∆x)− f ”(x)|| → 0 khi ||∆x || → 0, ∀x , x + ∆x ∈ X

Tập các hàm thỏa mãn tính chất này được ký hiệu là C 2(X ).

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 12 / 48

Page 13: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Nhắc lại một số khái niệm từ giải tích

Vi phân hàm nhiều biến (tiếp)

Công thức Taylor : Giả sử f (x) là hai lần khả vi liên tục tại một ε lâncận nào đó của xo , khi đó ta có

f (x) =f (xo)+ < f ′(xo), x − xo >

+1

2< f ”(xo)(x − xo), x − xo > +α(x , xo)||x − xo ||2

trong đó limx→xo α(x , xo) = 0, sai số có thể được viết dưới dạngo(||x − xo ||2)

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 13 / 48

Page 14: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Nhắc lại một số khái niệm từ giải tích

Vi phân hàm nhiều biến (tiếp)

Công thức số gia hữu hạn : Giả sử hàm f là khả vi liên tục trên tập mởS và x là một vec tơ nào đó trong S . Khi đó mọi vec tơ y thỏa mãnx + y ∈ S , luôn tìm được số α ∈ [0, 1] sao cho

f (x + y)− f (x) =< f ′(x + αy), y >=

∫ 1

0< f ′(x + ty), y > dt

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 14 / 48

Page 15: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Vi phân hàm nhiều biến

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 15 / 48

Page 16: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Nhắc lại một số khái niệm từ giải tích

Bài toán cực trị hàm nhiều biến

Xét bài toán tối ưuf (x)→ min, x ∈ X

trong đó X ⊂ Rn, còn f là hàm xác định trên X .Định nghĩa 5 : Điểm x∗ ∈ X được gọi là điểm cực tiểu toàn cục của ftrên X nếu f (x∗) ≤ f (x), ∀x ∈ X .

Giá trị f (x∗) là giá trị cực tiểu của f trên X và ta sẽ ký hiệumin{f (x) : x ∈ X}Điểm x∗ ∈ X được gọi là điểm cực tiểu địa phương của f trên Xnếu tìm được lân cận O(x , ε), ε > 0 sao cho f (x∗) ≤ f (x), vớix ∈ O(x , ε) ∩ X .

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 16 / 48

Page 17: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Nhắc lại một số khái niệm từ giải tích

Bài toán cực trị hàm nhiều biến (tiếp)

Định nghĩa 6 : Giả sử hàm f bị chặn trên X . Số f ∗ được gọi là cận dướicủa f trên X nếu

1 f ∗ ≤ f (x) với mọi x ∈ X

2 Với mọi số ε > 0 luôn tìm đc uε ∈ X sao cho f (uε) < f ∗ + ε

Khi đó ta ký hiệu : infx∈X f (x) = f ∗

Chú ý

Rõ ràng nếu hàm f đạt cực tiểu toàn cực trên X thì

infx∈X

f (x) = minx∈X

f (x)

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 17 / 48

Page 18: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Nhắc lại một số khái niệm từ giải tích

Một số ví dụ

f (x) = (x − 1)2 có cực tiểu toàn cục tại x∗ = 1 với f (x∗) = 0.

f (x) = ex + e−x − 3x2. Giá trị tối ưu của hàm f (x) = −7.02. Bàitoán có cực tiểu toàn cục tại hai điểm x = ±2.84, không có cực tiểuđịa phương.

f (x) = e−x cận dưới bằng không nhưng không đạt được. Không cócực tiểu địa phương cũng như cực tiểu toàn cục.

f (x) = −x + e−x Hàm mục tiêu không bị chặn dưới, không có cựctiểu địa phương cũng như cực tiểu toàn cục.

f (x) = ex + e−x − 3x2 + x Bài toán có hai cực tiểu địa phươngx1 = −2.9226 và x2 = 2.7418, trong đó x1 là cực tiểu toàn cục. Giátrị tối ưu của hàm là -9.9040

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 18 / 48

Page 19: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Nhắc lại một số khái niệm từ giải tích

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 19 / 48

Page 20: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Nhắc lại một số khái niệm từ giải tích

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 20 / 48

Page 21: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Bài toán cực trị hàm nhiều biến

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 21 / 48

Page 22: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Bài toán qui hoạch phi tuyến không ràng buộc

Định nghĩa

Xét bài toán qui hoạch phi tuyến không ràng buộc (unconstrainednonlinear programming)

min{f (x) : x ∈ Rn} (1)

trong đó f (x) khả vi liên tục.

Các định lý

Định lý 1 (Điều kiện cần tối ưu) : Điều kiện cần để x0 là cực tiểu địaphương là

Of (x0) = 0 (2)

Điều kiện (2) được gọi là điều kiện dừng, điểm x0 thỏa mãn (2) đc gọi làđiểm dừng. Như vậy việc giải bài toán (1) có thể qui về giải hệ phươngtrình (2).

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 22 / 48

Page 23: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Bài toán qui hoạch phi tuyến không ràng buộc

Các ví dụ

f (x) = x2 − 3x − 1 phương trình f ′(x) = 2x − 3 = 0 có nghiệm duynhất x0 = 3/2 là điểm cực tiểu địa phương, đồng thời là điểm cựctiểu toàn cục.

f (x1, x2) = x21 + x22 − 2x1x2 + x1 phương trình

Of (x) =

(2x1 − 2x2 + 1

−2x1 − 2x2

)= 0 có nghiệm duy nhất

x0 = (−1/4, 1/4). Tuy nhiên, nghiệm x0 không là phương án tối ưucủa bài toán min{f (x) : x ∈ R2} vì ta cóf (−1/4, 1/4) = −1/8 > −1 = f (0, 1).

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 23 / 48

Page 24: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Bài toán qui hoạch phi tuyến không ràng buộc

Các định lý (tiếp)

Định lý 2 (Điều kiện đủ tối ưu) : Giả sử f là hai lần khả vi liên tục. Điểmdừng x0 là cực tiểu địa phương nếu ma trận f ”(x0) là ma trận xác địnhdương.

Để biết ma trận có tính xác định dương hay không có thể sử dụng tiêuchuẩn Silvestra sau đây.Tiêu chuẩn Silvestra : Ma trận A = (aij)n×n là xác định không âm (bán

xác định dương) khi và chỉ khi tất cả các định thức con của nó là khôngâm

4i1,i2,··· ,ik = det

∣∣∣∣∣∣∣∣∣∣ai1,i1 ai1,i2 · · · ai1,ik

ai2,i1 ai2,i2 · · · ai2,ik

· · ·aik ,i1 aik ,i2 · · · aik ,ik

∣∣∣∣∣∣∣∣∣∣≥ 0

trong đó ∀1 ≤ i1 < i2 < · · · < ik ≤ n, ∀k = 1, 2, · · · , nTrịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 24 / 48

Page 25: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Bài toán qui hoạch phi tuyến không ràng buộc

Các ví dụ

Xét f (x1, x2) = ex21+x2

2 giải hệ phương trình

Of (x) =

(2x1e

x21+x2

2

2x2ex21+x2

2

)= 0

có nghiệm duy nhất x0 = (0, 0) do f ”(0, 0) =

(2 0

0 2

)có định thức

det|f ”(x0)| > 0 suy ra x0 là điểm cực tiểu địa phương đồng thời làphương án tối ưu của bài toán.

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 25 / 48

Page 26: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Bài toán qui hoạch phi tuyến không ràng buộc

Các ví dụ (tiếp)

Xét f (x1, x2) = −x21 + x22 − 2x1x2 − x1 giải hệ phương trình

Of (x) =

(−2x1 + 2x2 + 1

−2x1 + 2x2

)= 0

có nghiệm duy nhất x0 = (−1/4, 1/4) do f ”(x0) =

(−2 2

2 2

)có

định thức det|f ”(x0)| < 0 vậy x0 không là cực tiểu của hàm f (x).

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 26 / 48

Page 27: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Bài toán qui hoạch phi tuyến không ràng buộc

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 27 / 48

Page 28: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp cực tiểu một biến

Hàm đơn cực trị

Hàm đơn cực trị (unimodal function) là hàm chỉ có một điểm cực đại haycực tiểu trên đoạn xác định.Định nghĩa : Hàm f (x) được gọi là đơn cực tiểu nếu

x1 < x2 < x∗ kéo theo f (x2) < f (x1)

x2 > x1 > x∗ kéo theo f (x1) < f (x2)

trong đó x∗ là điểm cực tiểu.

Chú ý

Các phương pháp tìm kiếm (sẽ được giới thiệu) đều sử dụng giả thuyết làhàm đơn cực trị.

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 28 / 48

Page 29: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp cực tiểu một biến

Ví dụ

Giả sử đoạn chức cực tiểu [0,1], ta tính giá trị hàm tại hai điểmx1 < x2 : f (x1) = f1, f (x2) = f2 có 3 khả năng xảy ra :

1 f1 < f2 : Điểm cực tiểu x không thể nằm bên phải x2 vì thế đoạnchứa cực tiểu mới là [0, x2]

2 f1 > f2 : Điểm cực tiểu x không thể nằm bên trái x1 vì thế đoạn chứacực tiểu mới là [x1, 1]

3 f1 = f2 : Hai đoạn [0, x1) và (x2, 1] có thể loại bỏ và đoạn chứa cựctiểu mới là [x1, x2]

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 29 / 48

Page 30: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp cực tiểu một biến

Sơ đồ tìm kiếm

Giả sử ta có đoạn chứa cực tiểu xuất phát là [a, b]

1 Tính x1 = a + (b − a)/2− e/2 và x2 = a + (b − a)/2 + e/2 với e làsai số.

2 Tính f1 = f (x1) và f2 = f (x2)

3 I Nếu f1 < f2 thì đặt b = x2 (loại bỏ đoạn x > x2);I Nếu f1 > f2 thì đặt a = x1 (loại bỏ đoạn x < x1);I Nếu f1 = f2 thì đặt a = x1,b = x2 (loại bỏ đoạn x < x1 và x > x2);

4 Nếu |b − a| < 2e thì kết thúc; trái lại quay về bước 1

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 30 / 48

Page 31: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp cực tiểu một biến

Ví dụ :

Viết đoạn kịch bản tìm cực tiểu của f (x) = x(x − 15) trên đoạn(a, b) = (0, 1) với chênh lệch e = 0.01 so với nghiệm đúng x∗ = 0.75

f = inline(’x.*(x-1.5)’,’x’);eps = 0.01;a = 0; b = 1; k = 0;while abs(b-a)>= 2*eps

x1=a + (b-a)/2 - eps/2; x2=a + (b-a)/2 + eps/2;f1=f(x1); f2=f(x2); k=k+1;if f1<f2 b=x2;

elseif f1>f2 a=x1;else a=x1;b=x2;

endend...

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 31 / 48

Page 32: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp cực tiểu một biến

Ví dụ (tiếp) :

...fprintf(’So buoc lap k= %d ’,k);fprintf(’Do dai doan : b-a = %d’,b-a);fprintf(’x= %d’,x1);.Kết quả» So buoc lap k=7Do dai doan : b-a = 1.773438e-002x=7.502344e-001

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 32 / 48

Page 33: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp cực tiểu một biến

Phương pháp Fibonacci

Định nghĩa : Dãy Fibonacci được định nghĩa đệ quy như sau

F0 = 1; F1 = 1;

Fk = Fk−1 + Fk−2, k ≥ 2;

Ta phải xác định số bước lặp N trước khi thực hiện tính cực tiểu. Việc

chọn hai điểm x(k)1 và x

(k)2 ở bước lặp k đc xác định theo công thức :

x(k)1 =

FN−1−k

FN+1−k(bk − ak) + ak , k = 0, 1, · · · ,N − 1

x(k)2 =

FN−k

FN+1−k(bk − ak) + ak , k = 0, 1, · · · ,N − 1

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 33 / 48

Page 34: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp cực tiểu một biến

Phương pháp lát cắt vàng

Để cải tiến phương pháp Fibonacci, khi không cần cho trước số bước lặpN, ta áp luôn tỉ lệ cố định khi phân chia khoảng bk − ak

limN→∞

FN−1FN+1

= 0.382; limN→∞

FN+1

FN= 0.618

Do đó phương pháp lát cắt vàng đề xuất chọn hai điểm thử x(k)1 và x

(k)2

theo công thức cập nhật tại bước lặp như sau

x(k)1 = 0.382(bk − ak) + ak ,

x(k)2 = 0.618(bk − ak) + ak , k = 0, 1, 2, · · ·

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 34 / 48

Page 35: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp cực tiểu một biến

Ví dụ

Cài đặt thuật toán lát cắt vàng để tìm cực tiểu hàm trong đoạn [0,2]

f (x) = x2 − 2x + 1

f = inline(’x2̂-2*x+1’);a = 0; b = 2; eps = 0.00001;x1 = a + (b-a)*0.382;x2 = a + (b-a)*0.618;f1 = f(x1);f2 = f(x2);while abs(b-a)>2*eps

if f1 > f2a = x1; x1 = x2; f1 = f2;x2 = a + (b-a)*0.618;f2 = f(x2);...

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 35 / 48

Page 36: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp cực tiểu một biến

Ví dụ (tiếp)

...else

b = x2; x2 = x1; f2 = f1;x1 = a + (b-a)*0.382;f1 = f(x1);

endendfprintf(’Khoang co hep nghiem : [%f,%f]’,a,b);»Khoang co hep nghiem : [0.999990,1.000004]

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 36 / 48

Page 37: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp cực tiểu một biến

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 37 / 48

Page 38: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp số cực tiểu không ràng buộc

Mở đầu

Xét bài toán qui hoạch phi tuyến không ràng buộc

f (x)→ min, x ∈ Rn (3)

trong đó f (x) là khả vi liên tục. Để giải (3), nếu tồn tại có thể tìm đượctrong số các nghiệm của phương trình

Of (x) = 0 (4)

Tuy vậy, việc giải hệ phương trình (4) trong trường hợp tổng quát cũngkhông kém phần phức tạp. Dẫn đến ta phải dùng các phương pháp hiệuquả để giải (3).

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 38 / 48

Page 39: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp số cực tiểu không ràng buộc

Mở đầu (tiếp)

Hướng thường dùng để giải quyết (3) là dùng các phương pháp lặp từ giátrị khởi tạo x0 rồi dịch chuyển dẫn ’về hướng’ giá trị tối ưu x∗, theo mỗibước lặp cập nhật là :

xk+1 = xk + αkpk , k = 1, 2, · · · (5)

trong đó

pk là vec tơ định hướng dịch chuyển từ điểm xk .

αk là độ dài của bước dịch chuyển theo hướng pk .

Rõ ràng thủ tục (5) là xác định khi ta xác định được hướng dịch chuyểnpk và cách tính độ dài bước dịch chuyển αk .

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 39 / 48

Page 40: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp số cực tiểu không ràng buộc

Mở đầu (tiếp)

Phụ thuộc vào các cách xây dựng pk và αk khác nhau mà ta có các thủtục lặp với các đặc tính khác nhau. Ta đặc biệt quan tâm đến hai đặc tínhsau :

Sự thay đổi giá trị của hàm mục tiêu f của dãy {xk}

Sự hội tụ của dãy {xk} đến lời giải x∗.

Cũng cần chú ý là việc xác định pk và αk khác nhau cũng đòi hỏi khốilượng tính toán khác nhau.

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 40 / 48

Page 41: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp số cực tiểu không ràng buộc

Các phương pháp gradient

Ta chọn hướng pk sao cho

< Of (xk), pk >< 0 (6)

Bởi vì khi chọn αk đủ nhỏ, ta có

f (xk+1) = f (xk + αk) = f (xk) + αk < f (xk), pk > +o(αk) < f (xk)

tức là dịch chuyển theo hướng pk với độ dài đủ nhỏ ta sẽ đến được điểmxk+1 với giá trị hàm mục tiêu nhỏ hơn. Vậy hướng pk thỏa mãn (6) đượcgọi là hướng giảm (hướng tụt) của hàm mục tiêu f (x).

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 41 / 48

Page 42: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp số cực tiểu không ràng buộc

Các phương pháp gradient (tiếp)

Một trong các vec tơ thỏa mãn bất đẳng thức (6) có thể chọn là vec tơđối gradient của hàm f tại xk :

pk = −αkOf (xk), αk > 0, k = 0, 1, 2, · · ·

Khi đó ta có thủ tục lặp

xk+1 = xk − αkOf (xk), αk > 0, k = 0, 1, 2, · · · (7)

Thử tục lặp tuân theo công thức (7) được gọi là các phương phápgradient.

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 42 / 48

Page 43: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp số cực tiểu không ràng buộc

Các phương pháp gradient (tiếp)

Do hướng dịch chuyển là cố định, nên các phương pháp gradient khácnhau do cách chọn αk . Ta liệt kê ra một số cách chọn cơ bản sau

Thủ tục 1 : Giải bài toán cực tiểu hàm một biến

min{ϕk(λ) : λ ≥ 0}, với ϕk(λ)− f (xk − λOf (xk))

Phương án tối ưu của bài toán được lấy làm giá trị của αk .

Thủ tục 2 : Để chọn αk ta tiến hành theo thủ tục sau1 Đặt α = α > 02 Đặt u = xk − αOf (xk), tính f (u)3 Kiểm tra

f (u)− f (xk) ≤ −εα||Of (xk)||2, với 0 < ε < 1 (8)

4 Nếu bđt (8) thỏa mãn thì đặt αk = α, ngược lại đặt α α/2 và quay lạibước 2.

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 43 / 48

Page 44: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp số cực tiểu không ràng buộc

Các định lý với phương pháp gradient

Định lý 1 : Giả sử f (x) bị chặn dưới và gradient của nó f ′(x) thỏamãn điều kiện Lipchitz :

||f ′(x)− f ′(y)|| ≤ L||x − y ||

với mọi x , y ∈ Rn, việc chọn αk được tiến hành theo thủ tục 2. Khiđó theo công thức lặp (7) sẽ sinh ra dãy {xk} thỏa mãn điều kiện

||f ′(x)|| → 0, khi k →∞

với mọi điểm xuất phát x0

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 44 / 48

Page 45: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp số cực tiểu không ràng buộc

Các định lý với phương pháp gradient (tiếp)

Định lý 2 : Giả sử hàm f là hai lần khả vi liên tục và ma trận Hessiancủa nó thỏa mãn điều kiện

m||y ||2 ≤< H(x)y , y >≤ M||y ||2,M ≥ m > 0

với mọi x , y ∈ Rn, dãy {xk} được xây dựng theo thủ tục lặp (7) vớiαk được xác định theo thủ tục 2. Khi đó với mọi điểm xuất phát x0

ta cóxk → x∗, f (xk)→ f (x∗), khi k →∞

trong đó x∗ là điểm cực tiểu của f (x).

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 45 / 48

Page 46: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp số cực tiểu không ràng buộc

Ví dụ :

Xét bài toán cực tiểu hóa không ràng buộc

f (x1, x2) =1

2(x21 + γx22 ) (γ > 0)

Thực hiện thuật toán gradient bắt đầu từ phương án x0 = (γ, 1), độ dàibước xác định theo thủ tục 1, ta thu được dãy các phương án xấp xỉxk = (xk

1 , xk2 ) trong đó

xk1 = γ

(γ − 1

γ + 1

)k

, xk2 =

(−γ − 1

γ + 1

)k

Dãy xấp xỉ hội tụ chậm đến phương án tối ưu x∗ = (0, 0) khi γ >> 1 vàγ << 1

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 46 / 48

Page 47: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp số cực tiểu không ràng buộc

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 47 / 48

Page 48: Tính toán khoa học - Chương 7: Các phương pháp cực tiểu hóa không ràng buộc

Các phương pháp số cực tiểu không ràng buộc

Phương pháp Niu tơn

Trong trường hợp hàm f là hai lần khả vi liên tục và việc tính toán f ′(x)và f ”(x) là không khó khăn ta có thể sử dụng đến số hạng bậc hai củakhai triển Taylor.

fk(x) ≈ f (xk)+ < f ′(xk), x − xk > +1

2< H(xk)(x − xk), x − xk >

là xấp xỉ bậc hai của hàm f tại lân cận điểm xk .

Trịnh Anh Phúc ( Bộ môn Khoa Học Máy Tính, Viện CNTT & TT, Trường Đại Học Bách Khoa Hà Nội. )Tính toán khoa học Ngày 24 tháng 12 năm 2012 48 / 48