Upload
ho-hoang-phuc
View
21
Download
0
Embed Size (px)
DESCRIPTION
Cac dang hoi quy va ung dung
Citation preview
BAI GIANG ĐIÊN TƯ
TIN HOC ƯNG DUNG
TRONG KY THUÂT ĐIA CHÂT & DÂU KHÍ
Giảng viên : TS. Phạm Sơn Tùng
Bô môn : Khoan & Khai thac dâu khi
(Bài giảng được viết dựa trên bài giảng năm 2007 của các tac giả: ThS. Đỗ Quang Khánh & ThS. Bui Tử An)
Copyright 2015
HỒI QUY THỰC NGHIỆM
Copyright 2015
HỒI QUY THỰC NGHIỆM 2
PHÂN TÍCH HỒI QUY (REGRESSION ANALYSIS)
Khái niệm về phân tích hồi quy
Hồi quy tuyến tính (Linear regression)
Hồi quy đa thức (Polynomial regression)
Hồi quy lũy thừa (Power regression)
Hồi quy mũ (Exponential regression)
Copyright 2015
HỒI QUY THỰC NGHIỆM 3
HỒI QUY TUYẾN TÍNH
Sir Francis Galton (16/2/1822-17/1/1911)
Galton’s conclusions:
Nature dominates: “families of reputation were much more likely than ordinary families to produce offspring of ability
His “genetic utopia”: “Bright, healthy individuals were treated and paid well, and encouraged to have plenty of children. Social undesirables were treated with reasonable kindness so long as they worked hard and stayed celibate”
He went to JD Dickson, a mathematician at Cambridge, who formalized the relationship by developing what we know as linear regression
Copyright 2015
HỒI QUY THỰC NGHIỆM 4
KHÁI NIỆM VỀ PHÉP PHÂN TÍCH HỒI QUY
Phương pháp phân tích dữ liệu
Phân tích tương quan (Correlation)
Xác định mức độ liên quan giữa các biến
X ↔ Y: n cặp số đo (x1, y1), (x2, y2), … (xn, yn)
Hệ số tương quan (Coefficient of Correlation)
Copyright 2015
HỒI QUY THỰC NGHIỆM 5
KHÁI NIỆM VỀ PHÉP PHÂN TÍCH HỒI QUY
Phân tích mối liên hệ giữa số giờ xem tivi trong
ngày và điểm trung bình học kỳ
Số giờ xem
tivi/ngày Điểm TB
học kỳ
4 4
2.5 5
3 4.8
1 6.4
0.5 7.6
Copyright 2015
HỒI QUY THỰC NGHIỆM 6
KHÁI NIỆM VỀ PHÉP PHÂN TÍCH HỒI QUY
Phương pháp phân tích dữ liệu (Data analysis)
Phân tích tƣơng quan (Correlation)
Tiên lƣợng (Prediction)
Nếu các biến có mối liên hệ thì xây dựng mô
hình liên hệ giữa chúng
Cân nhắc lựa chọn mô hình toán học thích hợp
Từ đó có thể tiên lượng: X → Y
− X : biến độc lập (independent variable),
biến tiên lượng (predictor variable), biến giải
thích…
− Y : biến phụ thuộc (dependant variable),
biến được giải thích (response variable),
biến mục tiêu…
Copyright 2015
HỒI QUY THỰC NGHIỆM 7
KHÁI NIỆM VỀ PHÉP PHÂN TÍCH HỒI QUY
Phép phân tích hồi quy: trên cơ sở một tập các dữ liệu thực
nghiệm
Dạng tổng quát: ў = f (x1, x2, x3,…, a0, a1, a2 , …)
xi (i=1:k): biến độc lập thay đổi trong thực nghiệm
y: biến phục thuộc
a0, a1, a2 , …: các hệ số hồi quy tương ứng với các biến
trong mô hình toán học
Tính toán các hệ số hồi quy
Nghiên cứu mô hình toán học phù hợp nhất:
− HQ tuyến tính
− HQ đa thức
− HQ lũy thừa
− HQ mũ
Copyright 2015
HỒI QUY THỰC NGHIỆM 8
HỒI QUY TUYẾN TÍNH
Mục tiêu : tìm một mô hình (phương trình) để mô
tả một mối liên hệ tuyến tính giữa một hay
nhiều biến độc lập Xi đến một biến phụ thuộc Y
Nếu có một biến độc lập: hồi quy tuyến đính đơn
(Simple linear regression)
Nếu có nhiều biến độc lập: hồi quy tuyến tính bội
(Multiple linear regression)
Dạng phương trình hồi quy tuyến tính bội
ў = a0 + a1x1 + a2x2 + … + amxm
Ví dụ: x1 là Độ tuổi, x2 là Trọng lượng, x3 là chiều
cao, y là nồng độ Cholesterol trong máu
Copyright 2015
HỒI QUY THỰC NGHIỆM 9
Phương phap bình phương cực tiểu (tối thiểu) Least square method by Carl Friedrich Gauss (1795)
Tổng bình phương các sai số giữa giá trị thực nghiệm
và giá trị tính toán của thông số tối ưu là min.
Đường cong biểu diễn là phù hợp nhất với dữ liệu thực
nghiệm mà không nhất thiết phải đi qua tất cả các giá trị
thực nghiệm.
Copyright 2015
HỒI QUY THỰC NGHIỆM 10
PHƢƠNG PHÁP BÌNH PHƢƠNG CỰC TIỂU
Bài toán xác định hệ số hồi quy đối với một dạng phương
trình hồi quy trên cơ sở một tập dữ liệu thực nghiệm cho
trước:
Bài toán cực tiểu:
yj (j=1:N): giá trị thực nghiệm
ўj : giá trị tính toán
n: tổng số lần thực nghiệm
xi (i=1:m): biến số độc lập trong thực nghiệm.
1
2
1 2 0 1 2
1
ˆ[ ]
[ ( , ,..., , , ...) ] min
n
j j
j
n
j j
j
y y
y f x x a a a
Copyright 2015
HỒI QUY THỰC NGHIỆM 11
PHƢƠNG PHÁP BÌNH PHƢƠNG CỰC TIỂU (tt)
Phương pháp giải:
Điều kiện: ў = f(xi, a0, a1, a2,…) là hàm khả vi
Điều kiện cần để hàm Φ cực tiểu: đạo hàm riêng phần
của hàm Φ theo các hệ số hồi quy ai bằng 0
Sắp xếp và biến đổi ta được hệ phương trình chuẩn có
số phương trình bằng số các hệ số hồi quy (a0, a1,
a2,…) trong mô hình.
Biểu diễn dưới dạng ma trận
Giải hệ phương trình xác định hệ số hồi quy (a0, a1,
a2,…)
min]...),,,([]ˆ[1
2
210
1
N
j
jij
N
j
jj aaaxfyyy
Copyright 2015
HỒI QUY THỰC NGHIỆM 12
PHÂN TÍCH HỒI QUY TUYẾN TÍNH BỘI
Dạng phương trình hồi quy tuyến tính bội
ў = a0 + a1x1 + a2x2 + … + amxm
Các bước tiến hành:
Thiết lập hàm Φ
Áp dụng phương pháp bình phương cực tiểu
− Thiết lập HPT đại số tuyến tính đối với (m+1) ẩn số a0,
a1, a2, …, am
− Biểu diễn dưới dạng ma trận: AX = B
− Vector ần số X = [a0, a1, a2, …, am]T
2 2
0 1 1 2 2
1 1
ˆ[ ] [ ]n n
j j j m m jj j
y y y a a x a x a x
Copyright 2015
HỒI QUY THỰC NGHIỆM 13
PHÂN TÍCH HỒI QUY TUYẾN TÍNH BỘI (tt)
Suy ra:
Vector vế phải;
Ma trận A là ma trận vuông cấp (m+1)
Giải theo các phương pháp (ma trận nghịch đảo, khử Gauss, …)
tìm X
Thay (a0, a1, a2, …, am) vào mô hình và biểu diễn đường cong hồi
quy phù hợp nhất với một tập điểm thực nghiệm lấy mẫu
{(yj,x1j,x2j,…,xmj), j=1:n}
j
mjj
j
jj
j
jj
j
j
xy
xy
xy
y
B
2
1
2
21
2
2
2212
112
2
11
21
mjmjjmjjmj
jmjjjjj
jmjjjjj
mjjj
xxxxxx
xxxxxx
xxxxxx
xxxN
A
Copyright 2015
HỒI QUY THỰC NGHIỆM 14
PHÂN TÍCH HỒI QUY TUYẾN TÍNH BỘI (tt)
Trường hợp đặc biệt: ў = a0 + a1x
Khi đó hàm tổng bình phương các sai số đối
với tập n điểm thực nghiệm lấy mẫu
{yj,xj,j=1:n} cho trước sẽ là:
Cực tiểu hóa các hàm nói trên:
2 2
0 1
1 1
ˆ[ ] [ ( ]n n
j j j j
j j
y y y a a x
0 1
10
0 1
11
2[ ( )] 0
2[ ( )] 0
n
j j
j
n
j j j
j
y a a xa
y a a x xa
Copyright 2015
HỒI QUY THỰC NGHIỆM 15
PHÂN TÍCH HỒI QUY TUYẾN TÍNH BỘI (tt)
Bài toán thực tế: Quan sát 2 đại lượng vật ly X và Y trong một thí
nghiệm: i X Y
1 2 66
2 19 77
3 6 37
4 23 106
5 10 55
6 23 89
7 9 52
8 30 128
9 18 63
10 25 104
11 19 76
12 2 44
13 27 97
14 28 109
15 8 40
16 29 124
17 29 98
18 16 63
19 33 131
20 3 41
21 34 111
22 32 151
23 13 76
24 33 114
25 35 143
Copyright 2015
HỒI QUY THỰC NGHIỆM 16
PHÂN TÍCH HỒI QUY TUYẾN TÍNH BỘI (tt)
Bài tập 1: Theo 18 mẫu thử hình ranh lấy ở cùng một
via trên các khu vực khác nhau, người ta ghi lại dung
trọng của than đá và độ tro của chung như sau:
Biết rằng dung trọng và độ tro có quan hệ bậc nhất.
Giai: Tiến hành các bước trên ta xây dựng được
phương trình hồi qui thực nghiệm (Sinh viên tiến hanh
cac bước tinh toan như môt bai tâp)
xi 9 20 20 17 24 24 24 25 25 26 30 33 36
yi 1,4 1,4 1,4 1,5 1,5 1,5 1,5 1,5 1,6 1,6 1,7 1,7 1,8
Copyright 2015
HỒI QUY THỰC NGHIỆM 17
PHÂN TÍCH HỒI QUY TUYẾN TÍNH BỘI (tt)
y = 1.1863+ 0.0153x
0
0.5
1
1.5
2
0 10 20 30 40Dung troïng
Ño
ä tro
Qua số liệu ta thấy độ tro X tăng lên khi giá trị trọng lượng lượng
riêng than đá tăng. Tuy nhiên mối liên hệ đó không phải luc nào
cũng được bảo toàn. Trong một trường hợp Y tăng nhưng X
không đổi có trường hợp X tăng nhưng Y không đổi. Điều này
được giải thích bởi trọng lượng riêng của than không những phụ
thuộc vào độ tro, mà con phụ thuộc vào độ ẩm cũng như phụ
thuộc vào mức độ biến chất của nó.
Đáp án Bài tập 1
Copyright 2015
HỒI QUY THỰC NGHIỆM 18
PHÂN TÍCH HỒI QUY TUYẾN TÍNH BỘI (tt)
Bài tập 2: Kết quả thí nghiệm về tính thấm của một loại đất dính,
ta được quan hệ giữa độ dốc thủy lực J và vận tốc thấm V (cm/d)
như sau:
Biết V và J có quan hệ tuyến tính, xác định mối quan hệ này.
Giai: Tiến hành các bước trên ta xây dựng được phương trình
hồi qui thực nghiệm (Sinh viên tiến hanh cac bước tinh toan
như môt bai tâp)
J 7 9 12 15 18
V (cm/d) 0,5 2 6,5 9,5 14
V = 1.2373J - 8.5952
0
4
8
12
16
0 5 10 15 20J
V (cm/d)
Copyright 2015
HỒI QUY THỰC NGHIỆM 19
PHÂN TÍCH HỒI QUY ĐA THỨC
Dạng phương trình hồi quy hàm đa thức bậc m
ў = a0 + a1x + a2x2
+ … + apxp
Các bước tiến hành:
Đặt x1 = x, x2 = x2, … , xp = xp
Đưa về dạng phương trình hồi quy tuyến tính bội
Các bước tiếp theo như mục trước…
Biểu diễn phương trình hồi quy và đường hồi quy thực
nghiệm
Trường hợp đặc biệt: p =2 -> PTHQ parabol: ў = a0 + a1x
+ a2x2
Copyright 2015
HỒI QUY THỰC NGHIỆM 20
PHÂN TÍCH HỒI QUY ĐA THỨC (tt)
Bài toán thực tế: Thử nghiệm ứng suất keo một hợp kim
có được bảng dữ liệu sau:
Biết rằng hai đại lượng Stress và Strain có quan hệ
parabol. Tìm quan hệ này.
Giai: Lập bảng tính toán chuyển về dạng hồi qui tuyến
tính.
Test Stress(ksi)
Y
Strain (in./in.)
X Test
Stress(ksi)
Y
Strain (in./in.)
X
1
2
3
4
5
91
97
108
111
114
0.001
0.002
0.003
0.005
0.006
6
7
8
9
10
110
112
105
98
91
0.006
0.009
0.011
0.016
0.017
Copyright 2015
HỒI QUY THỰC NGHIỆM 21
PHÂN TÍCH HỒI QUY ĐA THỨC (tt)
Y X1(X) X1Y X2(X2) X2Y X1X2 X2
2
91
97
108
111
114
110
112
105
98
91
1037
=Y
0.001
0.002
0.003
0.005
0.006
0.006
0.009
0.011
0.016
0.017
0.076
=X1
0.091
0.194
0.324
0.555
0.684
0.660
1.008
1.155
1.568
1.547
77.786
=X1Y
110-6
410-6
910-6
2510-6
3610-6
3610-6
8110-6
12110-6
25610-6
28910-6
85810-6
=X2
0.000091
0.000388
0.000972
0.02775
0.004104
0.003960
0.009072
0.012705
0.025088
0.026299
0.085454
=X2Y
110-9
810-9
2710-9
12510-9
21610-9
21610-9
72910-9
133110-9
409610-9
491310-9
1166210-19
=X1X2
110-12
1610-12
8110-12
62510-12
129610-12
129610-12
656110-12
1464110-12
6553610-12
8352110-12
17357410-12
=X22
1037 = 10a0 + 0.076a1 + 85810-6a2
7.786 = 0.076a0 + 85810-6a1 + 1166210-9a2
0.085454 = 85810-6a0 + 1166210-9a1 + 17357410-12a2
a0 = 89.6; a1 = 5378; b2 = -311829
= 89.6 + 5378X1 - 311829X2 = 89.6 + 5378X - 311829X
Y
Copyright 2015
HỒI QUY THỰC NGHIỆM 22
PHÂN TÍCH HỒI QUY ĐA THỨC (tt)
Ta có đường hồi quy thực nghiệm.
y = -311829x2 + 5378x + 89.583
80
90
100
110
120
0 0.005 0.01 0.015 0.02Strain (in./in.)
Str
ess (
ksi)
Copyright 2015
HỒI QUY THỰC NGHIỆM 23
PHÂN TÍCH HỒI QUY ĐA THỨC (tt)
Trong tính toán địa chất thủy văn người ta thường
xác định bán kính ảnh hưởng R theo các công
thức kinh nghiệm hoặc theo tài liệu hut nước thí
nghiệm. Khi phân tích các công thức xác định lưu
lượng của lô khoan chung ta thấy rằng quan hệ
giữa lưu lượng Q và mực nước hạ thấp S là quan
hệ bậc hai parabol đối với lô khoan trong tầng
chứa nước không áp: S = aQ + bQ2
Ưng dụng định luật thấm Darcy trong môi trường
đất đá, quan hệ giữa vận tốc thấm V và độ dốc
thuy lực J đối với đất đá thấm nước mạnh: J = aV
+ bV2.
Copyright 2015
HỒI QUY THỰC NGHIỆM 24
PHÂN TÍCH HỒI QUY LŨY THỪA
Dạng phương trình hồi quy hàm lũy thừa
ў = a0x1a1 x2
a2 … xmam
Các bước tiến hành:
Tuyến tính hóa: ln ў = ln a0 + a1(ln x1) + a2(ln x2) + … + am(ln xm)
Đặt ž = ln ў, b0 = ln a0, t1 = ln x1, t2 = ln x2, … , tm = ln xm
Đưa về dạng phương trình hồi quy tuyến tính bội
ž = b0 + a1t1 + a2t2 + … + amtm
Các bước tiếp theo như mục trước…->(b0, a1
, a2,…, am)
Tìm lại các hệ số hồi quy ban đầu: (b0, a1
, a2,…, am) ->(a0
, a1, a2
,…,
am)
Biểu diễn phương trình hồi quy và đường hồi quy thực nghiệm
Trường hợp đặc biệt: m =1 -> PTHQ lũy thừa một biến: ў =
a0x1a1
Copyright 2015
HỒI QUY THỰC NGHIỆM 25
PHÂN TÍCH HỒI QUY LŨY THỪA (tt)
Bài toán thực tế:
Quan hệ ứng xử cơ học của dung dịch khoan giữa ứng
suất trượt và tốc độ trượt theo mô hình hàm lũy thừa có
dạng: Để xác định mối quan hệ này, thực tế tiến hành
đo ứng suất trượt trên nhớt kế Fann theo các tốc độ
quay khác nhau (thông thường 3, 6, 100, 200, 300 và
600 vong/phut).
Copyright 2015
HỒI QUY THỰC NGHIỆM 26
PHÂN TÍCH HỒI QUY LŨY THỪA (tt))
Giai: Lập bảng chuyển sang dạng hồi quy tuyến tính:
Tốc độ
(rpm)
Tốc độ
(s-1)
X
Ứng suât
trƣợt
(lbf/100ft2)
Y
LnX lnY LnX.LnY (lnX)2
3
6
10
200
300
600
5.11
10.22
170.33
340.66
511
1022
22
35
48
58
65
76
1.631
2.324
5.138
5.831
6.236
6.930
28.090
=lnX
3.091
3.555
3.871
4.060
4.174
4.331
23.083
=lnY
5.042
8.264
19.889
23.676
26.033
30.010
112.914
=(lnX.lnY)
2.661
5.403
26.396
33.999
38.892
48.018
155.369
=(lnX)2
20310
090283691556
08323090289141126a
21.
).().(
).)(.().(
8962
6
203100902808323a0
....
Copyright 2015
HỒI QUY THỰC NGHIỆM 27
PHÂN TÍCH HỒI QUY LŨY THỪA (tt))
20310
10818
x203108962y
..
..ˆ
0
10
20
30
40
50
60
70
80
0 200 400 600 800 1000 1200
Copyright 2015
HỒI QUY THỰC NGHIỆM 28
PHÂN TÍCH HỒI QUY LŨY THỪA (tt))
Trong tính toán địa chất thủy văn người ta thường xác định
bán kính ảnh hưởng R theo các công thức kinh nghiệm
hoặc theo tài liệu hut nước thí nghiệm.
Khi phân tích các công thức xác định lưu lượng của lô
khoan chung ta thấy rằng quan hệ giữa lưu lượng Q và
mực nước hạ thấp S là quan hệ đường thăng đối với lô
khoan trong tầng chứa nước áp lực, con đối với lô khoan
trong tầng chứa nước không áp, quan hệ giữa Q và S là
quan hệ bậc hai parabol.
Thực tế hut nước thí nghiệm chứng minh rằng quan hệ
giữa lưu lượng Q và mực nước hạ thấp S rất phức tạp.
Copyright 2015
HỒI QUY THỰC NGHIỆM 29
PHÂN TÍCH HỒI QUY MŨ
Dạng phương trình hồi quy hàm mũ
ў = a0a1x1
a2x2
… amxm
Các bước tiến hành:
Tuyến tính hóa: ln ў = ln a0 + (ln a1) x1 + (ln a2) x2 + … + (ln am)
xm
Đặt ž = ln ў, b0 = ln a0, b1 = ln a1, b2 = ln a2, … , bm = ln am
Đưa về dạng phương trình hồi quy tuyến tính bội
ž = b0 + b1x1 + b2x2 + … + bmxm
Các bước tiếp theo như mục trước…->(b0, b1
, b2,…, bm)
Tìm lại các hệ số hồi quy ban đầu: (b0, b1
, b2,…, bm)->(a0
, a1, a2
,…,
am)
Biểu diễn phương trình hồi quy và đường hồi quy thực nghiệm
Trường hợp đặc biệt: m =1 -> PTHQ mũ một biến: ў = a0a1x1
Copyright 2015
HỒI QUY THỰC NGHIỆM 30
PHÂN TÍCH HỒI QUY MŨ (tt)
Bài toán ví dụ: Phân tích kết quả chơi cờ của máy tính
Number
of Games
X
Skill
Index
Y
lnY XlnY X2
3
7
8
12
14
9
9
4
11
13
12
8
7
6
3
126
=X
16
34
40
93
125
50
48
18
70
110
85
45
40
33
20
2.773
3.526
3.689
4.533
4.828
3.912
3.871
2.890
4.248
4.700
4.443
3.807
3.689
3.497
2.996
57.402
=lnY
8.318
24.685
29.511
54.391
67.596
35.208
34.841
11.561
46.733
61.106
53.312
30.453
25.822
20.979
8.987
513.505
=XlnY
9
49
64
144
196
81
81
16
121
169
144
64
49
36
9
1232
=X2
Copyright 2015
HỒI QUY THỰC NGHIỆM 31
y = 10.083(1.1972)X
0
50
100
0 5 10 15
Number of Games
Skill In
dex
PHÂN TÍCH HỒI QUY MŨ
Đƣờng cong hồi quy:
XX180312
2
21
197210710eY
X180312Y
312180
15
126
15
40257a
180
126123215
4025712350551315a
).(.ˆ
..ˆln
.).(.
ln
.)()(
).().(ln
..