Upload
vu-tuyen-hoang
View
42
Download
5
Embed Size (px)
DESCRIPTION
cảnh báo va chạm ô tô trên mobie
Citation preview
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 1/62
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Khoa công nghệ thông tin 1
ĐÔ A NTÔ T NGHIÊ P ĐA I HO C
Đê ta i:
“NGHIÊN CƯ U VA XÂY DƯ NG PHẦN MỀM GIÁM SÁT VÀ CẢNH BÁO
VA CHẠM Ô TÔ TRÊN THIÊ T BI DI ĐÔ NG”
Giảng viên hướ ng dẫn: Ths.Nguyễn Thanh Thủy
Sinh viên thự c hiện : Vũ Tuyên Hoàng
Lớ p : D11CNPM2
Khóa :Hê :
2011 – 2016Ch nh quy
Ha nô i 12/2015
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 2/62
LƠ I CA M ƠN
Sau thơ i gian ho c tâ p, nghiên cư u trong Khoa Công nghê thông tin, cuô i cu ng em cu nghoa n tha nh đô a n tô t nghiê p đê trơ tha nh tân ky sư vơ i đê ta i “Nghiên cư u va xây dư ng phâ nmê m gia m sa t va ca nh ba o va cha m ô tô trên thiê t bi di đô ng”.
Lơ i đâ u tiên, con xin gư i lơ i ca m ơn ba me , anh trai đa luôn bên con, đô ng viên, u ng hô ,ch ba o va đi nh hươ ng cho con trong suô t năm năm dươ i Ho c Viê n Công Nghê Bưu Ch nhViễn Thông đê con co đươ c tha nh qua như nga y hôm nay.
Sau đo , em xin ca m ơn ca c thâ y cô trong Ho c Viê n no i chung va Khoa Công Nghê ThôngTin 1 no i riêng đa ân câ n, tâ n t nh gia ng da y cho em như ng kiê n thư c vê chuyên nga nh va như ng kiê n thư c vê la m ngươ i đê em co điê u kiê n ho c tâ p tô t nhâ t ta i Ho c Viê n.
Đă c biê t em xin gư i lơ i ca m ơn sâu să c tơ i Ths.Nguyễn Thanh Thu y đa ch ba o tâ n t nh va đô ng viên em đê em co thê hoa n tha nh đô a n tô t nghiê p mô t ca ch tô t nhâ t trong thơ i gian
qua.
Điê u cuô i cu ng em muô n chu c ca c thâ y cô trong khoa Khoa Công Nghê Thông Tin 1
ma nh kho e, luôn vui ve đê truyê n đa t nhiê u kiê n thư c cho chu ng em.
Em xin chân tha nh ca m ơn!
Ha nô i, 08/12/2015
Vu Tuyên Hoa ng
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 3/62
3
MU C LU C
DANH MU C CA C HI NH VE , SƠ ĐÔ ............................................................................. 5
DANH MỤC CÁC BẢNG ................................................................................................. 7
MƠ ĐÂ U ............................................................................................................................. 8
CHƯƠNG 1: GIƠ I THIÊ U CHUNG ............................................................................ 10
1.1. Hê thô ng gia m sa t va ca nh ba o va cha m ô tô ................................................ 10
1.2.
Pha m vi ba i toa n .............................................................................................. 11
1.3. Nghiên cư u liên quan ....................................................................................... 11
1.3.1. Sư du ng hê thô ng ca m biê n, hê thô ng kiê m soa t thông minh .................... 11
1.3.2.
Sư du ng phương pha p xư ly a nh ................................................................ 13
1.3.2.1. Phương pha p loa i trư nê n ....................................................................... 14
1.3.2.2. Phương pháp Optical flow ..................................................................... 16
1.4.
Ưu nhươ c điê m cu a ca c phương pha p đa pha t triê n .................................... 17
CHƯƠNG II: GIA I PHA P GIA M SA T VA ĐƯA RA CA NH BA O .......................... 18
2.1. Đê xuâ t gia i pha p tô ng thê .............................................................................. 18
2.1.1.
Nhâ n da ng đô i tươ ng ô tô .......................................................................... 18
2.1.2. Pha t hiê n la n đươ ng ................................................................................... 19
2.1.3.
Xư ly
thông tin va
đưa ra ca nh ba
o ............................................................ 20
2.2.
Nhâ n da ng đô i tươ ng ....................................................................................... 20
2.2.1. Kiê n thư c chung ......................................................................................... 20
2.2.1.1.
Tô ng quan vê video ................................................................................ 21
2.2.1.2.
Pha t hiê n đô i tươ ng chuyê n đô ng ........................................................... 23
2.2.1.3. Thuâ t toa n huâ n luyê n AdaBoot ............................................................ 25
2.2.1.4.
Đă c trưng Haar-like va mô h nh cascade ............................................... 26
2.2.1.5.
Đă c trưng Local Binary Pattern ............................................................. 29
2.2.2. Ca c bươ c nhâ n da ng đô i tươ ng .................................................................. 31
2.2.2.1.
Thu thâ p dư liê u ..................................................................................... 32
2.2.2.2.
Tiê n xư ly dư liê u ................................................................................... 34
2.2.2.3.
Huấn luyện ............................................................................................. 35
2.2.2.4.
Nhận dạng .............................................................................................. 36
2.3.
Pha t hiê n la n đươ ng ........................................................................................ 37
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 4/62
4
2.3.1.
Pha t hiê n điê m cư c tri Scale-space va thiê t lâ p vu ng quan tâm................. 37
2.3.1.1.
Pha t hiê n điê m cư c tri Sacle-space......................................................... 38
2.3.1.2. Ma ho a a nh theo khu vư c ....................................................................... 40
2.3.2.
Thuâ t toa n Canny va biê n đô i Hough ........................................................ 40
2.4.
Xư ly dư liê u va đưa ra ca nh ba o ................................................................... 44
2.4.1. Ươ c lươ ng khoa ng ca ch ............................................................................. 44
2.4.2.
Dư đoa n tô c đô ........................................................................................... 45
CHƯƠNG 3: XÂY DƯ NG PHÂ M MÊ M THƯ NGHIÊ M VA ĐA NH GIA KÊ T QUA ........................................................................................................................................... 46
3.1.
Thư nghiê m va đa nh gia kê t qua . ................................................................... 46
3.1.1.
Qua tr nh thu thâ p dư liê u .......................................................................... 46
3.1.1.1.
Dư liê u đâ u va o ...................................................................................... 46
3.1.1.2. Đô i tươ ng huâ n luyê n ............................................................................. 47
3.1.2. Qua tr nh huâ n luyê n.................................................................................. 49
3.1.2.1.
Môi trươ ng phâ n cư ng huâ n luyê n la ..................................................... 49
3.1.2.2.
Ca c bươ c huâ n luyê n .............................................................................. 50
3.1.3. Thư nghiê p va đa nh gia kết qua ................................................................. 54
3.2.
Phâ n mê m gia m sa t va ca nh ba o va cha m ô tô trên thiê t bi di đô ng .......... 57
3.2.1.
Phân t ch thiê t kê hê thô ng ......................................................................... 58
3.2.2. Giao diê n chương tr
nh .............................................................................. 59
KÊ T LUÂ N VA HƯƠ NG PHA T TRIÊ N ..................................................................... 61
TÀI LIỆU THAM KHẢO ............................................................................................... 62
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 5/62
5
DANH MU C CA C HI NH VE , SƠ ĐÔ
H nh 1-1: La n đươ ng va đô i tươ ng ô tô ............................................................................. 10
H nh 1-2: Sơ đô tô ng quan cu a hê thô ng ........................................................................... 11
H
nh 1-3: Mô pho
ng ca
c ca
m biê n đang đươ c sư
du ng .................................................... 12
H nh 1-4: Ca c bươ c xư ly a nh. .......................................................................................... 13
H nh 1-5: Ảnh (a) là ước lượ ng nền cơ sở , ảnh (b) thu đượ c ở bướ c tiế p theo. ảnh (c) thể
hiện bản đồ điểm ảnh nổi tr ội phát hiện đượ c bằng cách sử dụng phép tr ừ nền. .............. 14
H nh 1-6: Frame ảnh tại thời điểm t trướ c và sau khi vẽ các vector có hướ ng ................. 17
H nh 2-7: Đô i tươ ng ô tô đươ c nhâ n da ng......................................................................... 18
H nh 2-8: La n đươ ng đươ c pha t hiê n ................................................................................ 19
H nh 2-9: Khoa ng ca ch an toa n ........................................................................................ 20
H nh 2-10: Câ u tru c phân đoa n video ................................................................................ 21
H nh 2-11: Biê u đô ma u cu a 4 loa i cơ ba n (a) a nh tô i (b) a nh sa ng .................................. 22
H nh 2-12: Tô ng quan ca c khô i xư ly trong ba i toa n pha t hiê n đô i tươ ng. ....................... 23
H nh 2-13: Pha t hiê n vu ng a nh nô i .................................................................................... 24
H nh 2-14: Xư ly ca c vu ng a nh nô i (Foreground Processing)........................................... 24
H nh 2-15: Minh họa của thuật toán AdaBoost. ................................................................ 25
H nh 2-16: Bô phân loa i ma nh H(x) sau khi xây dư ng bă ng AdaBoostError! Bookmarknot defined. H nh 2-17: Ca c đă c trưng Haar like cơ ba n ....................................................................... 27
H nh 2-18: Minh họa ví dụ trong tính toán của các mẫu nhị phân cục bộ cho một pixel lâncâ n ...................................................................................................................................... 30
H nh 2-19: LBP bâ t biê n bâ t biê n vơ i ca ch thay đô i đơn trong mư c xa m ......................... 31
H nh 2-20: Khung h nh triê t xuâ t tư video đâ u va o. .......................................................... 33
H nh 2-21: Chuỗi các khung hình liên tiế p tách ra từ video (từ 1 đến 6) .......................... 33
H nh 2-22: Tậ p huấn luyện của các bộ học yếu ................................................................ 34
H nh 2-23: Mẫu Negative .................................................................................................. 35
H nh 2-24: hững đặc trưng Haar -like đầu tiên đượ c chọn trong bộ nhận dạng ................ 36
H nh 25: biê u diễn Scale-space ......................................................................................... 38
H nh 2-26: Biểu đồ mô phỏng việc tính toán các DoG ảnh từ các ảnh k ề mờ .................. 39
H nh 2-27: Mỗi điểm ảnh đượ c so sánh vớ i 26 láng giềng của nó .................................... 39
H nh 2-28: Khu vư c pha t hiê n la n đươ ng trong vo ng tro n ma u đo Error! Bookmark not
defined. H nh 2-29: v du a nh đươ ng viê n ....................................................................................... 41
H nh 2-30: A p dụng các biến đổi Hough cho đườ ng thẳng............................................... 43
H nh 2-31: Sau khi sư du ng thuâ t toa n hough va hough lines .......................................... 43
H nh 2-32: điê m kê t thu c cu a đươ ng khi sư du ng biê n đô i hough theo xa c suâ t .............. 43
H nh 2-33: Kết qua cuối cu ng ........................................... Error! Bookmark not defined. H nh 2-34: Mẫu h nh a nh ơ ca c khoa ng ca ch kha c nhau vơ i đô i tươ ng la xe. .................. 45
H nh 2-35: Sơ đô thê hiê n mô i quan hê giư a k ch thươ c va khoa ng ca ch ......................... 45
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 6/62
6
H nh 3-1: Sơ đô khô i mô ta hoa t đô ng cu a hê thô ng. ........................................................ 58
H nh 3-2: Sơ đô chi tiê t cho qua tr nh nhâ n da ng đô i tươ ng ............................................. 59
H nh 3-3: Công cụ Object Marker giúp tạo các mẫu huấn luyện ...................................... 51
H nh 3-4: Minh họa quá trình chạy công cụ huấn luyện bộ nhận dạng ............................ 53
H nh 3-5: Nhâ n da ng đô i tươ ng xe ph a trươ c................................................................... 55
H nh 3-6: Pha t hiê n la n xe. ................................................................................................ 55
H nh 3-7: Đo khoa ng ca ch tơ i xe ph a trươ c. .................................................................... 55
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 7/62
7
DANH MỤC CÁC BẢNG
Ba ng 1: Đô ch nh xa c viê c pha t hiê n đô i tươ ng xe trong 10s đâ u ............................... 56
Ba ng 2: Thơ i gian nhâ n da ng xe cu a mươ i xe trên thư c tê .......................................... 56
Ba
ng 3: Sô đô i tươ ng đo đươ c khoa
ng ca ch trong 10s đâ u ......................................... 56
Ba ng 4: Thơ i gian đo khoa ng ca ch cu a mươ i xe trong thư c tê .................................... 56
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 8/62
8
MƠ ĐÂ U
Đâ t nươ c ta đang thơ i thơ i k Công nghiê p ho a – Hiê n đa i ho a, vơ i sư tiê n bô va pha ttriê n không ngư ng trên tâ t ca ca c l nh vư c trong cuô c sô ng la m châ t lươ ng cuô c sô ng nga yca ng tăng cao. Khi xa hô i đi lên, nhu câ u đi la i, vâ n chuyê n cu a con ngươ i nga y ca ng caova câ n thiê t. Ch nh v vâ y giao thông nă m vai tro chu trô t trong xa hô i hiê n nay.
Trong những năm gần đây, Ô tô là phương tiện giao thông chủ yếu và ngày càng
phát triển hơn chiếm phần lớ n trong các quốc gia trên thế giới. Ô tô đã giải quyết các vấn
đề đi lại của con ngườ i và giảm thiểu đượ c thời gian đi lại đáng kể của mỗi chúng ta. Trên
thế giớ i có r ất nhiều hãng sản xuất xe nổi tiếng, lâu đờ i có thể k ể đến như: Mercedes,BMV, Honda... Theo số liệu thống kê của Bộ Giao thông Vận tải, trong 9 tháng của năm2015, lực lượ ng CSGT toàn quốc đăng ký mới 230.008 xe ôtô và hơn 2,2 triệu xe môtô,nâng tô ng số phương tiện đang quản lý lên 2,5 triệu xe ôtô và 43,4 triệu xe môtô. Chỉ t nhriêng sô vu ta i na n trong tháng 9 (tính từ ngày 16/8/2015 đến 15/9/2015), cả nướ c xảy ra
1.837 vụ, làm chết 697 ngườ i, làm bị thương 1.695 người. Sô vu tai na n đa gia m so vơ i
cu ng ky năm 2014 nhưng vẫn co n ơ mư a đa ng ba o đô ng.
Công nghệ cảnh báo tai nạn đượ c các hãng xe ô tô chú tr ọng nghiên cứu và phát triển
từ khá lâu. Ở hầu hết các mẫu xe hiện đại, hệ thống cảnh báo tai nạn hoạt động dựa trên
thông tin từ các cảm biến dọc thân xe có nhiệm vụ phát hiện vật cản, nguy cơ va chạm,
tr ạng thái xe bất thườ ng, từ đó kích hoạt hàng loạt các chức năng an toàn để thông báo
cho lái xe đồng thờ i giảm thiểu tổn thương cho ngườ i ngồi trong xe. Không chỉ bảo vệ
hành khách bằng cách tự siết chặt dây an toàn, nhiều mẫu xe hiện đại còn đượ c trang bị hàng loạt các tính năng an toàn như hệ thống cân bằng điện tử ESP, hệ thống phanh khẩn
cấ p BA, hệ thống chống bó cứng phanh ABS, hệ thống kiểm soát hành trình thông minh
ACC… Gần đây, nhiều công nghệ cảnh báo tai nạn đượ c các nhà khoa học tại Mỹ tíchcực nghiên cứu, trong đó phải k ể đến công nghệ dự đoán hành động của tài xế qua quan
sát ngôn ngữ cơ thể, công nghệ tự động liên lạc giữa các xe đang lưu thông trên đườ ng
khi có nguy cơ tai nạn xảy ra…
Khi con ngườ i sử dụng ô tô là phương tiện giao thông đi lại chủ yếu của mình hơn,thì hằng năm có rất nhiều vụ giao thông bằng ô tô đã xảy ra đã cướp đi bao nhiêu sinhmạng… Mấy năm trở lại đây, các công ty và các nhà phát triển trên thế giới đã chú trọng
hơn và không ngừng nghiên cứu phát triển các thiết bị cảnh báo va chạm ô tô nhằm góp
phần giảm thiểu nguy cơ va chạm do con ngườ i gây ra. Có thể k ể tớ i các thiết bị như công
nghệ V2V, Hệ thống cảnh báo chống va chạm giữa ôtô và xe đạ p vừa đượ c hãng xe Volvogiớ i thiệu tại triển lãm công nghệ CES 2015 va đă c biê t la thiê t bi nho go n Mobileye của
Isarel cảnh báo va chạm tai nạn sớm cho ô tô đã và đang rất nổi tiếng trên thế giớ i.
Y thư c tâ m quan tro ng cu a viê c ba o vê sư an toa n cho ca c chu phương tiê n tham giagiao thông băng ô tô va gia m các chi phí cho các thiết bị trên khá đắt, nên đề tài “ Phâ nmê m gia m sa t va ca nh ba o va cha m ô tô trên ca c thiê t bi di đô ng ”nhằm góp phần giảm
thiểu r ủi ro va chạm và phổ biến, thông dụng hơn cho tất cả mọi ngườ i lái xe ô tô.
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 9/62
9
Trong pha m vi đô a n cu a m nh, em xin đê xuâ t xây dư ng phâ n mê m gia m sa t va ca nh ba o va cha m ô tô co thê sư du ng đê pha t hiê n la n đươ ng đưa ra ca nh ba o nê u phương tiê nđi lâ n la n đươ ng, va pha t hiê n ô tô ph a trươ c.
Nô i dung đô a n bao gô m 3 chương như sau:
Chương 1: Giơ i thiê u chung
Phâ n na y se giơ i thiê u gia i pha p vê ca ch nhâ n da ng đô i tươ ng va đưa ra ca nh ba o.Ca ch tiê p câ n, phương pha p phu hơ p gia i quyê t vâ n đê ba i toa n.
Chương 2: Gia i pha p gia m sa t va đưa ra ca nh ba o
Chương na y se đưa ra nhưng ba i toa n nho trong hê thô ng va ca c phương pha p xâydư ng hê thô ng ư ng du ng.
Chương 3: Xây dư ng phâ n mê m thư nghiê m va đa nh gia kê t qua
Trong chương na y tr nh ba y cu thê vê qua tr nh xây dư ng hê thô ng phâ n mê m gia m
sa t va ca nh ba o va cha m ô tô, ca c bươ c thư c hiê n thư c nghiê m, kê t qua thư c nghiê m đa tđươ c. Như ng kê t qua ư ng dư ng hê thô ng đa đa t đươ c, nhưng khuyê t điê m va ca ch khă c phu c trong tương lai.
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 10/62
10
CHƯƠNG 1: GIƠ I THIÊ U CHUNG
Chương na y se giơ i thiê u tô ng qua t ba i toa n gia m sa t va ca nh ba o va cha m ô tô khilưu thông trên đươ ng bao gô m mu c tiêu, đô i tươ ng hươ ng tơ i va pha m vi cu a ba i toa n.Trong phâ n na y cu ng tr nh ba y tô ng quan vê ca c phương pha p liên quan gia i quyê t ba i
toa n.
1.1. Hê thô ng gia m sa t va ca nh ba o va cha m ô tô
Hê thô ng gia m sa t va ca nh ba o va cha m ô tô la hê thô ng co kha năng phân t ch, xư ly như ng h nh a nh thu đươ c tư camera cu a ca c thiê t bi di đô ng như mobile hay tablet, va xa cđi nh ca c đô i tươ ng la la n đươ ng va ô tô đang tham gia lưu thông, tư đo go p phâ n đưa ranhư ng phân t ch nhă m ca nh ba o cho t nh tra ng hiê n ta i cu a phương tiê n.
: La n đươ ng va đối tươ ng ô tô
Hê thô ng bao gô m 2 phâ n ch nh câ n quan tâm la : phâ n theo do i đôi tươ ng va phâ n đưara ca nh ba o.
Phâ n theo do i đô i tươ ng:
Đâ u va o: Video thu đươ c tư camera Đâ u ra: Nhâ n da ng đô i tươ ng thu đươ c tư camera đâ u va o va pha t hiê n la n đươ ng
Phâ n đưa ra ca nh ba o:
Đâ u va o: Ca c đô i tươ ng đa nhâ n da ng đươ c
Đâ u ra: Theo do i đô i tươ ng va đưa ra ca nh ba o
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 11/62
11
: Sơ đồ tô ng quan cu a hê thống
Hê thô ng sư du ng camera đê thu đươ c ca c video, sau đo se ta ch tha nh ca c khungh nh liên tiê p nhau đê la m đâ u va o qua tr nh xư ly a nh. Ơ bươ c na y hê thô ng se sư du ngca c phương pha p đa đươ c huâ n luyê n đê nhâ n da ng đô i tươ ng co trong a nh. Khi hê thô ng
đa nhâ n da ng đô i tươ ng co trong a nh tư đo pha t hiê n ra khoa ng ca ch giư a ca c đô i tươ ngva đưa ra ca nh ba o cho hê thô ng.
1.2. Pha m vi ba i toa n
Ba i toa n gia m sa t va ca nh ba o va cha m ô tô trên ca c thiê t bi di đô ng la mô t ba i toa nco thê a p du ng ơ pha m vi rô ng va ơ nhiê u điê u kiê n kha c nhau. Do ba i toa n đang trongqua tr nh nghiên cư u va pha t triê n lên em xin giơ i ha n ba i toa n theo mô t sô tiêu tr cu thê sau đê hê thô ng hoa t đô ng mô t ca ch tô t nhâ t.
Giơ i ha n vê pha m vi: ba i toa n a p du ng cho ca c phương tiên lưu thông ơ khu vư cngoa i tha nh trên la n đươ ng mô t chiê u.
Giơ i ha n vê thơ i gian: thơ i gian phương tiê n lưu thông ban nga y va như ng nơi co a nh sa ng tô t.
1.3.
Nghiên cư u liên quan
Vê ba i toa n gia m sa t va ca nh ba o va cha m ô tô trên ca c thiê t bi no i chung đa co râ tnhâ t nhiê u gia i pha p tiê p câ n vâ n đê na y. Phâ n na y se tr nh ba y mô t sô gia i pha p đươ c sư dung nhiều nhất đê gia i quyết ba i toa n trên.
1.3.1.
Sư du ng hê thô ng ca m biê n, hê thô ng kiê m soa t thông minh
Đã co nhiê u nghiên cứu, phát triển và ứng dụng trong suốt 20 năm qua trên khă p thê giơ i, các hệ thống ngăn ngừa va chạm sử dụng nhiều cảm biến để phát hiện nguy cơ vachạm vớ i các xe khác. Khi va chạm sắ p xảy ra, hệ thống này sẽ cảnh báo tài xế, hoặc tự
động phanh xe hay cao cấp hơn là tự đánh lái để né tránh.
Camera Ca c khun h nh Tiê n xư l a nh
Pha t hiê n ha nh vi Theo do i đô i tươ n Nhâ n da n đô i tươ n
Đưa ca nh ba o
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 12/62
12
Mô t v du tiêu biê u vê hê thô ng ca nh ba o va cha m ph a trươ c đươ c biê t đê n phô biê nnhâ t la công nghê an toa n Toyota Safety Sense, Prometheus va do ng xe thông minh trongtương lai gâ n.
Công nghệ Safety Sense sẽ mang đến hệ thống cảnh báo va chạm phía trướ c vớ i hệ
thống điều khiển bằng laser. Hê thô ng sẽ cảnh báo ngườ i lái phương tiê n ca c kha năngxảy ra va chạm như vươ t qua tô c đô , khoa ng ca ch vơ i xe ph a trươ c qua gâ n. Nếu ngườ ilái ta c đô ng gia m tô c đô sau tín hiệu cảnh báo, hệ thống phanh khẩn cấ p tự động sẽ hoạt
động dư a trên ca c nguyên tă c đâ u va o kha c nhau đê ta c đô ng va o tô c đô cu a xe, như giảm
tốc độ của xe xuống 30 km/h hoă c dư ng phương tiên hoàn toàn.
Hệ thống cảnh báo va chạm phía trướ c hoạt động khi vận tốc xe nằm trong khoảng
16 – 138 km/h và khi tốc độ giữa 2 xe chênh lệch lớn hơn 16 km/h [13]. Trong khi đó, hệ
thống phanh khẩn cấ p tự động hoạt động khi vận tốc đạt từ 11 đến 79 km/h. Bên cạnh đó,công nghệ mới này còn mang đến cho người dùng tính năng cảnh báo khở i hành sai làn
đườ ng.[13]
: Mô pho ng ca c ca m biến đang đươ c sư du ng
Ta i Nhật Bản đa khở i xướ ng chương trình xe an toàn tiên tiến để phát triển công
nghệ tiên tiến tránh các vụ tai nạn. Chương trình Prometheus đã đa pha t triê n trong mô t
thơ i gian da i đươ c coi như mô t ngươ i la i phu , dư a n đươ c pha t triê n ơ Nhâ t ba n vơ i ca c chức năng sau: giám sát làn đườ ng, và xe tự tr ị.
Ta i Hoa ky , hệ thống hỗ tr ợ lái xe tiên tiến đượ c gọi là (ADAS), sản phẩm tiế p tục
nghiên cứu và phát triển ngày càng cải thiện hơn. K ết quả là hê thô ng có khả năng cảm
nhận tình huống nguy hiểm và phản ứng một cách thích hợ p trong trườ ng hợ p ngườ i lái
xe không phải kiểm soát đượ c.
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 13/62
13
Hê thô ng xe thông minh là một thực tế đa đang va se pha t triê n lơ n ma nh trong như ngnăm tơ i va đi va o cuô c sô ng con ngươ i nhă m đem la i sư an toa n cho mỗi chu ng ta.
1.3.2. Sư du ng phương pha p xư ly a nh
Camera la tha nh tư u tha nh công cu a loa i ngươ i trong vâ n đê thu nhâ n a nh. Viê c sư du ng camera la m thiê t vi theo do i va ca nh ba o giao thông đa đươ c a p du ng trong như ngnăm gâ n đây trên nươ c ta. Trướ c kia, các video này sẽ đượ c gửi tớ i những người điều hành
đườ ng bộ chịu trách nhiệm giám sát tr ực tiế p. Nhưng ngày nay, ngoài việc sử dụng con
ngườ i thì ca c hê thô ng co sư du ng khoa ho c tâ m nh n ma y t nh co các thuật toán xử lý ảnh
đã có thể tự động đưa ra các phân tích, thu thậ p thông tin từ các video giao thông giúp cho
việc giám sát tr ở nên dễ dàng và tự động hóa hơn rất nhiều.
Về cơ bản, các thông tin về hình ảnh thu đươ c tư camera sẽ đượ c số hóa sử dụng các
phần cứng trong máy tính, máy tính đó cũng đượ c tính hợ p những phần mềm đươ c thiê tkê để có thể tính toán các số liệu giao thông cần thiết. Các thuật toán xử lý ảnh hoàn toàn
có thể đượ c sử dụng trong việc thay thế những thiê t bi ca m biê t bằng một camera giám sát
duy nhất, cung cấ p một phạm vi r ộng để có thể nhận dạng các đối tượ ng và ngoài ra còn
có chi phí bảo trì sửa chữa thấ p.
Ca c bươ c xư ly a nh:
: Ca c bươ c xư ly a nh.
Phần thu nhận ảnh: Ảnh có thể nhận qua thiê t bi camera. Có thể là a nh màu hoặca nh đen trắng với độ phân giải khác nhau.
Tiề n xử lý: la qua tr nh lọc nhiễu, nâng cao chất lượ ng ảnh. Phân vùng ảnh hay phân
đoạn: tách ảnh thành các vùng hoặc đối tượ ng quan tâm.
Biể u diễ n ảnh: Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng(feature extraction).
Cơ sơ tri thư c
Thu nhâ na nh
Nhâ n da ngva nô i suy
Biê u diễnva mô ta
Phân đoa na nh
Tiê n xư ly a nh
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 14/62
14
Nhận d ạng và nội suy ảnh: Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này
thường thu đượ c bằng cách so sánh vớ i mẫu chuẩn đã đượ c học (hoặc lưu) từ trướ c. Nội
suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng.
Cơ sở tri thứ c: Nhằm giúp quá trình xử lý và phân tích ảnh theo cách làm của con
ngườ i.
Các hệ thống nhận dạng sử dụng phương pha p xử lý ảnh có khả năng nhâ n da ng các phương tiện giao thông kha c nhau đang lưu thông đê co thê tính toán khoảng cách giư aca c phương tiê n và tốc độ cho mỗi loại phương tiện và trên từng làn đườ ng... mang la i sư hiê u qua hư a he n cho ba i toa n gia m sa t va ca nh ba o va cha m mà đồ án đang quan tâm.
1.3.2.1.
Phương pha p loa i trư nê n
Nhận dạng đối tượ ng chuyển động trong video là một trong những vấn đề quan tr ọng
cần phải giải quyết của lĩnh vực thị giác máy tính. Một trong những hướ ng tiế p cận đó là phải phân biệt đượ c giữa đối tượ ng ( foreground ) và cảnh vật, phông nền (background ).
Trong các hệ thống nhận dạng và theo dõi, thuật ngữ nền (background ) dùng để chỉ tậ phợp các điểm ảnh không có sự chuyển động hoặc các điểm ảnh không thuộc về bất cứ đối
tượ ng nào cần quan tâm [9].
Nhâ n da ng đô i tươ ng chuyê n đô ng tư chuỗi video la nê n ta ng va ta c vu quan tro ngtrong viê c gia m sa t video, kiê m tra va phân t ch t nh tra ng giao thông, gia m thiê u tai na n,do t m va theo do i con ngươ i…Phương pha p chung đê nhâ n da ng đô i tươ ng chuyê n đô ngla trư nê n, ơ đây mỗi khung video đươ c so sa nh vơ i mô h nh tham chiê u hoă c mô h nh trư nê n. Ca c pixel trong frame hiê n thơ i ma lê ch đa ng kê so vơ i nê n se đươ c xem như la đô itươ ng chuyê n đô ng. Như ng pixel na y đươ c xư ly tiê p cho viê c đi nh vi va theo do i đô i
tươ ng. Loại tr ừ nền là một trong những k ỹ thuật cơ bản của xử lý ảnh trong đó hướ ng giảiquyết cơ bản là đi xây dựng một mô hình nền từ video ban đầu tức là từ tậ p các khung
hình trích xuất ra từ video đó, sau đó sử dụng mô hình này cùng vớ i khung hình hiện tại
cần xét từ đó rút ra được các đối tượ ng chuyển động. Ưu điểm của phương pháp này làkhá đơn giản.
: Ảnh (a) là ước lượ ng nền cơ sở , ảnh (b) thu đượ c ở bướ c tiế p theo. ảnh (c) thể hiện bản đồ điể m ảnh nổ i tr ội phát hiện đượ c bằ ng cách sử d ụng phép tr ừ nề n.
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 15/62
15
Bất cứ một sự thay đổi đáng kể nào trên một vùng ảnh từ mô hình nền sẽ đượ c hiểu
r ằng đó là một đối tượ ng chuyển động. Tậ p hợ p những điểm ảnh tạo nên vùng ảnh có sự
thay đổi đó sẽ được lưu lại để xử lý.
Thông thườ ng các thuật toán liên k ết đối tượ ng sẽ đượ c sử dụng để xử lý tậ p những
điểm ảnh trên thành các đối tượ ng liên k ết vớ i nhau qua từng khung hình, tiến trình này
đượ c gọi là loại tr ừ nền.
Thuâ t toa n trư nê n Thuâ t toa n câ p nhâ p nê n
Input: ảnh nền B, ảnh hiện tại I và ma tr ận
ngưỡ ng T
Output : ảnh M là mặt nạ chuyển động
m:=getHeight(M);n:=getWidth(M);
for x:=1 to m do
for y:=1 to n do
if | B[x,y]-I[x,y] | > T[x,y] then
M[x,y]:=255;
else M[x,y]:=0;
Input: nền B, ảnh hiện tại I và mặt nạ
chuyển động M
Output: nền B đượ c cậ p nhật lại
m:=getHeight(B);n:=getWidth(B);
for x:=1 to m do
for y:=1 to n do
if M[x,y]=0 then
B[x,y]:=α*B[x,y]+(1-α)*B[x,y];
Đô chênh lê ch cu a ca c khung h nh
Để tính toán ra đượ c ảnh chỉ chứa nền thì một tậ p những chuỗi khung hình sẽ đượ clấy giá tr ị trung bình. Cụ thể ảnh nền tại thời điểm sẽ được tính bằng cách:
, 1 ∑ 1 , , 1
=
Trong đó là số lượng khung hình sử dụng để tính trung bình. Giá trị trung bình
này có liên quan đến giá trị trung bình của mỗi điểm ảnh trong những khung hình đó,bằng bao nhiêu sẽ phụ thuộc vào t ốc độ của video (số khung hình/giây) và t ổng số
những chuyển động có trong video đó. Sau khi tính toán được ảnh nền B, t hì có
thể sử dụng để loại tr ừ trong ảnh I , , tại thời điểm tương ứng và lấy ngưỡng, nghĩalà đối tượ ng sẽ đượ c tính theo:
| , , , | > ℎ
(1.1)
(1.2)
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 16/62
16
Trong đó là Th ngưỡng tương tự như phương pháp trên. Ngoài cách lấy giá tr ị trung
bình thì có thể dùng giá tr ị trung vị để tính ảnh nền, cách làm cũng tương tự vớ i giá tr ị trung bình.
Ha m Gaussian
Hướ ng tiế p cận này sẽ tính toán cho mỗi điểm ảnh
, m
ột cách độc l
ập. Trong
đó hàm mật độ xác suất Gaussian sẽ được sử dụng với n điểm ảnh ở khung hình trướ cđó. Để tránh việc phải tính lại hàm mật độ này ở mỗi khung hình mớ i, giá tr ị trung bình
qua các khung hình sẽ đượ c tính theo công thức:
1 −
Vớ i và là giá tr ị của điểm ảnh và giá tr ị trung bình tại thời điểm t và − là giá
tr ị trung bình tại thời điểm trước đó, là tr ọng số đượ c chọn tùy thuộc vào sự lựa chọn
ưu tiên giữa độ ổn định hay là tốc độ cậ p nhật giá tr ị. Tại mỗi khung hình ở thời điểm t,
giá tr ị sẽ được coi là đối tượ ng nếu nó thỏa mãn điều kiện:
| | >
Nếu không thỏa mãn thì sẽ được coi là nền. Với là độ lệch tiêu chuẩn của phân
phối Gaussian và có thể tính đượ c một cách dễ dàng giống như
Mỗi một cách tiế p cận đều có ưu điểm và nhược điểm riêng tùy thuộc vào đặc điểm
của video đầu vào mà sử dụng cho phù hợp. Ý tưở ng chung của các phương pháp này đều
là để có thể phát hiện ra các đối tượ ng chuyển động trong video thì phải xây dựng đượ cmô hình nền, mô hình này có thể đượ c học qua các khung hình lấy từ video đó. Sau đómô hình nền này sẽ đượ c sử dụ ng để so sánh vớ i khung hình hiện tại và k ết quả sẽ có
đượ c vùng nền và vùng đối tượng. Sau khi có được đối tượ ng r ồi thì việc bám theo đốitượ ng sẽ tr ở nên đơn giản hơn nhiều.
1.3.2.2. Phương pháp Optical flow
Phương pháp Optical flow [2] thực hiện bằng cách sử dụng các vector có hướ ng của
các đối tượ ng chuyển động theo thời gian để phát hiện các vùng chuyển động trong một
ảnh [3].
Ý tưở ng quan tr ọng của phương pháp tính optical flow dựa trên giả định sau:
Bề ngoài của đối tượ ng không có nhiều thay đổi (về cường độ sáng) khi xét từ framethứ n sang frame n+1
I(,t) = I( + ,t +1)
Trong đó:
I(,t) là hàm tr ả về cường độ sáng[4] của điểm ảnh tại thời điểm t (frame thứ
t).
(1.3)
(1.4)
(1.5)
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 17/62
17
, là tọa độ của điểm ảnh trên bề mặt (2D), (, ) là vector vận
tốc, thể hiện sự thay đổi vị trí của điểm ảnh từ frame thứ t sang frame t+1.
: Frame ảnh t ại thời điểm t trướ c và sau khi vẽ các vector có hướ ng
1.4.
Ưu nhươ c điê m cu a ca c phương pha p đa pha t triê n
Ca c gia i pha p trên đê u đưa ra ca c gia i pha p t nh toa n nhă m ha n chê ca c kha năng vacha m khi đang lưu thông trên đươ ng. Vơ i giơ i ha n ba i toa n co thê ru t ra đươ c mô t sô phânt ch va nhâ n xe t như sau:
Đô i vơ i biê n pha p sư du ng ca m biê n va hê thô ng kiê m soa t th gia i pha p na y chohiê u qua cao nhâ t v sư du ng ca c thiê t bi chuyên biê t, mỗi thiê t bi co mô t nhiê mvu riêng. Nhươ c điê m cu a biê n pha p la la kinh ph lă p đă t, ph ba o tr lơ n, chưaa p du ng đươ c ơ ca c do ng xe phô thông.
Vơ i cơ sơ ha tâ ng hiê n nay ơ Viê t Nam, viê c sư du ng ca c thiê t bi thông minhsmartphone đa trơ lên phô biê n th co thê thư c hiê n triê n khai hê thô ng bă ng ca chsư thuâ t toa n xư ly a nh nhă m că t gia m chi ph va phô biê n cho ngươ i tham giagiao thông. Vơ i viê c khoa ho c ma y t nh nga y ca ng pha t triê n th viê c ta c đô nghay can thiê p va o sâu trong ca c thiê t bi di đô ng th đươ c nghiên cư u va hỗ trơ nhiê u hơn. Ch nh v thê ơ đê ta i na y em se sư du ng thuâ t toa n xư ly a nh trongviê c nhâ n da ng va ca nh ba o va cha m ô tô se đươ c tr nh ba y trong chương sau.
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 18/62
18
CHƯƠNG II: GIA I PHA P GIA M SA T VA ĐƯA RA CA NH BA O
Chương na y se tr nh ba y ca c phương pha p gia i quyê t ba i toa n gia m sa t va đưa ca nh ba o va cha m ô tô trên ca c thiê t bi di đô ng.
2.1. Đê xuâ t gia i pha p tô ng thê
Như đa tr nh ba y ơ trên, ơ ba i toa n na y em se sư du ng gia i pha p xư ly a nh đê gia iquyê t ba i toa n. Ba i toa n lơ n na y se gô m 3 ba i toa n nho , mỗi ba i toa n se tiê p câ n mô t ca chxư ly va thuâ t toa n kha c nhau phu hơ p vơ i hoa n ca nh va điê u kiê n đă t ra.
Ba i toa n nhâ n da ng đô i tươ ng ô tô
Ba i toa n pha t hiê n la n đươ ng
Ba i toa n xư ly thông tin va đưa ra ca nh ba o
Trong giơ i ha n nghiên cư u đô a n na y, em xin phe p tr nh ba y ca c phương pha p kha cnhau cho ca c ba i toa n nho ơ trên đê t ch hơ p gia i quyê t nghiê p vu cu a ba i toa n lơ n. Tư đo dư a va o thư c nghiê p đê đa nh, ru t ra ba i ho c đê tô i ưu ba i toa n.
2.1.1. Nhâ n da ng đô i tươ ng ô tô
Ba i toa n đâ u tiên ma hê thô ng câ n gia i quyê t la vâ n đê nhâ n da ng đô i tươ ng, ma cu thê trong ba i toa n đỗi tương la phương tiê n giao thông ô tô. Dư liê u đâ u va o cu a ba i toa nla la video thu đươ c ơ camera ca c thiê t bi di đô ng, hê thô ng câ n nhâ n da ng đô i tươ ng đangchuyê n đô ng. Kê t qua cu a bươ c nhâ n na y đươ c minh ho a bă ng h nh a nh
: Đôi tươ ng ô tô đươ c nhâ n da ng
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 19/62
19
Dư liê u thu đươ c tư video sẽ đượ c trích xuất ra các khung hình (frame), mỗi khung
hình là một đơn vị ảnh thu đượ c từ video đó, chất lượ ng của khung hình sẽ phụ thuộc hoàn
toàn vào chất lượ ng của video, và từ đó chất lượ ng của việc nhận dạng cũng bị ảnh hưở ng.
Chất lượ ng của video bao gồm các yếu tố như độ phân giải, tốc độ khung hình, cấu tạo
ống kính máy quay… Nê n cu a video thu đươ c se la cung đươ ng tham gia giao thông, đô itươ ng di chuyê n co thê la ô tô, xe ma y, xe đa p, ngươ i đi bô ,…
Kê t qua đâ u ra cu a bươ c nhâ n da ng đô i tươ ng na y se la phâ n quan tro ng liên quanmâ t thiê t tơ i đô ch nh xa c viê c đo khoa ng ca ch phâ n sau. Ch nh v vâ y nê u nhâ n da ng đô itươ ng không tô t th se a nh hươ ng tơ i nghiê p vu ba i toa n.
Cụ thể thuật toán đượ c lựa chọn để sử dụng trong bài toán này là thuật toán học máy
AdaBoost dựa trên mô hình cascade để phát hiện nhanh đối tượ ng. AdaBoost là một giải
thuật học máy đượ c phát triển bở i Yoav Freund và Robert Schapire, nó hoạt động dựa trên
nguyên tắc k ết hợ p những bộ phân loại yếu để thu đượ c một bộ phân loại mạnh hơn [4].
Từ lý thuyết đó Paul Viola và Michael Jones đã sử dụng mô hình cascade, bao gồm các
đặc trưng Haar để xây dựng nên các bộ phân loại từ đó có thể nhận dạng được đối tượ ng
vớ i một độ chính xác cao. Ngoài ra trong phạm vi đồ án em sẽ trình bày thêm một đặc
trưng khác có thể sử dụng k ết hợ p vớ i thuật toán AdaBoost đó là đặc trưng LBP, lý thuyết
cụ thể của phần này sẽ đượ c trình bày trong phần sau
2.1.2. Pha t hiê n la n đươ ng
Ba i toa n pha t hiê n la n đươ ng phu c vu cho mu c đich theo do i la n đươ ng khi phươngtiê n di chuyê n va gia m sa t đưa ca nh ba o nê u phương tiê n lâ n la n đươ ng. Ba i toa n se sư du ng ca c thuâ t toa n đê ta ch biên, pha t hiê n đươ ng tr nh ba y ơ phâ n sau đê pha t hiê n la nđươ ng trên đươ ng.
: La n đươ ng đươ c pha t hiê n
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 20/62
20
2.1.3.
Xư ly thông tin va đưa ra ca nh ba o
Sau khi đô i tươ ng ô tô đươ c nhâ n da ng tha nh công. Hê thô ng se theo do i đô i tươ ngva t nh toa n khoa ng ca ch tư camera tơ i đô i tươ ng đươ c nhâ n da ng ph a trươ c. Ba i toa n na yđă t ra mô t vâ n đê la trong khi ca c phương tiê n cu ng tham gia lưu thông, hay cu ng đang dichuyê n th co biê n pha p na o đê đo đươ c khoa ng ca ch
: Khoa ng ca ch an toa n
Hiê n nay viê c sư du ng camera tư moblie đê xa c đi nh khoa ng ca ch đi a ly giư a hai đô itươ ng đang di chuyê n la mô t điê u vô cu ng kho . Khi mô pho ng thực 3D thông qua ống
kính của một máy ảnh vào một hình ảnh 2D, một số thông tin se bị mất trong đo co ca cthông sô vê khoa ng ca ch vơ i ca c phương tiê n kha c. Camera không thể đưa ra bất cứ phép
đo thực sự của các khoảng cách trong thế giớ i thực chỉ nhìn một hình ảnh. Phâ n sau se
ch
ra phương pha p đê đo khoa ng ca ch na y.
2.2. Nhâ n da ng đô i tươ ng
2.2.1.
Kiê n thư c chung
Việc nhận dạng đối tượ ng có thể đượ c thực hiện bằng cách học từ những khung nhìn
(view) khác nhau của đối tượ ng một cách tự động thông qua một cơ chế học máy có giám
sát. Việc học từ những khung nhìn này giúp giảm thiểu yêu cầu phải lưu trữ một bộ hoàn
chỉnh tất cả các mẫu. Các k ỹ thuật học máy có giám sát sẽ xây dựng một hàm từ dữ liệu
huấn luyện, dữ liệu huấn luyện này bao gồm các cặ p gồm đối tượng đầu vào và đối tượ ng
đầu ra mong muốn. Đầu ra của hàm đó có thể là một giá tr ị liên tục, gọi là hồi quy
(regression) hoặc có thể là dự đoán một nhãn phân loại cho một đối tượng đầu vào, gọi là
phân loại (classification) [5]. Trong ngữ cảnh của nhận dạng đối tượ ng, các mẫu huấn
luyện đượ c xây dựng nên từ các đặc trưng của đối tượ ng k ết hợ p với đối tượ ng liên k ết
với đặc trưng đó, trong bài toán nhận dạng phương tiện giao thông có thể hiểu mẫu huấn
luyện sẽ bao gồm các phương tiện giao thông và các đặc trưng của các phương tiện đó.
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 21/62
21
Việc lựa chọn các đặc trưng sao cho phù hợp đóng một vai trò quan tr ọng cho hiệu
năng của các bộ phân loại, một tập các đặc trưng phù hợ p khi k ết hợ p vớ i nhau có thể
phân loại một nhãn đối tượ ng này với nhãn đối tượ ng khác. Một đặc trưng có thể là một
vùng đối tượng, hướ ng chuyển động của đối tượ ng, hàm mật độ của đối tượ ng
(histogram)… Sau khi lựa chọn được các đặc trưng phù hợ p thì k ết quả phân loại sẽ phụ
thuộc vào thuật toán học máy. Một số thuật toán có thể k ể đến như là mạng nơ -ron,
AdaBoost, cây quyết định, SVM (Support Vector Machine)…Trong nghiê p vu cu a hê thô ng em sẽ sử dụng thuật toán AdaBoost dựa trên mô hình
cascade do Paul Viola và Michael Jones phát triển, trong đó có sử dụng k ết hợp các đặc
trưng Haar -like để huấn luyện nhâ n da ng phương tiê n đang tham gia lưu thông. Ngoài rađể có sự so sánh và đánh giá với đặc trưng Haar -like em sẽ sử dụng thêm một đặc trưngkhác để huấn luyện là đặc trưng LBP ( Local Binary Patterns).
2.2.1.1. Tô ng quan vê video
Video la tâ p ca c khung h nh, mỗi khung h nh la mô t a nh. Shot (lia) la đơn vi cơ sơ cu a video. Mô t lia la đơn vi vâ t lyscuar do ng video, gô m ca c chuỗi ca c khung h nh liêntiê p, không thê chia nho hơn, ư ng vơ i mô t thao ta c camera đơn.
Scene (ca nh) la ca c đơn vi logic cu a do ng video, mô t ca nh gô m ca c lia liên quan vê không gian va thơ i gian, cu ng mô ta mô t nô i dung ngư ngh a hoă c mô t t nh tiê t.
: Cấu tru c phân đoa n video
Khi video đươ c chiê u, ca c khung h nh đươ c hiê n thi ơ tô c đô nhâ t đi nh. Tô c đô thươ ng thâ y ơ ca c video la 20-24 h nh/s. Như vâ y mô t video co sô khung h nh tương ư ngla 10800 – 90000. Du video ơ da ng na o HD, fullHD, 2K, …th no co dung lươ ng râ t lơ nđă c biê t la đô i vơ i ca c thiê t bi di đô ng vô n đa chê vê bô lơ n th la vâ n đê nan gia i.
video
Scene
Shots Lia
Frames
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 22/62
22
Phân loa i la qua tr nh phân t ch va chia nô i dung h nh a nh video tha nh ca c đơn vi cơsơ go i la ca c lia (shot). Viê c lâ y mâ u ch nh la viê c cho n gâ n đu ng khung video đa i diê ncho mỗi lia, va đươ c go i la khung- kho a.
Khung – kho a la khung h nh đa i diê n mô ta nô i dung ch nh cu a shot.
Qua tr nh phân đoa n giư liê u video tiê n ha nh phân t ch, pha t hiê n sư chuyê n đô i lia
na y sang lia kha c hay ch nh la sư pha t hiê n danh giơ i giư a ca c lia đo (hay no i đơn gia nhơn đo ch nh la sư kha c nhau giư a ca c khung h nh liê n kê .)
Thuô c t nh đă c trung cu a video gô m co : Color (ma u), Texture (kê t câ u), Shape (h nhda ng), Motion (chuyê n đô ng).
Color
Vơ i mỗi mô t a nh đê u co mô t biê u đô ma u đê biê u diễn sư phân bô ma u trong a nh, biê u đô ma u không phu thuô c va o viê c quay a nh, di ch chuyê n a nh, chiê u nh n ma phu thuô c va o hê ma u va ca c phương pha p đi nh lươ ng đươ c du ng.
: Biê u đồ ma u cu a 4 loa i cơ ba n (a) a nh tối (b) a nh sa ng
(c) a nh tương pha n thấp (d) a nh tương pha n cao
Texture
Đây la mô t đă c trung quan tro ng cu a bê mă t, nơi xa y ra viê c lă p la i mẫu cơ ba n.Co 2 da ng biê u diễn texture phô biê n la : biê u diễn dươ i da ng ma trâ n đô ng thơ i va biê u diễn Tamura
Ma trâ n đô ng thơ i mô ta hươ ng va khoa ng ca ch giư a ca c điê m a nh, ta co thê tr ch cho n đươ c ca c đă c điê m y ngh a.
Biê u diễn Tamura đươ c thu c đâ y nhơ nghiên cư u vê tâm l trong viê c thu nhâ ntrư c gia c cu a con ngươ i giu p biê u diễn a nh trư c quan hơn.
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 23/62
23
Shape
Ca c đă c trưng vê h nh da ng co thê chia tha nh đă c trưng toa n cu c hoă c đă c trưngcu c bô
Đă c trưng toa n cu c la đă c trưng thuô c t nh thu đươ c tư toa n bô h nh da ng a nhnhư chu vi, t nh tro n, t nh hươ ng tru c…
Đă c trưng cu bô la đă c tư ng thu đươ c tư viê c thao ta c vơ i mô t phâ n cu a a nh,
không phu thuô c va o toa n bô a nh
Motion
la thuô c t nh quan tro ng cu a video, thông tin vê chuyê n đô ng co thê đươ c sinh ra bă ng ca c ky thuâ t ghe p khô i hoă c luô ng a nh sa ng. Ca c đă c trưng chuyê n đô ng: mô-men trươ ng chuyê n đô ng, biê u đô chuyê n đô ng, ca c tham sô chuyê n đô ng toa n cu cco thê tr ch cho n vectơ chuyê n đô ng. Ca c đă c trưng mư c cao pha n a nh di chuyê ncamera như nghiêng, zoom… cu ng co thê đươ c tr ch cho n
2.2.1.2. Pha t hiê n đô i tươ ng chuyê n đô ng
Đo la qua tr nh đưa ra vê t ca c đô i tươ ng chuyê n đô ng tư khung h nh video. Qua tr nh na ythư c châ t la qua tr nh xư ly chuỗi a nh liên tiê p trong mô t video đê pha t hiê n ra ca c đô itươ ng chuyê n đô ng trong mô t đoa n video theo mô h nh dươ i đây:
: Tô ng quan ca c khối xư ly trong ba i toa n pha t hiê n đối tươ ng.
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 24/62
24
Pha t hiê n vu ng a nh nô i
Xư ly vu ng a nh nô i Pha t hiê n vu ng a nh nô i la mô t modul thiê t yê u trong ba i toa n pha t hiê n đô i tươ ng chuyê n đô ng qua ca c khung h nh video. Module na y đo ng vai tro xư ly ca c khung h nh video đê đưa ra ca c vu ng a nh nô i lên trên ca c khung a nh nê n. Đê minhho a cho chư c năng na y ta co thê nh n h nh dươ i đây:
: Pha t hiê n vu ng a nh nô i
Ca c khung h nh bên tra i thu đươ c se đươ c xư ly đê đưa ra vu ng a nh nô i lên trên minhho a bơ i h nh bên pha i. Vu ng a nh nô i thu đươ c như quan sa t vẫn co n nhiê u nhiễu, ca c đô itươ ng chưa ro ra ng.
Xư ly vu ng a nh nô i
Ca c vu ng a nh nô i thư c tê co n nhiê u nhiễu, do đo đê lo c nhiễu, xư ly ghe p ma nh loa i
bo ca c vê t không liên quan th câ n module xư ly ca c vu ng a nh nô i đê đưa ra ca c đô i tươ ngro ra ng đê tư đo xa c minh t nh châ t cu a chu ng.
: Xư ly ca c vu ng a nh nô i (Foreground Processing)
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 25/62
25
H nh bên tra i la kê t qua thu đươ c sau module pha t hiê n vu ng a nh nô i lên tư ca c khungh nh video. Tư kê t qua đâ u ra na y ta co thê đưa ra đươ c ch nh xa c đô i tươ ng chuyê n đô ngtrong khung h nh đo va t nh châ t cu a no như h nh dang, v tr , …la đâ u va o cu a qua tr nh
phân loa i đô i tươ ng thư c thi ca c nghiê p vu vê sau.
2.2.1.3. Thuâ t toa n huâ n luyê n AdaBoot
Trong các phần trước đã đượ c giải thích đă c trưng đượ c chiết xuất từ các hình ảnh.Ơ phâ n na y se du ng phương pha p lo c đê loa i đi như ng điê m a nh co đô ch nh xa c cao dư atrên sư kê t hơ p cu a như ng bô lo c yê u trươ c.
Thuật toán này lần đầu tiên được đề xuất bở i Freund và Schapire (1995) [4], là một
bộ phân loại mạnh phi tuyến phức, hoạt động trên nguyên tắc k ết hợ p tuyến tính các bộ
phân loại yếu để tạo nên một bộ phân loại mạnh. AdaBoost sử dụng tr ọng số để đánh dấu
các mẫu khó nhận dạng. Trong quá trình huấn luyện cứ mỗi bộ phân loại yếu đượ c xây
dựng thì thuật toán sẽ tiến hành cậ p nhật lại tr ọng số để chuẩn bị cho việc xây dựng bộ
phân loại tiế p theo. Cậ p nhật bằng cách tăng trọng số của các mẫu nhận dạng sai và giảm
tr ọng số của các mẫu đượ c nhận dạng đúng bở i bộ phân loại yếu vừa xây dựng. Bằng cách
này thì bộ phân loại sau có thể tậ p trung vào các mẫu mà bộ phân loại trước nó làm chưatốt. Cuối cùng các bộ phân loại yếu sẽ đượ c k ết hợ p lại tùy theo mức độ tốt của chúng để
tạo nên một bộ phân loại mạnh.
Trong giai đoạn huấn luyện cho đô i tươ ng, vơ i ba i toa n trong đê ta i na y là mỗi hình
ảnh của mô t chiê c xe ô tô hoặc không pha i xe ô tô va mỗi xe đê u có tr ọng sô liên quan
đến nó. Trên mỗi lần lặ p, tr ọng sô của các xe huấn luyện sai phân loại sẽ tăng lên và trọng
sô của các phân loại chính xác sẽ giảm. V vâ y trong mỗi lần lặ p lại việc phân loại đượ clựa chọn se ưu tiên phân loa i vơ i h nh a nh co tro ng sô cao hơn minh ho a trong h nh sau.
Phân loa i không ch nh xa c
Tâ p dư liê u đầu va o P hân loa i lần 1 Phân loa i yếu lần 2 Phân loa
i yếu lần 3
: Minh họa của thuật toán AdaBoost.
Việc phân loại yếu được đại diện bởi các đườ ng tách các ví dụ huấn luyện trong một
không gian đặc trưng 2D. Các màu sắc đại diện cho lớ p của đối tượng và kích thướ c của
các điểm đại diện cho tr ọng lượ ng quan tr ọng
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 26/62
26
Cụ thể, mỗi bộ phân loại yếu sẽ đượ c xây dựng để lựa chọn ra một cửa sổ đặc trưng
(Đặc trưng Haar-like) nào phân biệt đượ c tốt nhất giữa mẫu đúng ( positive) và mẫu sai
(negative). Vớ i mỗi cửa sổ đặc trưng đó, bộ phân loại yếu sẽ xác định ra một ngưỡ ng tối
ưu nhất để cực tiểu số lượ ng mẫu nhận dạng sai. V thê mô t bô phân loa i yê u se đươ c biê udiễn như sau:
ℎ {1 ê < 0 ê ươ
Trong đo :
x là một cửa sổ con có kích thướ c 24x24 pixel của khung hình
là ngưỡ ng.
là cửa sổ đặc trưng (ở đây là đặc trưng Haar -like).
là hệ số quyết định chiều của bất đẳng thức.
Có thể hiểu đơn giản hoạt động bộ phân loại yếu là khi giá tr ị cửa sổ đặc trưng của
một mẫu tính bởi hàm đánh giá của bộ phân loại vượ t qua một ngưỡng nào đó thì mẫu đấy
là mẫu đúng (là đối tượ ng cần nhận dạng) còn nếu không thì mẫu đó là mẫu sai (không
phải đối tượ ng).
Trên thực tế không một bộ phân loại yếu nào có thể thực hiện việc phân loại vớ i tỷ
lệ lỗi thấp. Các đặc trưng đượ c lựa chọn ở những vòng lặp đầu tiên của tiến trình xây dựng
bộ phân loại đều có tỷ lệ lỗi nằm trong khoảng 0,1 đến 0,3. Các đặc trưng ở những vòng
lặp sau, nghĩa là phải phân loại những mẫu khó, thì có tỷ lệ lỗi nằm trong khoảng 0,4 đến
0,5.
2.2.1.4.
Đă c trưng Haar-like va mô h nh cascade
Paul Viola và Michael Jones cũng đi theo hướ ng sử dụng thuật toán AdaBoost cho
việc huấn luyện để nhận dạng đối tượ ng [5]. Công trình nghiên cứu này đưa ra 3 đóng gópquan tr ọng trong khả năng xử lý ảnh vớ i tốc độ nhanh và đạt đượ c tỷ lệ nhận dạng r ất cao:
Đưa ra khái niệm Integral Image cho phép tính toán các đặc trưng vớ i tốc độ r ất
cao.
Thuật toán học máy dựa trên AdaBoost có khả năng lựa chọn ra đượ c một số lượ ng nhỏ các đặc trưng từ một tập các đặc trưng rất lớ n từ đó lại xây dựng ra
đượ c các bộ phân loại có hiệu suất cao.
Đưa ra mô hình cascade cho phép kết hợ p các bộ phân loại để có thể loại bỏ nhanh
chóng vùng ảnh không chứa đối tượng trong khi đó tậ p trung quá trình tính toán
vào những vùng có nhiều khả năng có chứa đối tượng hơn.
(2.1)
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 27/62
27
Phương pháp của Viola và Jones có tốc độ xử lý nhanh, gấ p từ 10 đến 15 lần so vớ icác phương pháp trước đó, có thời điểm đạt đượ c tốc độ lên đến 15 khung hình/giây, cho
tỷ lệ chính xác lên đến 80%.
Đă c trưng Haar-like
Tiến trình nhận dạng đối tượ ng sẽ phân loại các mẫu dựa trên giá tr ị của các đặc
trưng đơn giản. Có nhiều lý do để sử dụng các đặc trưng thay vì xử lý tr ực tiế p trên từng
điểm ảnh. Một trong những lý do phổ biến nhất đó là các đặc trưng có thể diễn đạt đượ ctri thức về các đối tượ ng trong ảnh (biểu diễn mối liên hệ giữa các bộ phận của đối tượ ng),
đây là điều mà từng điểm ảnh không thể làm đượ c.
Một trong những đặc trưng cơ bản đượ c sử dụng trong bài toán nhận dạng đối tượ ng
trên ảnh là cửa sổ đặc trưng hay các đặc trưng Haar -like. Tên gọi cửa sổ đặc trưng xuất
phát từ cấu trúc của đặc trưng Haar -like này, nó đượ c xây dựng nên từ những hình chữ
nhật có kích thướ c bằng nhau và đượ c phân thành hai vùng là vùng sáng và vùng tối. Giá
tr ị của đặc trưng Haar -like chính là giá tr ị độ chênh lệch giữa các điểm ảnh nằm trong hai
vùng ảnh đó. Va đươ c mô ta bă ng h nh sau:
H nh 2-1: Ca c đă c trưng Haar like cơ ba n
Giá tr ị của đặc trưng 2 cửa sổ (hình (1) và (2)) đượ c tính bằng hiệu số giữa tổng
các điểm ảnh nằm trong 2 vùng ảnh sáng và tối.
Gia của đặc trưng 3 cửa sổ (hình (3)) đượ c tính bằng tổng các điểm ảnh của 2 vùng
ảnh 2 bên tr ừ đi tổng các điểm ảnh của vùng ảnh nằm giữa.
Giá tr ị đặc trưng 4 cửa sổ (hình (4)) đượ c tính bằng hiệu số giữa tổng các điểm ảnh
thuộc vùng sáng và tổng các điểm ảnh thuộc vùng tối (2 vùng ảnh nằm chéo nhau).
Bộ nhận dạng đượ c sử dụng ở đây có kích thước là 24x24 pixel, như vậy số lượ ng
các đặc trưng Haar -like có thể sinh ra cho mỗi một mẫu là r ất lớn (trên 180.000 đặc trưng),từ đó dẫn đến việc tính toán giá tr ị của các đặc trưng này đòi hỏi một thờ i gian xử lý đáng
k ể [5]. Vì nguyên nhân đó nên khái niệm Integral Image đã ra đờ i.
Integral Image
Khái niệm Integral Image được Viola và Jones đưa ra nhằm mục đích tăng tốc độ
tính toán cho các đặc trưng Haar -like nói trên. Các cửa sổ đặc trưng có thể đượ c tính toán
r ất nhanh thông qua một biểu diễn trung gian của ảnh gọi là Integral Image. Integral Image
tại vị trí x, y bằng tổng các giá tr ị điểm ảnh phía trên bên trái của điểm, :
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 28/62
28
Trong đó, là Integral Image và , là giá trị điểm ảnh ban đầu t ại vị trí , .
Integral Image là một mảng hai chiều với kích thướ c bằng kích thướ c của ảnh cần tính
giá tr ị đặc trưng Haar Like. Dưới đây là mô tả cách tính ảnh tích phân:
Integral Image ta i điê m, .
Sau khi đã tính đượ c Integral Image tại một điểm ảnh thì việc tính tổng giá tr ị củacác điểm ảnh tại một vùng bất k ỳ r ất đơn giản. Giả sử cần tính giá tr ị của vùng ảnh D nhưtrong hình dướ i:
Tính toán giá tr ị Intergral Image d ự a vào các Intergral Image trung gian
Tổng giá tr ị của vùng ảnh D có thể đượ c tính toán thông qua 4 Integral Image trung
gian. Giá tr ị của Integral Image tại vị trí 1 là tổng giá tr ị các điểm ảnh trong vùng A. Giá
tr ị Integral Image tại vị trí 2 là tổng của hai vùng A + B, tương tự vị trí 3 là hai vùng A +
C. Giá tr ị Integral Image tại vị trí 4 là tổng của cả bốn vùng A + B + C + D. Như vậy tổng
giá tr ị trong vùng ảnh D có thể đượ c tính theo Integral Image là Sum(D) = 4 + 1 – (2 + 3).
Sử dụng khái niệm Integral Image, tất cả các giá tr ị cửa sổ đặc trưng (đặc trưng Haar -like) có thể đượ c tính r ất nhanh thông qua các Integral Image trung gian. Cụ thể đối vớ iđặc trưng 2 cửa sổ bất k ỳ có thể tính thông qua 6 Integral Image, đặc trưng 3 cửa sổ cần 8
và đặc trưng 4 cửa sổ thì cần 9.
(2.2)
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 29/62
29
Mô hình phân tầng Cascade
Như đã trình bày ở phần trên, vớ i mỗi một mẫu đưa vào bộ nhận dạng có thể sinh ra
r ất nhiều các đặc trưng Haar -like, nếu chỉ tăng tốc độ tính toán giá tr ị của các đặc trưngthôi là chưa đủ. Bở i mỗi một khung hình có thể sinh ra đượ c r ất nhiều mẫu nhận dạng,
nếu như mẫu nào cũng phải tính toán tất cả các đặc trưng thì sẽ tốn r ất nhiều thờ i gian một
cách không cần thiết. Tuy nhiên có thể thấy trong các mẫu đưa vào không phải mẫu nàocũng khó để nhận dạng, có những mẫu chỉ cần sử dụng một vài đặc trưng là đã có thể loại
bỏ đượ c chứ không nhất thiết phải dùng tất cả các đặc trưng, ví dụ như các mẫu
background.
Cascade of Boosted Classifiers là mô hình phân tầng vớ i mỗi tầng là một mô hình
AdaBoost sử dụng bộ phân lớ p yếu là cây quyết định với các đặc trưng Haar-Like. Trong
quá trình huấn luyện, bộ phân lớ p phải duyệt qua tất cả các đặc trưng của mẫu trong tậ phuấn luyện. Việc này tốn r ất nhiều thờ i gian.
Tuy nhiên, trong các mẫu đưa vào, không phải mẫu nào cũng thuộc loại khó nhận
dạng, có những mẫu background r ất dễ nhận ra (gọi đây những mẫu background đơn giản).Đối vớ i những mẫu này, chỉ cần xét một hay một vài đặc trưng đơn giản là có thể nhận
dạng đượ c chứ không cần xét tất cả các đặc trưng. Nhưng đối vớ i các bộ phân loại thông
thườ ng thì cho dù mẫu cần nhận dạng là dễ hay khó nó vẫn phải xét tất cả các đặc trưngmà nó rút ra đượ c trong quá trình học. Do đó, chúng tốn thờ i gian xử lý một cách không
cần thiết.
Mô hình Cascade of Classifiers đượ c xây dựng nhằm rút ngắn thờ i gian xử lý, giảm
thiểu nhận dạng lầm (false alarm) cho bộ phân loại. Cascade trees gồm nhiều tầng (stage
hay còn gọi là layer), mỗi tầng là một mô hình AdaBoost vớ i bộ phân lớ p yếu là các cây
quyết định. Một mẫu để đượ c phân loại là đối tượ ng thì nó cần phải đi qua hết tất cả cáctầng.
Các tầng sau đượ c huấn luyện bằng những mẫu âm negative (không pha i đô i tươ ngcâ n nhâ n da ng) mà tầng trướ c nó nhận dạng sai, tức là nó sẽ tậ p trung học từ các mẫu
background khó hơn, do đó sự k ết hợ p các tầng AdaBoost này lại sẽ giúp bộ phân loại
giảm thiểu nhận dạng lầm. Vớ i cấu trúc này, những mẫu background dễ nhận dạng sẽ bị loại ngay từ những tầng đầu tiên, giúp đáp ứng tốt nhất thờ i gian xử lý và vẫn duy trì đượ chiệu quả phát hiện đô i tươ ng
2.2.1.5.
Đă c trưng Local Binary Pattern
Local Binary Pattern (LBP) hay co n go i la mẫu nhi phân cu c bô , là một đặc trưngđơn giản nhưng rất hiệu quả đượ c sử dụng trong các bài toán phân loại ở lĩnh vực thị giác
máy tính [10]
Ý tưởng cơ bản của tính năng LBP là để tr ch xuâ t các cấu trúc địa phương trong một
hình ảnh bằng cách so sánh từng điểm ảnh vớ i hàng xóm của mình. Ví dụ, mỗi điểm ảnh
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 30/62
30
trong các khu phố đượ c so sánh về cường độ để các điểm ảnh trung tâm. Nếu các giá tr ị cường độ cao hơn so với các điểm ảnh trung tâm, nó được đánh dấu là 1 và 0 nếu ngượ clại. Vào cuối của quá trình miê n lân câ n của mỗi điểm ảnh sẽ có một mô hình nhị phân.Toa n tư ga n nha n ca c pixel cu a khô i a nh bă ng ta o ngươ ng cho lân câ n cu a mỗi pixel vơ igia tri trung tâm va nhâ n kê t qua la 1 sô nhi phân.
Thông tin LBP của pixel tại trung tâm của mỗi khối ảnh sẽ đượ c tính dựa trên thông
tin của các pixel lận cận. Có thể tóm tắt các bướ c tiến hành như sau:
Bước 1: Xác định bán kính làm việc.
Bướ c 2: Tính giá tr ị LBP cho pixel ở trung tâm (,) khối ảnh dựa trên thông tin
của các pixel lân câ n.
, ∑ 2 −
=
Trong đó, () là giá tr ị grayscale của các pixel lân cận, () là giá tr ị grayscale của
các trung tâm và (s) là hàm nhị phân được xác định như sau: s(x) = 1 nếu giá tr ị x ≥0.
Toa n tư LBP gô c đươ c thư c hiê n vơ i 3*3 lân câ n cu a điê m a nh đươ c biê u diễn bơ iv du sau:
H nh 2-2: Minh họa ví d ụ trong tính toán của các mẫ u nhị phân cục bộ cho một pixel lân câ n
Da ng tô ng qua t cu a toa n thu LBP sư du ng ca c lân câ n đô i xư ng tha nh vo ng tro n h nh2.2. Trong trươ ng hơ p na y tương ư ng vơ i ca c gia tri mư c xa m cu a P pixel trong vo ntro n vơ i ba n k nh R. Biê u đô cu a ma LBP t nh toa n trên ca c khô i a nh va co thê sư du ng đê mô ta kê t câ u cu a khô i.
(2.3)
Threshold Multi l
LBP = 1 + 2 + 4 + 8 + 128 = 143
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 31/62
31
Mu c đ ch cu a phương pha p na y la xa c đi nh như ng vu ng cu a khung video co chư a đô itươ ng chuyê n đô ng. Phương pha p chia khung video tha nh ca c khô i co k ch thươ c bă ngnhau bă ng ca ch xư du ng câ u tru c lươ i chô ng cu c bô
To a đô các điê m lân câ n p ở một khoảng cách đươ ng tro n từ các điểm ảnh trung tâmđươ c thê hiê n như sau:
cos
sin
Trong đó R là khoảng cách đến các điểm ảnh trung tâm. Khi các tọa độ không tươngứng vớ i tọa độ ảnh, cường độ đượ c tính bằng Bilinear interpolation (gia tri cu a pixel rađươ c t nh bă ng gia tri trung b nh cu a 2x2 pixel lân câ n.) gia tri cu a ca c vu ng điê m a nh se đươ c thê hiê n như h nh:
: LBP bât biên bât biên vơ i ca ch thay đô i đơn trong mư c xa m
Như vậy, đối với mô hình cascade đã đượ c trình bày ở phần trước, các đặc trưngLBP có thể đượ c sử dụng khi huấn luyện các bộ nhận dạng vớ i thuật toán AdaBoost thay
thế cho việc sử dụ ng những đặc trưng Haar -like. Bên cạnh đó thông qua lý thuyết và thực
nghiệm chứng minh có thể thấy đượ c r ằng những bộ nhận dạng sử dụng đặc trưng LBPcho tốc độ nhận dạng nhanh hơn bộ nhận dạng sử dụng đặc trưng Haar -like.
2.2.2. Ca c bươ c nhâ n da ng đô i tươ ng
Như đã trình bày, các phần trước đã giớ i thiệu một cách khái quát những kiến thức
cần nắm được để có thể giải quyết đượ c bài toán nhận dạng phương tiện giao thông, bướ cđầu tiên và cũng là bướ c quan tr ọng để có thể đi tới được bài toán đếm lưu lượng phương
(2.4)
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 32/62
32
tiện giao thông cuối cùng. Phần này em xin đượ c trình bày về các bước chính em đã thực
hiện trong quá trình xây dự ng hệ thống nhận dạng của mình, bao gồm:
Thu thập dữ liệu: Xây dựng tập cơ sở dữ liệu ban đầu.
Tiê n xư ly dư liê u: Chuẩn bị đầu vào cho bộ huấn luyện.
Huấn luyện: Thực hiện quá trình huấn luyện bộ nhận dạng.
Nhận dạng: Sử dụng bộ nhận dạng để nhận dạng đối tượ ng.
2.2.2.1. Thu thâ p dư liê u
Để có thể xây dựng đượ c hệ thống nhận dạng dựa trên mô hình cascade, trướ c tiên
cần phải có một tậ p huấn luyện chứa các mẫu, bao gồm cả các mẫu chứa đối tượ ng và các
mẫu không chứa đối tượ ng. Tậ p huấn luyện này sẽ đượ c xây dựng từ 2 nguô n:
Tâ p huâ n luyê n thư nhâ t đươ c xây dư ng tư các hình ảnh thu đượ c từ video cameraca c thiê t bi đi đô ng
Tâ p huâ n luyê n thư hai đươ c lâ y tư một bộ khoảng 430 h nh a nh positive va hơn3000 h nh nagative sử dụng một tậ p huấn luyện k ết hợ p công việc của Markus
Weber và các bộ dữ liệu TME bở i Caraffi et al. (2012) [6], [10]
Ca c khung h nh, h nh a nh đượ c se đươ c tiê n xư ly qua ca c bươ c sau:
Co tâ t ca h nh a nh đê n mô t k ch thươ c 20×20 pixel
Chuyển đổi không gian màu của ảnh từ RGB (Red-Green-Blue) sang không gian
màu HSV (Hue-Saturation-Value).
Tách ảnh thành 3 ảnh thành phần chứa 3 kênh H, S, V riêng biệt.
Thực hiện thuật toán cân bằng Histogram trên kênh H. Ghép 3 ảnh thành phần lại về thành ảnh gốc.
Chuyển không gian màu từ HSV về RGB.
Tăng sáng cho kênh R của ảnh..
Thực hiện phép làm trơn ảnh bằng Gaussian.
Giảm sáng cho những điểm ảnh có mức xám lớ n.
Như đã nói thì đặc điểm của các video này là nó đượ c thu lại từ các camera ca c thiê t bi đô ng, các camera này có góc quay cố định, bối cảnh là làn đườ ng một chiều.
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 33/62
33
: Khung h nh triết xuât tư video đầu va o.
Mỗi video đượ c sử dụng làm đầu vào của bộ huấn luyện sẽ đượ c tách thành các
khung hình, mỗi khung hình là một đơn vị cơ bản của một video. Tất cả các khung hình
này sẽ đượ c sử dụng làm dữ liệu đầu vào cho hệ thống
: Chuỗ i các khung hình liên tiế p tách ra t ừ video (t ừ 1 đế n 6)
1 2
3 4
5 6
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 34/62
34
2.2.2.2.
Tiê n xư ly dư liê u
Sau khi lấy đượ c dữ liệu là các khung hình từ các video giao thông thì bướ c tiế p theo
sẽ là xây dựng tậ p huấn luyện. Tậ p huấn luyện bao gồm: positive va negative
Positive la ca c mẫu chư a đô i tươ ng
Nagative la ca c mẫu không chư a đô i tươ ng
Công cụ em sử dụng để thực hiện việc huấn luyện đòi hỏi phải có sự chuẩn hóa trong
dữ liệu đầu vào. Cụ thể là các mẫu positive chứa đối tượ ng phải có dạng hình vuông (chiều
cao mẫu bằng chiều r ộng mẫu) và kích thướ c tối thiểu là 24x24 pixel. Không như các mẫu
positive, các mẫu negative có thể có kích thước tùy ý nhưng phải lớn hơn kích thướ c mẫu
positive, tức là lớn hơn 24x24 pixel. Trong quá trình huấn luyện, các bộ phân loại sẽ học
từ các mẫu positive và các vùng ảnh trích xuất ra từ các mẫu negative. Vì đặc điểm này
nên trong các mẫu negative mặc dù có kích thướ c lớn nhưng cũng nhất định không đượ cchứa đối tượ ng cần nhận dạng, vì nếu không trong quá trình huấn luyện, vùng ảnh chứa
đối tượ ng có thể đượ c trích xuất ra để học, có thể dẫn đến vòng lặ p vô hạn, không k ết thúc
đượ c huấn luyện. Các mẫu positive đượ c lấy từ các dữ liệu (khung hình) đã đượ c chuẩn
bị ở bước trướ c, còn các mẫu negative có thể lấy bất cứ ở nguồn nào, miễn là không chứa
đối tượng, nghĩa là không chứa hình của các phương tiện giao thông trong đấy, ngoài ra
mẫu negative cũng có thể lấy ở các phương tiện giao thông trong đấy, ngoài ra mẫu
negative cũng có thể lấy ở các khung hình trên nhưng chỉ lấy những vùng ảnh nào không
chứa đối tượ ng [1].
: T ậ p huấ n luyện của các bộ học yế u
Sau khi đưa vào công cụ huấn luyện, các mẫu positive và negative sẽ tr ải qua một
bướ c chuẩn hóa nữa. Cụ thể các mẫu positive có kích thướ c lớn hơn kích thướ c tối thiểu
24x24 pixel sẽ được điều chỉnh về 24x24 pixel. Ngoài ra cả 2 mẫu positive và negative
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 35/62
35
đều được đưa về ảnh xám để phù hợ p vớ i yêu cầu huấn luyện của công cụ và để tăng tốc
độ huấn luyện (khi chỉ làm việc trên 1 kênh màu).
: Mâ u Negative
M â u positive đươ c huấn luyê n Mâ u positive theo Caraffi et al va MarkusWeber
2.2.2.3. Huấn luyện
Như đã trình bày ở trên, co hai phâ n:
Phâ n mô t : ca c mẫu positive ch nh em se sư du ng mẫu Caraffi et al va MarkusWeber nhă m tăng kha năng nhâ n da ng đươ c nhiê u mẫu xe hơn.
Phâ n hai: em sẽ dùng một công cụ để thực hiện việc huấn luyện các mẫu positive
và negative. Do phạm vi của đồ án có hạn nên em sẽ không thực hiện việc xây dựng
công cụ huấn luyện này mà thay vào đó là sử dụng một công cụ đã có sẵn và r ất phổ
biến là HaarTraining.
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 36/62
36
Về bản chất thì công cụ này dựa trên chính mô hình cascade gồm các bộ phân loại đượ cxây dựng bở i thuật toán AdaBoost và sử dụng các đặc trưng Haar -like như em đã trình
bày ở phần trên. Các bướ c sử dụng công cụ này sẽ đượ c trình bày cụ thể trong Chương 3.
Sau quá trình huấn luyện vớ i các mẫu positive và negative ở trên, công cụ HaarTraining
sẽ cho đầu ra là một cấu trúc theo tầng của các bộ phân loại mạnh. Mỗi bộ phân loại mạnh
sẽ bao gồm nhiều bộ phân loại yếu k ết hợ p vớ i nhau mà mỗi bộ phân loại yếu là một đặc
trưng Haar -like đượ c học từ các mẫu đầu vào. Theo như mô hình cascade mà em đã trình bày thì các tầng đầu mà đi qua tất cả các tầng mà không bị loại sẽ được coi là đối tượ ng
cần nhận dạng. Cấu trúc theo tầng này sẽ được lưu lại dưới định dạng file xml.
Tuy nhiên có một vấn đề cần chú ý ở đây là sử dụng bao nhiêu tầng trong bộ nhận dạng
thì đủ. Nếu sử dụng ít tầng thì số lượng đối tượ ng mà bộ nhận dạng bắt đượ c sẽ nhiều,
nhưng độ chính xác sẽ thấ p do việc bắt nhầm những vùng gần giống với đối tượ ng chứ
không phải đối tượ ng, ngoài ra còn có khả năng bắt thiếu những đối tượ ng khó nhận dạng.
Nếu sử dụng nhiều tầng thì độ chính xác sẽ cao (do số lượ ng bắt nhầm sẽ giảm r ất nhiều)
tuy nhiên số lượng đối tượ ng nhận dạng được theo đó sẽ thấ p, nhiều đối tượ ng giống vớ i background
sẽ dễ bị bộ nhận dạng loại bỏ. Như vậy ở đây sẽ có sự trao đổi, nếu tăng độ chính xác thì
sẽ giảm độ nhạy, nếu tăng độ nhạy thì sẽ giảm độ chính xác.
Từ đó có thể thấy việc lựa chọn số lượ ng tầng cho bộ nhận dạng cũng đóng vai trò quantr ọng cho chất lượ ng của bộ nhận dạng đó. Qua thực nghiệm và đánh giá thì hệ thống nhận
dạng phương tiện giao thông sẽ đạt k ết quả tốt nhất nếu số lượ ng tầng các bộ phân loại
nằm trong khoảng từ 25 đến 30.
: Những đặc trưng Haar -like đầu tiên đượ c chọn trong bộ nhận d ạng
2.2.2.4.
Nhận dạng
Bộ nhận dạng đối tượ ng sẽ đượ c xây dựng dựa trên cấu trúc theo tầng của các bộ
phân loại đã tìm đượ c sau quá trình huấn luyện ở trên. Khi đưa một ảnh vào bộ nhận dạng,
ở đây là các khung hình lấy từ các video dùng để kiểm tra (như đã nói ở trên thì các video
đượ c phân thành 2 phần dùng để huấn luyện và dùng để kiểm tra), bộ nhận dạng sẽ xem
xét tất cả các vùng ảnh với kích thước khác nhau đượ c trích xuất ra từ ảnh này để có thể
đưa ra đượ c k ết quả.
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 37/62
37
Kích thước ban đầu của vùng ảnh đượ c trích xuất sẽ là một cửa sổ có kích thướ c bằng với kích thướ c tối thiểu của các mẫu positive đượ c sử dụng trong quá tình huấn
luyện. Các vùng ảnh này sẽ đượ c dịch chuyển theo chiều ngang và chiều dọc một khoảng
vài pixel cho tớ i khi phủ kín ảnh cần nhận dạng. Hay nói cách khác bộ nhận dạng sẽ quét
một lượ t tất cả các vùng có thể trên ảnh để tìm đối tượ ng. Sau khi hết một lượ t, vùng ảnh
này sẽ được tăng kích thướ c lên và tiế p tục quá trình quét toàn bộ ảnh để xử lý, kích thướ c
mở r ộng này sẽ tăng cho tớ i khi vùng ảnh bằng với kích thướ c của cả bức ảnh hoặc bằngmột giá tr ị max nào đó, giá tr ị này có thể đượ c thiết lậ p bằng tay.
Như vậy sẽ có khả năng một đối tượng đượ c nhận dạng nhiều lần nhưng vớ i các
vùng ảnh có kích thướ c gần giống nhau, các đối tượ ng sẽ đượ c gọi là các đối tượ ng bị lặ p,
vấn đề này cũng sẽ đượ c xử lý và trình bày ở phần sau.
Nhờ có cấu trúc phân tầng cascade, các vùng ảnh không chứa đối tượ ng (background)
sẽ đượ c duyệt qua r ất nhanh nhờ những tầng đầu tiên. K ết quả của quá trình nhận dạng sẽ
là một tậ p các vùng ảnh đượ c cho là có chứa đối tượ ng ứng vớ i mỗi ảnh đầu vào (mỗi
khung hình trong video).
2.3.
Pha t hiê n la n đươ ng
Tâ t ca như ng ngươ i tham gia giao thông bă ng phương tiê n ô tô đê u râ t quan tâm tơ ivâ n đê an toa n khi đi sang la n đươ ng, đa co không t như ng vu tai na n do chu quan haykha ch quan vê viê c chuyê n la n mô t ca ch đô t ngô t hay biê n đô i la n trên tư ng cung đươ ng,đôi khi va o trong mô t sô điê u kiê n môi trươ ng viê c pha t hiê n la n đươ ng đô i vơ i mă t ngươ itrơ len kho khăn hơn.
Các nguyên nhân chính của như ng vu tai na n do chuyê n la n đươ ng đô t ngô t có thể là
cu a phương tiê n, do buồn ngủ, do sư du ng ca c châ t k ch th ch như rượ u / ma túy hoặc phiền nhiễu ca c thiê t bi điê n tư kha c… Nhiều nghiên cứu đã chỉ ra r ằng ngườ i lái xe thiếu
chú ý có thể ảnh hưởng đến kha năng quan sa t la n đươ ng.
Trong ba i toa n na y se sư du ng ca c phương pha p Scale-spacem, ma ho a a nh theo khuvư c, pha t hiê n ca nh Canny va biê n đô i Hough đê pha t hiê n la n đươ ng. Khi pha t hiê n la nđươ ng
2.3.1. Pha t hiê n điê m cư c tri Scale-space va thiê t lâ p vu ng quan tâm
Hê thô ng sư du ng camera cu a ca c thiê t bi di đô ng th viê c t nh toa n cu a thuâ t xư ly a nh se chiê m du ng ta i nguyên lơ n, đây la ha n chê cu a ca c thiê t bi trên. Ch nh v vâ y nê ukhông co phương pha p đê khă c phu c t nh tra ng trên th sô khung h nh thu đươ c trong mô tgiây (frames per second (fps)) se vô cu ng t.
Đê khă c phu c t nh tra ng trên ba i toa n se a p du ng ky thuâ t ma trâ n thu nho , tư c la mgia m k ch thươ c cu a khung a nh. Trong Ky thuâ t scale-space, bước đầu tiên này tiến hành
tìm kiếm các điểm hấ p dẫn trên tất cả các tỉ lệ và vị trí của ảnh. Nó sử dụng hàm different-
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 38/62
38
of-Gaussian để xác định tất cả các điểm hấ p dẫn tiềm năng mà bất biến vớ i quy mô và
hướ ng của ảnh
2.3.1.1. Pha t hiê n điê m cư c tri Sacle-space
: biê u diê n Scale-space
Các điểm hấ p dẫn với đặc trưng SIFT tương thích vớ i các cực tr ị địa phương của bộ
lọc difference – of-Gaussian (DoG) ở các tỉ lệ khác nhau. Định nghĩa không gian tỉ lệ của
một hình ảnh là hàm L(x,y,k ) đượ c mô tả như sau:
L(x,y, )= G(x,y,k )* I(x,y)
Vớ i: G( x,y , k ) : biến tỉ lệ Gaussian (variable scale Gaussian)
I(x,y) : Ảnh đầu vào
* là phép nhân chậ p giữa x và y
,, −+/
Để phát hiện được các điểm hấ p dẫn, ta đi tìm các cực tr ị của hàm DoG được địn nghĩa:
,, (,, ,,) ∗,
,, (,, ,,)
Giá tr ị hàm DoG đượ c tính xấ p xỉ dựa vào giá tr ị scale-normalized Laplacian ofGaussian (∇) thông qua các phương trình (2.10) (2.11) (2.12)
∇G
∇G ≈ (,,,,)
−
(2.5)
(2.6)
(2.7)
(2.9)
(2.8)
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 39/62
39
(,, ,,) ≈ 1 ∇2G
Như vậy, bước đầu tiên của giải thuật SIFT phát hiện các điểm hấ p dẫn vớ i bộ lọc
Gaussian ở các tỉ lệ khác nhau và các ảnh GoG từ sự khác nhau của các ảnh k ề mờ .
: Biểu đồ mô phỏng việc tính toán các DoG ảnh t ừ các ảnh k ề mờ
Các ảnh cuộn đượ c nhóm thành các octave (mỗi octave tương ứng vớ i giá tr ị gấp đôicủa ). Giá tr ị của k đượ c chọn sao cho số lượ ng ảnh mờ (blured images) cho mỗi octave
là cố định. Điều này đảm bảo cho số lượ ng các ảnh DoG cho mỗi octave không thay đổi.
Các điểm hấ p dẫn được xác định là các cực đại hoặc cực tiểu của các ảnh DoG qua các tỉ
lệ. Mỗi điểm ảnh trong DoG đượ c so sánh với 8 điểm ảnh láng giềng của nó ở cùng tỉ lệ đó và 9 láng giềng k ề ở các tỉ lệ ngay trướ c và sau nó. Nếu điểm ảnh đó đạt giá tr ị cực tiểu
hoặc cực đại thì sẽ đượ c chọn làm các điểm hấ p dẫn ứng viên.
: M ỗi điể m ảnh đượ c so sánh vớ i 26 láng giề ng của nó
(2.10)
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 40/62
40
2.3.1.2.
Ma ho a a nh theo khu vư c
Ma ho a anh theo khu vư c - Region of Interest (ROI), vơ i phương pha p na y giu p ha nchê viê c t m kiê m dâ u hiê u la n đươ ng cu a ca h nh a nh thu đươ c ơ đâ u va o bă ng viê c xa cđi nh 1 vu ng a nh quan tâm la mâ u chô t viê c nhâ n da ng đô i tươ ng đươ c mô pho ng bă ngh nh dươ i. Viê c na y la m loa i bo bơ t nhưng vu ng không co đô i tươ ng la n đươ ng như vu ng
bâ u trơ i giu p gia i pho ng bô nhơ thiê t bi va tăng tô c đô cu a qua tr nh lo c
: Khu vư c pha t hiê n la n đươ ng trong vo ng tro n ma u đo
2.3.2. Thuâ t toa n Canny va biê n đô i Hough
Thuâ t toa n Canny
Phát hiện cạnh Canny là một trong những phương pháp phát hiện biên đượ c sử dụng
để tìm tất cả các điểm cạnh trong hình ảnh và đầu ra là một bản đồ nhị phân. Canny sư du ng một gradient trên hình ảnh để tìm những thay đổi mạnh về cường độ pixel. Đây lànhững đườ ng nét có khả năng la la n đươ ng trong hình ảnh đâ u va o. Đầu ra là sau đó chỉ cần một bản đồ nhị phân đó cho bạn thấy nơi những đườ ng nét của hình.
Trong thuật toán Canny, các đạo hàm bậc một đượ c tính theo x và y và sau đó kết
hợ p thành bốn đạo hàm hướng. Các điểm nơi những đạo hàm hướ ng này là cực tr ị địa phương sau đó là các ứng viên cho tậ p hợ p thành các cạnh.Trong ba i toa n na y sử dụng để
phát hiện biên Canny để tìm ranh giới la n đươ ng trong khung ROI đa nhă c đê n ơ phâ ntrên.
Viê c phát hiện cạnh cơ bản sử dụng vector gradient của một hình ảnh cường độ đê pha t hiê n ranh giới làn đường có độ tương phản cao trong ảnh. Đây là một trong trong
những phương pháp tốt nhất và hiệu quả trong nhiều phương pháp phát hiện biên
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 41/62
41
: v du a nh đươ ng viền
Biê n đô i Hough
Biến đổi Hough là một k ỹ thuật có thể dùng để tách ra các đặc điểm của một hình
dáng cụ thể trong một ảnh nhị phân. Khi dùng các chương trình máy tính để nhận diện
một đối tượ ng nào đó có hình dạng bất k ỳ, phương pháp hữu hiệu hiện nay là sử dụng biến
đổi Hough. Các bài toán tìm kiếm từ những mức đơn giản như tìm đườ ng thẳng tớ i các bài toán phức tạp hơn như tìm hình tròn, hình elipse hoặc các hình phức tạp đều có thể
thực hiện bằng biến đổi Hough (với điều kiện các hình dạng này biểu diễn toán học đượ c).
Giai đoạn phát hiện làn sử dụng các ha m Hough Line đê lo c ca c đườ ng trong hình
ảnh dựa trên biến đổi Hough.
Biến đổi Hough tìm đườ ng thẳ ng
Đầu tiên chúng ta sẽ xem xét việc tìm kiếm các đườ ng thẳng trong một hình ảnh.
Trong một sự biểu diễn tham số Đề các, điểm cộng tuyến trong một hình ảnh vớ i tọa độ
(x,y) là có liên quan của độ dốc m và chặn c theo:
y = mx + c
Phương trình này có thể đượ c viết dướ i hình thức đồng nhất như:
Ay + Bx + 1 = 0
Trong đó A= -1/c và B = m/c. Do đó, một đườ ng thẳng được xác định bằng cách cho
một cặ p giá tr ị (A,B). Tuy nhiên, chúng ta có thể quan sát một đối xứng trong sự xác định
trong phương trình 2.12. Phương trình này là đối xứng từ một cặ p tọa độ (x,y) cũng xácđịnh một đườ ng thẳng trong không gian vớ i các tham số (A,B). Đó là, phương trình 2.12
có thể được xem như là phương trình của một đườ ng thẳng cho tọa độ cố định (x,y) hay
là phương trình của một đườ ng thẳng cho các tham số cố định (A,B). Như vậy, cặ p có thể
đượ c sử dụng để xác định các điểm và đườ ng thẳng đồng thờ i.
Hough tậ p hợ p dấu hiệu của điểm (A,B) bằng cách xem xét tất cả các điểm (x,y) xác
định cùng một đườ ng thẳng trong không gian (A, B). Có nghĩa là, nếu tậ p hợp các điểm
cộng tuyến {(xi ,yi)}xác định đườ ng thẳng (A, B), thì
(2.12)
(2.11)
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 42/62
42
1 0
Phương trình này có thể được xem như một hệ phương trình và nó có thể đượ c viết
lại đơn giản trong điều kiện của sự biểu diễn tham số Đề các như:
Vì vậy, để xác định đườ ng thẳng chúng ta phải tìm các giá tr ị của các tham số (m,c)
(hoặc (A, B) trong hình thức đồng nhất) đáp ứng phương trình 2.14(hoặc 2.13, tương ứng).
Biê n đô i Hough cung cấ p một phản ứng chính xác, ướ c tính chính xác của các tham
số đượ c sử dụng để xác định đườ ng thẳng, miễn là số lượng điểm thẳng dọc theo đườ ng
thẳng vượ t quá số lượng các điểm thẳng trên bất k ỳ đườ ng thẳng nào trong ảnh. Tuy nhiên,
tính phi tuyến của các tham số và sự r ờ i r ạc tạo các tích lũy tiếng ồn. Một vấn đề lớ n trong
việc thực hiện các Hough cơ bản cho đườ ng thẳng là sự xác định của một không gian tích
lũy thích hợ p.
Trong ứng dụng, thuật toán vẽ đườ ng thẳng Bresenham (Bresenham, 1965) có thể sử
dụng để vẽ các đườ ng thẳng bình chọn trong không gian tích lũy. Điều này đảm bảo r ằngđườ ng thẳng của các lựa chọn k ết nối được rút ra như trái ngượ c vớ i sử dụng phương trình2.20 có thể dẫn đến những khoảng tr ống trong các đườ ng vẽ. Ngoài ra, backmapping
(Gerig, 1986) có thể đượ c sử dụng để xác định chính xác điểm cạnh đóng góp cho một
đỉnh đặc biệt. Backmapping là một ánh xạ ngượ c từ không gian tích lũy đến dữ liệu cạnh
và có thể cho phép phân tích hình dạng của hình ảnh bằng cách loại bỏ các điểm cạnh góp
phần đỉnh đặc biệt, và sau đó tái tích lũy bằng cách sử dụng Hough.
Một cách để tránh các vấn đề của sự biểu diễn tham số Đề các trong Hough là cơ sở hàm ánh xạ trên một sự biểu diễn tham số thay thế. Biểu diễn tham số một đườ ng thẳng
này bằng cách xem xét một điểm (x, y) như là một hàm của một góc bình thườ ng vớ iđườ ng thẳng đi qua gốc của hình ảnh. Điều này cho phép một hình thức của Hough cho
các đườ ng thẳng đượ c gọi là Hough cực cho các đườ ng thẳng (Duda, 1972). Điểm mà
đườ ng thẳng này giao với đườ ng thẳng trong hình ảnh đượ c cho bởi công thư c:
p= x cos+y sin
Trong giai đoa n pha t hiê n la n đươ ng sử dụng các ha m Hough lines đê trích xuất
đườ ng trong ảnh dựa trên biến đổi Hough. Tư công thư c 2.21
x =−
, y =
−
(2.13)
(2.14)
(2.15)
(2.16)
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 43/62
43
: A p d ụng các biến đổi Hough cho đườ ng thẳ ng
Sau khi a p du ng biê n đô i Hough va Hough lines ta thu đươ c h nh a nh ba i toa n dươ iđây:
: Sau khi sư du ng thuâ t toa n hough va hough lines
Đô i vơ i ba i toa n trên sau khi lo c đươ ng mô ta như ca c va ch ma u đo , th co 1 vâ n đê xa ra la không t m đươ c điê m cuô i cu a đươ ng. Vê vâ n na y phương pha p biê n đô i Houghtheo xa c suâ t đê t m đươ c điê m kê t thu c cu a đươ ng
: điê m kết thu c cu a đươ ng khi sư du ng biến đô i hough theo xa c suất
Đê cho ra h nh a nh cuô i cu ng ta bô sung bit cu a hai a nh trên, kê t qua se thu đươ c a nhsau:
: Kêt qua cuối cu ng
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 44/62
44
2.4.
Xư ly dư liê u va đưa ra ca nh ba o
Ca nh ba o la nô i dung ch nh cu a hê thô ng ca nh ba o va cha m ô tô. Trong phâ n na y se sư du ng kê t qua la đâ u ra cu a bươ c nhâ n da ng đô i tươ ng ơ trên. Đô i tươ ng ơ đây đươ cnhâ n da ng va ba i toa n se t nh toa n khoa ng ca ch vơ i đô i tươ ng đo . Nê u trong ngươ ng khôngan toa n th hê thô ng se tư thông ba o cho ngươ i la i xe chu đô ng đê xư ly t nh huô ng ki p
thơ i nhă m gia m thiê u nguy cơ tai na n. Nô i dung phâ n na y gô m co :
Ươ c lươ ng khoa ng ca ch
Dư đoa n tô c đô
2.4.1. Ươ c lươ ng khoa ng ca ch
Sau khi nhâ n da ng đô i tươ ng, hê thô ng câ n ươ c lươ ng khoa ng ca ch vơ i tư cameramoblie vơ i ca c đô i tươ ng kha c đang tham gia lưu thông. Hiê n nay viê c sư du ng camera tư
moblie đê xa c đi nh khoa ng ca ch đi a ly giư a hai đô i tươ ng đang di chuyê n la mô t điê u vôcu ng kho . Khi mô pho ng thực 3D thông qua ống kính của một máy ảnh vào một hình ảnh
2D, một số thông tin se bị mất trong đo co ca c thông sô vê khoa ng ca ch vơ i ca c phươngtiê n kha c. Camera không thể đưa ra bất cứ phép đo thực sự của các khoảng cách trong thế
giớ i thực chỉ nhìn một hình ảnh. Va tô n ta i 2 vâ n đê sau:
Vấn đề thư nhâ t xe có kích thướ c và hình dạng khác nhau. Tuy nhiên là không phải
là một ý tưở ng tồi để giả định có chiều r ộng trung bình cho tất cả các loại xe.
Vấn đề thứ hai là chiều r ộng trong mét của xe không đượ c lấy tr ực tiế p từ hình ảnh,
nhưng một nhóm các điểm ảnh có chứa các hình ảnh của chiếc xe.
Để giải quyết điều này, cần t tìm ra mối quan hệ giữa kích thướ c của khu vực chứa
xe, và khoảng cách đến nó. Vì lý do này, đây là một phương pháp đê tiê p câ n, h nh a nhsau la khoa ng ca ch kha c nhau đo đươ c đê n vi tr cu a xe.
a)khoa ng ca ch 5m vơ i xe b)khoa ng ca ch 20m vơ i xe
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 45/62
45
c)khoa ng ca ch 35m vơ i xe d)khoa ng ca ch 50m vơ i xe
: Mâ u h nh a nh ơ ca c khoa ng ca ch kha c nhau vơ i đối tươ ng la xe.
Kê t qua thu đươ c thê hiê n mỗi quan hê giư a khoa ng ca ch vơ i k ch thươ c phân vu ngcâ n phân loa i thê hiê n trong h nh sau:
: Sơ đồ thê hiê n mối quan hê giư a k ch thươ c va khoa ng ca ch
Đườ ng cong phù hợ p cho xấ p xỉ khoảng cách từ vùng phân loại kích thước. tru choa nh la khoảng cách đến các xe (mét). Tru c tung là kích thước xe ta i vu ng đang xe t. Cácđiểm màu đỏ đại diện cho các biện phá p thu đượ c từ mỗi hình ảnh. Các đườ ng cong màu
xanh là mô hình tiên đoán đượ c trang bị cho các điểm dữ liệu.Để có thể thực hiện một dự
đoán của khoảng cách, biê u đô trên đã đượ c quyết định để phù hợ p vớ i một mô hình hàm
mũ [7]
.exp. .exp. 2.4.2.
Dư đoa n tô c đô
Điện thoại thông minh nga y nay đa co râ t nhiê u tiê n ch, trong đo có hệ thống định
vị toàn cầu GPS. Vớ i công nghệ này ta có thể ướ c tính tốc độ một cách dễ dàng và chính
xác hơn. Điều này đượ c thực hiện bằng cách đầu tiên ước lượ ng vị trí của thiết bị thôngqua kê t nô i internet. Viê c đo tô c đô se a p du ng theo công thư c: v = s/t (2.23)
(2.17)
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 46/62
46
CHƯƠNG 3: XÂY DƯ NG PHÂ M MÊ M THƯ NGHIÊ M VA ĐA NH GIA KÊ T QUA
Chương 2 đa nêu ra ca c phương pha p gia i quyê t ba i toa n gia m sa t va ca nh ba o vacha m
Chương này sẽ trình bày cụ thể về quá trình thực hiện việc xây dựng phâ n mê m gia m
sa t va ca nh ba o va cha m ô tô trên thiê t bi di đô ng, các thực nghiệm cụ thể bao gồm cách
xây dựng bộ dữ liệu huấn luyện, các bướ c thực nghiệm và k ết quả đạt đượ c, từ đó đưa racác phân tích, nhận xét về các k ết quả đó.
Trong quá trình nghiên cứu và cài đặt hệ thống phâ n mê m, em có sử dụng thư viện
mã nguồn mở OpenCV cho v OpenCV cài đặt khá đầy đủ các thuật toán xử lý ảnh nên
đượ c sử dụng r ất r ộng rãi trong lĩnh vực này. Toàn bộ chương trình đượ c viết trên ngôn
ngữ Java va C++ với môi trườ ng phát triển eclipse.
Ngoài ra để phục vụ cho quá trình huấn luyện dữ liệu em có sử dụng công cụ
HaarTraining đã cài đặt sẵn thuật toán AdaBoost để thực hiện huấn luyện các cascade sử dụng các đặc trưng Haar -like.
3.1. Thư nghiê m va đa nh gia kê t qua .
3.1.1.
Qua tr nh thu thâ p dư liê u
Hê thô ng co nhiê m vu gia m sa t va ca nh ba o va cha m ô tô nên hê thô ng se co hai phâ nch nh câ n đươ c xây dư ng:
Phâ n nhâ n da ng đô i tươ ng : Dư liê u la ca c khung h nh đươ c lâ y ra tư camera tư
thiê t bi di đô ng, sau đo hê thô ng thư c hiê n nhâ n da ng đô i tươ ng la m dư liê u đâ uva o cho phâ n theo do i va đưa ra ca nh ba o.
Phâ n theo do i đô i tươ ng va đưa ra ca nh ba o: Dư liê u đâ u va o la ca c đô i tươ ng thuđươ c ơ phâ n nhâ n da ng, tư đo sư du ng ca c thuâ t toa n đa nêu ơ chương 2 đê t nhtoa n khoa ng ca ch va đưa ra ca nh ba o.
3.1.1.1. Dư liê u đâ u va o
Qua tr nh thu nhâ p dư liê u la điê u kiê n bă t buô c cu a hê thô ng phâ n mê m gia m sa t va
ca nh ba o va cha m giao ô tô trên ca c thiê t bi di đô ng. Hê thô ng se sư du ng camera ca c thiê t bi trên đê thu video la m dư liê u đâ u va o, ca c video na y gă n trư c tiê p va ghi la i ha nh tr nhdi chuyê n cu a ca c phương tiê n tham gia lưu thông.
Video ban đêm co đă c điê m thiê u, ánh sáng đèn đườ ng yếu dẫn đến độ tương phản
tổng thể của cả video r ất thấ p, hầu như chỉ thấy đèn của các phương tiện giao thông chiếu
ra bở i vậy các video ban đêm trước khi đượ c lấy dữ liệu huấn luyện cần phải qua một
bướ c tiền xử lý. Cụ thể quá trình tiền xử lý này sẽ đượ c trình bày ở phần sau.
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 47/62
47
Video huấn luyên ban đêm
Video huấn luyê n ban nga y
3.1.1.2. Đô i tươ ng huâ n luyê n
Các đối tượng đượ c sử dụng cho quá trình huấn luyện đượ c trích xuất ra từ các video
đầu vào. Cụ thể là video đầu vào sẽ đượ c trích xuất ra các khung hình, r ồi các đối tượ ng
sẽ đượ c thu thậ p từ các khung hình đó.
Nhưng không phải tất cả các khung hình của video đều đượ c trích xuất, mỗi ảnh
đượ c lấy ra cách nhau 5 hoặc 10 khung hình do tỷ lệ khung hình/giây của video là khá lớ nnên các đối tượng đượ c trích xuất ra từ các khung hình liên tiế p nhau sẽ gần như là giống
nhau, mà việc này thì không có lợ i cho quá trình huấn luyện khi mà việc càng phong phú
các mẫu thì k ết quả huấn luyện sẽ càng tốt.
Như đã trình bày, trướ c khi thực hiện trích xuất đối tượng, các video ban đêm sẽ tr ải
qua một bướ c tiền xử lý, cụ thể là tất cả các khung hình sẽ đượ c xử lý sau khi lấy đượ c từ
các video. Quá trình tiền xử lý này bao gồm các bướ c:
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 48/62
48
Chuyển đổi không gian màu của ảnh từ RGB (Red-Green-Blue) sang không gian
màu HSV (Hue-Saturation-Value).
Tách ảnh thành 3 ảnh thành phần chứa 3 kênh H, S, V riêng biệt.
Thực hiện thuật toán cân bằng Histogram trên kênh H.
Ghép 3 ảnh thành phần lại về thành ảnh gốc.
Chuyển không gian màu từ HSV về RGB.
Tăng sáng cho kênh R của ảnh.
Thực hiện phép làm trơn ảnh bằng Gaussian.
Giảm sáng cho những điểm ảnh có mức xám lớ n.
Từng bướ c trong quá trình xử lý này đều có trong thư viện mà OpenCV hỗ tr ợ , nên
tốc độ chung của phần này là r ất nhanh, không đáng kể.
Trướ c và sau quá trình tiề n xử lý ảnh ban đêm
Sau khi đã xử lý xong các khung hình thì dữ liệu về các đối tượ ng sẽ đượ c trích xuất.
Mỗi đối tượ ng sẽ được đại diện bở i một cửa sổ hình vuông cắt ra từ các khung hình đó.
Mâ u positive ban nga y.
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 49/62
49
Mâ u positive ban đêm
Đê tăng kha năng nhâ n da ng đô i tươ ng cho hê thô ng, em đa sư du ng thêm ca c mẫu positivecu a Caraffi et al. (2012) va Markus Weber (1999). Bô dư liê u na y gô m bô 430 a nh vê đô itươ ng ô tô miêu ta như h nh sau:
Mâ u positive theo Caraffi et al va Markus Weber
Đô i tươ ng cu a ba i toa n la phương tiê n ô tô vơ i điê u kiê n a p du ng cho ba i toa n đa nêu
ơ chương I vơ i đă c điê m la đuôi xe ô tô đi trong la n đươ ng mô t chiê u.
3.1.2. Qua tr nh huâ n luyê n
3.1.2.1. Môi trươ ng phâ n cư ng huâ n luyê n la
Cấu hình phần cứng phục vụ cho quá trình huấn luyện:
Vi xư ly : Intel Core i5
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 50/62
50
RAM : 4GB
Hê điê u ha nh: Windows 10
Công cu huâ n luyê n: HaarTraining
Thờ i gian huấn luyện cho mỗi bộ phân loại thườ ng là từ 5-6 ngày.
3.1.2.2.
Ca c bươ c huâ n luyê n Sau khi đã có môi trườ ng huấn luyện và các dữ liệu đầu vào cần thiết thì sẽ tiến hành
thực hiện việc huấn luyện các mẫu dữ liệu đó.
Bươ c 1: Tạo các mẫu positive và negative cho bộ huấn luyện
Như đã trình bày ở chương 2, có hai loại mẫu đầu vào cần chuẩn bị để thực hiện quá
trình huấn luyện là các mẫu có chứa đối tượ ng (positive) và các mẫu không chứa đối tượ ng
(negative).
Đầu tiên là tạo ra hai tậ p tin mô tả của các mẫu positive và negative. Đưa h nh a nhva o trong thư mu c …\training\negative rô i cha y file batch create_list.bat.
Khi cha y tâ p tin na y ba n nhâ n file co ghi ca c do ng
Tiế p theo bạn cần phải tạo một tậ p tin dữ liệu chứa tên của hình ảnh positive cũngnhư vị trí của các đối tượ ng trong mỗi hình ảnh. Bạn có thể tạo ra file này thông qua mô ttrong hai công cu : Objectmarker or Image Clipper. Đê xây dư ng nhanh cho ng em du ngtool Objectmarker.
Ta o thư mu c ...\training\positive\rawdata đê chưa như ng h nh a nh positive
Sau khi cha y xong, chươnng tr nh objectmaker se ta o ra file info.txt là tậ p tin mô tả
mẫu positive nằm trong thư mục positive của công cụ huấn luyện, trong đó liệt kê số lượ ng
các phương tiện giao thông trong từng ảnh và tọa độ xuất hiện của phương tiện trong ảnhđó. Trong info.txt sẽ có một số thông tin đi nh da ng như dưới đây:
dir /b *.jpg >bg.txt
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 51/62
51
Số đầu tiên trong mỗi dòng xác định số lượng các đối tượ ng hiện có trong các hình
ảnh được đưa ra. Ví dụ, ở dòng thứ hai, số 3 có nghĩa là bạn đã chọn ra ba đối tượ ng xe ô
tô trong khung h nh image1201.bmp.
Bốn chữ số k ế tiế p (thể hiện trong màu xanh lá cây) xác định vị trí của đối tượng đầu
tiên trong hình ảnh (to a đô x = 35, y = 24, chiều r ộng = 70 và chiều cao = 39). Các con số
màu đỏ xác định các dữ liệu cho đối tượ ng thứ hai; Các con số màu xanh xa c đi nh đốitượ ng thứ ba.
H nh 3-4: Công cụ Object Marker giúp t ạo các mẫ u huấ n luyện
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 52/62
52
T ập tin positive đầu ra của công cụ Object Marker
Bươ c 2: Chạy bộ huấn luyện
Sau khi đã có 2 tậ p tin chứa các mẫu positive và negative cần thiết, việc tiế p theo là
tạo một tập tin lưu các vector ảnh sinh ra từ các mẫu positive thu đượ c ở bước trướ c. Thực
hiện việc này bằng cách chạy một lệnh trong công cụ HaarTraining:
Ý nghĩa các tham số chính:
-info: tậ p tin chứa các mẫu positive.
-vec: tập tin lưu các vector ảnh.
-num: số lượ ng các mẫu positve tổng cộng trong file info.txt.
-w, -h: kích thước đối tượ ng (các mẫu sẽ đượ c tự động chỉnh về kích thướ c này).
K ết quả thu đượ c là tậ p tin vector.vec nằm trong thư mục data của công cụ, tậ p tinnày sẽ là đầu vào cho quá trình huấn luyện. Chạy lệnh dưới đây để thực hiện quá trình
huấn luyện:
Ý nghĩa các tham số chính:
-data: các stage của mô hình cascade sau quá trình huấn luyện sẽ nằm trong thưmục này.
-vec: tập tin vector đượ c sinh ra ở trên.
-bg : tậ p tin chứa các mẫu negative (background).
-npos, -nneg : số lượ ng mẫu positive và negative.
-nstages: số lượ ng stage huấn luyện.
-mem: lượ ng RAM dành cho huấn luyện.
haartraining.exe -data data/cascade -vec data/vector.vec -bg negative/infofile.txt -npos 475
-nneg 2865 -nstages 25 -mem 1000 -mode BASIC -w 24 -h 24 – nonsym
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 53/62
53
K ết quả của quá trình huấn luyện này chính là bộ phân loại mạnh dùng cho quá trình
nhận dạng.
H nh 3-5: Minh họa quá trình chạ y công cụ huấ n luyện bộ nhận d ạng
Bươ c 3: Chuyê n đô i đi nh da ng bô phân loa i.
Sau khi kê t thu c huâ n luyê n bô nhâ n da ng bă ng tool Haar-training, trong thư mu c../training/cascades/data ta co ca c danh mu c đươ c đă t tên tư “0” đê n “N-1”, trong đo N la sô lươ ng ca c giai đoa n đa đươ c xa c đi nh trong haartraining.bat.
Các stage trong bộ huấn luyện sinh ra được sau bướ c 2 cần phải đượ c chuyển về định
dạng khác để có thể sử dụng được trong thư viện OpenCV, ở đây là định dạng xml. Thực
hiện điều này bằng cách chạy lệnh:
File xml sinh ra có cấu trúc tương đối tr ực quan, có chứa các stage là các bộ phân
loại mạnh bên trong có chứa các bộ phân loại yếu là các đặc trưng Haar -like, các đặc trưngna y đươ c lưu la i dướ i dạng các hình chữ nhật có tọa độ và kích thướ c nằm trong một
khung 24x24 pixel.
haarconv.exe data data output.xml 24 24
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 54/62
54
C ấ u trúc t ậ p tin xml chứ a bộ nhận d ạng
Trong thờ i gian thực hiện đồ án có hạn nên bộ nhận dạng sử dụng đặc trưng LBP chovideo ban đêm em chưa thực hiện xong nên chưa có kết quả để so sánh. Phần lớ n thờ i gian
huấn luyện dành chủ yếu cho các video ban ngày.
3.1.3. Thư nghiê p va đa nh gia kê t qua
Yêu câ u hê thô ng
Đê thư nghiê m cho ba i toa n, em cha y ư ng du ng trên ma y LG-isai vơ i câ u h nh:
Hê điê u ha nh: Android 4.4.2. KitKat
Ch p: Snapdragon 801 bốn nhân tốc độ 2.5 GHz
Ram: 3GB
Ma y ca i ư ng du ng OpenCV
Kê t qua thư nghiê m
Đô i vơ i ca c phương tiê n tham gia thao thông trên đươ ng, hê thô ng câ n nhâ n da ngca c xe ơ ph a trươ c va đo đươ c khoa ng ca ch, trong thư c nghiê m ba i toa n đa gia i quyê t vâ nđê trên nhưng co n trễ vê thơ i gian. Dươ i đây la mô t sô h nh a nh ma hê thô ng đa thu đươ c.
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 55/62
55
: Nhâ n da ng đối tươ ng xe ph a trươ c.
: Pha t hiê n la n xe
: Pha t hiê n la n xe
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 56/62
56
Trong qua tr nh thư c nghiê m trong qua ng đươ ng gâ n 50km kê t qua cu a hê thô ng tr nh ba y ơ ba ng dươ i đây:
Ba ng 1: Đô ch nh xa c viê c pha t hiê n đô i tươ ng xe trong 10s đâ u
Thơ i gian Thư c tê Pha t hiê n %
10h15 68 60 88,23
Ba ng 2: Thơ i gian nhâ n da ng xe cu a mươ i xe trên thư c tê
xe Thơ i gian pha t hiê n thư c tê (chuâ n0s)
Thơ i gian pha t hiê n cu a hê thô ng (s)
1 0 1,34
2 0 1,4
3 0 0,12
4 0 4,56
5 0 1.33
6 0 5,22
7 0 1,23
8 0 1,33
9 0 4,16
10 0 2,01
Ba ng 3: Sô đô i tươ ng đo đươ c khoa ng ca ch trong 10s đâ u
Thơ i gian Sô xe pha t hiê n đươ c Sô xe xa c đi nh đươ c khoa ng ca ch %
10h15 41 32 78,04
Ba
ng 4: Thơ
i gian đo khoa
ng ca ch cu
a mươ
i xe trong thư c tê
xe Thơ i gian pha t hiê n thư c tê (chuâ n0s)
Thơ i gian đo đươ c khoa ng ca ch cuarhê thô ng (s)
1 0 2,12
2 0 3,4
3 0 1,12
4 0 1,58
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 57/62
57
5 0 5.02
6 0 4,10
7 0 3,00
8 0 3,34
9 0 3,56
10 0 1,31
Nhâ n xe t va phân t ch kê t qua thu đươ c
Qua các k ết quả thu đượ c từ quá trình thực nghiệm em có một số đánh giá và nhận
xét sau:
Qua kê t qua ba ng 1 cho thâ y, viê c nhâ n da ng đô i tươ ng xe cu a hê thô ng l0s đâ u đa t88,23%, điê u na y cho thâ y ră ng viê c nhâ n ra ng đô i tươ ng la không kho vơ i ba i toa n na yv đơn gian ba i toa n ch nhâ n đô i tươ ng xe ph a trươ c va trong cu ng la n xe vơ i m nh lên
viê c nhâ n da ng trơ lên dễ da ng hơn.Mă t kha c, vẫn co n 11,77% la viê c nhâ n da ng diễn ralâu hơn 10s, không nhâ n da ng đươ c hoă c nhâ n da ng nhâ m.
Nguyên nhân chủ yếu là do đặc điểm của những video ở thời điểm khác nhau ảnh
hưởng khác nhau đến bộ nhận dạng. Như đã biết thì bộ nhận dạng sử dụng mô hình cascade
phụ thuộc nhiều vào yếu tố độ sáng, mà những video ở thời điểm sáng sớm có độ sáng
khác so vớ i những video ở thời điểm giữa trưa, ngoài ra hướ ng chiều của mặt tr ờ i lên các
phương tiện cũng khác nhau nên kết quả nhận dạng sẽ bị ảnh hưở ng nhiều.
Độ ổn định của hệ thống có thể đượ c cải thiện bằng cách tăng độ phong phú của các
mẫu huấn luyện, cụ thể là sử dụng nhiều mẫu ở tất cả các thời điểm khác nhau trong ngàyđể huấn luyện cho bộ nhận dạng. Hoặc một cách tiế p cận khác là có thể sử dụng riêng bộ
nhận dạng khác nhau cho từng thời điểm khác nhau, việc lựa chọn bộ nhận dạng nào sẽ
tùy vào độ sáng của video đó. Điê u na y ly gia i v sao thơ i gian pha t hiê n đô i tươ ng se bi trễ như trong ba ng 2
3.2. Phâ n mê m gia m sa t va ca nh ba o va cha m ô tô trên thiê t bi di đô ng
Ơ chương I đa nêu ra ca c phương pha p, ca c ư ng du ng cho ba i toa n gia m sa t va ca nh ba o va cha m ô tô. Nhưng no chưa phô biê n trong nga nh công nghê ô tô v đơn gia n ca c
chi ph sa n xuâ t ra ca c thiê t bi râ t đă t ma không pha i ngươ i tham gia phương tiê n na o cu ngco thê sơ hư u đươ c. V ly do na y em đa xây dư ng ba i toa n nêu trên trên ca c thiê t bi di đô ngnhă m kiê m tra va thư c hiê n t nh an toa n khi la i xe.
Ngày nay, hệ điều hành Android là nền tảng phổ biến nhất cho điện thoại thông minh
và các thiết bị di động. Do thực tế này đa co râ t nhiê u nha pha t triê n trên thê giơ i đa pha ttriê n như ng ư ng du ng liên quan đê n tâ m nh n ma y t nh. Mô t trong như ng ư ng du ng na y la ư ng du ng OpenCV do Bradski (2000) pha t triê n. Thư viện mạnh mẽ này đã thực hiện các
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 58/62
58
thuật toán và phương pháp phổ biến nhất hỗ trơ tiế p cận để phát hiện đối tượng v vâ y ư ngdu ng đo hoàn toàn phù hợ p bở i việc thực hiện của ba i toa n na y.
Phâ n mê m cha y trên ca c thiê t bi di đô ng, Ơ version na y em xây dư ng hê thô ng cha ytrên môi trươ ng android 4.0 trơ lên.
3.2.1. Tô ng quan vê phâ n mê m
Phâ n mê m vơ i giao diê n đơn gia n, sư dung camera cu a thiê t bi đê thu video. Phâ nmê m co nhiê m vu pha t hiê n la n đươ ng ma ô tô đang đi va pha t hiê n ra ca c ô tô ph a trươ c.Sau đo se đo đươ c khoa ng ca ch tơ i chiê c ô tô đa pha t hiê n đo , nhă m giu p cho ngươ i la i xe
biê t đươ c khoa ng ca ch vơ i xe ph a trươ c la bao xa đê thay đô i tô c đô
3.2.2.
Phân t ch thiê t kê phâ n mê m
: Sơ đồ khối mô ta hoa t đô ng cu a phần mềm .
Bă t đâ u
Huâ n luyê n bô nhâ n da ngđô i tươ ng ô tô
Theo do i, đưa ca nh ba o
Nhâ n da ng đô i tươ ng
Kê t thu c
Dư liê u huâ nluyê n
Dư liê u kiê mthư
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 59/62
59
: Sơ đồ chi tiết cho qua tr nh nhâ n da ng đối tươ ng
3.2.3.
Giao diê n chương tr nh
Giao diện của chương trình đượ c thiết k ế đơn giản, thân thiện vớ i giao diê n ch nh xư du ng camera cu a ca ch thiê t bi di đô ng.
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 60/62
60
Giao diê n ch nh cu a phần mềm sư du ng camera
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 61/62
61
KÊ T LUÂ N VA HƯƠ NG PHA T TRIÊ N
Trên cơ sơ t m hiê u va nghiên cư u ba i toa n gia m sa t va ca nh ba o va cha m ô tô trênthiê t bi di đô ng cu thê la viê c xây dư ng va pha t triê n ba i toa n nhâ n da ng đô i tươ ng, va ca nh ba o dư a trên thông tin đô i tươ ng đươ c nhâ n da ng, đồ án đã đạt đượ c những k ết quả
như sau:
Giớ i thiệu sơ lượ c về những phương pháp đã đượ c sử dụng cho ca nh ba o va cha mô tô trên thiê t bi di đô ng, từ đó đưa ra các so sánh và nhận xét để tìm được phươngán triển khai thích hợ p nhất.
Giớ i thiệu một cách khái quát bài toán nhận dạng đối tượ ng và bài toán ca nh ba o,,các phương pháp tiế p cận cho mỗi bài toán và việc k ết hợp hai bài toán để tạo
nên hệ thống đếm phương tiện giao thông hoàn chỉnh.
Trình bày thuật toán học máy AdaBoost, tìm hiểu về mô hình cascade cũng nhưđặc trưng Haar -like và đặc trưng LBP để có thể xây dựng đượ c bộ nhận dạng sử
dụng cho bài toán nhận dạng đối tượ ng cụ thể là nhận dạng phương tiện giao
thông.
Trình bày thuật toán pha t hiê n điê m cư c tri Scale-space va thiê t lâ p vu ng quantâm, thuâ t toa n Canny, thuâ t toa n Hough trong viê c pha t hiê n la n đươ ng
Tiến hành thực nghiệm hệ thống trên ca c thiê t bi di đô ng vơ đây la ca c thiê t bi android, từđó đưa ra cách đánh giá, nhận xét về k ết quả thu đượ c cho mỗi bài
toán nhỏ và cho cả hệ thống.
Bên cạnh những k ết quả đạt đượ c thì vẫn còn những hạn chế đó là:
K ết quả của hệ thống chưa ổn định, còn phụ thuộc nhiều vào điều kiện và đặcđiểm của các video đầu vào như là yếu tố thờ i gian, thờ i tiết, số lượng và đặc
điểm của các phương tiện giao thông…
Chưa ha n chê đươ c vê mă t trễ thơ i gian, điê u na y râ t quan tro ng trong thư c tê , va chưa co ca nh ba o ro ra ng
Qua những k ết quả và hạn chế của hệ thống đã cho thấy theo phương tiện giao thôngnói chung và đưa ra ca c ca nh ba o dư đoa n va cha m nói riêng đòi hỏi một quá trình nghiên
cứu và thực hiện lâu dài. Trong phạm vi đồ án em mớ i chỉ thực hiện đượ c việc gia m sa tva ca nh ba o va cha m ơ ca c vu ng ngoa i tha nh do viê c xe cô t đông đu c như trong nô i
tha nh, để có thể xây dựng một hệ thống tổng quát, áp dụng đượ c cho nhiều nơi thì cần
phải có thêm nhiều thời gian. Trướ c mắt hướ ng phát triển của đồ án sẽ là phải tậ p trung
cải thiện tăng độ chính xác cũng như độ ổn định của hệ thống vớ i nhiều điều kiện và hoàn
cảnh khác nhau, xây dựng và hoàn thiện những bộ nhận dạng đang còn thiếu sót, củng cố
và phát triển thuật toán để khắc phục đượ c những lỗi còn tồn tại.
7/21/2019 Đồ án tốt nghiệp
http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 62/62
TÀI LIỆU THAM KHẢO
Ta i liê u tiê ng Viê t:
[0] Thê Thi Hươ ng. Ky thuâ t trư a nh va ư ng du ng. Kho a luâ n tô t nghiê p Đa i ho c 2015,
Đa i ho c Công Nghê - Đa i ho c Quô c Gia Ha Nô i.
[1] Phạm Hồng Ngự, Nhận d ạng đối tượ ng sử d ụng thuật toán AdaBoost , Luận vănThạc sĩ Khoa học công nghệ thông tin, Đại học Huế, 2009.
Ta i liê u tiê ng Anh:
[2] David J. Fleet, Yair Weiss. Optical flow estimation, Mathematical models for
Computer Vision: The Handbook. N. Paragios, Y. Chen, and O. Faugeras (eds.), Springer,
2005.
[3] J. L. Barron, D. J. Fleet, and S. S. Beauchemin. Performance of optical flow
techniques. International Journal of Computer Vision, 12(1):43 – 77, 2007
[4] Yoav Freund and Robert E. Schapire, A decision-theoretic generalization of on-line
learning and an application to boosting, In Computational Learning Theory: Eurocolt ’95,Springer-Verlag, 1995.
[5] Paul Viola and Michael J. Jones, Rapid Object Detection using a Boosted Cascade
of Simple feature, IEEE CVPR, 2001.
[6] Multi-part Vehicle Detection using Symmetry Derived Analysis and Active
Learning, Ravi Kumar Satzoda, Member, IEEE and Mohan M. Trivedi, Fellow, IEEE.Accepted for Publication in IEEE Transactions on Intelligent Transportation Systems
[7] Ilustrated example in the calculation of the Local Binary Pattern for a pixel
with neighborbood of size 8
Website tham kha o
[10] CV oline: http://homepages.inf.ed.ac.uk/rbf/CVonline/Imagedbase.htm
[11] Wikipedia: http://www.wikipedia.org
[12] Youtube: https://www.youtube.com/watch?v=p5T8RzYE60M