Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 1/62

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

Khoa công nghệ thông tin 1

ĐÔ A NTÔ T NGHIÊ P ĐA I HO C

Đê ta i:

“NGHIÊN CƯ U VA XÂY DƯ NG PHẦN MỀM GIÁM SÁT VÀ CẢNH BÁO

VA CHẠM Ô TÔ TRÊN THIÊ T BI DI ĐÔ NG”

Giảng viên hướ ng dẫn: Ths.Nguyễn Thanh Thủy

Sinh viên thự c hiện : Vũ Tuyên Hoàng

Lớ p : D11CNPM2

Khóa :Hê :

2011 – 2016Ch nh quy

Ha nô i 12/2015



LƠ I CA M ƠN

Sau thơ i gian ho c tâ p, nghiên cư u trong Khoa Công nghê thông tin, cuô i cu ng em cu nghoa n tha nh đô a n tô t nghiê p đê trơ tha nh tân ky sư vơ i đê ta i “Nghiên cư u va xây dư ng phâ nmê m gia m sa t va ca nh ba o va cha m ô tô trên thiê t bi di đô ng”.

Lơ i đâ u tiên, con xin gư i lơ i ca m ơn ba me , anh trai đa luôn bên con, đô ng viên, u ng hô ,ch ba o va đi nh hươ ng cho con trong suô t năm năm dươ i Ho c Viê n Công Nghê Bưu Ch nhViễn Thông đê con co đươ c tha nh qua như nga y hôm nay.

Sau đo , em xin ca m ơn ca c thâ y cô trong Ho c Viê n no i chung va Khoa Công Nghê ThôngTin 1 no i riêng đa ân câ n, tâ n t nh gia ng da y cho em như ng kiê n thư c vê chuyên nga nh va như ng kiê n thư c vê la m ngươ i đê em co điê u kiê n ho c tâ p tô t nhâ t ta i Ho c Viê n.

Đă c biê t em xin gư i lơ i ca m ơn sâu să c tơ i Ths.Nguyễn Thanh Thu y đa ch ba o tâ n t nh va đô ng viên em đê em co thê hoa n tha nh đô a n tô t nghiê p mô t ca ch tô t nhâ t trong thơ i gian

qua.

Điê u cuô i cu ng em muô n chu c ca c thâ y cô trong khoa Khoa Công Nghê Thông Tin 1

ma nh kho e, luôn vui ve đê truyê n đa t nhiê u kiê n thư c cho chu ng em.

Em xin chân tha nh ca m ơn!

Ha nô i, 08/12/2015

Vu Tuyên Hoa ng



3

MU C LU C

DANH MU C CA C HI NH VE , SƠ ĐÔ ............................................................................. 5

DANH MỤC CÁC BẢNG ................................................................................................. 7

MƠ ĐÂ U ............................................................................................................................. 8

CHƯƠNG 1: GIƠ I THIÊ U CHUNG ............................................................................ 10

1.1. Hê thô ng gia m sa t va ca nh ba o va cha m ô tô ................................................ 10

1.2.

Pha m vi ba i toa n .............................................................................................. 11

1.3. Nghiên cư u liên quan ....................................................................................... 11

1.3.1. Sư du ng hê thô ng ca m biê n, hê thô ng kiê m soa t thông minh .................... 11

1.3.2.

Sư du ng phương pha p xư ly a nh ................................................................ 13

1.3.2.1. Phương pha p loa i trư nê n ....................................................................... 14

1.3.2.2. Phương pháp Optical flow ..................................................................... 16

1.4.

Ưu nhươ c điê m cu a ca c phương pha p đa pha t triê n .................................... 17

CHƯƠNG II: GIA I PHA P GIA M SA T VA ĐƯA RA CA NH BA O .......................... 18

2.1. Đê xuâ t gia i pha p tô ng thê .............................................................................. 18

2.1.1.

Nhâ n da ng đô i tươ ng ô tô .......................................................................... 18

2.1.2. Pha t hiê n la n đươ ng ................................................................................... 19

2.1.3.

Xư ly

thông tin va

đưa ra ca nh ba

o ............................................................ 20

2.2.

Nhâ n da ng đô i tươ ng ....................................................................................... 20

2.2.1. Kiê n thư c chung ......................................................................................... 20

2.2.1.1.

Tô ng quan vê video ................................................................................ 21

2.2.1.2.

Pha t hiê n đô i tươ ng chuyê n đô ng ........................................................... 23

2.2.1.3. Thuâ t toa n huâ n luyê n AdaBoot ............................................................ 25

2.2.1.4.

Đă c trưng Haar-like va mô h nh cascade ............................................... 26

2.2.1.5.

Đă c trưng Local Binary Pattern ............................................................. 29

2.2.2. Ca c bươ c nhâ n da ng đô i tươ ng .................................................................. 31

2.2.2.1.

Thu thâ p dư liê u ..................................................................................... 32

2.2.2.2.

Tiê n xư ly dư liê u ................................................................................... 34

2.2.2.3.

Huấn luyện ............................................................................................. 35

2.2.2.4.

Nhận dạng .............................................................................................. 36

2.3.

Pha t hiê n la n đươ ng ........................................................................................ 37



4

2.3.1.

Pha t hiê n điê m cư c tri Scale-space va thiê t lâ p vu ng quan tâm................. 37

2.3.1.1.

Pha t hiê n điê m cư c tri Sacle-space......................................................... 38

2.3.1.2. Ma ho a a nh theo khu vư c ....................................................................... 40

2.3.2.

Thuâ t toa n Canny va biê n đô i Hough ........................................................ 40

2.4.

Xư ly dư liê u va đưa ra ca nh ba o ................................................................... 44

2.4.1. Ươ c lươ ng khoa ng ca ch ............................................................................. 44

2.4.2.

Dư đoa n tô c đô ........................................................................................... 45

CHƯƠNG 3: XÂY DƯ NG PHÂ M MÊ M THƯ NGHIÊ M VA ĐA NH GIA KÊ T QUA ........................................................................................................................................... 46

3.1.

Thư nghiê m va đa nh gia kê t qua . ................................................................... 46

3.1.1.

Qua tr nh thu thâ p dư liê u .......................................................................... 46

3.1.1.1.

Dư liê u đâ u va o ...................................................................................... 46

3.1.1.2. Đô i tươ ng huâ n luyê n ............................................................................. 47

3.1.2. Qua tr nh huâ n luyê n.................................................................................. 49

3.1.2.1.

Môi trươ ng phâ n cư ng huâ n luyê n la ..................................................... 49

3.1.2.2.

Ca c bươ c huâ n luyê n .............................................................................. 50

3.1.3. Thư nghiê p va đa nh gia kết qua ................................................................. 54

3.2.

Phâ n mê m gia m sa t va ca nh ba o va cha m ô tô trên thiê t bi di đô ng .......... 57

3.2.1.

Phân t ch thiê t kê hê thô ng ......................................................................... 58

3.2.2. Giao diê n chương tr

nh .............................................................................. 59

KÊ T LUÂ N VA HƯƠ NG PHA T TRIÊ N ..................................................................... 61

TÀI LIỆU THAM KHẢO ............................................................................................... 62



5

DANH MU C CA C HI NH VE , SƠ ĐÔ

H nh 1-1: La n đươ ng va đô i tươ ng ô tô ............................................................................. 10

H nh 1-2: Sơ đô tô ng quan cu a hê thô ng ........................................................................... 11

H

nh 1-3: Mô pho

ng ca

c ca

m biê n đang đươ c sư

du ng .................................................... 12

H nh 1-4: Ca c bươ c xư ly a nh. .......................................................................................... 13

H nh 1-5: Ảnh (a) là ước lượ ng nền cơ sở , ảnh (b) thu đượ c ở bướ c tiế p theo. ảnh (c) thể

hiện bản đồ điểm ảnh nổi tr ội phát hiện đượ c bằng cách sử dụng phép tr ừ nền. .............. 14

H nh 1-6: Frame ảnh tại thời điểm t trướ c và sau khi vẽ các vector có hướ ng ................. 17

H nh 2-7: Đô i tươ ng ô tô đươ c nhâ n da ng......................................................................... 18

H nh 2-8: La n đươ ng đươ c pha t hiê n ................................................................................ 19

H nh 2-9: Khoa ng ca ch an toa n ........................................................................................ 20

H nh 2-10: Câ u tru c phân đoa n video ................................................................................ 21

H nh 2-11: Biê u đô ma u cu a 4 loa i cơ ba n (a) a nh tô i (b) a nh sa ng .................................. 22

H nh 2-12: Tô ng quan ca c khô i xư ly trong ba i toa n pha t hiê n đô i tươ ng. ....................... 23

H nh 2-13: Pha t hiê n vu ng a nh nô i .................................................................................... 24

H nh 2-14: Xư ly ca c vu ng a nh nô i (Foreground Processing)........................................... 24

H nh 2-15: Minh họa của thuật toán AdaBoost. ................................................................ 25

H nh 2-16: Bô phân loa i ma nh H(x) sau khi xây dư ng bă ng AdaBoostError! Bookmarknot defined. H nh 2-17: Ca c đă c trưng Haar like cơ ba n ....................................................................... 27

H nh 2-18: Minh họa ví dụ trong tính toán của các mẫu nhị phân cục bộ cho một pixel lâncâ n ...................................................................................................................................... 30

H nh 2-19: LBP bâ t biê n bâ t biê n vơ i ca ch thay đô i đơn trong mư c xa m ......................... 31

H nh 2-20: Khung h nh triê t xuâ t tư video đâ u va o. .......................................................... 33

H nh 2-21: Chuỗi các khung hình liên tiế p tách ra từ video (từ 1 đến 6) .......................... 33

H nh 2-22: Tậ p huấn luyện của các bộ học yếu ................................................................ 34

H nh 2-23: Mẫu Negative .................................................................................................. 35

H nh 2-24: hững đặc trưng Haar -like đầu tiên đượ c chọn trong bộ nhận dạng ................ 36

H nh 25: biê u diễn Scale-space ......................................................................................... 38

H nh 2-26: Biểu đồ mô phỏng việc tính toán các DoG ảnh từ các ảnh k ề mờ .................. 39

H nh 2-27: Mỗi điểm ảnh đượ c so sánh vớ i 26 láng giềng của nó .................................... 39

H nh 2-28: Khu vư c pha t hiê n la n đươ ng trong vo ng tro n ma u đo Error! Bookmark not

defined. H nh 2-29: v du a nh đươ ng viê n ....................................................................................... 41

H nh 2-30: A p dụng các biến đổi Hough cho đườ ng thẳng............................................... 43

H nh 2-31: Sau khi sư du ng thuâ t toa n hough va hough lines .......................................... 43

H nh 2-32: điê m kê t thu c cu a đươ ng khi sư du ng biê n đô i hough theo xa c suâ t .............. 43

H nh 2-33: Kết qua cuối cu ng ........................................... Error! Bookmark not defined. H nh 2-34: Mẫu h nh a nh ơ ca c khoa ng ca ch kha c nhau vơ i đô i tươ ng la xe. .................. 45

H nh 2-35: Sơ đô thê hiê n mô i quan hê giư a k ch thươ c va khoa ng ca ch ......................... 45



6

H nh 3-1: Sơ đô khô i mô ta hoa t đô ng cu a hê thô ng. ........................................................ 58

H nh 3-2: Sơ đô chi tiê t cho qua tr nh nhâ n da ng đô i tươ ng ............................................. 59

H nh 3-3: Công cụ Object Marker giúp tạo các mẫu huấn luyện ...................................... 51

H nh 3-4: Minh họa quá trình chạy công cụ huấn luyện bộ nhận dạng ............................ 53

H nh 3-5: Nhâ n da ng đô i tươ ng xe ph a trươ c................................................................... 55

H nh 3-6: Pha t hiê n la n xe. ................................................................................................ 55

H nh 3-7: Đo khoa ng ca ch tơ i xe ph a trươ c. .................................................................... 55



7

DANH MỤC CÁC BẢNG

Ba ng 1: Đô ch nh xa c viê c pha t hiê n đô i tươ ng xe trong 10s đâ u ............................... 56

Ba ng 2: Thơ i gian nhâ n da ng xe cu a mươ i xe trên thư c tê .......................................... 56

Ba

ng 3: Sô đô i tươ ng đo đươ c khoa

ng ca ch trong 10s đâ u ......................................... 56

Ba ng 4: Thơ i gian đo khoa ng ca ch cu a mươ i xe trong thư c tê .................................... 56



8

MƠ ĐÂ U

Đâ t nươ c ta đang thơ i thơ i k Công nghiê p ho a – Hiê n đa i ho a, vơ i sư tiê n bô va pha ttriê n không ngư ng trên tâ t ca ca c l nh vư c trong cuô c sô ng la m châ t lươ ng cuô c sô ng nga yca ng tăng cao. Khi xa hô i đi lên, nhu câ u đi la i, vâ n chuyê n cu a con ngươ i nga y ca ng caova câ n thiê t. Ch nh v vâ y giao thông nă m vai tro chu trô t trong xa hô i hiê n nay.

Trong những năm gần đây, Ô tô là phương tiện giao thông chủ yếu và ngày càng

phát triển hơn chiếm phần lớ n trong các quốc gia trên thế giới. Ô tô đã giải quyết các vấn

đề đi lại của con ngườ i và giảm thiểu đượ c thời gian đi lại đáng kể của mỗi chúng ta. Trên

thế giớ i có r ất nhiều hãng sản xuất xe nổi tiếng, lâu đờ i có thể k ể đến như: Mercedes,BMV, Honda... Theo số liệu thống kê của Bộ Giao thông Vận tải, trong 9 tháng của năm2015, lực lượ ng CSGT toàn quốc đăng ký mới 230.008 xe ôtô và hơn 2,2 triệu xe môtô,nâng tô ng số phương tiện đang quản lý lên 2,5 triệu xe ôtô và 43,4 triệu xe môtô. Chỉ t nhriêng sô vu ta i na n trong tháng 9 (tính từ ngày 16/8/2015 đến 15/9/2015), cả nướ c xảy ra

1.837 vụ, làm chết 697 ngườ i, làm bị thương 1.695 người. Sô vu tai na n đa gia m so vơ i

cu ng ky năm 2014 nhưng vẫn co n ơ mư a đa ng ba o đô ng.

Công nghệ cảnh báo tai nạn đượ c các hãng xe ô tô chú tr ọng nghiên cứu và phát triển

từ khá lâu. Ở hầu hết các mẫu xe hiện đại, hệ thống cảnh báo tai nạn hoạt động dựa trên

thông tin từ các cảm biến dọc thân xe có nhiệm vụ phát hiện vật cản, nguy cơ va chạm,

tr ạng thái xe bất thườ ng, từ đó kích hoạt hàng loạt các chức năng an toàn để thông báo

cho lái xe đồng thờ i giảm thiểu tổn thương cho ngườ i ngồi trong xe. Không chỉ bảo vệ

hành khách bằng cách tự siết chặt dây an toàn, nhiều mẫu xe hiện đại còn đượ c trang bị hàng loạt các tính năng an toàn như hệ thống cân bằng điện tử ESP, hệ thống phanh khẩn

cấ p BA, hệ thống chống bó cứng phanh ABS, hệ thống kiểm soát hành trình thông minh

ACC… Gần đây, nhiều công nghệ cảnh báo tai nạn đượ c các nhà khoa học tại Mỹ tíchcực nghiên cứu, trong đó phải k ể đến công nghệ dự đoán hành động của tài xế qua quan

sát ngôn ngữ cơ thể, công nghệ tự động liên lạc giữa các xe đang lưu thông trên đườ ng

khi có nguy cơ tai nạn xảy ra…

Khi con ngườ i sử dụng ô tô là phương tiện giao thông đi lại chủ yếu của mình hơn,thì hằng năm có rất nhiều vụ giao thông bằng ô tô đã xảy ra đã cướp đi bao nhiêu sinhmạng… Mấy năm trở lại đây, các công ty và các nhà phát triển trên thế giới đã chú trọng

hơn và không ngừng nghiên cứu phát triển các thiết bị cảnh báo va chạm ô tô nhằm góp

phần giảm thiểu nguy cơ va chạm do con ngườ i gây ra. Có thể k ể tớ i các thiết bị như công

nghệ V2V, Hệ thống cảnh báo chống va chạm giữa ôtô và xe đạ p vừa đượ c hãng xe Volvogiớ i thiệu tại triển lãm công nghệ CES 2015 va đă c biê t la thiê t bi nho go n Mobileye của

Isarel cảnh báo va chạm tai nạn sớm cho ô tô đã và đang rất nổi tiếng trên thế giớ i.

Y thư c tâ m quan tro ng cu a viê c ba o vê sư an toa n cho ca c chu phương tiê n tham giagiao thông băng ô tô va gia m các chi phí cho các thiết bị trên khá đắt, nên đề tài “ Phâ nmê m gia m sa t va ca nh ba o va cha m ô tô trên ca c thiê t bi di đô ng ”nhằm góp phần giảm

thiểu r ủi ro va chạm và phổ biến, thông dụng hơn cho tất cả mọi ngườ i lái xe ô tô.



9

Trong pha m vi đô a n cu a m nh, em xin đê xuâ t xây dư ng phâ n mê m gia m sa t va ca nh ba o va cha m ô tô co thê sư du ng đê pha t hiê n la n đươ ng đưa ra ca nh ba o nê u phương tiê nđi lâ n la n đươ ng, va pha t hiê n ô tô ph a trươ c.

Nô i dung đô a n bao gô m 3 chương như sau:

Chương 1: Giơ i thiê u chung

Phâ n na y se giơ i thiê u gia i pha p vê ca ch nhâ n da ng đô i tươ ng va đưa ra ca nh ba o.Ca ch tiê p câ n, phương pha p phu hơ p gia i quyê t vâ n đê ba i toa n.

Chương 2: Gia i pha p gia m sa t va đưa ra ca nh ba o

Chương na y se đưa ra nhưng ba i toa n nho trong hê thô ng va ca c phương pha p xâydư ng hê thô ng ư ng du ng.

Chương 3: Xây dư ng phâ n mê m thư nghiê m va đa nh gia kê t qua

Trong chương na y tr nh ba y cu thê vê qua tr nh xây dư ng hê thô ng phâ n mê m gia m

sa t va ca nh ba o va cha m ô tô, ca c bươ c thư c hiê n thư c nghiê m, kê t qua thư c nghiê m đa tđươ c. Như ng kê t qua ư ng dư ng hê thô ng đa đa t đươ c, nhưng khuyê t điê m va ca ch khă c phu c trong tương lai.



10

CHƯƠNG 1: GIƠ I THIÊ U CHUNG

Chương na y se giơ i thiê u tô ng qua t ba i toa n gia m sa t va ca nh ba o va cha m ô tô khilưu thông trên đươ ng bao gô m mu c tiêu, đô i tươ ng hươ ng tơ i va pha m vi cu a ba i toa n.Trong phâ n na y cu ng tr nh ba y tô ng quan vê ca c phương pha p liên quan gia i quyê t ba i

toa n.

1.1. Hê thô ng gia m sa t va ca nh ba o va cha m ô tô

Hê thô ng gia m sa t va ca nh ba o va cha m ô tô la hê thô ng co kha năng phân t ch, xư ly như ng h nh a nh thu đươ c tư camera cu a ca c thiê t bi di đô ng như mobile hay tablet, va xa cđi nh ca c đô i tươ ng la la n đươ ng va ô tô đang tham gia lưu thông, tư đo go p phâ n đưa ranhư ng phân t ch nhă m ca nh ba o cho t nh tra ng hiê n ta i cu a phương tiê n.

: La n đươ ng va đối tươ ng ô tô

Hê thô ng bao gô m 2 phâ n ch nh câ n quan tâm la : phâ n theo do i đôi tươ ng va phâ n đưara ca nh ba o.

Phâ n theo do i đô i tươ ng:

Đâ u va o: Video thu đươ c tư camera Đâ u ra: Nhâ n da ng đô i tươ ng thu đươ c tư camera đâ u va o va pha t hiê n la n đươ ng

Phâ n đưa ra ca nh ba o:

Đâ u va o: Ca c đô i tươ ng đa nhâ n da ng đươ c

Đâ u ra: Theo do i đô i tươ ng va đưa ra ca nh ba o



11

: Sơ đồ tô ng quan cu a hê thống

Hê thô ng sư du ng camera đê thu đươ c ca c video, sau đo se ta ch tha nh ca c khungh nh liên tiê p nhau đê la m đâ u va o qua tr nh xư ly a nh. Ơ bươ c na y hê thô ng se sư du ngca c phương pha p đa đươ c huâ n luyê n đê nhâ n da ng đô i tươ ng co trong a nh. Khi hê thô ng

đa nhâ n da ng đô i tươ ng co trong a nh tư đo pha t hiê n ra khoa ng ca ch giư a ca c đô i tươ ngva đưa ra ca nh ba o cho hê thô ng.

1.2. Pha m vi ba i toa n

Ba i toa n gia m sa t va ca nh ba o va cha m ô tô trên ca c thiê t bi di đô ng la mô t ba i toa nco thê a p du ng ơ pha m vi rô ng va ơ nhiê u điê u kiê n kha c nhau. Do ba i toa n đang trongqua tr nh nghiên cư u va pha t triê n lên em xin giơ i ha n ba i toa n theo mô t sô tiêu tr cu thê sau đê hê thô ng hoa t đô ng mô t ca ch tô t nhâ t.

Giơ i ha n vê pha m vi: ba i toa n a p du ng cho ca c phương tiên lưu thông ơ khu vư cngoa i tha nh trên la n đươ ng mô t chiê u.

Giơ i ha n vê thơ i gian: thơ i gian phương tiê n lưu thông ban nga y va như ng nơi co a nh sa ng tô t.

1.3.

Nghiên cư u liên quan

Vê ba i toa n gia m sa t va ca nh ba o va cha m ô tô trên ca c thiê t bi no i chung đa co râ tnhâ t nhiê u gia i pha p tiê p câ n vâ n đê na y. Phâ n na y se tr nh ba y mô t sô gia i pha p đươ c sư dung nhiều nhất đê gia i quyết ba i toa n trên.

1.3.1.

Sư du ng hê thô ng ca m biê n, hê thô ng kiê m soa t thông minh

Đã co nhiê u nghiên cứu, phát triển và ứng dụng trong suốt 20 năm qua trên khă p thê giơ i, các hệ thống ngăn ngừa va chạm sử dụng nhiều cảm biến để phát hiện nguy cơ vachạm vớ i các xe khác. Khi va chạm sắ p xảy ra, hệ thống này sẽ cảnh báo tài xế, hoặc tự

động phanh xe hay cao cấp hơn là tự đánh lái để né tránh.

Camera Ca c khun h nh Tiê n xư l a nh

Pha t hiê n ha nh vi Theo do i đô i tươ n Nhâ n da n đô i tươ n

Đưa ca nh ba o



12

Mô t v du tiêu biê u vê hê thô ng ca nh ba o va cha m ph a trươ c đươ c biê t đê n phô biê nnhâ t la công nghê an toa n Toyota Safety Sense, Prometheus va do ng xe thông minh trongtương lai gâ n.

Công nghệ Safety Sense sẽ mang đến hệ thống cảnh báo va chạm phía trướ c vớ i hệ

thống điều khiển bằng laser. Hê thô ng sẽ cảnh báo ngườ i lái phương tiê n ca c kha năngxảy ra va chạm như vươ t qua tô c đô , khoa ng ca ch vơ i xe ph a trươ c qua gâ n. Nếu ngườ ilái ta c đô ng gia m tô c đô sau tín hiệu cảnh báo, hệ thống phanh khẩn cấ p tự động sẽ hoạt

động dư a trên ca c nguyên tă c đâ u va o kha c nhau đê ta c đô ng va o tô c đô cu a xe, như giảm

tốc độ của xe xuống 30 km/h hoă c dư ng phương tiên hoàn toàn.

Hệ thống cảnh báo va chạm phía trướ c hoạt động khi vận tốc xe nằm trong khoảng

16 – 138 km/h và khi tốc độ giữa 2 xe chênh lệch lớn hơn 16 km/h [13]. Trong khi đó, hệ

thống phanh khẩn cấ p tự động hoạt động khi vận tốc đạt từ 11 đến 79 km/h. Bên cạnh đó,công nghệ mới này còn mang đến cho người dùng tính năng cảnh báo khở i hành sai làn

đườ ng.[13]

: Mô pho ng ca c ca m biến đang đươ c sư du ng

Ta i Nhật Bản đa khở i xướ ng chương trình xe an toàn tiên tiến để phát triển công

nghệ tiên tiến tránh các vụ tai nạn. Chương trình Prometheus đã đa pha t triê n trong mô t

thơ i gian da i đươ c coi như mô t ngươ i la i phu , dư a n đươ c pha t triê n ơ Nhâ t ba n vơ i ca c chức năng sau: giám sát làn đườ ng, và xe tự tr ị.

Ta i Hoa ky , hệ thống hỗ tr ợ lái xe tiên tiến đượ c gọi là (ADAS), sản phẩm tiế p tục

nghiên cứu và phát triển ngày càng cải thiện hơn. K ết quả là hê thô ng có khả năng cảm

nhận tình huống nguy hiểm và phản ứng một cách thích hợ p trong trườ ng hợ p ngườ i lái

xe không phải kiểm soát đượ c.



13

Hê thô ng xe thông minh là một thực tế đa đang va se pha t triê n lơ n ma nh trong như ngnăm tơ i va đi va o cuô c sô ng con ngươ i nhă m đem la i sư an toa n cho mỗi chu ng ta.

1.3.2. Sư du ng phương pha p xư ly a nh

Camera la tha nh tư u tha nh công cu a loa i ngươ i trong vâ n đê thu nhâ n a nh. Viê c sư du ng camera la m thiê t vi theo do i va ca nh ba o giao thông đa đươ c a p du ng trong như ngnăm gâ n đây trên nươ c ta. Trướ c kia, các video này sẽ đượ c gửi tớ i những người điều hành

đườ ng bộ chịu trách nhiệm giám sát tr ực tiế p. Nhưng ngày nay, ngoài việc sử dụng con

ngườ i thì ca c hê thô ng co sư du ng khoa ho c tâ m nh n ma y t nh co các thuật toán xử lý ảnh

đã có thể tự động đưa ra các phân tích, thu thậ p thông tin từ các video giao thông giúp cho

việc giám sát tr ở nên dễ dàng và tự động hóa hơn rất nhiều.

Về cơ bản, các thông tin về hình ảnh thu đươ c tư camera sẽ đượ c số hóa sử dụng các

phần cứng trong máy tính, máy tính đó cũng đượ c tính hợ p những phần mềm đươ c thiê tkê để có thể tính toán các số liệu giao thông cần thiết. Các thuật toán xử lý ảnh hoàn toàn

có thể đượ c sử dụng trong việc thay thế những thiê t bi ca m biê t bằng một camera giám sát

duy nhất, cung cấ p một phạm vi r ộng để có thể nhận dạng các đối tượ ng và ngoài ra còn

có chi phí bảo trì sửa chữa thấ p.

Ca c bươ c xư ly a nh:

: Ca c bươ c xư ly a nh.

Phần thu nhận ảnh: Ảnh có thể nhận qua thiê t bi camera. Có thể là a nh màu hoặca nh đen trắng với độ phân giải khác nhau.

Tiề n xử lý: la qua tr nh lọc nhiễu, nâng cao chất lượ ng ảnh. Phân vùng ảnh hay phân

đoạn: tách ảnh thành các vùng hoặc đối tượ ng quan tâm.

Biể u diễ n ảnh: Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng(feature extraction).

Cơ sơ tri thư c

Thu nhâ na nh

Nhâ n da ngva nô i suy

Biê u diễnva mô ta

Phân đoa na nh

Tiê n xư ly a nh



14

Nhận d ạng và nội suy ảnh: Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này

thường thu đượ c bằng cách so sánh vớ i mẫu chuẩn đã đượ c học (hoặc lưu) từ trướ c. Nội

suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng.

Cơ sở tri thứ c: Nhằm giúp quá trình xử lý và phân tích ảnh theo cách làm của con

ngườ i.

Các hệ thống nhận dạng sử dụng phương pha p xử lý ảnh có khả năng nhâ n da ng các phương tiện giao thông kha c nhau đang lưu thông đê co thê tính toán khoảng cách giư aca c phương tiê n và tốc độ cho mỗi loại phương tiện và trên từng làn đườ ng... mang la i sư hiê u qua hư a he n cho ba i toa n gia m sa t va ca nh ba o va cha m mà đồ án đang quan tâm.

1.3.2.1.

Phương pha p loa i trư nê n

Nhận dạng đối tượ ng chuyển động trong video là một trong những vấn đề quan tr ọng

cần phải giải quyết của lĩnh vực thị giác máy tính. Một trong những hướ ng tiế p cận đó là phải phân biệt đượ c giữa đối tượ ng ( foreground ) và cảnh vật, phông nền (background ).

Trong các hệ thống nhận dạng và theo dõi, thuật ngữ nền (background ) dùng để chỉ tậ phợp các điểm ảnh không có sự chuyển động hoặc các điểm ảnh không thuộc về bất cứ đối

tượ ng nào cần quan tâm [9].

Nhâ n da ng đô i tươ ng chuyê n đô ng tư chuỗi video la nê n ta ng va ta c vu quan tro ngtrong viê c gia m sa t video, kiê m tra va phân t ch t nh tra ng giao thông, gia m thiê u tai na n,do t m va theo do i con ngươ i…Phương pha p chung đê nhâ n da ng đô i tươ ng chuyê n đô ngla trư nê n, ơ đây mỗi khung video đươ c so sa nh vơ i mô h nh tham chiê u hoă c mô h nh trư nê n. Ca c pixel trong frame hiê n thơ i ma lê ch đa ng kê so vơ i nê n se đươ c xem như la đô itươ ng chuyê n đô ng. Như ng pixel na y đươ c xư ly tiê p cho viê c đi nh vi va theo do i đô i

tươ ng. Loại tr ừ nền là một trong những k ỹ thuật cơ bản của xử lý ảnh trong đó hướ ng giảiquyết cơ bản là đi xây dựng một mô hình nền từ video ban đầu tức là từ tậ p các khung

hình trích xuất ra từ video đó, sau đó sử dụng mô hình này cùng vớ i khung hình hiện tại

cần xét từ đó rút ra được các đối tượ ng chuyển động. Ưu điểm của phương pháp này làkhá đơn giản.

: Ảnh (a) là ước lượ ng nền cơ sở , ảnh (b) thu đượ c ở bướ c tiế p theo. ảnh (c) thể hiện bản đồ điể m ảnh nổ i tr ội phát hiện đượ c bằ ng cách sử d ụng phép tr ừ nề n.



15

Bất cứ một sự thay đổi đáng kể nào trên một vùng ảnh từ mô hình nền sẽ đượ c hiểu

r ằng đó là một đối tượ ng chuyển động. Tậ p hợ p những điểm ảnh tạo nên vùng ảnh có sự

thay đổi đó sẽ được lưu lại để xử lý.

Thông thườ ng các thuật toán liên k ết đối tượ ng sẽ đượ c sử dụng để xử lý tậ p những

điểm ảnh trên thành các đối tượ ng liên k ết vớ i nhau qua từng khung hình, tiến trình này

đượ c gọi là loại tr ừ nền.

Thuâ t toa n trư nê n Thuâ t toa n câ p nhâ p nê n

Input: ảnh nền B, ảnh hiện tại I và ma tr ận

ngưỡ ng T

Output : ảnh M là mặt nạ chuyển động

m:=getHeight(M);n:=getWidth(M);

for x:=1 to m do

for y:=1 to n do

if | B[x,y]-I[x,y] | > T[x,y] then

M[x,y]:=255;

else M[x,y]:=0;

Input: nền B, ảnh hiện tại I và mặt nạ

chuyển động M

Output: nền B đượ c cậ p nhật lại

m:=getHeight(B);n:=getWidth(B);

for x:=1 to m do

for y:=1 to n do

if M[x,y]=0 then

B[x,y]:=α*B[x,y]+(1-α)*B[x,y];

Đô chênh lê ch cu a ca c khung h nh

Để tính toán ra đượ c ảnh chỉ chứa nền thì một tậ p những chuỗi khung hình sẽ đượ clấy giá tr ị trung bình. Cụ thể ảnh nền tại thời điểm sẽ được tính bằng cách:

, 1 ∑ 1 , , 1

=

Trong đó là số lượng khung hình sử dụng để tính trung bình. Giá trị trung bình

này có liên quan đến giá trị trung bình của mỗi điểm ảnh trong những khung hình đó,bằng bao nhiêu sẽ phụ thuộc vào t ốc độ của video (số khung hình/giây) và t ổng số

những chuyển động có trong video đó. Sau khi tính toán được ảnh nền B, t hì có

thể sử dụng để loại tr ừ trong ảnh I , , tại thời điểm tương ứng và lấy ngưỡng, nghĩalà đối tượ ng sẽ đượ c tính theo:

| , , , | > ℎ

(1.1)

(1.2)



16

Trong đó là Th ngưỡng tương tự như phương pháp trên. Ngoài cách lấy giá tr ị trung

bình thì có thể dùng giá tr ị trung vị để tính ảnh nền, cách làm cũng tương tự vớ i giá tr ị trung bình.

Ha m Gaussian

Hướ ng tiế p cận này sẽ tính toán cho mỗi điểm ảnh

, m

ột cách độc l

ập. Trong

đó hàm mật độ xác suất Gaussian sẽ được sử dụng với n điểm ảnh ở khung hình trướ cđó. Để tránh việc phải tính lại hàm mật độ này ở mỗi khung hình mớ i, giá tr ị trung bình

qua các khung hình sẽ đượ c tính theo công thức:

1 −

Vớ i và là giá tr ị của điểm ảnh và giá tr ị trung bình tại thời điểm t và − là giá

tr ị trung bình tại thời điểm trước đó, là tr ọng số đượ c chọn tùy thuộc vào sự lựa chọn

ưu tiên giữa độ ổn định hay là tốc độ cậ p nhật giá tr ị. Tại mỗi khung hình ở thời điểm t,

giá tr ị sẽ được coi là đối tượ ng nếu nó thỏa mãn điều kiện:

| | >

Nếu không thỏa mãn thì sẽ được coi là nền. Với là độ lệch tiêu chuẩn của phân

phối Gaussian và có thể tính đượ c một cách dễ dàng giống như

Mỗi một cách tiế p cận đều có ưu điểm và nhược điểm riêng tùy thuộc vào đặc điểm

của video đầu vào mà sử dụng cho phù hợp. Ý tưở ng chung của các phương pháp này đều

là để có thể phát hiện ra các đối tượ ng chuyển động trong video thì phải xây dựng đượ cmô hình nền, mô hình này có thể đượ c học qua các khung hình lấy từ video đó. Sau đómô hình nền này sẽ đượ c sử dụ ng để so sánh vớ i khung hình hiện tại và k ết quả sẽ có

đượ c vùng nền và vùng đối tượng. Sau khi có được đối tượ ng r ồi thì việc bám theo đốitượ ng sẽ tr ở nên đơn giản hơn nhiều.

1.3.2.2. Phương pháp Optical flow

Phương pháp Optical flow [2] thực hiện bằng cách sử dụng các vector có hướ ng của

các đối tượ ng chuyển động theo thời gian để phát hiện các vùng chuyển động trong một

ảnh [3].

Ý tưở ng quan tr ọng của phương pháp tính optical flow dựa trên giả định sau:

Bề ngoài của đối tượ ng không có nhiều thay đổi (về cường độ sáng) khi xét từ framethứ n sang frame n+1

I(,t) = I( + ,t +1)

Trong đó:

I(,t) là hàm tr ả về cường độ sáng[4] của điểm ảnh tại thời điểm t (frame thứ

t).

(1.3)

(1.4)

(1.5)



17

, là tọa độ của điểm ảnh trên bề mặt (2D), (, ) là vector vận

tốc, thể hiện sự thay đổi vị trí của điểm ảnh từ frame thứ t sang frame t+1.

: Frame ảnh t ại thời điểm t trướ c và sau khi vẽ các vector có hướ ng

1.4.

Ưu nhươ c điê m cu a ca c phương pha p đa pha t triê n

Ca c gia i pha p trên đê u đưa ra ca c gia i pha p t nh toa n nhă m ha n chê ca c kha năng vacha m khi đang lưu thông trên đươ ng. Vơ i giơ i ha n ba i toa n co thê ru t ra đươ c mô t sô phânt ch va nhâ n xe t như sau:

Đô i vơ i biê n pha p sư du ng ca m biê n va hê thô ng kiê m soa t th gia i pha p na y chohiê u qua cao nhâ t v sư du ng ca c thiê t bi chuyên biê t, mỗi thiê t bi co mô t nhiê mvu riêng. Nhươ c điê m cu a biê n pha p la la kinh ph lă p đă t, ph ba o tr lơ n, chưaa p du ng đươ c ơ ca c do ng xe phô thông.

Vơ i cơ sơ ha tâ ng hiê n nay ơ Viê t Nam, viê c sư du ng ca c thiê t bi thông minhsmartphone đa trơ lên phô biê n th co thê thư c hiê n triê n khai hê thô ng bă ng ca chsư thuâ t toa n xư ly a nh nhă m că t gia m chi ph va phô biê n cho ngươ i tham giagiao thông. Vơ i viê c khoa ho c ma y t nh nga y ca ng pha t triê n th viê c ta c đô nghay can thiê p va o sâu trong ca c thiê t bi di đô ng th đươ c nghiên cư u va hỗ trơ nhiê u hơn. Ch nh v thê ơ đê ta i na y em se sư du ng thuâ t toa n xư ly a nh trongviê c nhâ n da ng va ca nh ba o va cha m ô tô se đươ c tr nh ba y trong chương sau.



18

CHƯƠNG II: GIA I PHA P GIA M SA T VA ĐƯA RA CA NH BA O

Chương na y se tr nh ba y ca c phương pha p gia i quyê t ba i toa n gia m sa t va đưa ca nh ba o va cha m ô tô trên ca c thiê t bi di đô ng.

2.1. Đê xuâ t gia i pha p tô ng thê

Như đa tr nh ba y ơ trên, ơ ba i toa n na y em se sư du ng gia i pha p xư ly a nh đê gia iquyê t ba i toa n. Ba i toa n lơ n na y se gô m 3 ba i toa n nho , mỗi ba i toa n se tiê p câ n mô t ca chxư ly va thuâ t toa n kha c nhau phu hơ p vơ i hoa n ca nh va điê u kiê n đă t ra.

Ba i toa n nhâ n da ng đô i tươ ng ô tô

Ba i toa n pha t hiê n la n đươ ng

Ba i toa n xư ly thông tin va đưa ra ca nh ba o

Trong giơ i ha n nghiên cư u đô a n na y, em xin phe p tr nh ba y ca c phương pha p kha cnhau cho ca c ba i toa n nho ơ trên đê t ch hơ p gia i quyê t nghiê p vu cu a ba i toa n lơ n. Tư đo dư a va o thư c nghiê p đê đa nh, ru t ra ba i ho c đê tô i ưu ba i toa n.

2.1.1. Nhâ n da ng đô i tươ ng ô tô

Ba i toa n đâ u tiên ma hê thô ng câ n gia i quyê t la vâ n đê nhâ n da ng đô i tươ ng, ma cu thê trong ba i toa n đỗi tương la phương tiê n giao thông ô tô. Dư liê u đâ u va o cu a ba i toa nla la video thu đươ c ơ camera ca c thiê t bi di đô ng, hê thô ng câ n nhâ n da ng đô i tươ ng đangchuyê n đô ng. Kê t qua cu a bươ c nhâ n na y đươ c minh ho a bă ng h nh a nh

: Đôi tươ ng ô tô đươ c nhâ n da ng



19

Dư liê u thu đươ c tư video sẽ đượ c trích xuất ra các khung hình (frame), mỗi khung

hình là một đơn vị ảnh thu đượ c từ video đó, chất lượ ng của khung hình sẽ phụ thuộc hoàn

toàn vào chất lượ ng của video, và từ đó chất lượ ng của việc nhận dạng cũng bị ảnh hưở ng.

Chất lượ ng của video bao gồm các yếu tố như độ phân giải, tốc độ khung hình, cấu tạo

ống kính máy quay… Nê n cu a video thu đươ c se la cung đươ ng tham gia giao thông, đô itươ ng di chuyê n co thê la ô tô, xe ma y, xe đa p, ngươ i đi bô ,…

Kê t qua đâ u ra cu a bươ c nhâ n da ng đô i tươ ng na y se la phâ n quan tro ng liên quanmâ t thiê t tơ i đô ch nh xa c viê c đo khoa ng ca ch phâ n sau. Ch nh v vâ y nê u nhâ n da ng đô itươ ng không tô t th se a nh hươ ng tơ i nghiê p vu ba i toa n.

Cụ thể thuật toán đượ c lựa chọn để sử dụng trong bài toán này là thuật toán học máy

AdaBoost dựa trên mô hình cascade để phát hiện nhanh đối tượ ng. AdaBoost là một giải

thuật học máy đượ c phát triển bở i Yoav Freund và Robert Schapire, nó hoạt động dựa trên

nguyên tắc k ết hợ p những bộ phân loại yếu để thu đượ c một bộ phân loại mạnh hơn [4].

Từ lý thuyết đó Paul Viola và Michael Jones đã sử dụng mô hình cascade, bao gồm các

đặc trưng Haar để xây dựng nên các bộ phân loại từ đó có thể nhận dạng được đối tượ ng

vớ i một độ chính xác cao. Ngoài ra trong phạm vi đồ án em sẽ trình bày thêm một đặc

trưng khác có thể sử dụng k ết hợ p vớ i thuật toán AdaBoost đó là đặc trưng LBP, lý thuyết

cụ thể của phần này sẽ đượ c trình bày trong phần sau

2.1.2. Pha t hiê n la n đươ ng

Ba i toa n pha t hiê n la n đươ ng phu c vu cho mu c đich theo do i la n đươ ng khi phươngtiê n di chuyê n va gia m sa t đưa ca nh ba o nê u phương tiê n lâ n la n đươ ng. Ba i toa n se sư du ng ca c thuâ t toa n đê ta ch biên, pha t hiê n đươ ng tr nh ba y ơ phâ n sau đê pha t hiê n la nđươ ng trên đươ ng.

: La n đươ ng đươ c pha t hiê n



20

2.1.3.

Xư ly thông tin va đưa ra ca nh ba o

Sau khi đô i tươ ng ô tô đươ c nhâ n da ng tha nh công. Hê thô ng se theo do i đô i tươ ngva t nh toa n khoa ng ca ch tư camera tơ i đô i tươ ng đươ c nhâ n da ng ph a trươ c. Ba i toa n na yđă t ra mô t vâ n đê la trong khi ca c phương tiê n cu ng tham gia lưu thông, hay cu ng đang dichuyê n th co biê n pha p na o đê đo đươ c khoa ng ca ch

: Khoa ng ca ch an toa n

Hiê n nay viê c sư du ng camera tư moblie đê xa c đi nh khoa ng ca ch đi a ly giư a hai đô itươ ng đang di chuyê n la mô t điê u vô cu ng kho . Khi mô pho ng thực 3D thông qua ống

kính của một máy ảnh vào một hình ảnh 2D, một số thông tin se bị mất trong đo co ca cthông sô vê khoa ng ca ch vơ i ca c phương tiê n kha c. Camera không thể đưa ra bất cứ phép

đo thực sự của các khoảng cách trong thế giớ i thực chỉ nhìn một hình ảnh. Phâ n sau se

ch

ra phương pha p đê đo khoa ng ca ch na y.

2.2. Nhâ n da ng đô i tươ ng

2.2.1.

Kiê n thư c chung

Việc nhận dạng đối tượ ng có thể đượ c thực hiện bằng cách học từ những khung nhìn

(view) khác nhau của đối tượ ng một cách tự động thông qua một cơ chế học máy có giám

sát. Việc học từ những khung nhìn này giúp giảm thiểu yêu cầu phải lưu trữ một bộ hoàn

chỉnh tất cả các mẫu. Các k ỹ thuật học máy có giám sát sẽ xây dựng một hàm từ dữ liệu

huấn luyện, dữ liệu huấn luyện này bao gồm các cặ p gồm đối tượng đầu vào và đối tượ ng

đầu ra mong muốn. Đầu ra của hàm đó có thể là một giá tr ị liên tục, gọi là hồi quy

(regression) hoặc có thể là dự đoán một nhãn phân loại cho một đối tượng đầu vào, gọi là

phân loại (classification) [5]. Trong ngữ cảnh của nhận dạng đối tượ ng, các mẫu huấn

luyện đượ c xây dựng nên từ các đặc trưng của đối tượ ng k ết hợ p với đối tượ ng liên k ết

với đặc trưng đó, trong bài toán nhận dạng phương tiện giao thông có thể hiểu mẫu huấn

luyện sẽ bao gồm các phương tiện giao thông và các đặc trưng của các phương tiện đó.



21

Việc lựa chọn các đặc trưng sao cho phù hợp đóng một vai trò quan tr ọng cho hiệu

năng của các bộ phân loại, một tập các đặc trưng phù hợ p khi k ết hợ p vớ i nhau có thể

phân loại một nhãn đối tượ ng này với nhãn đối tượ ng khác. Một đặc trưng có thể là một

vùng đối tượng, hướ ng chuyển động của đối tượ ng, hàm mật độ của đối tượ ng

(histogram)… Sau khi lựa chọn được các đặc trưng phù hợ p thì k ết quả phân loại sẽ phụ

thuộc vào thuật toán học máy. Một số thuật toán có thể k ể đến như là mạng nơ -ron,

AdaBoost, cây quyết định, SVM (Support Vector Machine)…Trong nghiê p vu cu a hê thô ng em sẽ sử dụng thuật toán AdaBoost dựa trên mô hình

cascade do Paul Viola và Michael Jones phát triển, trong đó có sử dụng k ết hợp các đặc

trưng Haar -like để huấn luyện nhâ n da ng phương tiê n đang tham gia lưu thông. Ngoài rađể có sự so sánh và đánh giá với đặc trưng Haar -like em sẽ sử dụng thêm một đặc trưngkhác để huấn luyện là đặc trưng LBP ( Local Binary Patterns).

2.2.1.1. Tô ng quan vê video

Video la tâ p ca c khung h nh, mỗi khung h nh la mô t a nh. Shot (lia) la đơn vi cơ sơ cu a video. Mô t lia la đơn vi vâ t lyscuar do ng video, gô m ca c chuỗi ca c khung h nh liêntiê p, không thê chia nho hơn, ư ng vơ i mô t thao ta c camera đơn.

Scene (ca nh) la ca c đơn vi logic cu a do ng video, mô t ca nh gô m ca c lia liên quan vê không gian va thơ i gian, cu ng mô ta mô t nô i dung ngư ngh a hoă c mô t t nh tiê t.

: Cấu tru c phân đoa n video

Khi video đươ c chiê u, ca c khung h nh đươ c hiê n thi ơ tô c đô nhâ t đi nh. Tô c đô thươ ng thâ y ơ ca c video la 20-24 h nh/s. Như vâ y mô t video co sô khung h nh tương ư ngla 10800 – 90000. Du video ơ da ng na o HD, fullHD, 2K, …th no co dung lươ ng râ t lơ nđă c biê t la đô i vơ i ca c thiê t bi di đô ng vô n đa chê vê bô lơ n th la vâ n đê nan gia i.

video

Scene

Shots Lia

Frames



22

Phân loa i la qua tr nh phân t ch va chia nô i dung h nh a nh video tha nh ca c đơn vi cơsơ go i la ca c lia (shot). Viê c lâ y mâ u ch nh la viê c cho n gâ n đu ng khung video đa i diê ncho mỗi lia, va đươ c go i la khung- kho a.

Khung – kho a la khung h nh đa i diê n mô ta nô i dung ch nh cu a shot.

Qua tr nh phân đoa n giư liê u video tiê n ha nh phân t ch, pha t hiê n sư chuyê n đô i lia

na y sang lia kha c hay ch nh la sư pha t hiê n danh giơ i giư a ca c lia đo (hay no i đơn gia nhơn đo ch nh la sư kha c nhau giư a ca c khung h nh liê n kê .)

Thuô c t nh đă c trung cu a video gô m co : Color (ma u), Texture (kê t câ u), Shape (h nhda ng), Motion (chuyê n đô ng).

Color

Vơ i mỗi mô t a nh đê u co mô t biê u đô ma u đê biê u diễn sư phân bô ma u trong a nh, biê u đô ma u không phu thuô c va o viê c quay a nh, di ch chuyê n a nh, chiê u nh n ma phu thuô c va o hê ma u va ca c phương pha p đi nh lươ ng đươ c du ng.

: Biê u đồ ma u cu a 4 loa i cơ ba n (a) a nh tối (b) a nh sa ng

(c) a nh tương pha n thấp (d) a nh tương pha n cao

Texture

Đây la mô t đă c trung quan tro ng cu a bê mă t, nơi xa y ra viê c lă p la i mẫu cơ ba n.Co 2 da ng biê u diễn texture phô biê n la : biê u diễn dươ i da ng ma trâ n đô ng thơ i va biê u diễn Tamura

Ma trâ n đô ng thơ i mô ta hươ ng va khoa ng ca ch giư a ca c điê m a nh, ta co thê tr ch cho n đươ c ca c đă c điê m y ngh a.

Biê u diễn Tamura đươ c thu c đâ y nhơ nghiên cư u vê tâm l trong viê c thu nhâ ntrư c gia c cu a con ngươ i giu p biê u diễn a nh trư c quan hơn.



23

Shape

Ca c đă c trưng vê h nh da ng co thê chia tha nh đă c trưng toa n cu c hoă c đă c trưngcu c bô

Đă c trưng toa n cu c la đă c trưng thuô c t nh thu đươ c tư toa n bô h nh da ng a nhnhư chu vi, t nh tro n, t nh hươ ng tru c…

Đă c trưng cu bô la đă c tư ng thu đươ c tư viê c thao ta c vơ i mô t phâ n cu a a nh,

không phu thuô c va o toa n bô a nh

Motion

la thuô c t nh quan tro ng cu a video, thông tin vê chuyê n đô ng co thê đươ c sinh ra bă ng ca c ky thuâ t ghe p khô i hoă c luô ng a nh sa ng. Ca c đă c trưng chuyê n đô ng: mô-men trươ ng chuyê n đô ng, biê u đô chuyê n đô ng, ca c tham sô chuyê n đô ng toa n cu cco thê tr ch cho n vectơ chuyê n đô ng. Ca c đă c trưng mư c cao pha n a nh di chuyê ncamera như nghiêng, zoom… cu ng co thê đươ c tr ch cho n

2.2.1.2. Pha t hiê n đô i tươ ng chuyê n đô ng

Đo la qua tr nh đưa ra vê t ca c đô i tươ ng chuyê n đô ng tư khung h nh video. Qua tr nh na ythư c châ t la qua tr nh xư ly chuỗi a nh liên tiê p trong mô t video đê pha t hiê n ra ca c đô itươ ng chuyê n đô ng trong mô t đoa n video theo mô h nh dươ i đây:

: Tô ng quan ca c khối xư ly trong ba i toa n pha t hiê n đối tươ ng.



24

Pha t hiê n vu ng a nh nô i

Xư ly vu ng a nh nô i Pha t hiê n vu ng a nh nô i la mô t modul thiê t yê u trong ba i toa n pha t hiê n đô i tươ ng chuyê n đô ng qua ca c khung h nh video. Module na y đo ng vai tro xư ly ca c khung h nh video đê đưa ra ca c vu ng a nh nô i lên trên ca c khung a nh nê n. Đê minhho a cho chư c năng na y ta co thê nh n h nh dươ i đây:

: Pha t hiê n vu ng a nh nô i

Ca c khung h nh bên tra i thu đươ c se đươ c xư ly đê đưa ra vu ng a nh nô i lên trên minhho a bơ i h nh bên pha i. Vu ng a nh nô i thu đươ c như quan sa t vẫn co n nhiê u nhiễu, ca c đô itươ ng chưa ro ra ng.

Xư ly vu ng a nh nô i

Ca c vu ng a nh nô i thư c tê co n nhiê u nhiễu, do đo đê lo c nhiễu, xư ly ghe p ma nh loa i

bo ca c vê t không liên quan th câ n module xư ly ca c vu ng a nh nô i đê đưa ra ca c đô i tươ ngro ra ng đê tư đo xa c minh t nh châ t cu a chu ng.

: Xư ly ca c vu ng a nh nô i (Foreground Processing)



25

H nh bên tra i la kê t qua thu đươ c sau module pha t hiê n vu ng a nh nô i lên tư ca c khungh nh video. Tư kê t qua đâ u ra na y ta co thê đưa ra đươ c ch nh xa c đô i tươ ng chuyê n đô ngtrong khung h nh đo va t nh châ t cu a no như h nh dang, v tr , …la đâ u va o cu a qua tr nh

phân loa i đô i tươ ng thư c thi ca c nghiê p vu vê sau.

2.2.1.3. Thuâ t toa n huâ n luyê n AdaBoot

Trong các phần trước đã đượ c giải thích đă c trưng đượ c chiết xuất từ các hình ảnh.Ơ phâ n na y se du ng phương pha p lo c đê loa i đi như ng điê m a nh co đô ch nh xa c cao dư atrên sư kê t hơ p cu a như ng bô lo c yê u trươ c.

Thuật toán này lần đầu tiên được đề xuất bở i Freund và Schapire (1995) [4], là một

bộ phân loại mạnh phi tuyến phức, hoạt động trên nguyên tắc k ết hợ p tuyến tính các bộ

phân loại yếu để tạo nên một bộ phân loại mạnh. AdaBoost sử dụng tr ọng số để đánh dấu

các mẫu khó nhận dạng. Trong quá trình huấn luyện cứ mỗi bộ phân loại yếu đượ c xây

dựng thì thuật toán sẽ tiến hành cậ p nhật lại tr ọng số để chuẩn bị cho việc xây dựng bộ

phân loại tiế p theo. Cậ p nhật bằng cách tăng trọng số của các mẫu nhận dạng sai và giảm

tr ọng số của các mẫu đượ c nhận dạng đúng bở i bộ phân loại yếu vừa xây dựng. Bằng cách

này thì bộ phân loại sau có thể tậ p trung vào các mẫu mà bộ phân loại trước nó làm chưatốt. Cuối cùng các bộ phân loại yếu sẽ đượ c k ết hợ p lại tùy theo mức độ tốt của chúng để

tạo nên một bộ phân loại mạnh.

Trong giai đoạn huấn luyện cho đô i tươ ng, vơ i ba i toa n trong đê ta i na y là mỗi hình

ảnh của mô t chiê c xe ô tô hoặc không pha i xe ô tô va mỗi xe đê u có tr ọng sô liên quan

đến nó. Trên mỗi lần lặ p, tr ọng sô của các xe huấn luyện sai phân loại sẽ tăng lên và trọng

sô của các phân loại chính xác sẽ giảm. V vâ y trong mỗi lần lặ p lại việc phân loại đượ clựa chọn se ưu tiên phân loa i vơ i h nh a nh co tro ng sô cao hơn minh ho a trong h nh sau.

Phân loa i không ch nh xa c

Tâ p dư liê u đầu va o P hân loa i lần 1 Phân loa i yếu lần 2 Phân loa

i yếu lần 3

: Minh họa của thuật toán AdaBoost.

Việc phân loại yếu được đại diện bởi các đườ ng tách các ví dụ huấn luyện trong một

không gian đặc trưng 2D. Các màu sắc đại diện cho lớ p của đối tượng và kích thướ c của

các điểm đại diện cho tr ọng lượ ng quan tr ọng



26

Cụ thể, mỗi bộ phân loại yếu sẽ đượ c xây dựng để lựa chọn ra một cửa sổ đặc trưng

(Đặc trưng Haar-like) nào phân biệt đượ c tốt nhất giữa mẫu đúng ( positive) và mẫu sai

(negative). Vớ i mỗi cửa sổ đặc trưng đó, bộ phân loại yếu sẽ xác định ra một ngưỡ ng tối

ưu nhất để cực tiểu số lượ ng mẫu nhận dạng sai. V thê mô t bô phân loa i yê u se đươ c biê udiễn như sau:

ℎ {1 ê < 0 ê ươ

Trong đo :

x là một cửa sổ con có kích thướ c 24x24 pixel của khung hình

là ngưỡ ng.

là cửa sổ đặc trưng (ở đây là đặc trưng Haar -like).

là hệ số quyết định chiều của bất đẳng thức.

Có thể hiểu đơn giản hoạt động bộ phân loại yếu là khi giá tr ị cửa sổ đặc trưng của

một mẫu tính bởi hàm đánh giá của bộ phân loại vượ t qua một ngưỡng nào đó thì mẫu đấy

là mẫu đúng (là đối tượ ng cần nhận dạng) còn nếu không thì mẫu đó là mẫu sai (không

phải đối tượ ng).

Trên thực tế không một bộ phân loại yếu nào có thể thực hiện việc phân loại vớ i tỷ

lệ lỗi thấp. Các đặc trưng đượ c lựa chọn ở những vòng lặp đầu tiên của tiến trình xây dựng

bộ phân loại đều có tỷ lệ lỗi nằm trong khoảng 0,1 đến 0,3. Các đặc trưng ở những vòng

lặp sau, nghĩa là phải phân loại những mẫu khó, thì có tỷ lệ lỗi nằm trong khoảng 0,4 đến

0,5.

2.2.1.4.

Đă c trưng Haar-like va mô h nh cascade

Paul Viola và Michael Jones cũng đi theo hướ ng sử dụng thuật toán AdaBoost cho

việc huấn luyện để nhận dạng đối tượ ng [5]. Công trình nghiên cứu này đưa ra 3 đóng gópquan tr ọng trong khả năng xử lý ảnh vớ i tốc độ nhanh và đạt đượ c tỷ lệ nhận dạng r ất cao:

Đưa ra khái niệm Integral Image cho phép tính toán các đặc trưng vớ i tốc độ r ất

cao.

Thuật toán học máy dựa trên AdaBoost có khả năng lựa chọn ra đượ c một số lượ ng nhỏ các đặc trưng từ một tập các đặc trưng rất lớ n từ đó lại xây dựng ra

đượ c các bộ phân loại có hiệu suất cao.

Đưa ra mô hình cascade cho phép kết hợ p các bộ phân loại để có thể loại bỏ nhanh

chóng vùng ảnh không chứa đối tượng trong khi đó tậ p trung quá trình tính toán

vào những vùng có nhiều khả năng có chứa đối tượng hơn.

(2.1)



27

Phương pháp của Viola và Jones có tốc độ xử lý nhanh, gấ p từ 10 đến 15 lần so vớ icác phương pháp trước đó, có thời điểm đạt đượ c tốc độ lên đến 15 khung hình/giây, cho

tỷ lệ chính xác lên đến 80%.

Đă c trưng Haar-like

Tiến trình nhận dạng đối tượ ng sẽ phân loại các mẫu dựa trên giá tr ị của các đặc

trưng đơn giản. Có nhiều lý do để sử dụng các đặc trưng thay vì xử lý tr ực tiế p trên từng

điểm ảnh. Một trong những lý do phổ biến nhất đó là các đặc trưng có thể diễn đạt đượ ctri thức về các đối tượ ng trong ảnh (biểu diễn mối liên hệ giữa các bộ phận của đối tượ ng),

đây là điều mà từng điểm ảnh không thể làm đượ c.

Một trong những đặc trưng cơ bản đượ c sử dụng trong bài toán nhận dạng đối tượ ng

trên ảnh là cửa sổ đặc trưng hay các đặc trưng Haar -like. Tên gọi cửa sổ đặc trưng xuất

phát từ cấu trúc của đặc trưng Haar -like này, nó đượ c xây dựng nên từ những hình chữ

nhật có kích thướ c bằng nhau và đượ c phân thành hai vùng là vùng sáng và vùng tối. Giá

tr ị của đặc trưng Haar -like chính là giá tr ị độ chênh lệch giữa các điểm ảnh nằm trong hai

vùng ảnh đó. Va đươ c mô ta bă ng h nh sau:

H nh 2-1: Ca c đă c trưng Haar like cơ ba n

Giá tr ị của đặc trưng 2 cửa sổ (hình (1) và (2)) đượ c tính bằng hiệu số giữa tổng

các điểm ảnh nằm trong 2 vùng ảnh sáng và tối.

Gia của đặc trưng 3 cửa sổ (hình (3)) đượ c tính bằng tổng các điểm ảnh của 2 vùng

ảnh 2 bên tr ừ đi tổng các điểm ảnh của vùng ảnh nằm giữa.

Giá tr ị đặc trưng 4 cửa sổ (hình (4)) đượ c tính bằng hiệu số giữa tổng các điểm ảnh

thuộc vùng sáng và tổng các điểm ảnh thuộc vùng tối (2 vùng ảnh nằm chéo nhau).

Bộ nhận dạng đượ c sử dụng ở đây có kích thước là 24x24 pixel, như vậy số lượ ng

các đặc trưng Haar -like có thể sinh ra cho mỗi một mẫu là r ất lớn (trên 180.000 đặc trưng),từ đó dẫn đến việc tính toán giá tr ị của các đặc trưng này đòi hỏi một thờ i gian xử lý đáng

k ể [5]. Vì nguyên nhân đó nên khái niệm Integral Image đã ra đờ i.

Integral Image

Khái niệm Integral Image được Viola và Jones đưa ra nhằm mục đích tăng tốc độ

tính toán cho các đặc trưng Haar -like nói trên. Các cửa sổ đặc trưng có thể đượ c tính toán

r ất nhanh thông qua một biểu diễn trung gian của ảnh gọi là Integral Image. Integral Image

tại vị trí x, y bằng tổng các giá tr ị điểm ảnh phía trên bên trái của điểm, :



28

Trong đó, là Integral Image và , là giá trị điểm ảnh ban đầu t ại vị trí , .

Integral Image là một mảng hai chiều với kích thướ c bằng kích thướ c của ảnh cần tính

giá tr ị đặc trưng Haar Like. Dưới đây là mô tả cách tính ảnh tích phân:

Integral Image ta i điê m, .

Sau khi đã tính đượ c Integral Image tại một điểm ảnh thì việc tính tổng giá tr ị củacác điểm ảnh tại một vùng bất k ỳ r ất đơn giản. Giả sử cần tính giá tr ị của vùng ảnh D nhưtrong hình dướ i:

Tính toán giá tr ị Intergral Image d ự a vào các Intergral Image trung gian

Tổng giá tr ị của vùng ảnh D có thể đượ c tính toán thông qua 4 Integral Image trung

gian. Giá tr ị của Integral Image tại vị trí 1 là tổng giá tr ị các điểm ảnh trong vùng A. Giá

tr ị Integral Image tại vị trí 2 là tổng của hai vùng A + B, tương tự vị trí 3 là hai vùng A +

C. Giá tr ị Integral Image tại vị trí 4 là tổng của cả bốn vùng A + B + C + D. Như vậy tổng

giá tr ị trong vùng ảnh D có thể đượ c tính theo Integral Image là Sum(D) = 4 + 1 – (2 + 3).

Sử dụng khái niệm Integral Image, tất cả các giá tr ị cửa sổ đặc trưng (đặc trưng Haar -like) có thể đượ c tính r ất nhanh thông qua các Integral Image trung gian. Cụ thể đối vớ iđặc trưng 2 cửa sổ bất k ỳ có thể tính thông qua 6 Integral Image, đặc trưng 3 cửa sổ cần 8

và đặc trưng 4 cửa sổ thì cần 9.

(2.2)



29

Mô hình phân tầng Cascade

Như đã trình bày ở phần trên, vớ i mỗi một mẫu đưa vào bộ nhận dạng có thể sinh ra

r ất nhiều các đặc trưng Haar -like, nếu chỉ tăng tốc độ tính toán giá tr ị của các đặc trưngthôi là chưa đủ. Bở i mỗi một khung hình có thể sinh ra đượ c r ất nhiều mẫu nhận dạng,

nếu như mẫu nào cũng phải tính toán tất cả các đặc trưng thì sẽ tốn r ất nhiều thờ i gian một

cách không cần thiết. Tuy nhiên có thể thấy trong các mẫu đưa vào không phải mẫu nàocũng khó để nhận dạng, có những mẫu chỉ cần sử dụng một vài đặc trưng là đã có thể loại

bỏ đượ c chứ không nhất thiết phải dùng tất cả các đặc trưng, ví dụ như các mẫu

background.

Cascade of Boosted Classifiers là mô hình phân tầng vớ i mỗi tầng là một mô hình

AdaBoost sử dụng bộ phân lớ p yếu là cây quyết định với các đặc trưng Haar-Like. Trong

quá trình huấn luyện, bộ phân lớ p phải duyệt qua tất cả các đặc trưng của mẫu trong tậ phuấn luyện. Việc này tốn r ất nhiều thờ i gian.

Tuy nhiên, trong các mẫu đưa vào, không phải mẫu nào cũng thuộc loại khó nhận

dạng, có những mẫu background r ất dễ nhận ra (gọi đây những mẫu background đơn giản).Đối vớ i những mẫu này, chỉ cần xét một hay một vài đặc trưng đơn giản là có thể nhận

dạng đượ c chứ không cần xét tất cả các đặc trưng. Nhưng đối vớ i các bộ phân loại thông

thườ ng thì cho dù mẫu cần nhận dạng là dễ hay khó nó vẫn phải xét tất cả các đặc trưngmà nó rút ra đượ c trong quá trình học. Do đó, chúng tốn thờ i gian xử lý một cách không

cần thiết.

Mô hình Cascade of Classifiers đượ c xây dựng nhằm rút ngắn thờ i gian xử lý, giảm

thiểu nhận dạng lầm (false alarm) cho bộ phân loại. Cascade trees gồm nhiều tầng (stage

hay còn gọi là layer), mỗi tầng là một mô hình AdaBoost vớ i bộ phân lớ p yếu là các cây

quyết định. Một mẫu để đượ c phân loại là đối tượ ng thì nó cần phải đi qua hết tất cả cáctầng.

Các tầng sau đượ c huấn luyện bằng những mẫu âm negative (không pha i đô i tươ ngcâ n nhâ n da ng) mà tầng trướ c nó nhận dạng sai, tức là nó sẽ tậ p trung học từ các mẫu

background khó hơn, do đó sự k ết hợ p các tầng AdaBoost này lại sẽ giúp bộ phân loại

giảm thiểu nhận dạng lầm. Vớ i cấu trúc này, những mẫu background dễ nhận dạng sẽ bị loại ngay từ những tầng đầu tiên, giúp đáp ứng tốt nhất thờ i gian xử lý và vẫn duy trì đượ chiệu quả phát hiện đô i tươ ng

2.2.1.5.

Đă c trưng Local Binary Pattern

Local Binary Pattern (LBP) hay co n go i la mẫu nhi phân cu c bô , là một đặc trưngđơn giản nhưng rất hiệu quả đượ c sử dụng trong các bài toán phân loại ở lĩnh vực thị giác

máy tính [10]

Ý tưởng cơ bản của tính năng LBP là để tr ch xuâ t các cấu trúc địa phương trong một

hình ảnh bằng cách so sánh từng điểm ảnh vớ i hàng xóm của mình. Ví dụ, mỗi điểm ảnh



30

trong các khu phố đượ c so sánh về cường độ để các điểm ảnh trung tâm. Nếu các giá tr ị cường độ cao hơn so với các điểm ảnh trung tâm, nó được đánh dấu là 1 và 0 nếu ngượ clại. Vào cuối của quá trình miê n lân câ n của mỗi điểm ảnh sẽ có một mô hình nhị phân.Toa n tư ga n nha n ca c pixel cu a khô i a nh bă ng ta o ngươ ng cho lân câ n cu a mỗi pixel vơ igia tri trung tâm va nhâ n kê t qua la 1 sô nhi phân.

Thông tin LBP của pixel tại trung tâm của mỗi khối ảnh sẽ đượ c tính dựa trên thông

tin của các pixel lận cận. Có thể tóm tắt các bướ c tiến hành như sau:

Bước 1: Xác định bán kính làm việc.

Bướ c 2: Tính giá tr ị LBP cho pixel ở trung tâm (,) khối ảnh dựa trên thông tin

của các pixel lân câ n.

, ∑ 2 −

=

Trong đó, () là giá tr ị grayscale của các pixel lân cận, () là giá tr ị grayscale của

các trung tâm và (s) là hàm nhị phân được xác định như sau: s(x) = 1 nếu giá tr ị x ≥0.

Toa n tư LBP gô c đươ c thư c hiê n vơ i 3*3 lân câ n cu a điê m a nh đươ c biê u diễn bơ iv du sau:

H nh 2-2: Minh họa ví d ụ trong tính toán của các mẫ u nhị phân cục bộ cho một pixel lân câ n

Da ng tô ng qua t cu a toa n thu LBP sư du ng ca c lân câ n đô i xư ng tha nh vo ng tro n h nh2.2. Trong trươ ng hơ p na y tương ư ng vơ i ca c gia tri mư c xa m cu a P pixel trong vo ntro n vơ i ba n k nh R. Biê u đô cu a ma LBP t nh toa n trên ca c khô i a nh va co thê sư du ng đê mô ta kê t câ u cu a khô i.

(2.3)

Threshold Multi l

LBP = 1 + 2 + 4 + 8 + 128 = 143



31

Mu c đ ch cu a phương pha p na y la xa c đi nh như ng vu ng cu a khung video co chư a đô itươ ng chuyê n đô ng. Phương pha p chia khung video tha nh ca c khô i co k ch thươ c bă ngnhau bă ng ca ch xư du ng câ u tru c lươ i chô ng cu c bô

To a đô các điê m lân câ n p ở một khoảng cách đươ ng tro n từ các điểm ảnh trung tâmđươ c thê hiê n như sau:

cos

sin

Trong đó R là khoảng cách đến các điểm ảnh trung tâm. Khi các tọa độ không tươngứng vớ i tọa độ ảnh, cường độ đượ c tính bằng Bilinear interpolation (gia tri cu a pixel rađươ c t nh bă ng gia tri trung b nh cu a 2x2 pixel lân câ n.) gia tri cu a ca c vu ng điê m a nh se đươ c thê hiê n như h nh:

: LBP bât biên bât biên vơ i ca ch thay đô i đơn trong mư c xa m

Như vậy, đối với mô hình cascade đã đượ c trình bày ở phần trước, các đặc trưngLBP có thể đượ c sử dụng khi huấn luyện các bộ nhận dạng vớ i thuật toán AdaBoost thay

thế cho việc sử dụ ng những đặc trưng Haar -like. Bên cạnh đó thông qua lý thuyết và thực

nghiệm chứng minh có thể thấy đượ c r ằng những bộ nhận dạng sử dụng đặc trưng LBPcho tốc độ nhận dạng nhanh hơn bộ nhận dạng sử dụng đặc trưng Haar -like.

2.2.2. Ca c bươ c nhâ n da ng đô i tươ ng

Như đã trình bày, các phần trước đã giớ i thiệu một cách khái quát những kiến thức

cần nắm được để có thể giải quyết đượ c bài toán nhận dạng phương tiện giao thông, bướ cđầu tiên và cũng là bướ c quan tr ọng để có thể đi tới được bài toán đếm lưu lượng phương

(2.4)



32

tiện giao thông cuối cùng. Phần này em xin đượ c trình bày về các bước chính em đã thực

hiện trong quá trình xây dự ng hệ thống nhận dạng của mình, bao gồm:

Thu thập dữ liệu: Xây dựng tập cơ sở dữ liệu ban đầu.

Tiê n xư ly dư liê u: Chuẩn bị đầu vào cho bộ huấn luyện.

Huấn luyện: Thực hiện quá trình huấn luyện bộ nhận dạng.

Nhận dạng: Sử dụng bộ nhận dạng để nhận dạng đối tượ ng.

2.2.2.1. Thu thâ p dư liê u

Để có thể xây dựng đượ c hệ thống nhận dạng dựa trên mô hình cascade, trướ c tiên

cần phải có một tậ p huấn luyện chứa các mẫu, bao gồm cả các mẫu chứa đối tượ ng và các

mẫu không chứa đối tượ ng. Tậ p huấn luyện này sẽ đượ c xây dựng từ 2 nguô n:

Tâ p huâ n luyê n thư nhâ t đươ c xây dư ng tư các hình ảnh thu đượ c từ video cameraca c thiê t bi đi đô ng

Tâ p huâ n luyê n thư hai đươ c lâ y tư một bộ khoảng 430 h nh a nh positive va hơn3000 h nh nagative sử dụng một tậ p huấn luyện k ết hợ p công việc của Markus

Weber và các bộ dữ liệu TME bở i Caraffi et al. (2012) [6], [10]

Ca c khung h nh, h nh a nh đượ c se đươ c tiê n xư ly qua ca c bươ c sau:

Co tâ t ca h nh a nh đê n mô t k ch thươ c 20×20 pixel

Chuyển đổi không gian màu của ảnh từ RGB (Red-Green-Blue) sang không gian

màu HSV (Hue-Saturation-Value).

Tách ảnh thành 3 ảnh thành phần chứa 3 kênh H, S, V riêng biệt.

Thực hiện thuật toán cân bằng Histogram trên kênh H. Ghép 3 ảnh thành phần lại về thành ảnh gốc.

Chuyển không gian màu từ HSV về RGB.

Tăng sáng cho kênh R của ảnh..

Thực hiện phép làm trơn ảnh bằng Gaussian.

Giảm sáng cho những điểm ảnh có mức xám lớ n.

Như đã nói thì đặc điểm của các video này là nó đượ c thu lại từ các camera ca c thiê t bi đô ng, các camera này có góc quay cố định, bối cảnh là làn đườ ng một chiều.



33

: Khung h nh triết xuât tư video đầu va o.

Mỗi video đượ c sử dụng làm đầu vào của bộ huấn luyện sẽ đượ c tách thành các

khung hình, mỗi khung hình là một đơn vị cơ bản của một video. Tất cả các khung hình

này sẽ đượ c sử dụng làm dữ liệu đầu vào cho hệ thống

: Chuỗ i các khung hình liên tiế p tách ra t ừ video (t ừ 1 đế n 6)

1 2

3 4

5 6



34

2.2.2.2.

Tiê n xư ly dư liê u

Sau khi lấy đượ c dữ liệu là các khung hình từ các video giao thông thì bướ c tiế p theo

sẽ là xây dựng tậ p huấn luyện. Tậ p huấn luyện bao gồm: positive va negative

Positive la ca c mẫu chư a đô i tươ ng

Nagative la ca c mẫu không chư a đô i tươ ng

Công cụ em sử dụng để thực hiện việc huấn luyện đòi hỏi phải có sự chuẩn hóa trong

dữ liệu đầu vào. Cụ thể là các mẫu positive chứa đối tượ ng phải có dạng hình vuông (chiều

cao mẫu bằng chiều r ộng mẫu) và kích thướ c tối thiểu là 24x24 pixel. Không như các mẫu

positive, các mẫu negative có thể có kích thước tùy ý nhưng phải lớn hơn kích thướ c mẫu

positive, tức là lớn hơn 24x24 pixel. Trong quá trình huấn luyện, các bộ phân loại sẽ học

từ các mẫu positive và các vùng ảnh trích xuất ra từ các mẫu negative. Vì đặc điểm này

nên trong các mẫu negative mặc dù có kích thướ c lớn nhưng cũng nhất định không đượ cchứa đối tượ ng cần nhận dạng, vì nếu không trong quá trình huấn luyện, vùng ảnh chứa

đối tượ ng có thể đượ c trích xuất ra để học, có thể dẫn đến vòng lặ p vô hạn, không k ết thúc

đượ c huấn luyện. Các mẫu positive đượ c lấy từ các dữ liệu (khung hình) đã đượ c chuẩn

bị ở bước trướ c, còn các mẫu negative có thể lấy bất cứ ở nguồn nào, miễn là không chứa

đối tượng, nghĩa là không chứa hình của các phương tiện giao thông trong đấy, ngoài ra

mẫu negative cũng có thể lấy ở các phương tiện giao thông trong đấy, ngoài ra mẫu

negative cũng có thể lấy ở các khung hình trên nhưng chỉ lấy những vùng ảnh nào không

chứa đối tượ ng [1].

: T ậ p huấ n luyện của các bộ học yế u

Sau khi đưa vào công cụ huấn luyện, các mẫu positive và negative sẽ tr ải qua một

bướ c chuẩn hóa nữa. Cụ thể các mẫu positive có kích thướ c lớn hơn kích thướ c tối thiểu

24x24 pixel sẽ được điều chỉnh về 24x24 pixel. Ngoài ra cả 2 mẫu positive và negative



35

đều được đưa về ảnh xám để phù hợ p vớ i yêu cầu huấn luyện của công cụ và để tăng tốc

độ huấn luyện (khi chỉ làm việc trên 1 kênh màu).

: Mâ u Negative

M â u positive đươ c huấn luyê n Mâ u positive theo Caraffi et al va MarkusWeber

2.2.2.3. Huấn luyện

Như đã trình bày ở trên, co hai phâ n:

Phâ n mô t : ca c mẫu positive ch nh em se sư du ng mẫu Caraffi et al va MarkusWeber nhă m tăng kha năng nhâ n da ng đươ c nhiê u mẫu xe hơn.

Phâ n hai: em sẽ dùng một công cụ để thực hiện việc huấn luyện các mẫu positive

và negative. Do phạm vi của đồ án có hạn nên em sẽ không thực hiện việc xây dựng

công cụ huấn luyện này mà thay vào đó là sử dụng một công cụ đã có sẵn và r ất phổ

biến là HaarTraining.



36

Về bản chất thì công cụ này dựa trên chính mô hình cascade gồm các bộ phân loại đượ cxây dựng bở i thuật toán AdaBoost và sử dụng các đặc trưng Haar -like như em đã trình

bày ở phần trên. Các bướ c sử dụng công cụ này sẽ đượ c trình bày cụ thể trong Chương 3.

Sau quá trình huấn luyện vớ i các mẫu positive và negative ở trên, công cụ HaarTraining

sẽ cho đầu ra là một cấu trúc theo tầng của các bộ phân loại mạnh. Mỗi bộ phân loại mạnh

sẽ bao gồm nhiều bộ phân loại yếu k ết hợ p vớ i nhau mà mỗi bộ phân loại yếu là một đặc

trưng Haar -like đượ c học từ các mẫu đầu vào. Theo như mô hình cascade mà em đã trình bày thì các tầng đầu mà đi qua tất cả các tầng mà không bị loại sẽ được coi là đối tượ ng

cần nhận dạng. Cấu trúc theo tầng này sẽ được lưu lại dưới định dạng file xml.

Tuy nhiên có một vấn đề cần chú ý ở đây là sử dụng bao nhiêu tầng trong bộ nhận dạng

thì đủ. Nếu sử dụng ít tầng thì số lượng đối tượ ng mà bộ nhận dạng bắt đượ c sẽ nhiều,

nhưng độ chính xác sẽ thấ p do việc bắt nhầm những vùng gần giống với đối tượ ng chứ

không phải đối tượ ng, ngoài ra còn có khả năng bắt thiếu những đối tượ ng khó nhận dạng.

Nếu sử dụng nhiều tầng thì độ chính xác sẽ cao (do số lượ ng bắt nhầm sẽ giảm r ất nhiều)

tuy nhiên số lượng đối tượ ng nhận dạng được theo đó sẽ thấ p, nhiều đối tượ ng giống vớ i background

sẽ dễ bị bộ nhận dạng loại bỏ. Như vậy ở đây sẽ có sự trao đổi, nếu tăng độ chính xác thì

sẽ giảm độ nhạy, nếu tăng độ nhạy thì sẽ giảm độ chính xác.

Từ đó có thể thấy việc lựa chọn số lượ ng tầng cho bộ nhận dạng cũng đóng vai trò quantr ọng cho chất lượ ng của bộ nhận dạng đó. Qua thực nghiệm và đánh giá thì hệ thống nhận

dạng phương tiện giao thông sẽ đạt k ết quả tốt nhất nếu số lượ ng tầng các bộ phân loại

nằm trong khoảng từ 25 đến 30.

: Những đặc trưng Haar -like đầu tiên đượ c chọn trong bộ nhận d ạng

2.2.2.4.

Nhận dạng

Bộ nhận dạng đối tượ ng sẽ đượ c xây dựng dựa trên cấu trúc theo tầng của các bộ

phân loại đã tìm đượ c sau quá trình huấn luyện ở trên. Khi đưa một ảnh vào bộ nhận dạng,

ở đây là các khung hình lấy từ các video dùng để kiểm tra (như đã nói ở trên thì các video

đượ c phân thành 2 phần dùng để huấn luyện và dùng để kiểm tra), bộ nhận dạng sẽ xem

xét tất cả các vùng ảnh với kích thước khác nhau đượ c trích xuất ra từ ảnh này để có thể

đưa ra đượ c k ết quả.



37

Kích thước ban đầu của vùng ảnh đượ c trích xuất sẽ là một cửa sổ có kích thướ c bằng với kích thướ c tối thiểu của các mẫu positive đượ c sử dụng trong quá tình huấn

luyện. Các vùng ảnh này sẽ đượ c dịch chuyển theo chiều ngang và chiều dọc một khoảng

vài pixel cho tớ i khi phủ kín ảnh cần nhận dạng. Hay nói cách khác bộ nhận dạng sẽ quét

một lượ t tất cả các vùng có thể trên ảnh để tìm đối tượ ng. Sau khi hết một lượ t, vùng ảnh

này sẽ được tăng kích thướ c lên và tiế p tục quá trình quét toàn bộ ảnh để xử lý, kích thướ c

mở r ộng này sẽ tăng cho tớ i khi vùng ảnh bằng với kích thướ c của cả bức ảnh hoặc bằngmột giá tr ị max nào đó, giá tr ị này có thể đượ c thiết lậ p bằng tay.

Như vậy sẽ có khả năng một đối tượng đượ c nhận dạng nhiều lần nhưng vớ i các

vùng ảnh có kích thướ c gần giống nhau, các đối tượ ng sẽ đượ c gọi là các đối tượ ng bị lặ p,

vấn đề này cũng sẽ đượ c xử lý và trình bày ở phần sau.

Nhờ có cấu trúc phân tầng cascade, các vùng ảnh không chứa đối tượ ng (background)

sẽ đượ c duyệt qua r ất nhanh nhờ những tầng đầu tiên. K ết quả của quá trình nhận dạng sẽ

là một tậ p các vùng ảnh đượ c cho là có chứa đối tượ ng ứng vớ i mỗi ảnh đầu vào (mỗi

khung hình trong video).

2.3.

Pha t hiê n la n đươ ng

Tâ t ca như ng ngươ i tham gia giao thông bă ng phương tiê n ô tô đê u râ t quan tâm tơ ivâ n đê an toa n khi đi sang la n đươ ng, đa co không t như ng vu tai na n do chu quan haykha ch quan vê viê c chuyê n la n mô t ca ch đô t ngô t hay biê n đô i la n trên tư ng cung đươ ng,đôi khi va o trong mô t sô điê u kiê n môi trươ ng viê c pha t hiê n la n đươ ng đô i vơ i mă t ngươ itrơ len kho khăn hơn.

Các nguyên nhân chính của như ng vu tai na n do chuyê n la n đươ ng đô t ngô t có thể là

cu a phương tiê n, do buồn ngủ, do sư du ng ca c châ t k ch th ch như rượ u / ma túy hoặc phiền nhiễu ca c thiê t bi điê n tư kha c… Nhiều nghiên cứu đã chỉ ra r ằng ngườ i lái xe thiếu

chú ý có thể ảnh hưởng đến kha năng quan sa t la n đươ ng.

Trong ba i toa n na y se sư du ng ca c phương pha p Scale-spacem, ma ho a a nh theo khuvư c, pha t hiê n ca nh Canny va biê n đô i Hough đê pha t hiê n la n đươ ng. Khi pha t hiê n la nđươ ng

2.3.1. Pha t hiê n điê m cư c tri Scale-space va thiê t lâ p vu ng quan tâm

Hê thô ng sư du ng camera cu a ca c thiê t bi di đô ng th viê c t nh toa n cu a thuâ t xư ly a nh se chiê m du ng ta i nguyên lơ n, đây la ha n chê cu a ca c thiê t bi trên. Ch nh v vâ y nê ukhông co phương pha p đê khă c phu c t nh tra ng trên th sô khung h nh thu đươ c trong mô tgiây (frames per second (fps)) se vô cu ng t.

Đê khă c phu c t nh tra ng trên ba i toa n se a p du ng ky thuâ t ma trâ n thu nho , tư c la mgia m k ch thươ c cu a khung a nh. Trong Ky thuâ t scale-space, bước đầu tiên này tiến hành

tìm kiếm các điểm hấ p dẫn trên tất cả các tỉ lệ và vị trí của ảnh. Nó sử dụng hàm different-



38

of-Gaussian để xác định tất cả các điểm hấ p dẫn tiềm năng mà bất biến vớ i quy mô và

hướ ng của ảnh

2.3.1.1. Pha t hiê n điê m cư c tri Sacle-space

: biê u diê n Scale-space

Các điểm hấ p dẫn với đặc trưng SIFT tương thích vớ i các cực tr ị địa phương của bộ

lọc difference – of-Gaussian (DoG) ở các tỉ lệ khác nhau. Định nghĩa không gian tỉ lệ của

một hình ảnh là hàm L(x,y,k ) đượ c mô tả như sau:

L(x,y, )= G(x,y,k )* I(x,y)

Vớ i: G( x,y , k ) : biến tỉ lệ Gaussian (variable scale Gaussian)

I(x,y) : Ảnh đầu vào

* là phép nhân chậ p giữa x và y

,, −+/

Để phát hiện được các điểm hấ p dẫn, ta đi tìm các cực tr ị của hàm DoG được địn nghĩa:

,, (,, ,,) ∗,

,, (,, ,,)

Giá tr ị hàm DoG đượ c tính xấ p xỉ dựa vào giá tr ị scale-normalized Laplacian ofGaussian (∇) thông qua các phương trình (2.10) (2.11) (2.12)

∇G

∇G ≈ (,,,,)

−

(2.5)

(2.6)

(2.7)

(2.9)

(2.8)



39

(,, ,,) ≈ 1 ∇2G

Như vậy, bước đầu tiên của giải thuật SIFT phát hiện các điểm hấ p dẫn vớ i bộ lọc

Gaussian ở các tỉ lệ khác nhau và các ảnh GoG từ sự khác nhau của các ảnh k ề mờ .

: Biểu đồ mô phỏng việc tính toán các DoG ảnh t ừ các ảnh k ề mờ

Các ảnh cuộn đượ c nhóm thành các octave (mỗi octave tương ứng vớ i giá tr ị gấp đôicủa ). Giá tr ị của k đượ c chọn sao cho số lượ ng ảnh mờ (blured images) cho mỗi octave

là cố định. Điều này đảm bảo cho số lượ ng các ảnh DoG cho mỗi octave không thay đổi.

Các điểm hấ p dẫn được xác định là các cực đại hoặc cực tiểu của các ảnh DoG qua các tỉ

lệ. Mỗi điểm ảnh trong DoG đượ c so sánh với 8 điểm ảnh láng giềng của nó ở cùng tỉ lệ đó và 9 láng giềng k ề ở các tỉ lệ ngay trướ c và sau nó. Nếu điểm ảnh đó đạt giá tr ị cực tiểu

hoặc cực đại thì sẽ đượ c chọn làm các điểm hấ p dẫn ứng viên.

: M ỗi điể m ảnh đượ c so sánh vớ i 26 láng giề ng của nó

(2.10)



40

2.3.1.2.

Ma ho a a nh theo khu vư c

Ma ho a anh theo khu vư c - Region of Interest (ROI), vơ i phương pha p na y giu p ha nchê viê c t m kiê m dâ u hiê u la n đươ ng cu a ca h nh a nh thu đươ c ơ đâ u va o bă ng viê c xa cđi nh 1 vu ng a nh quan tâm la mâ u chô t viê c nhâ n da ng đô i tươ ng đươ c mô pho ng bă ngh nh dươ i. Viê c na y la m loa i bo bơ t nhưng vu ng không co đô i tươ ng la n đươ ng như vu ng

bâ u trơ i giu p gia i pho ng bô nhơ thiê t bi va tăng tô c đô cu a qua tr nh lo c

: Khu vư c pha t hiê n la n đươ ng trong vo ng tro n ma u đo

2.3.2. Thuâ t toa n Canny va biê n đô i Hough

Thuâ t toa n Canny

Phát hiện cạnh Canny là một trong những phương pháp phát hiện biên đượ c sử dụng

để tìm tất cả các điểm cạnh trong hình ảnh và đầu ra là một bản đồ nhị phân. Canny sư du ng một gradient trên hình ảnh để tìm những thay đổi mạnh về cường độ pixel. Đây lànhững đườ ng nét có khả năng la la n đươ ng trong hình ảnh đâ u va o. Đầu ra là sau đó chỉ cần một bản đồ nhị phân đó cho bạn thấy nơi những đườ ng nét của hình.

Trong thuật toán Canny, các đạo hàm bậc một đượ c tính theo x và y và sau đó kết

hợ p thành bốn đạo hàm hướng. Các điểm nơi những đạo hàm hướ ng này là cực tr ị địa phương sau đó là các ứng viên cho tậ p hợ p thành các cạnh.Trong ba i toa n na y sử dụng để

phát hiện biên Canny để tìm ranh giới la n đươ ng trong khung ROI đa nhă c đê n ơ phâ ntrên.

Viê c phát hiện cạnh cơ bản sử dụng vector gradient của một hình ảnh cường độ đê pha t hiê n ranh giới làn đường có độ tương phản cao trong ảnh. Đây là một trong trong

những phương pháp tốt nhất và hiệu quả trong nhiều phương pháp phát hiện biên



41

: v du a nh đươ ng viền

Biê n đô i Hough

Biến đổi Hough là một k ỹ thuật có thể dùng để tách ra các đặc điểm của một hình

dáng cụ thể trong một ảnh nhị phân. Khi dùng các chương trình máy tính để nhận diện

một đối tượ ng nào đó có hình dạng bất k ỳ, phương pháp hữu hiệu hiện nay là sử dụng biến

đổi Hough. Các bài toán tìm kiếm từ những mức đơn giản như tìm đườ ng thẳng tớ i các bài toán phức tạp hơn như tìm hình tròn, hình elipse hoặc các hình phức tạp đều có thể

thực hiện bằng biến đổi Hough (với điều kiện các hình dạng này biểu diễn toán học đượ c).

Giai đoạn phát hiện làn sử dụng các ha m Hough Line đê lo c ca c đườ ng trong hình

ảnh dựa trên biến đổi Hough.

Biến đổi Hough tìm đườ ng thẳ ng

Đầu tiên chúng ta sẽ xem xét việc tìm kiếm các đườ ng thẳng trong một hình ảnh.

Trong một sự biểu diễn tham số Đề các, điểm cộng tuyến trong một hình ảnh vớ i tọa độ

(x,y) là có liên quan của độ dốc m và chặn c theo:

y = mx + c

Phương trình này có thể đượ c viết dướ i hình thức đồng nhất như:

Ay + Bx + 1 = 0

Trong đó A= -1/c và B = m/c. Do đó, một đườ ng thẳng được xác định bằng cách cho

một cặ p giá tr ị (A,B). Tuy nhiên, chúng ta có thể quan sát một đối xứng trong sự xác định

trong phương trình 2.12. Phương trình này là đối xứng từ một cặ p tọa độ (x,y) cũng xácđịnh một đườ ng thẳng trong không gian vớ i các tham số (A,B). Đó là, phương trình 2.12

có thể được xem như là phương trình của một đườ ng thẳng cho tọa độ cố định (x,y) hay

là phương trình của một đườ ng thẳng cho các tham số cố định (A,B). Như vậy, cặ p có thể

đượ c sử dụng để xác định các điểm và đườ ng thẳng đồng thờ i.

Hough tậ p hợ p dấu hiệu của điểm (A,B) bằng cách xem xét tất cả các điểm (x,y) xác

định cùng một đườ ng thẳng trong không gian (A, B). Có nghĩa là, nếu tậ p hợp các điểm

cộng tuyến {(xi ,yi)}xác định đườ ng thẳng (A, B), thì

(2.12)

(2.11)



42

1 0

Phương trình này có thể được xem như một hệ phương trình và nó có thể đượ c viết

lại đơn giản trong điều kiện của sự biểu diễn tham số Đề các như:

Vì vậy, để xác định đườ ng thẳng chúng ta phải tìm các giá tr ị của các tham số (m,c)

(hoặc (A, B) trong hình thức đồng nhất) đáp ứng phương trình 2.14(hoặc 2.13, tương ứng).

Biê n đô i Hough cung cấ p một phản ứng chính xác, ướ c tính chính xác của các tham

số đượ c sử dụng để xác định đườ ng thẳng, miễn là số lượng điểm thẳng dọc theo đườ ng

thẳng vượ t quá số lượng các điểm thẳng trên bất k ỳ đườ ng thẳng nào trong ảnh. Tuy nhiên,

tính phi tuyến của các tham số và sự r ờ i r ạc tạo các tích lũy tiếng ồn. Một vấn đề lớ n trong

việc thực hiện các Hough cơ bản cho đườ ng thẳng là sự xác định của một không gian tích

lũy thích hợ p.

Trong ứng dụng, thuật toán vẽ đườ ng thẳng Bresenham (Bresenham, 1965) có thể sử

dụng để vẽ các đườ ng thẳng bình chọn trong không gian tích lũy. Điều này đảm bảo r ằngđườ ng thẳng của các lựa chọn k ết nối được rút ra như trái ngượ c vớ i sử dụng phương trình2.20 có thể dẫn đến những khoảng tr ống trong các đườ ng vẽ. Ngoài ra, backmapping

(Gerig, 1986) có thể đượ c sử dụng để xác định chính xác điểm cạnh đóng góp cho một

đỉnh đặc biệt. Backmapping là một ánh xạ ngượ c từ không gian tích lũy đến dữ liệu cạnh

và có thể cho phép phân tích hình dạng của hình ảnh bằng cách loại bỏ các điểm cạnh góp

phần đỉnh đặc biệt, và sau đó tái tích lũy bằng cách sử dụng Hough.

Một cách để tránh các vấn đề của sự biểu diễn tham số Đề các trong Hough là cơ sở hàm ánh xạ trên một sự biểu diễn tham số thay thế. Biểu diễn tham số một đườ ng thẳng

này bằng cách xem xét một điểm (x, y) như là một hàm của một góc bình thườ ng vớ iđườ ng thẳng đi qua gốc của hình ảnh. Điều này cho phép một hình thức của Hough cho

các đườ ng thẳng đượ c gọi là Hough cực cho các đườ ng thẳng (Duda, 1972). Điểm mà

đườ ng thẳng này giao với đườ ng thẳng trong hình ảnh đượ c cho bởi công thư c:

p= x cos+y sin

Trong giai đoa n pha t hiê n la n đươ ng sử dụng các ha m Hough lines đê trích xuất

đườ ng trong ảnh dựa trên biến đổi Hough. Tư công thư c 2.21

x =−

, y =

−

(2.13)

(2.14)

(2.15)

(2.16)



43

: A p d ụng các biến đổi Hough cho đườ ng thẳ ng

Sau khi a p du ng biê n đô i Hough va Hough lines ta thu đươ c h nh a nh ba i toa n dươ iđây:

: Sau khi sư du ng thuâ t toa n hough va hough lines

Đô i vơ i ba i toa n trên sau khi lo c đươ ng mô ta như ca c va ch ma u đo , th co 1 vâ n đê xa ra la không t m đươ c điê m cuô i cu a đươ ng. Vê vâ n na y phương pha p biê n đô i Houghtheo xa c suâ t đê t m đươ c điê m kê t thu c cu a đươ ng

: điê m kết thu c cu a đươ ng khi sư du ng biến đô i hough theo xa c suất

Đê cho ra h nh a nh cuô i cu ng ta bô sung bit cu a hai a nh trên, kê t qua se thu đươ c a nhsau:

: Kêt qua cuối cu ng



44

2.4.

Xư ly dư liê u va đưa ra ca nh ba o

Ca nh ba o la nô i dung ch nh cu a hê thô ng ca nh ba o va cha m ô tô. Trong phâ n na y se sư du ng kê t qua la đâ u ra cu a bươ c nhâ n da ng đô i tươ ng ơ trên. Đô i tươ ng ơ đây đươ cnhâ n da ng va ba i toa n se t nh toa n khoa ng ca ch vơ i đô i tươ ng đo . Nê u trong ngươ ng khôngan toa n th hê thô ng se tư thông ba o cho ngươ i la i xe chu đô ng đê xư ly t nh huô ng ki p

thơ i nhă m gia m thiê u nguy cơ tai na n. Nô i dung phâ n na y gô m co :

Ươ c lươ ng khoa ng ca ch

Dư đoa n tô c đô

2.4.1. Ươ c lươ ng khoa ng ca ch

Sau khi nhâ n da ng đô i tươ ng, hê thô ng câ n ươ c lươ ng khoa ng ca ch vơ i tư cameramoblie vơ i ca c đô i tươ ng kha c đang tham gia lưu thông. Hiê n nay viê c sư du ng camera tư

moblie đê xa c đi nh khoa ng ca ch đi a ly giư a hai đô i tươ ng đang di chuyê n la mô t điê u vôcu ng kho . Khi mô pho ng thực 3D thông qua ống kính của một máy ảnh vào một hình ảnh

2D, một số thông tin se bị mất trong đo co ca c thông sô vê khoa ng ca ch vơ i ca c phươngtiê n kha c. Camera không thể đưa ra bất cứ phép đo thực sự của các khoảng cách trong thế

giớ i thực chỉ nhìn một hình ảnh. Va tô n ta i 2 vâ n đê sau:

Vấn đề thư nhâ t xe có kích thướ c và hình dạng khác nhau. Tuy nhiên là không phải

là một ý tưở ng tồi để giả định có chiều r ộng trung bình cho tất cả các loại xe.

Vấn đề thứ hai là chiều r ộng trong mét của xe không đượ c lấy tr ực tiế p từ hình ảnh,

nhưng một nhóm các điểm ảnh có chứa các hình ảnh của chiếc xe.

Để giải quyết điều này, cần t tìm ra mối quan hệ giữa kích thướ c của khu vực chứa

xe, và khoảng cách đến nó. Vì lý do này, đây là một phương pháp đê tiê p câ n, h nh a nhsau la khoa ng ca ch kha c nhau đo đươ c đê n vi tr cu a xe.

a)khoa ng ca ch 5m vơ i xe b)khoa ng ca ch 20m vơ i xe



45

c)khoa ng ca ch 35m vơ i xe d)khoa ng ca ch 50m vơ i xe

: Mâ u h nh a nh ơ ca c khoa ng ca ch kha c nhau vơ i đối tươ ng la xe.

Kê t qua thu đươ c thê hiê n mỗi quan hê giư a khoa ng ca ch vơ i k ch thươ c phân vu ngcâ n phân loa i thê hiê n trong h nh sau:

: Sơ đồ thê hiê n mối quan hê giư a k ch thươ c va khoa ng ca ch

Đườ ng cong phù hợ p cho xấ p xỉ khoảng cách từ vùng phân loại kích thước. tru choa nh la khoảng cách đến các xe (mét). Tru c tung là kích thước xe ta i vu ng đang xe t. Cácđiểm màu đỏ đại diện cho các biện phá p thu đượ c từ mỗi hình ảnh. Các đườ ng cong màu

xanh là mô hình tiên đoán đượ c trang bị cho các điểm dữ liệu.Để có thể thực hiện một dự

đoán của khoảng cách, biê u đô trên đã đượ c quyết định để phù hợ p vớ i một mô hình hàm

mũ [7]

.exp. .exp. 2.4.2.

Dư đoa n tô c đô

Điện thoại thông minh nga y nay đa co râ t nhiê u tiê n ch, trong đo có hệ thống định

vị toàn cầu GPS. Vớ i công nghệ này ta có thể ướ c tính tốc độ một cách dễ dàng và chính

xác hơn. Điều này đượ c thực hiện bằng cách đầu tiên ước lượ ng vị trí của thiết bị thôngqua kê t nô i internet. Viê c đo tô c đô se a p du ng theo công thư c: v = s/t (2.23)

(2.17)



46

CHƯƠNG 3: XÂY DƯ NG PHÂ M MÊ M THƯ NGHIÊ M VA ĐA NH GIA KÊ T QUA

Chương 2 đa nêu ra ca c phương pha p gia i quyê t ba i toa n gia m sa t va ca nh ba o vacha m

Chương này sẽ trình bày cụ thể về quá trình thực hiện việc xây dựng phâ n mê m gia m

sa t va ca nh ba o va cha m ô tô trên thiê t bi di đô ng, các thực nghiệm cụ thể bao gồm cách

xây dựng bộ dữ liệu huấn luyện, các bướ c thực nghiệm và k ết quả đạt đượ c, từ đó đưa racác phân tích, nhận xét về các k ết quả đó.

Trong quá trình nghiên cứu và cài đặt hệ thống phâ n mê m, em có sử dụng thư viện

mã nguồn mở OpenCV cho v OpenCV cài đặt khá đầy đủ các thuật toán xử lý ảnh nên

đượ c sử dụng r ất r ộng rãi trong lĩnh vực này. Toàn bộ chương trình đượ c viết trên ngôn

ngữ Java va C++ với môi trườ ng phát triển eclipse.

Ngoài ra để phục vụ cho quá trình huấn luyện dữ liệu em có sử dụng công cụ

HaarTraining đã cài đặt sẵn thuật toán AdaBoost để thực hiện huấn luyện các cascade sử dụng các đặc trưng Haar -like.

3.1. Thư nghiê m va đa nh gia kê t qua .

3.1.1.

Qua tr nh thu thâ p dư liê u

Hê thô ng co nhiê m vu gia m sa t va ca nh ba o va cha m ô tô nên hê thô ng se co hai phâ nch nh câ n đươ c xây dư ng:

Phâ n nhâ n da ng đô i tươ ng : Dư liê u la ca c khung h nh đươ c lâ y ra tư camera tư

thiê t bi di đô ng, sau đo hê thô ng thư c hiê n nhâ n da ng đô i tươ ng la m dư liê u đâ uva o cho phâ n theo do i va đưa ra ca nh ba o.

Phâ n theo do i đô i tươ ng va đưa ra ca nh ba o: Dư liê u đâ u va o la ca c đô i tươ ng thuđươ c ơ phâ n nhâ n da ng, tư đo sư du ng ca c thuâ t toa n đa nêu ơ chương 2 đê t nhtoa n khoa ng ca ch va đưa ra ca nh ba o.

3.1.1.1. Dư liê u đâ u va o

Qua tr nh thu nhâ p dư liê u la điê u kiê n bă t buô c cu a hê thô ng phâ n mê m gia m sa t va

ca nh ba o va cha m giao ô tô trên ca c thiê t bi di đô ng. Hê thô ng se sư du ng camera ca c thiê t bi trên đê thu video la m dư liê u đâ u va o, ca c video na y gă n trư c tiê p va ghi la i ha nh tr nhdi chuyê n cu a ca c phương tiê n tham gia lưu thông.

Video ban đêm co đă c điê m thiê u, ánh sáng đèn đườ ng yếu dẫn đến độ tương phản

tổng thể của cả video r ất thấ p, hầu như chỉ thấy đèn của các phương tiện giao thông chiếu

ra bở i vậy các video ban đêm trước khi đượ c lấy dữ liệu huấn luyện cần phải qua một

bướ c tiền xử lý. Cụ thể quá trình tiền xử lý này sẽ đượ c trình bày ở phần sau.



47

Video huấn luyên ban đêm

Video huấn luyê n ban nga y

3.1.1.2. Đô i tươ ng huâ n luyê n

Các đối tượng đượ c sử dụng cho quá trình huấn luyện đượ c trích xuất ra từ các video

đầu vào. Cụ thể là video đầu vào sẽ đượ c trích xuất ra các khung hình, r ồi các đối tượ ng

sẽ đượ c thu thậ p từ các khung hình đó.

Nhưng không phải tất cả các khung hình của video đều đượ c trích xuất, mỗi ảnh

đượ c lấy ra cách nhau 5 hoặc 10 khung hình do tỷ lệ khung hình/giây của video là khá lớ nnên các đối tượng đượ c trích xuất ra từ các khung hình liên tiế p nhau sẽ gần như là giống

nhau, mà việc này thì không có lợ i cho quá trình huấn luyện khi mà việc càng phong phú

các mẫu thì k ết quả huấn luyện sẽ càng tốt.

Như đã trình bày, trướ c khi thực hiện trích xuất đối tượng, các video ban đêm sẽ tr ải

qua một bướ c tiền xử lý, cụ thể là tất cả các khung hình sẽ đượ c xử lý sau khi lấy đượ c từ

các video. Quá trình tiền xử lý này bao gồm các bướ c:



48

Chuyển đổi không gian màu của ảnh từ RGB (Red-Green-Blue) sang không gian

màu HSV (Hue-Saturation-Value).

Tách ảnh thành 3 ảnh thành phần chứa 3 kênh H, S, V riêng biệt.

Thực hiện thuật toán cân bằng Histogram trên kênh H.

Ghép 3 ảnh thành phần lại về thành ảnh gốc.

Chuyển không gian màu từ HSV về RGB.

Tăng sáng cho kênh R của ảnh.

Thực hiện phép làm trơn ảnh bằng Gaussian.

Giảm sáng cho những điểm ảnh có mức xám lớ n.

Từng bướ c trong quá trình xử lý này đều có trong thư viện mà OpenCV hỗ tr ợ , nên

tốc độ chung của phần này là r ất nhanh, không đáng kể.

Trướ c và sau quá trình tiề n xử lý ảnh ban đêm

Sau khi đã xử lý xong các khung hình thì dữ liệu về các đối tượ ng sẽ đượ c trích xuất.

Mỗi đối tượ ng sẽ được đại diện bở i một cửa sổ hình vuông cắt ra từ các khung hình đó.

Mâ u positive ban nga y.



49

Mâ u positive ban đêm

Đê tăng kha năng nhâ n da ng đô i tươ ng cho hê thô ng, em đa sư du ng thêm ca c mẫu positivecu a Caraffi et al. (2012) va Markus Weber (1999). Bô dư liê u na y gô m bô 430 a nh vê đô itươ ng ô tô miêu ta như h nh sau:

Mâ u positive theo Caraffi et al va Markus Weber

Đô i tươ ng cu a ba i toa n la phương tiê n ô tô vơ i điê u kiê n a p du ng cho ba i toa n đa nêu

ơ chương I vơ i đă c điê m la đuôi xe ô tô đi trong la n đươ ng mô t chiê u.

3.1.2. Qua tr nh huâ n luyê n

3.1.2.1. Môi trươ ng phâ n cư ng huâ n luyê n la

Cấu hình phần cứng phục vụ cho quá trình huấn luyện:

Vi xư ly : Intel Core i5



50

RAM : 4GB

Hê điê u ha nh: Windows 10

Công cu huâ n luyê n: HaarTraining

Thờ i gian huấn luyện cho mỗi bộ phân loại thườ ng là từ 5-6 ngày.

3.1.2.2.

Ca c bươ c huâ n luyê n Sau khi đã có môi trườ ng huấn luyện và các dữ liệu đầu vào cần thiết thì sẽ tiến hành

thực hiện việc huấn luyện các mẫu dữ liệu đó.

Bươ c 1: Tạo các mẫu positive và negative cho bộ huấn luyện

Như đã trình bày ở chương 2, có hai loại mẫu đầu vào cần chuẩn bị để thực hiện quá

trình huấn luyện là các mẫu có chứa đối tượ ng (positive) và các mẫu không chứa đối tượ ng

(negative).

Đầu tiên là tạo ra hai tậ p tin mô tả của các mẫu positive và negative. Đưa h nh a nhva o trong thư mu c …\training\negative rô i cha y file batch create_list.bat.

Khi cha y tâ p tin na y ba n nhâ n file co ghi ca c do ng

Tiế p theo bạn cần phải tạo một tậ p tin dữ liệu chứa tên của hình ảnh positive cũngnhư vị trí của các đối tượ ng trong mỗi hình ảnh. Bạn có thể tạo ra file này thông qua mô ttrong hai công cu : Objectmarker or Image Clipper. Đê xây dư ng nhanh cho ng em du ngtool Objectmarker.

Ta o thư mu c ...\training\positive\rawdata đê chưa như ng h nh a nh positive

Sau khi cha y xong, chươnng tr nh objectmaker se ta o ra file info.txt là tậ p tin mô tả

mẫu positive nằm trong thư mục positive của công cụ huấn luyện, trong đó liệt kê số lượ ng

các phương tiện giao thông trong từng ảnh và tọa độ xuất hiện của phương tiện trong ảnhđó. Trong info.txt sẽ có một số thông tin đi nh da ng như dưới đây:

dir /b *.jpg >bg.txt



51

Số đầu tiên trong mỗi dòng xác định số lượng các đối tượ ng hiện có trong các hình

ảnh được đưa ra. Ví dụ, ở dòng thứ hai, số 3 có nghĩa là bạn đã chọn ra ba đối tượ ng xe ô

tô trong khung h nh image1201.bmp.

Bốn chữ số k ế tiế p (thể hiện trong màu xanh lá cây) xác định vị trí của đối tượng đầu

tiên trong hình ảnh (to a đô x = 35, y = 24, chiều r ộng = 70 và chiều cao = 39). Các con số

màu đỏ xác định các dữ liệu cho đối tượ ng thứ hai; Các con số màu xanh xa c đi nh đốitượ ng thứ ba.

H nh 3-4: Công cụ Object Marker giúp t ạo các mẫ u huấ n luyện



52

T ập tin positive đầu ra của công cụ Object Marker

Bươ c 2: Chạy bộ huấn luyện

Sau khi đã có 2 tậ p tin chứa các mẫu positive và negative cần thiết, việc tiế p theo là

tạo một tập tin lưu các vector ảnh sinh ra từ các mẫu positive thu đượ c ở bước trướ c. Thực

hiện việc này bằng cách chạy một lệnh trong công cụ HaarTraining:

Ý nghĩa các tham số chính:

-info: tậ p tin chứa các mẫu positive.

-vec: tập tin lưu các vector ảnh.

-num: số lượ ng các mẫu positve tổng cộng trong file info.txt.

-w, -h: kích thước đối tượ ng (các mẫu sẽ đượ c tự động chỉnh về kích thướ c này).

K ết quả thu đượ c là tậ p tin vector.vec nằm trong thư mục data của công cụ, tậ p tinnày sẽ là đầu vào cho quá trình huấn luyện. Chạy lệnh dưới đây để thực hiện quá trình

huấn luyện:

Ý nghĩa các tham số chính:

-data: các stage của mô hình cascade sau quá trình huấn luyện sẽ nằm trong thưmục này.

-vec: tập tin vector đượ c sinh ra ở trên.

-bg : tậ p tin chứa các mẫu negative (background).

-npos, -nneg : số lượ ng mẫu positive và negative.

-nstages: số lượ ng stage huấn luyện.

-mem: lượ ng RAM dành cho huấn luyện.

haartraining.exe -data data/cascade -vec data/vector.vec -bg negative/infofile.txt -npos 475

-nneg 2865 -nstages 25 -mem 1000 -mode BASIC -w 24 -h 24 – nonsym



53

K ết quả của quá trình huấn luyện này chính là bộ phân loại mạnh dùng cho quá trình

nhận dạng.

H nh 3-5: Minh họa quá trình chạ y công cụ huấ n luyện bộ nhận d ạng

Bươ c 3: Chuyê n đô i đi nh da ng bô phân loa i.

Sau khi kê t thu c huâ n luyê n bô nhâ n da ng bă ng tool Haar-training, trong thư mu c../training/cascades/data ta co ca c danh mu c đươ c đă t tên tư “0” đê n “N-1”, trong đo N la sô lươ ng ca c giai đoa n đa đươ c xa c đi nh trong haartraining.bat.

Các stage trong bộ huấn luyện sinh ra được sau bướ c 2 cần phải đượ c chuyển về định

dạng khác để có thể sử dụng được trong thư viện OpenCV, ở đây là định dạng xml. Thực

hiện điều này bằng cách chạy lệnh:

File xml sinh ra có cấu trúc tương đối tr ực quan, có chứa các stage là các bộ phân

loại mạnh bên trong có chứa các bộ phân loại yếu là các đặc trưng Haar -like, các đặc trưngna y đươ c lưu la i dướ i dạng các hình chữ nhật có tọa độ và kích thướ c nằm trong một

khung 24x24 pixel.

haarconv.exe data data output.xml 24 24



54

C ấ u trúc t ậ p tin xml chứ a bộ nhận d ạng

Trong thờ i gian thực hiện đồ án có hạn nên bộ nhận dạng sử dụng đặc trưng LBP chovideo ban đêm em chưa thực hiện xong nên chưa có kết quả để so sánh. Phần lớ n thờ i gian

huấn luyện dành chủ yếu cho các video ban ngày.

3.1.3. Thư nghiê p va đa nh gia kê t qua

Yêu câ u hê thô ng

Đê thư nghiê m cho ba i toa n, em cha y ư ng du ng trên ma y LG-isai vơ i câ u h nh:

Hê điê u ha nh: Android 4.4.2. KitKat

Ch p: Snapdragon 801 bốn nhân tốc độ 2.5 GHz

Ram: 3GB

Ma y ca i ư ng du ng OpenCV

Kê t qua thư nghiê m

Đô i vơ i ca c phương tiê n tham gia thao thông trên đươ ng, hê thô ng câ n nhâ n da ngca c xe ơ ph a trươ c va đo đươ c khoa ng ca ch, trong thư c nghiê m ba i toa n đa gia i quyê t vâ nđê trên nhưng co n trễ vê thơ i gian. Dươ i đây la mô t sô h nh a nh ma hê thô ng đa thu đươ c.



55

: Nhâ n da ng đối tươ ng xe ph a trươ c.

: Pha t hiê n la n xe

: Pha t hiê n la n xe



56

Trong qua tr nh thư c nghiê m trong qua ng đươ ng gâ n 50km kê t qua cu a hê thô ng tr nh ba y ơ ba ng dươ i đây:

Ba ng 1: Đô ch nh xa c viê c pha t hiê n đô i tươ ng xe trong 10s đâ u

Thơ i gian Thư c tê Pha t hiê n %

10h15 68 60 88,23

Ba ng 2: Thơ i gian nhâ n da ng xe cu a mươ i xe trên thư c tê

xe Thơ i gian pha t hiê n thư c tê (chuâ n0s)

Thơ i gian pha t hiê n cu a hê thô ng (s)

1 0 1,34

2 0 1,4

3 0 0,12

4 0 4,56

5 0 1.33

6 0 5,22

7 0 1,23

8 0 1,33

9 0 4,16

10 0 2,01

Ba ng 3: Sô đô i tươ ng đo đươ c khoa ng ca ch trong 10s đâ u

Thơ i gian Sô xe pha t hiê n đươ c Sô xe xa c đi nh đươ c khoa ng ca ch %

10h15 41 32 78,04

Ba

ng 4: Thơ

i gian đo khoa

ng ca ch cu

a mươ

i xe trong thư c tê

xe Thơ i gian pha t hiê n thư c tê (chuâ n0s)

Thơ i gian đo đươ c khoa ng ca ch cuarhê thô ng (s)

1 0 2,12

2 0 3,4

3 0 1,12

4 0 1,58



57

5 0 5.02

6 0 4,10

7 0 3,00

8 0 3,34

9 0 3,56

10 0 1,31

Nhâ n xe t va phân t ch kê t qua thu đươ c

Qua các k ết quả thu đượ c từ quá trình thực nghiệm em có một số đánh giá và nhận

xét sau:

Qua kê t qua ba ng 1 cho thâ y, viê c nhâ n da ng đô i tươ ng xe cu a hê thô ng l0s đâ u đa t88,23%, điê u na y cho thâ y ră ng viê c nhâ n ra ng đô i tươ ng la không kho vơ i ba i toa n na yv đơn gian ba i toa n ch nhâ n đô i tươ ng xe ph a trươ c va trong cu ng la n xe vơ i m nh lên

viê c nhâ n da ng trơ lên dễ da ng hơn.Mă t kha c, vẫn co n 11,77% la viê c nhâ n da ng diễn ralâu hơn 10s, không nhâ n da ng đươ c hoă c nhâ n da ng nhâ m.

Nguyên nhân chủ yếu là do đặc điểm của những video ở thời điểm khác nhau ảnh

hưởng khác nhau đến bộ nhận dạng. Như đã biết thì bộ nhận dạng sử dụng mô hình cascade

phụ thuộc nhiều vào yếu tố độ sáng, mà những video ở thời điểm sáng sớm có độ sáng

khác so vớ i những video ở thời điểm giữa trưa, ngoài ra hướ ng chiều của mặt tr ờ i lên các

phương tiện cũng khác nhau nên kết quả nhận dạng sẽ bị ảnh hưở ng nhiều.

Độ ổn định của hệ thống có thể đượ c cải thiện bằng cách tăng độ phong phú của các

mẫu huấn luyện, cụ thể là sử dụng nhiều mẫu ở tất cả các thời điểm khác nhau trong ngàyđể huấn luyện cho bộ nhận dạng. Hoặc một cách tiế p cận khác là có thể sử dụng riêng bộ

nhận dạng khác nhau cho từng thời điểm khác nhau, việc lựa chọn bộ nhận dạng nào sẽ

tùy vào độ sáng của video đó. Điê u na y ly gia i v sao thơ i gian pha t hiê n đô i tươ ng se bi trễ như trong ba ng 2

3.2. Phâ n mê m gia m sa t va ca nh ba o va cha m ô tô trên thiê t bi di đô ng

Ơ chương I đa nêu ra ca c phương pha p, ca c ư ng du ng cho ba i toa n gia m sa t va ca nh ba o va cha m ô tô. Nhưng no chưa phô biê n trong nga nh công nghê ô tô v đơn gia n ca c

chi ph sa n xuâ t ra ca c thiê t bi râ t đă t ma không pha i ngươ i tham gia phương tiê n na o cu ngco thê sơ hư u đươ c. V ly do na y em đa xây dư ng ba i toa n nêu trên trên ca c thiê t bi di đô ngnhă m kiê m tra va thư c hiê n t nh an toa n khi la i xe.

Ngày nay, hệ điều hành Android là nền tảng phổ biến nhất cho điện thoại thông minh

và các thiết bị di động. Do thực tế này đa co râ t nhiê u nha pha t triê n trên thê giơ i đa pha ttriê n như ng ư ng du ng liên quan đê n tâ m nh n ma y t nh. Mô t trong như ng ư ng du ng na y la ư ng du ng OpenCV do Bradski (2000) pha t triê n. Thư viện mạnh mẽ này đã thực hiện các



58

thuật toán và phương pháp phổ biến nhất hỗ trơ tiế p cận để phát hiện đối tượng v vâ y ư ngdu ng đo hoàn toàn phù hợ p bở i việc thực hiện của ba i toa n na y.

Phâ n mê m cha y trên ca c thiê t bi di đô ng, Ơ version na y em xây dư ng hê thô ng cha ytrên môi trươ ng android 4.0 trơ lên.

3.2.1. Tô ng quan vê phâ n mê m

Phâ n mê m vơ i giao diê n đơn gia n, sư dung camera cu a thiê t bi đê thu video. Phâ nmê m co nhiê m vu pha t hiê n la n đươ ng ma ô tô đang đi va pha t hiê n ra ca c ô tô ph a trươ c.Sau đo se đo đươ c khoa ng ca ch tơ i chiê c ô tô đa pha t hiê n đo , nhă m giu p cho ngươ i la i xe

biê t đươ c khoa ng ca ch vơ i xe ph a trươ c la bao xa đê thay đô i tô c đô

3.2.2.

Phân t ch thiê t kê phâ n mê m

: Sơ đồ khối mô ta hoa t đô ng cu a phần mềm .

Bă t đâ u

Huâ n luyê n bô nhâ n da ngđô i tươ ng ô tô

Theo do i, đưa ca nh ba o

Nhâ n da ng đô i tươ ng

Kê t thu c

Dư liê u huâ nluyê n

Dư liê u kiê mthư



59

: Sơ đồ chi tiết cho qua tr nh nhâ n da ng đối tươ ng

3.2.3.

Giao diê n chương tr nh

Giao diện của chương trình đượ c thiết k ế đơn giản, thân thiện vớ i giao diê n ch nh xư du ng camera cu a ca ch thiê t bi di đô ng.



60

Giao diê n ch nh cu a phần mềm sư du ng camera



61

KÊ T LUÂ N VA HƯƠ NG PHA T TRIÊ N

Trên cơ sơ t m hiê u va nghiên cư u ba i toa n gia m sa t va ca nh ba o va cha m ô tô trênthiê t bi di đô ng cu thê la viê c xây dư ng va pha t triê n ba i toa n nhâ n da ng đô i tươ ng, va ca nh ba o dư a trên thông tin đô i tươ ng đươ c nhâ n da ng, đồ án đã đạt đượ c những k ết quả

như sau:

Giớ i thiệu sơ lượ c về những phương pháp đã đượ c sử dụng cho ca nh ba o va cha mô tô trên thiê t bi di đô ng, từ đó đưa ra các so sánh và nhận xét để tìm được phươngán triển khai thích hợ p nhất.

Giớ i thiệu một cách khái quát bài toán nhận dạng đối tượ ng và bài toán ca nh ba o,,các phương pháp tiế p cận cho mỗi bài toán và việc k ết hợp hai bài toán để tạo

nên hệ thống đếm phương tiện giao thông hoàn chỉnh.

Trình bày thuật toán học máy AdaBoost, tìm hiểu về mô hình cascade cũng nhưđặc trưng Haar -like và đặc trưng LBP để có thể xây dựng đượ c bộ nhận dạng sử

dụng cho bài toán nhận dạng đối tượ ng cụ thể là nhận dạng phương tiện giao

thông.

Trình bày thuật toán pha t hiê n điê m cư c tri Scale-space va thiê t lâ p vu ng quantâm, thuâ t toa n Canny, thuâ t toa n Hough trong viê c pha t hiê n la n đươ ng

Tiến hành thực nghiệm hệ thống trên ca c thiê t bi di đô ng vơ đây la ca c thiê t bi android, từđó đưa ra cách đánh giá, nhận xét về k ết quả thu đượ c cho mỗi bài

toán nhỏ và cho cả hệ thống.

Bên cạnh những k ết quả đạt đượ c thì vẫn còn những hạn chế đó là:

K ết quả của hệ thống chưa ổn định, còn phụ thuộc nhiều vào điều kiện và đặcđiểm của các video đầu vào như là yếu tố thờ i gian, thờ i tiết, số lượng và đặc

điểm của các phương tiện giao thông…

Chưa ha n chê đươ c vê mă t trễ thơ i gian, điê u na y râ t quan tro ng trong thư c tê , va chưa co ca nh ba o ro ra ng

Qua những k ết quả và hạn chế của hệ thống đã cho thấy theo phương tiện giao thôngnói chung và đưa ra ca c ca nh ba o dư đoa n va cha m nói riêng đòi hỏi một quá trình nghiên

cứu và thực hiện lâu dài. Trong phạm vi đồ án em mớ i chỉ thực hiện đượ c việc gia m sa tva ca nh ba o va cha m ơ ca c vu ng ngoa i tha nh do viê c xe cô t đông đu c như trong nô i

tha nh, để có thể xây dựng một hệ thống tổng quát, áp dụng đượ c cho nhiều nơi thì cần

phải có thêm nhiều thời gian. Trướ c mắt hướ ng phát triển của đồ án sẽ là phải tậ p trung

cải thiện tăng độ chính xác cũng như độ ổn định của hệ thống vớ i nhiều điều kiện và hoàn

cảnh khác nhau, xây dựng và hoàn thiện những bộ nhận dạng đang còn thiếu sót, củng cố

và phát triển thuật toán để khắc phục đượ c những lỗi còn tồn tại.



TÀI LIỆU THAM KHẢO

Ta i liê u tiê ng Viê t:

[0] Thê Thi Hươ ng. Ky thuâ t trư a nh va ư ng du ng. Kho a luâ n tô t nghiê p Đa i ho c 2015,

Đa i ho c Công Nghê - Đa i ho c Quô c Gia Ha Nô i.

[1] Phạm Hồng Ngự, Nhận d ạng đối tượ ng sử d ụng thuật toán AdaBoost , Luận vănThạc sĩ Khoa học công nghệ thông tin, Đại học Huế, 2009.

Ta i liê u tiê ng Anh:

[2] David J. Fleet, Yair Weiss. Optical flow estimation, Mathematical models for

Computer Vision: The Handbook. N. Paragios, Y. Chen, and O. Faugeras (eds.), Springer,

2005.

[3] J. L. Barron, D. J. Fleet, and S. S. Beauchemin. Performance of optical flow

techniques. International Journal of Computer Vision, 12(1):43 – 77, 2007

[4] Yoav Freund and Robert E. Schapire, A decision-theoretic generalization of on-line

learning and an application to boosting, In Computational Learning Theory: Eurocolt ’95,Springer-Verlag, 1995.

[5] Paul Viola and Michael J. Jones, Rapid Object Detection using a Boosted Cascade

of Simple feature, IEEE CVPR, 2001.

[6] Multi-part Vehicle Detection using Symmetry Derived Analysis and Active

Learning, Ravi Kumar Satzoda, Member, IEEE and Mohan M. Trivedi, Fellow, IEEE.Accepted for Publication in IEEE Transactions on Intelligent Transportation Systems

[7] Ilustrated example in the calculation of the Local Binary Pattern for a pixel

with neighborbood of size 8

Website tham kha o

[10] CV oline: http://homepages.inf.ed.ac.uk/rbf/CVonline/Imagedbase.htm

[11] Wikipedia: http://www.wikipedia.org

[12] Youtube: https://www.youtube.com/watch?v=p5T8RzYE60M

http://homepages.inf.ed.ac.uk/rbf/CVonline/Imagedbase.htm


http://www.wikipedia.org/

http://www.wikipedia.org/


Documents

Đồ án tốt nghiệp