62
7/21/2019 Đồ án tốt nghiệp http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 1/62  HC VIN CÔNG NGH BƯU CHÍNH VIỄN THÔNG Khoa công ngh thông tin 1 ĐÔ    A   N   T NGHIÊ     P ĐA     I HO     C  Đê    ta   i: NGHIÊN CƯ  U VA    XÂY DƯ     NG PHẦN MM GIÁM SÁT VÀ CNH BÁO VA CHM Ô TÔ TRÊN THIÊ   T BI     DI ĐÔ     NG Giảng viên hướ ng dn: Ths.Nguyn Thanh Thy Sinh viên thự c hin : Vũ Tuyên Hoàng Lớ p : D11CNPM2 Khóa :      : 2011 –  2016 Ch   nh quy Ha    nô    i 12/2015 

Đồ án tốt nghiệp

Embed Size (px)

DESCRIPTION

cảnh báo va chạm ô tô trên mobie

Citation preview

Page 1: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 1/62

 

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

Khoa công nghệ thông tin 1

ĐÔ    A  NTÔ  T NGHIÊ   P ĐA   I HO   C 

 Đê  ta  i: 

“NGHIÊN CƯ   U VA    XÂY DƯ    NG PHẦN MỀM GIÁM SÁT VÀ CẢNH BÁO

VA CHẠM Ô TÔ TRÊN THIÊ  T BI   DI ĐÔ   NG” 

Giảng viên hướ ng dẫn: Ths.Nguyễn Thanh Thủy

Sinh viên thự c hiện : Vũ Tuyên Hoàng 

Lớ p : D11CNPM2

Khóa :Hê      : 

2011 –  2016Ch nh quy 

Ha  nô   i 12/2015 

Page 2: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 2/62

 

LƠ    I CA  M ƠN 

Sau thơ   i gian ho  c tâ    p, nghiên cư  u trong Khoa Công nghê   thông tin, cuô  i cu ng em cu  nghoa n tha nh đô  a n tô  t nghiê    p đê  trơ    tha nh tân ky   sư vơ   i đê  ta i “Nghiên cư  u va  xây dư  ng phâ nmê m gia m sa  t va  ca nh ba o va cha  m ô tô trên thiê t bi  di đô  ng”. 

Lơ   i đâ u tiên, con xin gư  i lơ   i ca m ơn ba me   , anh trai đa   luôn bên con, đô  ng viên, u ng hô   ,ch  ba o va  đi   nh hươ   ng cho con trong suô  t năm năm dươ   i Ho  c Viê  n Công Nghê    Bưu Ch nhViễn Thông đê  con co   đươ   c tha nh qua  như nga y hôm nay. 

Sau đo  , em xin ca m ơn ca c thâ y cô trong Ho  c Viê  n no  i chung va  Khoa Công Nghê    ThôngTin 1 no  i riêng đa   ân câ n, tâ  n t nh gia ng da  y cho em như  ng kiê n thư  c vê  chuyên nga nh va  như   ng kiê n thư  c vê  la m ngươ   i đê  em co   điê u kiê  n ho  c tâ    p tô  t nhâ  t ta   i Ho  c Viê  n.

Đă   c biê   t em xin gư  i lơ   i ca m ơn sâu să  c tơ   i Ths.Nguyễn Thanh Thu  y đa   ch  ba o tâ  n t nh va  đô  ng viên em đê  em co   thê  hoa n tha nh đô  a n tô  t nghiê    p mô   t ca ch tô  t nhâ  t trong thơ   i gian

qua.

Điê u cuô  i cu ng em muô n chu  c ca c thâ y cô trong khoa Khoa Công Nghê   Thông Tin 1

ma  nh kho e, luôn vui ve  đê  truyê n đa   t nhiê u kiê n thư  c cho chu  ng em. 

Em xin chân tha nh ca m ơn! 

Ha  nô   i, 08/12/2015

Vu   Tuyên Hoa ng

Page 3: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 3/62

 

3

MU   C LU   C 

DANH MU   C CA  C HI  NH VE   , SƠ ĐÔ    ............................................................................. 5 

DANH MỤC CÁC BẢNG ................................................................................................. 7 

MƠ    Đ   U ............................................................................................................................. 8 

CHƯƠNG 1: GIƠ   I THIÊ   U CHUNG ............................................................................ 10 

1.1.  Hê   thô  ng gia  m sa  t va    ca nh ba  o va cha   m ô tô ................................................ 10 

1.2. 

Pha   m vi ba   i toa  n .............................................................................................. 11 

1.3.  Nghiên cư   u liên quan ....................................................................................... 11 

1.3.1.  Sư   du  ng hê  thô  ng ca m biê n, hê  thô  ng kiê m soa  t thông minh .................... 11

 

1.3.2. 

Sư   du  ng phương pha  p xư   ly  a nh ................................................................ 13 

1.3.2.1.  Phương pha  p loa   i trư   nê n ....................................................................... 14

 

1.3.2.2.  Phương pháp Optical flow ..................................................................... 16

 

1.4. 

Ưu nhươ    c điê m cu  a ca  c phương pha  p đa   pha  t triê n .................................... 17 

CHƯƠNG II: GIA  I PHA  P GIA  M SA  T VA    ĐƯA RA CA  NH BA  O .......................... 18 

2.1.  Đê   xuâ  t gia  i pha  p tô ng thê  .............................................................................. 18 

2.1.1. 

 Nhâ  n da  ng đô  i tươ   ng ô tô .......................................................................... 18 

2.1.2.  Pha  t hiê  n la n đươ  ng ................................................................................... 19

 

2.1.3. 

Xư   ly 

 thông tin va 

 đưa ra ca nh ba 

o ............................................................ 20 

2.2. 

Nhâ   n da   ng đô  i tươ    ng ....................................................................................... 20 

2.2.1.  Kiê n thư  c chung ......................................................................................... 20

 

2.2.1.1. 

Tô ng quan vê  video ................................................................................ 21 

2.2.1.2. 

Pha  t hiê  n đô  i tươ   ng chuyê n đô  ng ........................................................... 23 

2.2.1.3.  Thuâ   t toa n huâ n luyê  n AdaBoot ............................................................ 25

 

2.2.1.4. 

Đă   c trưng Haar-like va  mô h nh cascade ............................................... 26 

2.2.1.5. 

Đă   c trưng Local Binary Pattern ............................................................. 29 

2.2.2.  Ca c bươ   c nhâ  n da  ng đô  i tươ   ng .................................................................. 31

 

2.2.2.1. 

Thu thâ    p dư    liê  u ..................................................................................... 32 

2.2.2.2. 

Tiê n xư   ly  dư    liê  u ................................................................................... 34 

2.2.2.3. 

Huấn luyện ............................................................................................. 35 

2.2.2.4. 

 Nhận dạng .............................................................................................. 36 

2.3. 

Pha  t hiê   n la   n đươ    ng ........................................................................................ 37 

Page 4: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 4/62

 

4

2.3.1. 

Pha  t hiê  n điê m cư  c tri  Scale-space va  thiê  t lâ    p vu ng quan tâm................. 37 

2.3.1.1. 

Pha  t hiê  n điê m cư  c tri  Sacle-space......................................................... 38 

2.3.1.2.  Ma   ho  a a nh theo khu vư  c ....................................................................... 40

 

2.3.2. 

Thuâ   t toa n Canny va  biê n đô  i Hough ........................................................ 40 

2.4. 

Xư    ly   dư     liê   u va    đưa ra ca  nh ba  o ................................................................... 44 

2.4.1.  Ươ   c lươ   ng khoa ng ca ch ............................................................................. 44

 

2.4.2. 

Dư    đoa n tô  c đô    ........................................................................................... 45 

CHƯƠNG 3: XÂY DƯ    NG PH   M MÊ   M THƯ    NGHIÊ   M VA    ĐA  NH GIA   KÊ  T QUA  ........................................................................................................................................... 46

 

3.1. 

Thư    nghiê   m va    đa  nh gia   kê  t qua  . ................................................................... 46 

3.1.1. 

Qua   tr nh thu thâ    p dư    liê  u .......................................................................... 46 

3.1.1.1. 

Dư    liê  u đâ u va o ...................................................................................... 46 

3.1.1.2.  Đô  i tươ   ng huâ n luyê  n ............................................................................. 47

 

3.1.2.  Qua   tr nh huâ n luyê  n.................................................................................. 49

 

3.1.2.1. 

Môi trươ  ng phâ n cư  ng huâ n luyê  n la  ..................................................... 49 

3.1.2.2. 

Ca c bươ   c huâ n luyê  n .............................................................................. 50 

3.1.3.  Thư   nghiê  p va  đa nh gia   kết qua  ................................................................. 54

 

3.2. 

Phâ   n mê  m gia  m sa  t va    ca nh ba  o va cha   m ô tô trên thiê  t bi   di đô   ng .......... 57 

3.2.1. 

Phân t ch thiê t kê  hê   thô ng ......................................................................... 58 

3.2.2.  Giao diê  n chương tr

 

nh .............................................................................. 59 

KÊ  T LU   N VA    HƯƠ   NG PHA  T TRIÊ  N ..................................................................... 61 

TÀI LIỆU THAM KHẢO ............................................................................................... 62 

Page 5: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 5/62

 

5

DANH MU   C CA  C HI  NH VE   , SƠ ĐÔ    

H nh 1-1: La n đươ  ng va  đô  i tươ   ng ô tô ............................................................................. 10 

H nh 1-2: Sơ đô  tô ng quan cu  a hê  thô  ng ........................................................................... 11 

nh 1-3: Mô pho 

ng ca 

c ca 

m biê n đang đươ   c sư 

 du  ng .................................................... 12 

H nh 1-4: Ca c bươ   c xư   ly  a nh. .......................................................................................... 13 

H nh 1-5: Ảnh (a) là ước lượ ng nền cơ sở , ảnh (b) thu đượ c ở   bướ c tiế p theo. ảnh (c) thể 

hiện bản đồ điểm ảnh nổi tr ội phát hiện đượ c bằng cách sử dụng phép tr ừ nền. .............. 14 

H nh 1-6: Frame ảnh tại thời điểm t trướ c và sau khi vẽ các vector có hướ ng ................. 17 

H nh 2-7: Đô  i tươ   ng ô tô đươ   c nhâ  n da  ng......................................................................... 18 

H nh 2-8: La n đươ  ng đươ   c pha  t hiê  n ................................................................................ 19 

H nh 2-9: Khoa ng ca ch an toa n ........................................................................................ 20 

H nh 2-10: Câ u tru  c phân đoa  n video ................................................................................ 21 

H nh 2-11: Biê u đô  ma u cu a 4 loa   i cơ ba n (a) a nh tô  i (b) a nh sa ng .................................. 22 

H nh 2-12: Tô ng quan ca c khô  i xư   ly  trong ba i toa n pha  t hiê  n đô  i tươ   ng. ....................... 23 

H nh 2-13: Pha  t hiê  n vu ng a nh nô  i .................................................................................... 24 

H nh 2-14: Xư   ly  ca c vu ng a nh nô  i (Foreground Processing)........................................... 24 

H nh 2-15: Minh họa của thuật toán AdaBoost. ................................................................ 25 

H nh 2-16: Bô    phân loa   i ma  nh H(x) sau khi xây dư  ng bă ng AdaBoostError! Bookmarknot defined. H nh 2-17: Ca c đă   c trưng Haar like cơ ba n ....................................................................... 27

 

H nh 2-18: Minh họa ví dụ trong tính toán của các mẫu nhị phân cục bộ cho một pixel lâncâ  n ...................................................................................................................................... 30

 

H nh 2-19: LBP bâ  t biê n bâ  t biê n vơ   i ca ch thay đô i đơn trong mư  c xa m ......................... 31

 

H nh 2-20: Khung h nh triê t xuâ  t tư   video đâ u va o. .......................................................... 33 

H nh 2-21: Chuỗi các khung hình liên tiế p tách ra từ video (từ 1 đến 6) .......................... 33 

H nh 2-22: Tậ p huấn luyện của các bộ học yếu ................................................................ 34 

H nh 2-23: Mẫu Negative .................................................................................................. 35 

H nh 2-24: hững đặc trưng Haar -like đầu tiên đượ c chọn trong bộ nhận dạng ................ 36 

H nh 25: biê u diễn Scale-space ......................................................................................... 38 

H nh 2-26: Biểu đồ mô phỏng việc tính toán các DoG ảnh từ các ảnh k ề mờ  .................. 39 

H nh 2-27: Mỗi điểm ảnh đượ c so sánh vớ i 26 láng giềng của nó .................................... 39 

H nh 2-28: Khu vư  c pha  t hiê  n la n đươ  ng trong vo ng tro n ma u đo Error! Bookmark not

defined. H nh 2-29: v  du    a nh đươ  ng viê n ....................................................................................... 41

 

H nh 2-30: A  p dụng các biến đổi Hough cho đườ ng thẳng............................................... 43 

H nh 2-31: Sau khi sư   du  ng thuâ   t toa n hough va  hough lines .......................................... 43 

H nh 2-32: điê m kê t thu  c cu a đươ  ng khi sư   du  ng biê n đô  i hough theo xa c suâ  t .............. 43 

H nh 2-33: Kết qua  cuối cu ng ........................................... Error! Bookmark not defined. H nh 2-34: Mẫu h nh a nh ơ    ca c khoa ng ca ch kha c nhau vơ   i đô  i tươ   ng la  xe. .................. 45

 

H nh 2-35: Sơ đô  thê  hiê  n mô  i quan hê  giư   a k ch thươ   c va  khoa ng ca ch ......................... 45 

Page 6: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 6/62

 

6

H nh 3-1: Sơ đô  khô  i mô ta  hoa   t đô  ng cu  a hê    thô ng. ........................................................ 58 

H nh 3-2: Sơ đô  chi tiê t cho qua   tr nh nhâ  n da  ng đô  i tươ   ng ............................................. 59 

H nh 3-3: Công cụ Object Marker giúp tạo các mẫu huấn luyện ...................................... 51 

H nh 3-4: Minh họa quá trình chạy công cụ huấn luyện bộ nhận dạng ............................ 53 

H nh 3-5: Nhâ  n da  ng đô  i tươ   ng xe ph a trươ   c................................................................... 55 

H nh 3-6: Pha  t hiê  n la n xe. ................................................................................................ 55 

H nh 3-7: Đo khoa ng ca ch tơ   i xe ph a trươ   c. .................................................................... 55 

Page 7: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 7/62

 

7

DANH MỤC CÁC BẢNG

Ba ng 1: Đô     ch nh xa  c viê    c pha  t hiê   n đô  i tươ    ng xe trong 10s đâ   u ............................... 56 

Ba ng 2: Thơ    i gian nhâ   n da   ng xe cu  a mươ    i xe trên thư    c tê  .......................................... 56 

Ba 

ng 3: Sô   đô  i tươ    ng đo đươ    c khoa 

ng ca ch trong 10s đâ   u ......................................... 56

 

Ba ng 4: Thơ    i gian đo khoa  ng ca  ch cu  a mươ    i xe trong thư    c tê  .................................... 56 

Page 8: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 8/62

 

8

MƠ    Đ   U 

Đâ t nươ   c ta đang thơ   i thơ   i k  Công nghiê    p ho  a – Hiê  n đa   i ho a, vơ   i sư    tiê n bô    va  pha  ttriê n không ngư  ng trên tâ  t ca  ca c l  nh vư  c trong cuô  c sô ng la m châ  t lươ   ng cuô  c sô  ng nga yca ng tăng cao. Khi xa   hô   i đi lên, nhu câ u đi la   i, vâ  n chuyê n cu a con ngươ   i nga y ca ng caova  câ n thiê t. Ch nh v  vâ  y giao thông nă m vai tro  chu   trô  t trong xa   hô   i hiê  n nay. 

Trong những năm gần đây, Ô tô là phương tiện giao thông chủ yếu và ngày càng

 phát triển hơn chiếm phần lớ n trong các quốc gia trên thế giới. Ô tô đã giải quyết các vấn

đề đi lại của con ngườ i và giảm thiểu đượ c thời gian đi lại đáng kể của mỗi chúng ta. Trên

thế giớ i có r ất nhiều hãng sản xuất xe nổi tiếng, lâu đờ i có thể k ể đến như: Mercedes,BMV, Honda... Theo số liệu thống kê của Bộ Giao thông Vận tải, trong 9 tháng của năm2015, lực lượ ng CSGT toàn quốc đăng ký mới 230.008 xe ôtô và hơn 2,2 triệu xe môtô,nâng tô ng số  phương tiện đang quản lý lên 2,5 triệu xe ôtô và 43,4 triệu xe môtô. Chỉ t nhriêng sô   vu    ta   i na  n trong tháng 9 (tính từ ngày 16/8/2015 đến 15/9/2015), cả nướ c xảy ra

1.837 vụ, làm chết 697 ngườ i, làm bị thương 1.695 người. Sô   vu    tai na  n đa   gia m so vơ   i

cu ng ky  năm 2014 nhưng vẫn co n ơ    mư  a đa ng ba o đô  ng. 

Công nghệ cảnh báo tai nạn đượ c các hãng xe ô tô chú tr ọng nghiên cứu và phát triển

từ khá lâu. Ở hầu hết các mẫu xe hiện đại, hệ thống cảnh báo tai nạn hoạt động dựa trên

thông tin từ các cảm biến dọc thân xe có nhiệm vụ phát hiện vật cản, nguy cơ va chạm,

tr ạng thái xe bất thườ ng, từ đó kích hoạt hàng loạt các chức năng an toàn để thông báo

cho lái xe đồng thờ i giảm thiểu tổn thương cho ngườ i ngồi trong xe. Không chỉ bảo vệ 

hành khách bằng cách tự siết chặt dây an toàn, nhiều mẫu xe hiện đại còn đượ c trang bị hàng loạt các tính năng an toàn như hệ thống cân bằng điện tử ESP, hệ thống phanh khẩn

cấ p BA, hệ thống chống bó cứng phanh ABS, hệ thống kiểm soát hành trình thông minh

ACC… Gần đây, nhiều công nghệ cảnh báo tai nạn đượ c các nhà khoa học tại Mỹ tíchcực nghiên cứu, trong đó phải k ể đến công nghệ dự đoán hành động của tài xế qua quan

sát ngôn ngữ cơ thể, công nghệ tự động liên lạc giữa các xe đang lưu thông trên đườ ng

khi có nguy cơ tai nạn xảy ra… 

Khi con ngườ i sử dụng ô tô là phương tiện giao thông đi lại chủ yếu của mình hơn,thì hằng năm có rất nhiều vụ giao thông bằng ô tô đã xảy ra đã cướp đi bao nhiêu sinhmạng… Mấy năm trở  lại đây, các công ty và các nhà phát triển trên thế giới đã chú trọng

hơn và không ngừng nghiên cứu phát triển các thiết bị cảnh báo va chạm ô tô nhằm góp

 phần giảm thiểu nguy cơ va chạm do con ngườ i gây ra. Có thể k ể tớ i các thiết bị như công

nghệ V2V, Hệ thống cảnh báo chống va chạm giữa ôtô và xe đạ p vừa đượ c hãng xe Volvogiớ i thiệu tại triển lãm công nghệ CES 2015 va  đă   c biê   t la  thiê  t bi  nho   go  n Mobileye của

Isarel cảnh báo va chạm tai nạn sớm cho ô tô đã và đang rất nổi tiếng trên thế giớ i.

Y   thư  c tâ m quan tro  ng cu  a viê   c ba o vê  sư    an toa n cho ca c chu   phương tiê  n tham giagiao thông băng ô tô va  gia m các chi phí cho các thiết bị trên khá đắt, nên đề tài “ Phâ nmê m gia  m sa  t va   ca  nh ba  o va cha   m ô tô trên ca  c thiê t bi    di đô   ng ”nhằm góp phần giảm

thiểu r ủi ro va chạm và phổ biến, thông dụng hơn cho tất cả mọi ngườ i lái xe ô tô.

Page 9: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 9/62

 

9

Trong pha  m vi đô  a n cu a m nh, em xin đê  xuâ  t xây dư  ng phâ n mê m gia m sa  t va  ca nh ba o va cha  m ô tô co   thê  sư   du  ng đê  pha  t hiê  n la n đươ  ng đưa ra ca nh ba o nê u phương tiê  nđi lâ n la n đươ  ng, va  pha  t hiê  n ô tô ph a trươ   c. 

 Nô   i dung đô  a n bao gô m 3 chương như sau: 

Chương 1: Giơ   i thiê   u chung

Phâ n na y se   giơ   i thiê  u gia i pha  p vê  ca ch nhâ  n da  ng đô  i tươ   ng va  đưa ra ca nh ba o.Ca ch tiê  p câ  n, phương pha  p phu   hơ     p gia i quyê  t vâ n đê  ba i toa n. 

Chương 2: Gia  i pha  p gia  m sa  t va    đưa ra ca  nh ba  o 

Chương na y se   đưa ra nhưng ba i toa n nho   trong hê   thô  ng va  ca c phương pha  p xâydư  ng hê  thô ng ư  ng du  ng. 

Chương 3: Xây dư    ng phâ   n mê  m thư    nghiê   m va    đa  nh gia   kê  t qua   

Trong chương na y tr nh ba y cu    thê  vê  qua   tr nh xây dư  ng hê   thô  ng phâ n mê m gia m

sa  t va  ca nh ba o va cha  m ô tô, ca c bươ   c thư  c hiê  n thư  c nghiê  m, kê t qua  thư  c nghiê  m đa   tđươ   c. Như  ng kê  t qua  ư  ng dư  ng hê   thô ng đa   đa   t đươ   c, nhưng khuyê t điê m va  ca ch khă  c phu  c trong tương lai. 

Page 10: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 10/62

 

10

CHƯƠNG 1: GIƠ   I THIÊ   U CHUNG 

Chương na y se   giơ   i thiê  u tô ng qua  t ba i toa n gia m sa  t va  ca nh ba o va cha  m ô tô khilưu thông trên đươ  ng bao gô m mu  c tiêu, đô  i tươ   ng hươ   ng tơ   i va  pha  m vi cu  a ba i toa n.Trong phâ n na y cu  ng tr nh ba y tô ng quan vê  ca c phương pha  p liên quan gia i quyê  t ba i

toa n. 

1.1.  Hê   thô  ng gia  m sa  t va    ca nh ba  o va cha   m ô tô

Hê  thô ng gia m sa  t va  ca nh ba o va cha  m ô tô la  hê  thô ng co   kha  năng phân t ch, xư   ly  như   ng h nh a nh thu đươ   c tư   camera cu a ca c thiê t bi  di đô  ng như mobile hay tablet, va  xa cđi   nh ca c đô  i tươ   ng la  la n đươ  ng va  ô tô đang tham gia lưu thông, tư   đo   go  p phâ n đưa ranhư  ng phân t ch nhă m ca nh ba o cho t nh tra  ng hiê  n ta   i cu  a phương tiê  n.

: La  n đươ   ng va   đối tươ   ng ô tô

Hê  thô ng bao gô m 2 phâ n ch nh câ n quan tâm la : phâ n theo do  i đôi tươ   ng va  phâ n đưara ca nh ba o. 

 Phâ n theo do  i đô  i tươ   ng:  

 Đâ u va  o: Video thu đươ   c tư   camera    Đâ u ra: Nhâ  n da  ng đô  i tươ   ng thu đươ   c tư   camera đâ u va o va  pha  t hiê  n la n đươ  ng 

 Phâ n đưa ra ca nh ba  o:

   Đâ u va  o: Ca c đô  i tươ   ng đa   nhâ  n da  ng đươ   c 

   Đâ u ra: Theo do  i đô  i tươ   ng va  đưa ra ca nh ba o 

Page 11: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 11/62

 

11

: Sơ đồ tô ng quan cu a hê    thống  

Hê   thô  ng sư   du  ng camera đê  thu đươ   c ca c video, sau đo   se    ta ch tha nh ca c khungh nh liên tiê  p nhau đê  la m đâ u va o qua   tr nh xư   ly  a nh. Ơ   bươ   c na y hê   thô ng se   sư   du  ngca c phương pha  p đa   đươ   c huâ n luyê  n đê  nhâ  n da  ng đô  i tươ   ng co   trong a nh. Khi hê   thô  ng

đa   nhâ  n da  ng đô  i tươ   ng co   trong a nh tư   đo   pha  t hiê  n ra khoa ng ca ch giư   a ca c đô  i tươ   ngva  đưa ra ca nh ba o cho hê  thô  ng. 

1.2.  Pha   m vi ba   i toa  n 

Ba i toa n gia m sa  t va  ca nh ba o va cha  m ô tô trên ca c thiê t bi  di đô  ng la  mô   t ba i toa nco   thê  a  p du  ng ơ    pha  m vi rô  ng va  ơ    nhiê u điê  u kiê  n kha c nhau. Do ba i toa n đang trongqua   tr nh nghiên cư  u va  pha  t triê n lên em xin giơ   i ha  n ba i toa n theo mô   t sô   tiêu tr  cu    thê  sau đê  hê  thô  ng hoa   t đô  ng mô   t ca ch tô  t nhâ  t.

 

Giơ   i ha  n vê  pha  m vi: ba i toa n a  p du  ng cho ca c phương tiên lưu thông ơ    khu vư  cngoa   i tha nh trên la n đươ  ng mô   t chiê u. 

  Giơ   i ha  n vê  thơ   i gian: thơ   i gian phương tiê  n lưu thông ban nga y va  như   ng nơi co   a nh sa ng tô  t. 

1.3. 

Nghiên cư   u liên quan

Vê  ba i toa n gia m sa  t va  ca nh ba o va cha  m ô tô trên ca c thiê t bi  no  i chung đa   co   râ  tnhâ  t nhiê u gia i pha  p tiê  p câ  n vâ n đê  na y. Phâ n na y se   tr nh ba y mô   t sô   gia i pha  p đươ   c sư   dung nhiều nhất đê  gia i quyết ba i toa n trên. 

1.3.1. 

Sư    du   ng hê   thô  ng ca m biê n, hê   thô  ng kiê m soa  t thông minh 

Đã co   nhiê u nghiên cứu, phát triển và ứng dụng trong suốt 20 năm qua trên khă  p thê   giơ   i, các hệ thống ngăn ngừa va chạm sử dụng nhiều cảm biến để phát hiện nguy cơ vachạm vớ i các xe khác. Khi va chạm sắ p xảy ra, hệ thống này sẽ cảnh báo tài xế, hoặc tự 

động phanh xe hay cao cấp hơn là tự đánh lái để né tránh.

Camera Ca c khun h nh  Tiê n xư   l    a nh 

Pha  t hiê  n ha nh vi  Theo do  i đô  i tươ   n    Nhâ  n da  n đô  i tươ   n  

Đưa ca nh ba o 

Page 12: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 12/62

 

12

Mô   t v  du    tiêu biê u vê  hê  thô  ng ca nh ba o va cha  m ph a trươ   c đươ   c biê t đê n phô   biê nnhâ  t la  công nghê  an toa n Toyota Safety Sense, Prometheus va  do ng xe thông minh trongtương lai gâ n.

Công nghệ Safety Sense sẽ mang đến hệ thống cảnh báo va chạm phía trướ c vớ i hệ 

thống điều khiển bằng laser. Hê   thô ng sẽ cảnh báo ngườ i lái phương tiê  n ca c kha  năngxảy ra va chạm như vươ    t qua   tô  c đô   , khoa ng ca ch vơ   i xe ph a trươ   c qua   gâ n. Nếu ngườ ilái ta c đô  ng gia m tô  c đô    sau tín hiệu cảnh báo, hệ thống phanh khẩn cấ p tự động sẽ hoạt

động dư  a trên ca c nguyên tă  c đâ u va o kha c nhau đê  ta c đô  ng va o tô  c đô    cu  a xe, như giảm

tốc độ của xe xuống 30 km/h hoă   c dư  ng phương tiên hoàn toàn.

Hệ thống cảnh báo va chạm phía trướ c hoạt động khi vận tốc xe nằm trong khoảng

16 –  138 km/h và khi tốc độ giữa 2 xe chênh lệch lớn hơn 16 km/h [13]. Trong khi đó, hệ 

thống phanh khẩn cấ p tự động hoạt động khi vận tốc đạt từ 11 đến 79 km/h. Bên cạnh đó,công nghệ mới này còn mang đến cho người dùng tính năng cảnh báo khở i hành sai làn

đườ ng.[13]

: Mô pho ng ca  c ca m biến đang đươ   c sư    du  ng  

Ta   i Nhật Bản đa    khở i xướ ng chương  trình xe an toàn tiên tiến để phát triển công

nghệ tiên tiến tránh các vụ tai nạn. Chương trình Prometheus đã đa   pha  t triê n trong mô   t

thơ   i gian da i đươ   c coi như mô   t ngươ   i la  i phu   , dư    a n đươ   c pha  t triê n ơ    Nhâ   t ba n vơ   i ca c chức năng sau: giám sát làn đườ ng, và xe tự tr ị.

Ta   i Hoa ky , hệ thống hỗ tr ợ  lái xe tiên tiến đượ c gọi là (ADAS), sản phẩm tiế p tục

nghiên cứu và phát triển ngày càng cải thiện hơn. K ết quả là hê   thô  ng có khả năng cảm

nhận tình huống nguy hiểm và phản ứng một cách thích hợ  p trong trườ ng hợ  p ngườ i lái

xe không phải kiểm soát đượ c.

Page 13: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 13/62

 

13

Hê  thô  ng xe thông minh là một thực tế đa   đang va  se   pha  t triê n lơ   n ma  nh trong như   ngnăm tơ   i va  đi va o cuô  c sô  ng con ngươ   i nhă m đem la   i sư    an toa n cho mỗi chu  ng ta. 

1.3.2.  Sư    du   ng phương pha  p xư    ly   a nh 

Camera la  tha nh tư  u tha nh công cu a loa i ngươ   i trong vâ n đê  thu nhâ  n a nh. Viê   c sư   du  ng camera la m thiê t vi  theo do  i va  ca nh ba o giao thông đa   đươ   c a  p du  ng trong như   ngnăm gâ n đây trên nươ   c ta. Trướ c kia, các video này sẽ đượ c gửi tớ i những người điều hành

đườ ng bộ chịu trách nhiệm giám sát tr ực tiế p. Nhưng ngày nay, ngoài việc sử dụng con

ngườ i thì ca c hê  thô  ng co   sư   du  ng khoa ho  c tâ m nh n ma y t nh co   các thuật toán xử lý ảnh

đã có thể tự động đưa ra các phân tích, thu thậ p thông tin từ các video giao thông giúp cho

việc giám sát tr ở  nên dễ dàng và tự động hóa hơn rất nhiều.

Về cơ bản, các thông tin về hình ảnh thu đươ   c tư   camera sẽ đượ c số hóa sử dụng các

 phần cứng trong máy tính, máy tính đó cũng đượ c tính hợ  p những phần mềm đươ   c thiê tkê   để có thể tính toán các số liệu giao thông cần thiết. Các thuật toán xử lý ảnh hoàn toàn

có thể đượ c sử dụng trong việc thay thế những thiê t bi  ca m biê t bằng một camera giám sát

duy nhất, cung cấ p một phạm vi r ộng để có thể nhận dạng các đối tượ ng và ngoài ra còn

có chi phí bảo trì sửa chữa thấ p.

Ca c bươ   c xư   ly  a nh: 

: Ca  c bươ   c xư    ly   a nh. 

 Phần thu nhận ảnh: Ảnh có thể nhận qua thiê t bi  camera. Có thể là a nh màu hoặca nh đen trắng với độ phân giải khác nhau.

Tiề n xử  lý: la  qua   tr nh lọc nhiễu, nâng cao chất lượ ng ảnh. Phân vùng ảnh hay phân

đoạn: tách ảnh thành các vùng hoặc đối tượ ng quan tâm.

 Biể u diễ n ảnh: Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng(feature extraction).

Cơ sơ    tri thư  c 

Thu nhâ  na nh 

 Nhâ  n da  ngva  nô   i suy 

Biê u diễnva  mô ta  

Phân đoa  na nh 

Tiê n xư   ly  a nh 

Page 14: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 14/62

 

14

 Nhận d ạng và nội suy ảnh: Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này

thường thu đượ c bằng cách so sánh vớ i mẫu chuẩn đã đượ c học (hoặc lưu) từ trướ c. Nội

suy là phán đoán theo ý nghĩa trên cơ sở  nhận dạng.

Cơ sở  tri thứ c: Nhằm giúp quá trình xử lý và phân tích ảnh theo cách làm của con

ngườ i.

Các hệ thống nhận dạng sử dụng phương pha  p xử lý ảnh có khả năng nhâ  n da  ng các phương tiện giao thông kha c nhau đang lưu thông đê  co   thê  tính toán khoảng cách giư   aca c phương tiê  n và tốc độ cho mỗi loại phương tiện và trên từng làn đườ ng... mang la   i sư    hiê  u qua  hư  a he  n cho ba i toa n gia m sa  t va  ca nh ba o va cha  m mà đồ án đang quan tâm. 

1.3.2.1. 

Phương pha  p loa    i trư     nê  n 

 Nhận dạng đối tượ ng chuyển động trong video là một trong những vấn đề quan tr ọng

cần phải giải quyết của lĩnh vực thị giác máy tính. Một trong những hướ ng tiế p cận đó là phải phân biệt đượ c giữa đối tượ ng ( foreground ) và cảnh vật, phông nền (background ).

Trong các hệ thống nhận dạng và theo dõi, thuật ngữ nền (background ) dùng để chỉ tậ phợp các điểm ảnh không có sự chuyển động hoặc các điểm ảnh không thuộc về bất cứ đối

tượ ng nào cần quan tâm [9].

 Nhâ  n da  ng đô  i tươ   ng chuyê n đô  ng tư   chuỗi video la  nê n ta ng va  ta c vu    quan tro  ngtrong viê   c gia m sa  t video, kiê m tra va  phân t ch t nh tra  ng giao thông, gia m thiê u tai na  n,do  t m va  theo do  i con ngươ   i…Phương pha  p chung đê  nhâ  n da  ng đô  i tươ   ng chuyê n đô  ngla  trư   nê n, ơ    đây mỗi khung video đươ   c so sa nh vơ   i mô h nh tham chiê u hoă   c mô h nh trư   nê n. Ca c pixel trong frame hiê  n thơ   i ma  lê   ch đa ng kê  so vơ   i nê n se   đươ   c xem như la  đô  itươ   ng chuyê n đô  ng. Như  ng pixel na y đươ   c xư    ly   tiê  p cho viê   c đi   nh vi   va   theo do  i đô  i

tươ   ng. Loại tr ừ nền là một trong những k ỹ thuật cơ bản của xử lý ảnh trong đó hướ ng giảiquyết cơ bản là đi xây dựng một mô hình nền từ video ban đầu tức là từ tậ p các khung

hình trích xuất ra từ video đó, sau đó sử dụng mô hình này cùng vớ i khung hình hiện tại

cần xét từ đó rút ra được các đối tượ ng chuyển động. Ưu điểm của phương pháp này làkhá đơn giản.

: Ảnh (a) là ước lượ ng nền cơ sở  , ảnh (b) thu đượ c ở  bướ c tiế  p theo. ảnh (c) thể  hiện bản đồ điể m ảnh nổ i tr ội phát hiện đượ c bằ ng cách sử  d ụng phép tr ừ  nề n.

Page 15: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 15/62

 

15

Bất cứ một sự thay đổi đáng kể nào trên một vùng ảnh từ mô hình nền sẽ đượ c hiểu

r ằng đó là một đối tượ ng chuyển động. Tậ p hợ  p những điểm ảnh tạo nên vùng ảnh có sự 

thay đổi đó sẽ được lưu lại để xử lý.

Thông thườ ng các thuật toán liên k ết đối tượ ng sẽ đượ c sử dụng để xử lý tậ p những

điểm ảnh trên thành các đối tượ ng liên k ết vớ i nhau qua từng khung hình, tiến trình này

đượ c gọi là loại tr ừ nền.

Thuâ   t toa n trư   nê n  Thuâ   t toa n câ    p nhâ    p nê n 

 Input: ảnh nền B, ảnh hiện tại I và ma tr ận

ngưỡ ng T

Output : ảnh M là mặt nạ chuyển động

m:=getHeight(M);n:=getWidth(M);

for x:=1 to m do

for y:=1 to n do

if | B[x,y]-I[x,y] | > T[x,y] then

M[x,y]:=255;

else M[x,y]:=0;

 Input:  nền B, ảnh hiện tại I và mặt nạ 

chuyển động M

Output: nền B đượ c cậ p nhật lại

m:=getHeight(B);n:=getWidth(B);

for x:=1 to m do

for y:=1 to n do

if M[x,y]=0 then

B[x,y]:=α*B[x,y]+(1-α)*B[x,y]; 

 

Đô     chênh lê    ch cu  a ca  c khung h  nh 

Để tính toán ra đượ c ảnh chỉ chứa nền thì một tậ p những chuỗi khung hình sẽ đượ clấy giá tr ị trung bình. Cụ thể ảnh nền tại thời điểm sẽ được tính bằng cách:

, 1 ∑ 1 , , 1

Trong đó là số lượng khung hình sử dụng để tính trung bình. Giá trị trung bình

này có liên quan đến giá trị trung bình của mỗi điểm ảnh trong những khung hình đó,bằng bao nhiêu sẽ phụ thuộc vào t ốc độ của video (số khung hình/giây) và t ổng số 

những chuyển động có trong video đó. Sau khi tính toán được ảnh nền B,  t hì có

thể sử dụng để loại tr ừ trong ảnh I , , tại thời điểm tương ứng và lấy ngưỡng, nghĩalà đối tượ ng sẽ đượ c tính theo:

| , , , | > ℎ 

(1.1)

(1.2)

Page 16: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 16/62

 

16

Trong đó là Th ngưỡng tương tự như phương pháp trên. Ngoài cách lấy giá tr ị trung

 bình thì có thể dùng giá tr ị trung vị để tính ảnh nền, cách làm cũng tương tự vớ i giá tr ị trung bình.

 

Ha   m Gaussian 

Hướ ng tiế p cận này sẽ tính toán cho mỗi điểm ảnh

,   m

ột cách độc l

ập. Trong

đó hàm mật độ xác suất Gaussian sẽ được sử dụng với n điểm ảnh ở  khung hình trướ cđó. Để tránh việc phải tính lại hàm mật độ này ở  mỗi khung hình mớ i, giá tr ị trung bình

qua các khung hình sẽ đượ c tính theo công thức:

1 −  

Vớ i  và  là giá tr ị của điểm ảnh và giá tr ị trung bình tại thời điểm t và − là giá

tr ị trung bình tại thời điểm trước đó,  là tr ọng số đượ c chọn tùy thuộc vào sự lựa chọn

ưu tiên giữa độ ổn định hay là tốc độ cậ p nhật giá tr ị. Tại mỗi khung hình ở  thời điểm t,

giá tr ị  sẽ được coi là đối tượ ng nếu nó thỏa mãn điều kiện:

| | >  

 Nếu không thỏa mãn thì  sẽ được coi là nền. Với  là độ lệch tiêu chuẩn của phân

 phối Gaussian và có thể tính đượ c một cách dễ dàng giống như  

Mỗi một cách tiế p cận đều có ưu điểm và nhược điểm riêng tùy thuộc vào đặc điểm

của video đầu vào mà sử dụng cho phù hợp. Ý tưở ng chung của các phương pháp này đều

là để có thể phát hiện ra các đối tượ ng chuyển động trong video thì phải xây dựng đượ cmô hình nền, mô hình này có thể đượ c học qua các khung hình lấy từ video đó. Sau đómô hình nền này sẽ đượ c sử dụ ng để so sánh vớ i khung hình hiện tại và k ết quả sẽ có

đượ c vùng nền và vùng đối tượng. Sau khi có được đối tượ ng r ồi thì việc bám theo đốitượ ng sẽ tr ở  nên đơn giản hơn nhiều.

1.3.2.2.  Phương pháp Optical flow 

Phương pháp Optical flow [2] thực hiện bằng cách sử dụng các vector có hướ ng của

các đối tượ ng chuyển động theo thời gian để phát hiện các vùng chuyển động trong một

ảnh [3].

Ý tưở ng quan tr ọng của phương pháp tính optical flow dựa trên giả định sau:

Bề ngoài của đối tượ ng không có nhiều thay đổi (về cường độ sáng) khi xét từ framethứ n sang frame n+1

I(,t) = I( + ,t +1)

Trong đó: 

  I(,t) là hàm tr ả về cường độ sáng[4] của điểm ảnh   tại thời điểm t (frame thứ 

t).

(1.3)

(1.4)

(1.5)

Page 17: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 17/62

 

17

  ,  là tọa độ của điểm ảnh trên bề mặt (2D),  (, ) là vector vận

tốc, thể hiện sự thay đổi vị trí của điểm ảnh từ frame thứ t sang frame t+1.

: Frame ảnh t ại thời điểm t trướ c và sau khi vẽ  các vector có hướ ng

1.4. 

Ưu nhươ    c điê m cu  a ca  c phương pha  p đa   pha  t triê n

Ca c gia i pha  p trên đê u đưa ra ca c gia i pha  p t nh toa n nhă m ha  n chê  ca c kha  năng vacha  m khi đang lưu thông trên đươ  ng. Vơ   i giơ   i ha  n ba i toa n co   thê  ru  t ra đươ   c mô   t sô   phânt ch va  nhâ  n xe t như sau: 

  Đô  i vơ   i biê  n pha  p sư   du  ng ca m biê n va  hê  thô  ng kiê m soa  t th  gia i pha  p na y chohiê  u qua  cao nhâ  t v  sư   du  ng ca c thiê t bi  chuyên biê   t, mỗi thiê t bi  co   mô   t nhiê  mvu    riêng. Nhươ   c điê m cu  a biê  n pha  p la  la  kinh ph  lă  p đă   t, ph  ba o tr  lơ   n, chưaa  p du  ng đươ   c ơ    ca c do ng xe phô   thông. 

 

Vơ   i cơ sơ    ha     tâ ng hiê  n nay ơ    Viê   t Nam, viê   c sư   du  ng ca c thiê t bi   thông minhsmartphone đa   trơ    lên phô   biê n th  co   thê  thư  c hiê  n triê n khai hê  thô  ng bă ng ca chsư   thuâ   t toa n xư   ly  a nh nhă m că  t gia m chi ph  va  phô   biê n cho ngươ   i tham giagiao thông. Vơ   i viê   c khoa ho  c ma y t nh nga y ca ng pha  t triê n th  viê   c ta c đô  nghay can thiê    p va o sâu trong ca c thiê t bi  di đô  ng th  đươ   c nghiên cư  u va  hỗ trơ     nhiê u hơn. Ch nh v   thê   ơ    đê   ta i na y em se   sư   du  ng thuâ   t toa n xư   ly  a nh trongviê   c nhâ  n da  ng va  ca nh ba o va cha  m ô tô se   đươ   c tr nh ba y trong chương sau.

Page 18: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 18/62

 

18

CHƯƠNG II: GIA  I PHA  P GIA  M SA  T VA    ĐƯA RA CA  NH BA  O 

Chương na y se   tr nh ba y ca c phương pha  p gia i quyê t ba i toa n gia m sa  t va  đưa ca nh ba o va cha  m ô tô trên ca c thiê t bi  di đô  ng. 

2.1.  Đê   xuâ  t gia  i pha  p tô ng thê  

 Như đa   tr nh ba y ơ    trên, ơ    ba i toa n na y em se   sư   du  ng gia i pha  p xư   ly  a nh đê  gia iquyê  t ba i toa n. Ba i toa n lơ   n na y se   gô m 3 ba i toa n nho  , mỗi ba i toa n se   tiê  p câ  n mô   t ca chxư   ly  va  thuâ   t toa n kha c nhau phu   hơ     p vơ   i hoa n ca nh va  điê u kiê  n đă   t ra.

  Ba i toa n nhâ  n da  ng đô  i tươ   ng ô tô

  Ba i toa n pha  t hiê  n la n đươ  ng 

  Ba i toa n xư   ly  thông tin va  đưa ra ca nh ba o 

Trong giơ   i ha  n nghiên cư  u đô  a n na y, em xin phe  p tr nh ba y ca c phương pha  p kha cnhau cho ca c ba i toa n nho   ơ    trên đê  t ch hơ     p gia i quyê t nghiê    p vu    cu  a ba i toa n lơ   n. Tư   đo   dư  a va o thư  c nghiê    p đê  đa nh, ru  t ra ba i ho  c đê  tô  i ưu ba i toa n. 

2.1.1.  Nhâ   n da   ng đô  i tươ    ng ô tô

Ba i toa n đâ u tiên ma  hê   thô  ng câ n gia i quyê t la  vâ n đê  nhâ  n da  ng đô  i tươ   ng, ma  cu    thê  trong ba i toa n đỗi tương la  phương tiê  n giao thông ô tô. Dư    liê  u đâ u va o cu a ba i toa nla  la  video thu đươ   c ơ    camera ca c thiê t bi  di đô  ng, hê    thô  ng câ n nhâ  n da  ng đô  i tươ   ng đangchuyê n đô  ng. Kê t qua  cu  a bươ   c nhâ  n na y đươ   c minh ho  a bă ng h nh a nh 

: Đôi tươ   ng ô tô đươ   c nhâ  n da  ng  

Page 19: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 19/62

 

19

Dư    liê  u thu đươ   c tư   video sẽ đượ c trích xuất ra các khung hình (frame), mỗi khung

hình là một đơn vị ảnh thu đượ c từ video đó, chất lượ ng của khung hình sẽ phụ thuộc hoàn

toàn vào chất lượ ng của video, và từ đó chất lượ ng của việc nhận dạng cũng bị ảnh hưở ng.

Chất lượ ng của video bao gồm các yếu tố như độ phân giải, tốc độ khung hình, cấu tạo

ống kính máy quay… Nê n cu  a video thu đươ   c se   la  cung đươ  ng tham gia giao thông, đô  itươ   ng di chuyê n co   thê  la  ô tô, xe ma y, xe đa    p, ngươ   i đi bô   ,…

Kê t qua  đâ u ra cu a bươ   c nhâ  n da  ng đô  i tươ   ng na y se   la  phâ n quan tro  ng liên quanmâ   t thiê t tơ   i đô    ch nh xa c viê   c đo khoa ng ca ch phâ n sau. Ch nh v  vâ  y nê u nhâ  n da  ng đô  itươ   ng không tô  t th  se   a nh hươ   ng tơ   i nghiê    p vu    ba i toa n. 

Cụ thể thuật toán đượ c lựa chọn để sử dụng trong bài toán này là thuật toán học máy

AdaBoost dựa trên mô hình cascade để phát hiện nhanh đối tượ ng. AdaBoost là một giải

thuật học máy đượ c phát triển bở i Yoav Freund và Robert Schapire, nó hoạt động dựa trên

nguyên tắc k ết hợ  p những bộ phân loại yếu để thu đượ c một bộ phân loại mạnh hơn [4].

Từ lý thuyết đó Paul Viola và Michael Jones đã sử dụng mô hình cascade, bao gồm các

đặc trưng Haar để xây dựng nên các bộ phân loại từ đó có thể nhận dạng được đối tượ ng

vớ i một độ chính xác cao. Ngoài ra trong phạm vi đồ án em sẽ trình bày thêm một đặc

trưng khác có thể sử dụng k ết hợ  p vớ i thuật toán AdaBoost đó là đặc trưng LBP, lý thuyết

cụ thể của phần này sẽ đượ c trình bày trong phần sau

2.1.2.  Pha  t hiê   n la   n đươ    ng 

Ba i toa n pha  t hiê  n la n đươ  ng phu  c vu    cho mu  c đich theo do  i la n đươ  ng khi phươngtiê  n di chuyê n va  gia m sa  t đưa ca nh ba o nê u phương tiê  n lâ n la n đươ  ng. Ba i toa n se   sư   du  ng ca c thuâ   t toa n đê  ta ch biên, pha  t hiê  n đươ  ng tr nh ba y ơ    phâ n sau đê  pha  t hiê  n la nđươ  ng trên đươ  ng. 

: La  n đươ   ng đươ   c pha  t hiê  n 

Page 20: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 20/62

 

20

2.1.3. 

Xư    ly   thông tin va    đưa ra ca  nh ba  o 

Sau khi đô  i tươ   ng ô tô đươ   c nhâ  n da  ng tha nh công. Hê   thô ng se   theo do  i đô  i tươ   ngva  t nh toa n khoa ng ca ch tư   camera tơ   i đô  i tươ   ng đươ   c nhâ  n da  ng ph a trươ   c. Ba i toa n na yđă   t ra mô   t vâ n đê  la  trong khi ca c phương tiê  n cu ng tham gia lưu thông, hay cu ng đang dichuyê n th  co   biê  n pha  p na o đê  đo đươ   c khoa ng ca ch 

: Khoa ng ca  ch  an toa  n 

Hiê  n nay viê   c sư   du  ng camera tư   moblie đê  xa c đi   nh khoa ng ca ch đi   a ly  giư   a hai đô  itươ   ng đang di chuyê n la  mô   t điê u vô cu ng kho  . Khi mô pho ng thực 3D thông qua ống

kính của một máy ảnh vào một hình ảnh 2D, một số thông tin se    bị mất trong đo   co   ca cthông sô   vê  khoa ng ca ch vơ   i ca c phương tiê  n kha c. Camera không thể đưa ra bất cứ phép

đo thực sự của các khoảng cách trong thế giớ i thực chỉ nhìn một hình ảnh. Phâ n sau se  

 ch 

 ra phương pha  p đê  đo khoa ng ca ch na y. 

2.2.  Nhâ   n da   ng đô  i tươ    ng 

2.2.1. 

Kiê n thư   c chung 

Việc nhận dạng đối tượ ng có thể đượ c thực hiện bằng cách học từ những khung nhìn

(view) khác nhau của đối tượ ng một cách tự động thông qua một cơ chế học máy có giám

sát. Việc học từ những khung nhìn này giúp giảm thiểu yêu cầu phải lưu trữ một bộ hoàn

chỉnh tất cả các mẫu. Các k ỹ thuật học máy có giám sát sẽ xây dựng một hàm từ dữ liệu

huấn luyện, dữ liệu huấn luyện này bao gồm các cặ p gồm đối tượng đầu vào và đối tượ ng

đầu ra mong muốn. Đầu ra của hàm đó có thể  là một giá tr ị  liên tục, gọi là hồi quy

(regression) hoặc có thể là dự đoán một nhãn phân loại cho một đối tượng đầu vào, gọi là

 phân loại (classification) [5]. Trong ngữ cảnh của nhận dạng đối tượ ng, các mẫu huấn

luyện đượ c xây dựng nên từ các đặc trưng của đối tượ ng k ết hợ  p với đối tượ ng liên k ết

với đặc trưng đó, trong bài toán nhận dạng phương tiện giao thông có thể hiểu mẫu huấn

luyện sẽ bao gồm các phương tiện giao thông và các đặc trưng của các phương tiện đó. 

Page 21: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 21/62

 

21

Việc lựa chọn các đặc trưng sao cho phù hợp đóng một vai trò quan tr ọng cho hiệu

năng của các bộ phân loại, một tập các đặc trưng phù hợ  p khi k ết hợ  p vớ i nhau có thể 

 phân loại một nhãn đối tượ ng này với nhãn đối tượ ng khác. Một đặc trưng có thể là một

vùng đối tượng, hướ ng chuyển động của đối tượ ng, hàm mật độ  của đối tượ ng

(histogram)… Sau khi lựa chọn được các đặc trưng phù hợ  p thì k ết quả phân loại sẽ phụ 

thuộc vào thuật toán học máy. Một số  thuật toán có thể  k ể  đến như là mạng nơ -ron,

AdaBoost, cây quyết định, SVM (Support Vector Machine)…Trong nghiê    p vu    cu  a hê   thô  ng em sẽ sử dụng thuật toán AdaBoost dựa trên mô hình

cascade do Paul Viola và Michael Jones phát triển, trong đó có sử dụng k ết hợp các đặc

trưng Haar -like để huấn luyện nhâ  n da  ng phương tiê  n đang tham gia lưu thông. Ngoài rađể có sự so sánh và đánh giá với đặc trưng Haar -like em sẽ sử dụng thêm một đặc trưngkhác để huấn luyện là đặc trưng LBP ( Local Binary Patterns).

2.2.1.1.  Tô ng quan vê   video 

Video la  tâ    p ca c khung h nh, mỗi khung h nh la  mô   t a nh. Shot (lia) la  đơn vi  cơ sơ    cu  a video. Mô   t lia la  đơn vi  vâ   t lyscuar do ng video, gô m ca c chuỗi ca c khung h nh liêntiê  p, không thê  chia nho   hơn, ư  ng vơ   i mô   t thao ta c camera đơn. 

Scene (ca nh) la  ca c đơn vi  logic cu a do ng video, mô   t ca nh gô m ca c lia liên quan vê  không gian va  thơ   i gian, cu ng mô ta  mô   t nô   i dung ngư    ngh  a hoă   c mô   t t nh tiê t. 

: Cấu tru  c phân đoa  n video 

Khi video đươ   c chiê u, ca c khung h nh đươ   c hiê n thi   ơ     tô  c đô     nhâ  t đi   nh. Tô  c đô    thươ  ng thâ y ơ    ca c video la  20-24 h nh/s. Như vâ  y mô   t video co   sô   khung h nh tương ư  ngla  10800 – 90000. Du   video ơ    da  ng na o HD, fullHD, 2K, …th  no   co   dung lươ   ng râ  t lơ   nđă   c biê   t la  đô  i vơ   i ca c thiê t bi  di đô  ng vô  n đa   chê  vê  bô    lơ   n th  la  vâ n đê  nan gia i. 

video

Scene

Shots Lia

Frames

Page 22: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 22/62

 

22

Phân loa   i la  qua   tr nh phân t ch va  chia nô   i dung h nh a nh video tha nh ca c đơn vi  cơsơ    go   i la  ca c lia (shot). Viê   c lâ y mâ u ch nh la  viê   c cho  n gâ n đu  ng khung video đa   i diê  ncho mỗi lia, va  đươ   c go   i la  khung- kho a.

Khung – kho a la  khung h nh đa   i diê  n mô ta  nô   i dung ch nh cu a shot. 

Qua   tr nh phân đoa  n giư    liê  u video tiê n ha nh phân t ch, pha  t hiê  n sư    chuyê n đô  i lia

na y sang lia kha c hay ch nh la  sư    pha  t hiê  n danh giơ   i giư   a ca c lia đo   (hay no  i đơn gia nhơn đo   ch nh la  sư    kha c nhau giư   a ca c khung h nh liê n kê .) 

Thuô  c t nh đă   c trung cu a video gô m co  : Color (ma u), Texture (kê t câ u), Shape (h nhda  ng), Motion (chuyê n đô  ng). 

 

Color 

Vơ   i mỗi mô   t a nh đê u co   mô   t biê u đô  ma u đê  biê u diễn sư    phân bô   ma u trong a nh, biê u đô  ma u không phu    thuô  c va o viê   c quay a nh, di   ch chuyê n a nh, chiê u nh n ma   phu    thuô  c va o hê  ma u va  ca c phương pha  p đi   nh lươ   ng đươ   c du ng. 

: Biê u đồ ma  u cu a 4 loa   i cơ ba n (a) a nh tối (b) a nh sa  ng  

(c) a nh tương pha n thấp (d) a nh tương pha n cao 

 

Texture 

Đây la  mô   t đă   c trung quan tro  ng cu  a bê  mă   t, nơi xa y ra viê   c lă    p la   i mẫu cơ ba n.Co   2 da  ng biê u diễn texture phô   biê n la : biê u diễn dươ   i da  ng ma trâ  n đô ng thơ   i va   biê u diễn Tamura 

  Ma trâ  n đô ng thơ   i mô ta  hươ   ng va  khoa ng ca ch giư   a ca c điê m a nh, ta co   thê  tr ch cho  n đươ   c ca c đă   c điê m y  ngh  a. 

  Biê u diễn Tamura đươ   c thu  c đâ y nhơ    nghiên cư  u vê  tâm l  trong viê   c thu nhâ  ntrư  c gia c cu  a con ngươ   i giu  p biê u diễn a nh trư  c quan hơn. 

Page 23: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 23/62

 

23

 

Shape 

Ca c đă   c trưng vê  h nh da ng co   thê  chia tha nh đă   c trưng toa n cu  c hoă   c đă   c trưngcu  c bô    

  Đă   c trưng toa n cu  c la  đă   c trưng thuô  c t nh thu đươ   c tư   toa n bô    h nh da ng a nhnhư chu vi, t nh tro n, t nh hươ   ng tru  c… 

  Đă   c trưng cu    bô    la  đă   c tư  ng thu đươ   c tư   viê   c thao ta c vơ   i mô   t phâ n cu  a a nh,

không phu    thuô  c va o toa n bô    a nh 

  Motion 

la  thuô  c t nh quan tro  ng cu  a video, thông tin vê  chuyê n đô  ng co   thê  đươ   c sinh ra bă ng ca c ky   thuâ   t ghe  p khô  i hoă   c luô ng a nh sa ng. Ca c đă   c trưng chuyê n đô  ng: mô-men trươ  ng chuyê n đô  ng, biê u đô  chuyê n đô  ng, ca c tham sô   chuyê n đô  ng toa n cu  cco    thê   tr ch cho  n vectơ chuyê n đô  ng. Ca c đă   c trưng mư  c cao pha n a nh di chuyê ncamera như nghiêng, zoom… cu  ng co   thê  đươ   c tr ch cho  n 

2.2.1.2.  Pha  t hiê   n đô  i tươ    ng chuyê n đô   ng

Đo   la  qua   tr nh đưa ra vê t ca c đô  i tươ   ng chuyê n đô  ng tư   khung h nh video. Qua   tr nh na ythư  c châ  t la  qua   tr nh xư   ly  chuỗi a nh liên tiê  p trong mô   t video đê  pha  t hiê  n ra ca c đô  itươ   ng chuyê n đô  ng trong mô   t đoa  n video theo mô h nh dươ   i đây: 

: Tô ng quan ca  c khối xư    ly   trong ba  i toa  n pha  t hiê  n đối tươ   ng. 

Page 24: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 24/62

 

24

 

Pha  t hiê   n vu   ng a nh nô  i 

Xư   ly  vu ng a nh nô  i Pha  t hiê  n vu ng a nh nô  i la  mô   t modul thiê t yê u trong ba i toa n pha  t hiê  n đô  i tươ   ng chuyê n đô  ng qua ca c khung h nh video. Module na y đo  ng vai tro  xư   ly  ca c khung h nh video đê  đưa ra ca c vu ng a nh nô  i lên trên ca c khung a nh nê n. Đê  minhho  a cho chư  c năng na y ta co   thê  nh n h nh dươ   i đây: 

: Pha  t hiê  n vu  ng a nh nô i 

Ca c khung h nh bên tra  i thu đươ   c se   đươ   c xư   ly  đê  đưa ra vu ng a nh nô  i lên trên minhho  a bơ   i h nh bên pha i. Vu ng a nh nô  i thu đươ   c như quan sa  t vẫn co n nhiê u nhiễu, ca c đô  itươ   ng chưa ro   ra ng. 

  Xư    ly   vu   ng a nh nô  i 

Ca c vu ng a nh nô  i thư  c tê   co n nhiê u nhiễu, do đo   đê  lo  c nhiễu, xư   ly   ghe  p ma nh loa   i

 bo   ca c vê t không liên quan th  câ n module xư   ly   ca c vu ng a nh nô  i đê  đưa ra ca c đô  i tươ   ngro   ra ng đê  tư   đo   xa c minh t nh châ  t cu  a chu  ng. 

: Xư    ly   ca  c vu  ng a nh nô i (Foreground Processing) 

Page 25: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 25/62

 

25

H nh bên tra  i la  kê t qua  thu đươ   c sau module pha  t hiê  n vu ng a nh nô  i lên tư   ca c khungh nh video. Tư   kê t qua  đâ u ra na y ta co   thê  đưa ra đươ   c ch nh xa c đô  i tươ   ng chuyê n đô  ngtrong khung h nh đo   va  t nh châ  t cu  a no   như h nh dang, v  tr , …la  đâ u va o cu a qua   tr nh

 phân loa   i đô  i tươ   ng thư  c thi ca c nghiê    p vu    vê  sau. 

2.2.1.3.  Thuâ    t toa  n huâ  n luyê   n AdaBoot 

Trong các phần trước đã đượ c giải thích đă   c trưng đượ c chiết xuất từ các hình ảnh.Ơ   phâ n na y se   du ng phương pha  p lo  c đê  loa   i đi như   ng điê m a nh co   đô    ch nh xa c cao dư  atrên sư    kê t hơ     p cu  a như   ng bô    lo  c yê u trươ   c. 

Thuật toán này lần đầu tiên được đề xuất bở i Freund và Schapire (1995) [4], là một

 bộ phân loại mạnh phi tuyến phức, hoạt động trên nguyên tắc k ết hợ  p tuyến tính các bộ 

 phân loại yếu để tạo nên một bộ phân loại mạnh. AdaBoost sử dụng tr ọng số để đánh dấu

các mẫu khó nhận dạng. Trong quá trình huấn luyện cứ mỗi bộ phân loại yếu đượ c xây

dựng thì thuật toán sẽ tiến hành cậ p nhật lại tr ọng số để chuẩn bị cho việc xây dựng bộ 

 phân loại tiế p theo. Cậ p nhật bằng cách tăng trọng số của các mẫu nhận dạng sai và giảm

tr ọng số của các mẫu đượ c nhận dạng đúng bở i bộ phân loại yếu vừa xây dựng. Bằng cách

này thì bộ phân loại sau có thể tậ p trung vào các mẫu mà bộ phân loại trước nó làm chưatốt. Cuối cùng các bộ phân loại yếu sẽ đượ c k ết hợ  p lại tùy theo mức độ tốt của chúng để 

tạo nên một bộ phân loại mạnh.

Trong giai đoạn huấn luyện cho đô  i tươ   ng, vơ   i ba i toa n trong đê  ta i na y là mỗi hình

ảnh của mô   t chiê c xe ô tô hoặc không pha i xe ô tô va  mỗi xe đê u có tr ọng sô liên quan

đến nó. Trên mỗi lần lặ p, tr ọng sô   của các xe huấn luyện sai phân loại sẽ tăng lên và trọng

sô   của các phân loại chính xác sẽ giảm. V  vâ  y trong mỗi lần lặ p lại việc phân loại đượ clựa chọn se   ưu tiên phân loa   i vơ   i h nh a nh co   tro  ng sô   cao hơn minh ho  a trong h nh sau.

 Phân loa   i không ch nh xa  c 

Tâ    p dư    liê  u đầu va  o   P hân loa   i lần 1   Phân loa   i yếu lần 2   Phân loa

   i yếu lần 3  

: Minh họa của thuật toán AdaBoost.

Việc phân loại yếu được đại diện bởi các đườ ng tách các ví dụ huấn luyện trong một

không gian đặc trưng 2D. Các màu sắc đại diện cho lớ  p của đối tượng và kích thướ c của

các điểm đại diện cho tr ọng lượ ng quan tr ọng

Page 26: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 26/62

 

26

Cụ thể, mỗi bộ phân loại yếu sẽ đượ c xây dựng để lựa chọn ra một cửa sổ đặc trưng 

(Đặc trưng Haar-like) nào phân biệt đượ c tốt nhất giữa mẫu đúng ( positive) và mẫu sai

(negative). Vớ i mỗi cửa sổ đặc trưng đó, bộ phân loại yếu sẽ xác định ra một ngưỡ ng tối

ưu nhất để cực tiểu số lượ ng mẫu nhận dạng sai. V  thê  mô   t bô    phân loa   i yê u se   đươ   c biê udiễn như sau: 

ℎ {1 ê   < 0 ê ươ

Trong đo  :

  x là một cửa sổ con có kích thướ c 24x24 pixel của khung hình

  là ngưỡ ng.

     là cửa sổ đặc trưng (ở  đây là đặc trưng Haar -like).

 

 là hệ số quyết định chiều của bất đẳng thức.

Có thể hiểu đơn giản hoạt động bộ phân loại yếu là khi giá tr ị cửa sổ đặc trưng của

một mẫu tính bởi hàm đánh giá của bộ phân loại vượ t qua một ngưỡng nào đó thì mẫu đấy

là mẫu đúng (là đối tượ ng cần nhận dạng) còn nếu không thì mẫu đó là mẫu sai (không

 phải đối tượ ng).

Trên thực tế không một bộ phân loại yếu nào có thể thực hiện việc phân loại vớ i tỷ 

lệ lỗi thấp. Các đặc trưng đượ c lựa chọn ở  những vòng lặp đầu tiên của tiến trình xây dựng

 bộ phân loại đều có tỷ lệ lỗi nằm trong khoảng 0,1 đến 0,3. Các đặc trưng ở  những vòng

lặp sau, nghĩa là phải phân loại những mẫu khó, thì có tỷ lệ lỗi nằm trong khoảng 0,4 đến

0,5.

2.2.1.4. 

Đă    c trưng Haar-like va    mô h  nh cascade 

Paul Viola và Michael Jones cũng đi theo hướ ng sử dụng thuật toán AdaBoost cho

việc huấn luyện để nhận dạng đối tượ ng [5]. Công trình nghiên cứu này đưa ra 3 đóng gópquan tr ọng trong khả năng xử lý ảnh vớ i tốc độ nhanh và đạt đượ c tỷ lệ nhận dạng r ất cao:

  Đưa ra khái niệm Integral Image cho phép tính toán các đặc trưng vớ i tốc độ r ất

cao.

 

Thuật toán học máy dựa trên AdaBoost có khả năng lựa chọn ra đượ c một số lượ ng nhỏ các đặc trưng từ một tập các đặc trưng rất lớ n từ đó lại xây dựng ra

đượ c các bộ phân loại có hiệu suất cao.

  Đưa ra mô hình cascade cho phép kết hợ  p các bộ phân loại để có thể loại bỏ nhanh

chóng vùng ảnh không chứa đối tượng trong khi đó tậ p trung quá trình tính toán

vào những vùng có nhiều khả năng có chứa đối tượng hơn.

(2.1)

Page 27: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 27/62

 

27

Phương pháp của Viola và Jones có tốc độ xử lý nhanh, gấ p từ 10 đến 15 lần so vớ icác phương pháp trước đó, có thời điểm đạt đượ c tốc độ lên đến 15 khung hình/giây, cho

tỷ lệ chính xác lên đến 80%.

  Đă    c trưng Haar-like

Tiến trình nhận dạng đối tượ ng sẽ phân loại các mẫu dựa trên giá tr ị của các đặc

trưng đơn giản. Có nhiều lý do để sử dụng các đặc trưng thay vì xử lý tr ực tiế p trên từng

điểm ảnh. Một trong những lý do phổ biến nhất đó là các đặc trưng có thể diễn đạt đượ ctri thức về các đối tượ ng trong ảnh (biểu diễn mối liên hệ giữa các bộ phận của đối tượ ng),

đây là điều mà từng điểm ảnh không thể làm đượ c.

Một trong những đặc trưng cơ bản đượ c sử dụng trong bài toán nhận dạng đối tượ ng

trên ảnh là cửa sổ đặc trưng hay các đặc trưng Haar -like. Tên gọi cửa sổ đặc trưng xuất

 phát từ cấu trúc của đặc trưng Haar -like này, nó đượ c xây dựng nên từ những hình chữ 

nhật có kích thướ c bằng nhau và đượ c phân thành hai vùng là vùng sáng và vùng tối. Giá

tr ị của đặc trưng Haar -like chính là giá tr ị độ chênh lệch giữa các điểm ảnh nằm trong hai

vùng ảnh đó. Va  đươ   c mô ta  bă ng h nh sau: 

 H nh 2-1: Ca  c đă  c trưng Haar like cơ ba n 

  Giá tr ị của đặc trưng 2 cửa sổ (hình (1) và (2)) đượ c tính bằng hiệu số giữa tổng

các điểm ảnh nằm trong 2 vùng ảnh sáng và tối.

  Gia   của đặc trưng 3 cửa sổ (hình (3)) đượ c tính bằng tổng các điểm ảnh của 2 vùng

ảnh 2 bên tr ừ đi tổng các điểm ảnh của vùng ảnh nằm giữa.

  Giá tr ị đặc trưng 4 cửa sổ (hình (4)) đượ c tính bằng hiệu số giữa tổng các điểm ảnh

thuộc vùng sáng và tổng các điểm ảnh thuộc vùng tối (2 vùng ảnh nằm chéo nhau).

Bộ nhận dạng đượ c sử dụng ở  đây có kích thước là 24x24 pixel, như vậy số lượ ng

các đặc trưng Haar -like có thể sinh ra cho mỗi một mẫu là r ất lớn (trên 180.000 đặc trưng),từ đó dẫn đến việc tính toán giá tr ị của các đặc trưng này đòi hỏi một thờ i gian xử lý đáng

k ể [5]. Vì nguyên nhân đó nên khái niệm Integral Image đã ra đờ i.

  Integral Image

Khái niệm Integral Image được Viola và Jones đưa ra nhằm mục đích tăng tốc độ 

tính toán cho các đặc trưng Haar -like nói trên. Các cửa sổ đặc trưng có thể đượ c tính toán

r ất nhanh thông qua một biểu diễn trung gian của ảnh gọi là Integral Image. Integral Image

tại vị trí x, y bằng tổng các giá tr ị điểm ảnh phía trên bên trái của điểm, : 

Page 28: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 28/62

 

28

Trong đó,  là Integral Image và ,  là giá trị điểm ảnh ban đầu t ại vị trí , . 

Integral Image là một mảng hai chiều với kích thướ c bằng kích thướ c của ảnh cần tính

giá tr ị đặc trưng Haar Like. Dưới đây là mô tả cách tính ảnh tích phân:

 Integral Image ta   i điê m, .

Sau khi đã tính đượ c Integral Image tại một điểm ảnh thì việc tính tổng giá tr ị củacác điểm ảnh tại một vùng bất k ỳ r ất đơn giản. Giả sử cần tính giá tr ị của vùng ảnh D nhưtrong hình dướ i:

Tính toán giá tr ị Intergral Image d ự a vào các Intergral Image trung gian

Tổng giá tr ị của vùng ảnh D có thể đượ c tính toán thông qua 4 Integral Image trung

gian. Giá tr ị của Integral Image tại vị trí 1 là tổng giá tr ị các điểm ảnh trong vùng A. Giá

tr ị Integral Image tại vị trí 2 là tổng của hai vùng A + B, tương tự vị trí 3 là hai vùng A +

C. Giá tr ị Integral Image tại vị trí 4 là tổng của cả bốn vùng A + B + C + D. Như vậy tổng

giá tr ị trong vùng ảnh D có thể đượ c tính theo Integral Image là Sum(D) = 4 + 1 –  (2 + 3).

Sử dụng khái niệm Integral Image, tất cả các giá tr ị cửa sổ đặc trưng (đặc trưng Haar -like) có thể đượ c tính r ất nhanh thông qua các Integral Image trung gian. Cụ thể đối vớ iđặc trưng 2 cửa sổ bất k ỳ có thể tính thông qua 6 Integral Image, đặc trưng 3 cửa sổ cần 8

và đặc trưng 4 cửa sổ thì cần 9.

(2.2)

Page 29: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 29/62

 

29

 

Mô hình phân tầng Cascade

 Như đã trình bày ở  phần trên, vớ i mỗi một mẫu đưa vào bộ nhận dạng có thể sinh ra

r ất nhiều các đặc trưng Haar -like, nếu chỉ tăng tốc độ tính toán giá tr ị của các đặc trưngthôi là chưa đủ. Bở i mỗi một khung hình có thể sinh ra đượ c r ất nhiều mẫu nhận dạng,

nếu như mẫu nào cũng phải tính toán tất cả các đặc trưng thì sẽ tốn r ất nhiều thờ i gian một

cách không cần thiết. Tuy nhiên có thể thấy trong các mẫu đưa vào không phải mẫu nàocũng khó để nhận dạng, có những mẫu chỉ cần sử dụng một vài đặc trưng là đã có thể loại

 bỏ  đượ c chứ  không nhất thiết phải dùng tất cả  các đặc trưng, ví dụ  như các mẫu

 background.

Cascade of Boosted Classifiers là mô hình phân tầng vớ i mỗi tầng là một mô hình

AdaBoost sử dụng bộ phân lớ  p yếu là cây quyết định với các đặc trưng Haar-Like. Trong

quá trình huấn luyện, bộ phân lớ  p phải duyệt qua tất cả các đặc trưng của mẫu trong tậ phuấn luyện. Việc này tốn r ất nhiều thờ i gian.

Tuy nhiên, trong các mẫu đưa vào, không phải mẫu nào cũng thuộc loại khó nhận

dạng, có những mẫu background r ất dễ nhận ra (gọi đây những mẫu background đơn giản).Đối vớ i những mẫu này, chỉ cần xét một hay một vài đặc trưng đơn giản là có thể nhận

dạng đượ c chứ không cần xét tất cả các đặc trưng. Nhưng đối vớ i các bộ phân loại thông

thườ ng thì cho dù mẫu cần nhận dạng là dễ hay khó nó vẫn phải xét tất cả các đặc trưngmà nó rút ra đượ c trong quá trình học. Do đó, chúng tốn thờ i gian xử lý một cách không

cần thiết.

Mô hình Cascade of Classifiers đượ c xây dựng nhằm rút ngắn thờ i gian xử lý, giảm

thiểu nhận dạng lầm (false alarm) cho bộ phân loại. Cascade trees gồm nhiều tầng (stage

hay còn gọi là layer), mỗi tầng là một mô hình AdaBoost vớ i bộ phân lớ  p yếu là các cây

quyết định. Một mẫu để đượ c phân loại là đối tượ ng thì nó cần phải đi qua hết tất cả cáctầng.

Các tầng sau đượ c huấn luyện bằng những mẫu âm negative (không pha i đô  i tươ   ngcâ n nhâ  n da  ng) mà tầng trướ c nó nhận dạng sai, tức là nó sẽ tậ p trung học từ các mẫu

 background khó hơn, do đó sự k ết hợ  p các tầng AdaBoost này lại sẽ giúp bộ phân loại

giảm thiểu nhận dạng lầm. Vớ i cấu trúc này, những mẫu background dễ nhận dạng sẽ bị loại ngay từ những tầng đầu tiên, giúp đáp ứng tốt nhất thờ i gian xử lý và vẫn duy trì đượ chiệu quả phát hiện đô  i tươ   ng 

2.2.1.5. 

Đă    c trưng Local Binary Pattern

Local Binary Pattern (LBP) hay co n go   i la  mẫu nhi    phân cu  c bô   , là một đặc trưngđơn giản nhưng rất hiệu quả đượ c sử dụng trong các bài toán phân loại ở  lĩnh vực thị giác

máy tính [10]

Ý tưởng cơ bản của tính năng LBP là để tr ch xuâ  t các cấu trúc địa phương trong một

hình ảnh bằng cách so sánh từng điểm ảnh vớ i hàng xóm của mình. Ví dụ, mỗi điểm ảnh

Page 30: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 30/62

 

30

trong các khu phố đượ c so sánh về cường độ để các điểm ảnh trung tâm. Nếu các giá tr ị cường độ cao hơn so với các điểm ảnh trung tâm, nó được đánh dấu là 1 và 0 nếu ngượ clại. Vào cuối của quá trình miê n lân câ  n của mỗi điểm ảnh sẽ có một mô hình nhị phân.Toa n tư   ga n nha  n ca c pixel cu  a khô  i a nh bă ng ta  o ngươ   ng cho lân câ  n cu  a mỗi pixel vơ   igia   tri   trung tâm va  nhâ  n kê t qua  la  1 sô   nhi    phân. 

Thông tin LBP của pixel tại trung tâm của mỗi khối ảnh sẽ đượ c tính dựa trên thông

tin của các pixel lận cận. Có thể tóm tắt các bướ c tiến hành như sau: 

Bước 1: Xác định bán kính làm việc.

Bướ c 2: Tính giá tr ị LBP cho pixel ở  trung tâm (,) khối ảnh dựa trên thông tin

của các pixel lân câ  n. 

, ∑ 2 −

=

 

Trong đó, () là giá tr ị grayscale của các pixel lân cận, () là giá tr ị grayscale của

các trung tâm và (s) là hàm nhị  phân được xác định như sau: s(x) = 1 nếu giá tr ị x ≥0. 

Toa n tư   LBP gô  c đươ   c thư  c hiê  n vơ   i 3*3 lân câ  n cu a điê m a nh đươ   c biê u diễn bơ   iv  du    sau: 

 H nh 2-2: Minh họa ví d ụ trong tính toán của các mẫ u nhị phân cục bộ cho một pixel lân câ  n 

Da  ng tô ng qua  t cu  a toa n thu   LBP sư   du  ng ca c lân câ  n đô  i xư  ng tha nh vo ng tro n h nh2.2. Trong trươ  ng hơ     p na y  tương ư  ng vơ   i ca c gia   tri  mư  c xa m cu  a P pixel trong vo ntro n vơ   i ba n k nh R. Biê u đô  cu  a ma   LBP t nh toa n trên ca c khô  i a nh va  co   thê  sư   du  ng đê  mô ta  kê t câ u cu  a khô  i. 

(2.3)

Threshold Multi l

LBP = 1 + 2 + 4 + 8 + 128 = 143

Page 31: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 31/62

 

31

Mu  c đ ch cu a phương pha  p na y la  xa c đi   nh như   ng vu ng cu a khung video co   chư  a đô  itươ   ng chuyê n đô  ng. Phương pha  p chia khung video tha nh ca c khô  i co   k ch thươ   c bă ngnhau bă ng ca ch xư   du  ng câ u tru  c lươ   i chô ng cu  c bô    

To  a đô    các điê m lân câ  n p ở  một khoảng cách đươ  ng tro n từ các điểm ảnh trung tâmđươ   c thê  hiê  n như sau: 

cos  

sin  

Trong đó R là khoảng cách đến các điểm ảnh trung tâm. Khi các tọa độ không tươngứng vớ i tọa độ ảnh, cường độ đượ c tính bằng Bilinear interpolation (gia   tri  cu  a pixel rađươ   c t nh bă ng gia   tri  trung b nh cu a 2x2 pixel lân câ  n.) gia   tri  cu  a ca  c vu ng điê m a nh se   đươ   c thê  hiê  n như h nh: 

: LBP bât biên bât biên vơ   i ca  ch thay đô i đơn trong mư   c xa  m 

 Như vậy, đối với mô hình cascade đã đượ c trình bày ở  phần trước, các đặc trưngLBP có thể đượ c sử dụng khi huấn luyện các bộ nhận dạng vớ i thuật toán AdaBoost thay

thế cho việc sử dụ ng những đặc trưng Haar -like. Bên cạnh đó thông qua lý thuyết và thực

nghiệm chứng minh có thể thấy đượ c r ằng những bộ nhận dạng sử dụng đặc trưng LBPcho tốc độ nhận dạng nhanh hơn bộ nhận dạng sử dụng đặc trưng Haar -like.

2.2.2.  Ca  c bươ   c nhâ   n da   ng đô  i tươ    ng 

 Như đã trình bày, các phần trước đã giớ i thiệu một cách khái quát những kiến thức

cần nắm được để có thể giải quyết đượ c bài toán nhận dạng phương tiện giao thông, bướ cđầu tiên và cũng là bướ c quan tr ọng để có thể đi tới được bài toán đếm lưu lượng phương

(2.4)

Page 32: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 32/62

 

32

tiện giao thông cuối cùng. Phần này em xin đượ c trình bày về các bước chính em đã thực

hiện trong quá trình xây dự ng hệ thống nhận dạng của mình, bao gồm:

  Thu thập dữ  liệu: Xây dựng tập cơ sở  dữ liệu ban đầu.

  Tiê  n xư    ly   dư     liê   u: Chuẩn bị đầu vào cho bộ huấn luyện.

  Huấn luyện: Thực hiện quá trình huấn luyện bộ nhận dạng.

 

Nhận dạng: Sử dụng bộ nhận dạng để nhận dạng đối tượ ng.

2.2.2.1.  Thu thâ   p dư     liê   u

Để có thể xây dựng đượ c hệ thống nhận dạng dựa trên mô hình cascade, trướ c tiên

cần phải có một tậ p huấn luyện chứa các mẫu, bao gồm cả các mẫu chứa đối tượ ng và các

mẫu không chứa đối tượ ng. Tậ p huấn luyện này sẽ đượ c xây dựng từ 2 nguô n: 

  Tâ    p huâ n luyê  n thư   nhâ  t đươ   c xây dư  ng tư   các hình ảnh thu đượ c từ video cameraca c thiê t bi  đi đô  ng

 

Tâ    p huâ n luyê  n thư   hai đươ   c lâ y tư   một bộ khoảng 430 h nh a nh positive va  hơn3000 h nh nagative sử dụng một tậ p huấn luyện k ết hợ  p công việc của Markus

Weber và các bộ dữ liệu TME bở i Caraffi et al. (2012) [6], [10]

Ca c khung h nh, h nh a nh đượ c se   đươ   c tiê n xư   ly   qua ca c bươ   c sau: 

  Co tâ  t ca  h nh a nh đê n mô   t k ch thươ   c 20×20 pixel

  Chuyển đổi không gian màu của ảnh từ RGB (Red-Green-Blue) sang không gian

màu HSV (Hue-Saturation-Value).

  Tách ảnh thành 3 ảnh thành phần chứa 3 kênh H, S, V riêng biệt.

 

Thực hiện thuật toán cân bằng Histogram trên kênh H.  Ghép 3 ảnh thành phần lại về thành ảnh gốc.

  Chuyển không gian màu từ HSV về RGB.

  Tăng sáng cho kênh R của ảnh..

  Thực hiện phép làm trơn ảnh bằng Gaussian.

  Giảm sáng cho những điểm ảnh có mức xám lớ n.

 Như đã nói thì đặc điểm của các video này là nó đượ c thu lại từ các camera ca c thiê t bi  đô  ng, các camera này có góc quay cố định, bối cảnh là làn đườ ng một chiều.

Page 33: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 33/62

 

33

: Khung h nh triết xuât tư    video đầu va  o. 

Mỗi video đượ c sử dụng làm đầu vào của bộ  huấn luyện sẽ đượ c tách thành các

khung hình, mỗi khung hình là một đơn vị cơ bản của một video. Tất cả các khung hình

này sẽ đượ c sử dụng làm dữ liệu đầu vào cho hệ thống

: Chuỗ i các khung hình liên tiế  p tách ra t ừ  video (t ừ  1 đế n 6)

1  2

3 4

5 6

Page 34: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 34/62

 

34

2.2.2.2. 

Tiê  n xư    ly   dư     liê   u 

Sau khi lấy đượ c dữ liệu là các khung hình từ các video giao thông thì bướ c tiế p theo

sẽ là xây dựng tậ p huấn luyện. Tậ p huấn luyện bao gồm: positive va  negative 

  Positive la  ca c mẫu chư  a đô  i tươ   ng 

   Nagative la  ca c mẫu không chư  a đô  i tươ   ng 

Công cụ em sử dụng để thực hiện việc huấn luyện đòi hỏi phải có sự chuẩn hóa trong

dữ liệu đầu vào. Cụ thể là các mẫu positive chứa đối tượ ng phải có dạng hình vuông (chiều

cao mẫu bằng chiều r ộng mẫu) và kích thướ c tối thiểu là 24x24 pixel. Không như các mẫu

 positive, các mẫu negative có thể có kích thước tùy ý nhưng phải lớn hơn kích thướ c mẫu

 positive, tức là lớn hơn 24x24 pixel. Trong quá trình huấn luyện, các bộ phân loại sẽ học

từ các mẫu positive và các vùng ảnh trích xuất ra từ các mẫu negative. Vì đặc điểm này

nên trong các mẫu negative mặc dù có kích thướ c lớn nhưng cũng nhất định không đượ cchứa đối tượ ng cần nhận dạng, vì nếu không trong quá trình huấn luyện, vùng ảnh chứa

đối tượ ng có thể đượ c trích xuất ra để học, có thể dẫn đến vòng lặ p vô hạn, không k ết thúc

đượ c huấn luyện. Các mẫu positive đượ c lấy từ các dữ liệu (khung hình) đã đượ c chuẩn

 bị ở   bước trướ c, còn các mẫu negative có thể lấy bất cứ ở  nguồn nào, miễn là không chứa

đối tượng, nghĩa là không chứa hình của các phương tiện giao thông trong đấy, ngoài ra

mẫu negative cũng có thể  lấy ở   các  phương tiện giao thông trong đấy, ngoài ra mẫu

negative cũng có thể lấy ở  các khung hình trên nhưng chỉ lấy những vùng ảnh nào không

chứa đối tượ ng [1].

: T ậ p huấ n luyện của các bộ học yế u

Sau khi đưa vào công cụ huấn luyện, các mẫu positive và negative sẽ tr ải qua một

 bướ c chuẩn hóa nữa. Cụ thể các mẫu positive có kích thướ c lớn hơn kích thướ c tối thiểu

24x24 pixel sẽ được điều chỉnh về 24x24 pixel. Ngoài ra cả 2 mẫu positive và negative

Page 35: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 35/62

 

35

đều được đưa về ảnh xám để phù hợ  p vớ i yêu cầu huấn luyện của công cụ và để tăng tốc

độ huấn luyện (khi chỉ làm việc trên 1 kênh màu).

: Mâ  u Negative 

 M â  u positive đươ   c huấn luyê  n Mâ  u positive theo Caraffi et al  va   MarkusWeber

2.2.2.3.  Huấn luyện

 Như đã trình bày ở trên, co   hai phâ n: 

 

 Phâ n mô   t : ca c mẫu positive ch nh em se    sư    du  ng mẫu Caraffi et al va   MarkusWeber nhă m tăng kha  năng nhâ  n da  ng đươ   c nhiê u mẫu xe hơn.

   Phâ n hai: em sẽ dùng một công cụ để thực hiện việc huấn luyện các mẫu positive

và negative. Do phạm vi của đồ án có hạn nên em sẽ không thực hiện việc xây dựng

công cụ huấn luyện này mà thay vào đó là sử dụng một công cụ đã có sẵn và r ất phổ 

 biến là HaarTraining.

Page 36: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 36/62

 

36

Về bản chất thì công cụ này dựa trên chính mô hình cascade gồm các bộ phân loại đượ cxây dựng bở i thuật toán AdaBoost và sử dụng các đặc trưng Haar -like như em đã trình

 bày ở  phần trên. Các bướ c sử dụng công cụ này sẽ đượ c trình bày cụ thể trong Chương 3.

Sau quá trình huấn luyện vớ i các mẫu positive và negative ở  trên, công cụ HaarTraining

sẽ cho đầu ra là một cấu trúc theo tầng của các bộ phân loại mạnh. Mỗi bộ phân loại mạnh

sẽ bao gồm nhiều bộ phân loại yếu k ết hợ  p vớ i nhau mà mỗi bộ phân loại yếu là một đặc

trưng Haar -like đượ c học từ các mẫu đầu vào. Theo như mô hình cascade mà em đã trình bày thì các tầng đầu mà đi qua tất cả các tầng mà không bị loại sẽ được coi là đối tượ ng

cần nhận dạng. Cấu trúc theo tầng này sẽ được lưu lại dưới định dạng file xml.

Tuy nhiên có một vấn đề cần chú ý ở  đây là sử dụng bao nhiêu tầng trong bộ nhận dạng

thì đủ. Nếu sử dụng ít tầng thì số lượng đối tượ ng mà bộ nhận dạng bắt đượ c sẽ nhiều,

nhưng độ chính xác sẽ thấ p do việc bắt nhầm những vùng gần giống với đối tượ ng chứ 

không phải đối tượ ng, ngoài ra còn có khả năng bắt thiếu những đối tượ ng khó nhận dạng.

 Nếu sử dụng nhiều tầng thì độ chính xác sẽ cao (do số lượ ng bắt nhầm sẽ giảm r ất nhiều)

tuy nhiên số lượng đối tượ ng nhận dạng được theo đó sẽ thấ p, nhiều đối tượ ng giống vớ i background

sẽ dễ bị bộ nhận dạng loại bỏ. Như vậy ở  đây sẽ có sự trao đổi, nếu tăng độ chính xác thì

sẽ giảm độ nhạy, nếu tăng độ nhạy thì sẽ giảm độ chính xác.

Từ đó có thể thấy việc lựa chọn số lượ ng tầng cho bộ nhận dạng cũng đóng vai trò quantr ọng cho chất lượ ng của bộ nhận dạng đó. Qua thực nghiệm và đánh giá thì hệ thống nhận

dạng phương tiện giao thông sẽ đạt k ết quả tốt nhất nếu số lượ ng tầng các bộ phân loại

nằm trong khoảng từ 25 đến 30.

: Những đặc trưng Haar -like đầu tiên đượ c chọn trong bộ nhận d ạng

2.2.2.4. 

Nhận dạng

Bộ nhận dạng đối tượ ng sẽ đượ c xây dựng dựa trên cấu trúc theo tầng của các bộ 

 phân loại đã tìm đượ c sau quá trình huấn luyện ở  trên. Khi đưa một ảnh vào bộ nhận dạng,

ở  đây là các khung hình lấy từ các video dùng để kiểm tra (như đã nói ở  trên thì các video

đượ c phân thành 2 phần dùng để huấn luyện và dùng để kiểm tra), bộ nhận dạng sẽ xem

xét tất cả các vùng ảnh với kích thước khác nhau đượ c trích xuất ra từ ảnh này để có thể 

đưa ra đượ c k ết quả.

Page 37: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 37/62

 

37

Kích thước ban đầu của vùng ảnh đượ c trích xuất sẽ  là một cửa sổ có kích thướ c bằng với kích thướ c tối thiểu của các mẫu  positive đượ c sử  dụng trong quá tình huấn

luyện. Các vùng ảnh này sẽ đượ c dịch chuyển theo chiều ngang và chiều dọc một khoảng

vài pixel cho tớ i khi phủ kín ảnh cần nhận dạng. Hay nói cách khác bộ nhận dạng sẽ quét

một lượ t tất cả các vùng có thể trên ảnh để tìm đối tượ ng. Sau khi hết một lượ t, vùng ảnh

này sẽ được tăng kích thướ c lên và tiế p tục quá trình quét toàn bộ ảnh để xử lý, kích thướ c

mở  r ộng này sẽ tăng cho tớ i khi vùng ảnh bằng với kích thướ c của cả bức ảnh hoặc bằngmột giá tr ị max nào đó, giá tr ị này có thể đượ c thiết lậ p bằng tay.

 Như vậy sẽ có khả năng một đối tượng đượ c nhận dạng nhiều lần nhưng vớ i các

vùng ảnh có kích thướ c gần giống nhau, các đối tượ ng sẽ đượ c gọi là các đối tượ ng bị lặ p,

vấn đề này cũng sẽ đượ c xử lý và trình bày ở  phần sau.

 Nhờ  có cấu trúc phân tầng cascade, các vùng ảnh không chứa đối tượ ng (background)

sẽ đượ c duyệt qua r ất nhanh nhờ  những tầng đầu tiên. K ết quả của quá trình nhận dạng sẽ 

là một tậ p các vùng ảnh đượ c cho là có chứa đối tượ ng ứng vớ i mỗi ảnh đầu vào (mỗi

khung hình trong video).

2.3. 

Pha  t hiê   n la   n đươ    ng 

Tâ t ca  như  ng ngươ   i tham gia giao thông bă ng phương tiê  n ô tô đê u râ  t quan tâm tơ   ivâ n đê  an toa n khi đi sang la n đươ  ng, đa   co   không  t như   ng vu    tai na  n do chu   quan haykha ch quan vê  viê   c chuyê n la n mô   t ca ch đô   t ngô   t hay biê n đô  i la n trên tư  ng cung đươ  ng,đôi khi va o trong mô   t sô   điê u kiê  n môi trươ  ng viê   c pha  t hiê  n la n đươ   ng đô  i vơ   i mă  t ngươ   itrơ    len kho   khăn hơn. 

Các nguyên nhân chính của như   ng vu    tai na  n do chuyê n la n đươ   ng đô   t ngô   t có thể là

cu a phương tiê  n, do buồn ngủ, do sư   du  ng ca c châ  t k ch th ch như rượ u / ma túy hoặc phiền nhiễu ca c thiê t bi  điê  n tư   kha c… Nhiều nghiên cứu đã chỉ ra r ằng ngườ i lái xe thiếu

chú ý có thể ảnh hưởng đến kha  năng quan sa  t la n đươ  ng.

Trong ba i toa n na y se   sư   du  ng ca c phương pha  p Scale-spacem, ma   ho  a a nh theo khuvư  c, pha  t hiê  n ca  nh Canny va  biê n đô  i Hough đê  pha  t hiê  n la n đươ  ng. Khi pha  t hiê  n la nđươ  ng 

2.3.1.  Pha  t hiê   n điê m cư    c tri   Scale-space va    thiê  t lâ   p vu   ng quan tâm 

Hê   thô  ng sư   du  ng camera cu a ca c thiê t bi  di đô  ng th  viê   c t nh toa n cu  a thuâ   t xư   ly   a nh se   chiê m du  ng ta i nguyên lơ   n, đây la  ha  n chê   cu  a ca c thiê t bi  trên. Ch nh v  vâ  y nê ukhông co   phương pha  p đê  khă c phu  c t nh tra  ng trên th  sô   khung h nh thu đươ   c trong mô   tgiây (frames per second (fps)) se   vô cu ng  t. 

Đê  khă c phu  c t nh tra  ng trên ba i toa n se   a  p du  ng ky   thuâ   t ma trâ  n thu nho  , tư  c la mgia m k ch thươ   c cu a khung a nh. Trong Ky   thuâ   t scale-space, bước đầu tiên này tiến hành

tìm kiếm các điểm hấ p dẫn trên tất cả các tỉ lệ và vị trí của ảnh. Nó sử dụng hàm different-

Page 38: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 38/62

 

38

of-Gaussian để xác định tất cả các điểm hấ p dẫn tiềm năng mà bất biến vớ i quy mô và

hướ ng của ảnh

2.3.1.1.  Pha  t hiê   n điê m cư    c tri   Sacle-space

: biê u diê  n Scale-space

Các điểm hấ p dẫn với đặc trưng SIFT tương thích vớ i các cực tr ị địa phương của bộ 

lọc difference – of-Gaussian (DoG) ở  các tỉ lệ khác nhau. Định nghĩa không gian tỉ lệ của

một hình ảnh là hàm L(x,y,k ) đượ c mô tả như sau: 

L(x,y,  )= G(x,y,k  )* I(x,y) 

Vớ i: G( x,y , k ) : biến tỉ lệ Gaussian (variable scale Gaussian)

I(x,y) : Ảnh đầu vào

* là phép nhân chậ p giữa x và y

,, −+/

 

Để phát hiện được các điểm hấ p dẫn, ta đi tìm các cực tr ị của hàm DoG được địn nghĩa: 

,, (,, ,,) ∗, 

,, (,, ,,) 

Giá tr ị hàm DoG đượ c tính xấ p xỉ dựa vào giá tr ị scale-normalized Laplacian ofGaussian (∇) thông qua các phương trình (2.10) (2.11) (2.12)

∇G 

∇G   ≈ (,,,,)

−  

(2.5)

(2.6)

(2.7)

(2.9)

(2.8)

Page 39: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 39/62

 

39

(,, ,,) ≈ 1 ∇2G 

 Như vậy, bước đầu tiên của giải thuật SIFT phát hiện các điểm hấ p dẫn vớ i bộ lọc

Gaussian ở  các tỉ lệ khác nhau và các ảnh GoG từ sự khác nhau của các ảnh k ề mờ .

: Biểu đồ mô phỏng việc tính toán các DoG ảnh t ừ  các ảnh k ề  mờ  

Các ảnh cuộn đượ c nhóm thành các octave (mỗi octave tương ứng vớ i giá tr ị gấp đôicủa ). Giá tr ị của k đượ c chọn sao cho số lượ ng ảnh mờ  (blured images) cho mỗi octave

là cố định. Điều này đảm bảo cho số lượ ng các ảnh DoG cho mỗi octave không thay đổi.

Các điểm hấ p dẫn được xác định là các cực đại hoặc cực tiểu của các ảnh DoG qua các tỉ 

lệ. Mỗi điểm ảnh trong DoG đượ c so sánh với 8 điểm ảnh láng giềng của nó ở  cùng tỉ lệ đó và 9 láng giềng k ề ở  các tỉ lệ ngay trướ c và sau nó. Nếu điểm ảnh đó đạt giá tr ị cực tiểu

hoặc cực đại thì sẽ đượ c chọn làm các điểm hấ p dẫn ứng viên.

: M ỗi điể m ảnh đượ c so sánh vớ i 26 láng giề ng của nó

(2.10)

Page 40: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 40/62

 

40

2.3.1.2. 

Ma   ho  a a  nh theo khu vư    c 

Ma   ho  a anh theo khu vư  c - Region of Interest (ROI), vơ   i phương pha  p na y giu  p ha  nchê   viê   c t m kiê m dâ u hiê  u la n đươ  ng cu  a ca  h nh a nh thu đươ   c ơ    đâ u va o bă ng viê   c xa cđi   nh 1 vu ng a nh quan tâm la  mâ u chô  t viê   c nhâ  n da  ng đô  i tươ   ng đươ   c mô pho ng bă ngh nh dươ   i. Viê   c na y la m loa   i bo   bơ   t nhưng vu ng không co   đô  i tươ   ng la n đươ  ng như vu ng

 bâ u trơ   i giu  p gia i pho  ng bô    nhơ    thiê t bi  va  tăng tô  c đô    cu  a qua   tr nh lo  c 

: Khu vư   c pha  t hiê  n la  n đươ   ng trong vo  ng tro  n ma  u đo  

2.3.2.  Thuâ    t toa  n Canny va    biê n đô  i Hough 

  Thuâ    t toa  n Canny 

Phát hiện cạnh Canny là một trong những phương pháp phát hiện biên đượ c sử dụng

để tìm tất cả các điểm cạnh trong hình ảnh và đầu ra là một bản đồ nhị phân. Canny sư   du  ng một gradient trên hình ảnh để tìm những thay đổi mạnh về cường độ  pixel. Đây lànhững đườ ng nét có khả năng la  la n đươ  ng trong hình ảnh đâ u va o. Đầu ra là sau đó chỉ cần một bản đồ nhị  phân đó cho bạn thấy nơi những đườ ng nét của hình.

Trong thuật toán Canny, các đạo hàm bậc một đượ c tính theo x và y và sau đó kết

hợ  p thành bốn đạo hàm hướng. Các điểm nơi những đạo hàm hướ ng này là cực tr ị địa phương sau đó là các ứng viên cho tậ p hợ  p thành các cạnh.Trong ba i toa n na y sử dụng để 

 phát hiện biên Canny để tìm ranh giới la n đươ  ng trong khung ROI đa   nhă c đê n ơ    phâ ntrên.

Viê   c phát hiện cạnh cơ bản sử dụng vector gradient của một hình ảnh cường độ đê   pha  t hiê  n ranh giới làn đường có độ tương phản cao trong ảnh. Đây là một trong trong

những phương pháp tốt nhất và hiệu quả trong nhiều phương pháp phát hiện biên

Page 41: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 41/62

 

41

: v  du    a nh đươ   ng viền 

  Biê n đô  i Hough 

Biến đổi Hough là một k ỹ thuật có thể dùng để tách ra các đặc điểm của một hình

dáng cụ thể trong một ảnh nhị  phân. Khi dùng các chương trình máy tính để nhận diện

một đối tượ ng nào đó có hình dạng bất k ỳ, phương pháp hữu hiệu hiện nay là sử dụng biến

đổi Hough. Các bài toán tìm kiếm từ những mức đơn giản như tìm đườ ng thẳng tớ i các bài toán phức tạp hơn như tìm hình tròn, hình elipse hoặc các hình phức tạp đều có thể 

thực hiện bằng biến đổi Hough (với điều kiện các hình dạng này biểu diễn toán học đượ c).

Giai đoạn phát hiện làn sử dụng các ha m Hough Line đê  lo  c ca c đườ ng trong hình

ảnh dựa trên biến đổi Hough.

 Biến đổi Hough tìm đườ ng thẳ ng

Đầu tiên chúng ta sẽ xem xét việc tìm kiếm các đườ ng thẳng trong một hình ảnh.

Trong một sự biểu diễn tham số Đề các, điểm cộng tuyến trong một hình ảnh vớ i tọa độ 

(x,y) là có liên quan của độ dốc m và chặn c theo:

y = mx + c

Phương trình này có thể đượ c viết dướ i hình thức đồng nhất như: 

Ay + Bx + 1 = 0

Trong đó A= -1/c và B = m/c. Do đó, một đườ ng thẳng được xác định bằng cách cho

một cặ p giá tr ị (A,B). Tuy nhiên, chúng ta có thể quan sát một đối xứng trong sự xác định

trong phương trình 2.12. Phương trình này là đối xứng từ một cặ p tọa độ (x,y) cũng xácđịnh một đườ ng thẳng trong không gian vớ i các tham số (A,B). Đó là, phương trình 2.12

có thể được xem như là phương trình của một đườ ng thẳng cho tọa độ cố định (x,y) hay

là phương trình của một đườ ng thẳng cho các tham số cố định (A,B). Như vậy, cặ p có thể 

đượ c sử dụng để xác định các điểm và đườ ng thẳng đồng thờ i.

Hough tậ p hợ  p dấu hiệu của điểm (A,B) bằng cách xem xét tất cả các điểm (x,y) xác

định cùng một đườ ng thẳng trong không gian (A, B). Có nghĩa là, nếu tậ p hợp các điểm

cộng tuyến {(xi ,yi)}xác định đườ ng thẳng (A, B), thì

(2.12)

(2.11)

Page 42: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 42/62

 

42

  1 0 

Phương trình này có thể được xem như một hệ  phương trình và nó có thể đượ c viết

lại đơn giản trong điều kiện của sự biểu diễn tham số Đề các như:

 Vì vậy, để xác định đườ ng thẳng chúng ta phải tìm các giá tr ị của các tham số (m,c)

(hoặc (A, B) trong hình thức đồng nhất) đáp ứng phương trình 2.14(hoặc 2.13, tương ứng).

Biê n đô  i Hough cung cấ p một phản ứng chính xác, ướ c tính chính xác của các tham

số đượ c sử dụng để xác định đườ ng thẳng, miễn là số lượng điểm thẳng dọc theo đườ ng

thẳng vượ t quá số lượng các điểm thẳng trên bất k ỳ đườ ng thẳng nào trong ảnh. Tuy nhiên,

tính phi tuyến của các tham số và sự r ờ i r ạc tạo các tích lũy tiếng ồn. Một vấn đề lớ n trong

việc thực hiện các Hough cơ bản cho đườ ng thẳng là sự xác định của một không gian tích

lũy thích hợ  p.

Trong ứng dụng, thuật toán vẽ đườ ng thẳng Bresenham (Bresenham, 1965) có thể sử 

dụng để vẽ các đườ ng thẳng bình chọn trong không gian tích lũy. Điều này đảm bảo r ằngđườ ng thẳng của các lựa chọn k ết nối được rút ra như trái ngượ c vớ i sử dụng phương trình2.20 có thể  dẫn đến những khoảng tr ống trong các đườ ng vẽ. Ngoài ra, backmapping

(Gerig, 1986) có thể đượ c sử dụng để xác định chính xác điểm cạnh đóng góp cho một

đỉnh đặc biệt. Backmapping là một ánh xạ ngượ c từ không gian tích lũy đến dữ liệu cạnh

và có thể cho phép phân tích hình dạng của hình ảnh bằng cách loại bỏ các điểm cạnh góp

 phần đỉnh đặc biệt, và sau đó tái tích lũy bằng cách sử dụng Hough.

Một cách để tránh các vấn đề của sự biểu diễn tham số Đề các trong Hough là cơ sở  hàm ánh xạ trên một sự biểu diễn tham số thay thế. Biểu diễn tham số một đườ ng thẳng

này bằng cách xem xét một điểm (x, y) như là một hàm của một góc bình thườ ng vớ iđườ ng thẳng đi qua gốc của hình ảnh. Điều này cho phép một hình thức của Hough cho

các đườ ng thẳng đượ c gọi là Hough cực cho các đườ ng thẳng (Duda, 1972). Điểm mà

đườ ng thẳng này giao với đườ ng thẳng trong hình ảnh đượ c cho bởi công thư  c: 

 p= x cos+y sin 

Trong giai đoa  n pha  t hiê  n la n đươ  ng sử dụng các ha m Hough lines đê   trích xuất

đườ ng trong ảnh dựa trên biến đổi Hough. Tư   công thư  c 2.21 

x =−

 , y =

−  

(2.13)

(2.14)

(2.15)

(2.16)

Page 43: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 43/62

 

43

: A  p d ụng các biến đổi Hough cho đườ ng thẳ ng

Sau khi a  p du  ng biê n đô  i Hough va  Hough lines ta thu đươ   c h nh a nh ba i toa n dươ   iđây: 

: Sau khi sư    du  ng thuâ   t toa  n hough va   hough lines 

Đô  i vơ   i ba i toa n trên sau khi lo  c đươ  ng mô ta  như ca c va   ch ma u đo  , th  co   1 vâ n đê  xa  ra la  không t m đươ   c điê m cuô  i cu  a đươ  ng. Vê  vâ n na y phương pha  p biê n đô  i Houghtheo xa c suâ  t đê  t m đươ   c điê m kê  t thu  c cu  a đươ  ng 

: điê m kết thu  c cu a đươ   ng khi sư    du  ng biến đô i hough theo xa  c suất  

Đê  cho ra h nh a nh cuô  i cu ng ta bô   sung bit cu a hai a nh trên, kê  t qua  se   thu đươ   c a nhsau:

: Kêt qua   cuối cu  ng  

Page 44: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 44/62

 

44

2.4. 

Xư    ly   dư     liê   u va    đưa ra ca nh ba  o 

Ca nh ba o la  nô   i dung ch nh cu  a hê    thô  ng ca nh ba o va cha  m ô tô. Trong phâ n na y se   sư   du  ng kê t qua  la  đâ u ra cu a bươ   c nhâ  n da  ng đô  i tươ   ng ơ    trên. Đô  i tươ   ng ơ    đây đươ   cnhâ  n da  ng va  ba i toa n se   t nh toa n khoa ng ca ch vơ   i đô  i tươ   ng đo  . Nê u trong ngươ   ng khôngan toa n th  hê   thô ng se   tư    thông ba o cho ngươ   i la  i xe chu   đô  ng đê  xư   ly  t nh huô ng ki    p

thơ   i nhă m gia m thiê u nguy cơ tai na  n. Nô   i dung phâ n na y gô m co  : 

  Ươ   c lươ   ng khoa ng ca ch 

  Dư    đoa n tô  c đô    

2.4.1.  Ươ   c lươ    ng khoa  ng ca  ch 

Sau khi nhâ  n da  ng đô  i tươ   ng, hê   thô  ng câ n ươ   c lươ   ng khoa ng ca ch vơ   i tư   cameramoblie vơ   i ca c đô  i tươ   ng kha c đang tham gia lưu thông. Hiê  n nay viê   c sư   du  ng camera tư   

moblie đê  xa c đi   nh khoa ng ca ch đi   a ly   giư   a hai đô  i tươ   ng đang di chuyê n la  mô   t điê u vôcu ng kho  . Khi mô pho ng thực 3D thông qua ống kính của một máy ảnh vào một hình ảnh

2D, một số thông tin se   bị mất trong đo   co   ca c thông sô   vê  khoa ng ca ch vơ   i ca c phươngtiê  n kha c. Camera không thể đưa ra bất cứ  phép đo thực sự của các khoảng cách trong thế 

giớ i thực chỉ nhìn một hình ảnh. Va  tô n ta   i 2 vâ n đê  sau: 

  Vấn đề thư   nhâ  t xe có kích thướ c và hình dạng khác nhau. Tuy nhiên là không phải

là một ý tưở ng tồi để giả định có chiều r ộng trung bình cho tất cả các loại xe.

  Vấn đề thứ hai là chiều r ộng trong mét của xe không đượ c lấy tr ực tiế p từ hình ảnh,

nhưng một nhóm các điểm ảnh có chứa các hình ảnh của chiếc xe.

Để giải quyết điều này, cần t tìm ra mối quan hệ giữa kích thướ c của khu vực chứa

xe, và khoảng cách đến nó. Vì lý do này, đây là một phương pháp đê  tiê  p câ  n, h nh a nhsau la  khoa ng ca ch kha c nhau đo đươ   c đê n vi  tr  cu  a xe. 

a)khoa ng ca  ch 5m vơ   i xe  b)khoa ng ca  ch 20m vơ   i xe 

Page 45: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 45/62

 

45

c)khoa ng ca  ch 35m vơ   i xe  d)khoa ng ca  ch 50m vơ   i xe 

: Mâ  u h nh a nh ơ    ca  c khoa ng ca  ch kha  c nhau vơ   i đối tươ   ng la   xe. 

Kê t qua  thu đươ   c thê  hiê  n mỗi quan hê    giư   a khoa ng ca ch vơ   i k ch thươ   c phân vu ngcâ n phân loa   i thê  hiê  n trong h nh sau: 

: Sơ đồ thê  hiê  n mối quan hê    giư   a k ch thươ   c va   khoa ng ca  ch 

Đườ ng cong phù hợ  p cho xấ p xỉ khoảng cách từ vùng phân loại kích thước. tru  choa nh la  khoảng cách đến các xe (mét). Tru  c tung là kích thước xe ta   i vu ng đang xe  t. Cácđiểm màu đỏ đại diện cho các biện phá p thu đượ c từ mỗi hình ảnh. Các đườ ng cong màu

xanh là mô hình tiên đoán đượ c trang bị cho các điểm dữ liệu.Để có thể thực hiện một dự 

đoán của khoảng cách, biê u đô  trên đã đượ c quyết định để phù hợ  p vớ i một mô hình hàm

mũ [7]

.exp. .exp.  2.4.2. 

Dư      đoa  n tô  c đô     

Điện thoại thông minh nga y nay đa   co   râ  t nhiê u tiê  n  ch, trong đo   có hệ thống định

vị toàn cầu GPS. Vớ i công nghệ này ta có thể ướ c tính tốc độ một cách dễ dàng và chính

xác hơn. Điều này đượ c thực hiện bằng cách đầu tiên ước lượ ng vị trí của thiết bị thôngqua kê t nô  i internet. Viê   c đo tô  c đô    se   a  p du  ng theo công thư  c: v = s/t (2.23)

(2.17)

Page 46: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 46/62

 

46

CHƯƠNG 3: XÂY DƯ    NG PH   M MÊ   M THƯ    NGHIÊ   M VA    ĐA  NH GIA   KÊ  T QUA   

Chương 2 đa   nêu ra ca c phương pha  p gia i quyê  t ba i toa n gia m sa  t va  ca nh ba o vacha  m

Chương này sẽ trình bày cụ thể về quá trình thực hiện việc xây dựng phâ n mê m gia m

sa  t va  ca nh ba o va cha  m ô tô trên thiê  t bi  di đô  ng, các thực nghiệm cụ thể bao gồm cách

xây dựng bộ dữ liệu huấn luyện, các bướ c thực nghiệm và k ết quả đạt đượ c, từ đó đưa racác phân tích, nhận xét về các k ết quả đó.

Trong quá trình nghiên cứu và cài đặt hệ thống phâ n mê m, em có sử dụng thư viện

mã nguồn mở  OpenCV cho v  OpenCV cài đặt khá đầy đủ các thuật toán xử lý ảnh nên

đượ c sử dụng r ất r ộng rãi trong lĩnh vực này. Toàn bộ chương trình đượ c viết trên ngôn

ngữ Java va  C++ với môi trườ ng phát triển eclipse.

 Ngoài ra để  phục vụ  cho quá trình huấn luyện dữ  liệu em có sử  dụng công cụ 

HaarTraining đã cài đặt sẵn thuật toán AdaBoost để thực hiện huấn luyện các cascade sử dụng các đặc trưng Haar -like.

3.1.  Thư    nghiê   m va    đa  nh gia   kê  t qua  . 

3.1.1. 

Qua   tr  nh thu thâ   p dư     liê   u 

Hê  thô  ng co   nhiê  m vu    gia m sa  t va  ca nh ba o va cha  m ô tô nên hê    thô ng se   co   hai phâ nch nh câ n đươ   c xây dư  ng: 

   Phâ n nhâ  n da  ng đô  i tươ   ng : Dư    liê  u la  ca c khung h nh đươ   c lâ y ra tư   camera tư   

thiê t bi  di đô  ng, sau đo   hê   thô  ng thư  c hiê  n nhâ  n da  ng đô  i tươ   ng la m dư    liê  u đâ uva o cho phâ n theo do  i va  đưa ra ca nh ba o. 

   Phâ n theo do  i đô  i tươ   ng va   đưa ra ca nh ba  o: Dư    liê  u đâ u va o la  ca c đô  i tươ   ng thuđươ   c ơ    phâ n nhâ  n da  ng, tư   đo   sư   du  ng ca c thuâ   t toa n đa   nêu ơ    chương 2 đê  t nhtoa n khoa ng ca ch va  đưa ra ca nh ba o. 

3.1.1.1.  Dư     liê   u đâ   u va   o

Qua   tr nh thu nhâ    p dư    liê  u la  điê  u kiê  n bă  t buô  c cu a hê  thô  ng phâ n mê m gia m sa  t va  

ca nh ba o va cha  m giao ô tô trên ca c thiê t bi  di đô  ng. Hê  thô ng se   sư   du  ng camera ca c thiê  t bi  trên đê  thu video la m dư    liê  u đâ u va o, ca c video na y gă n trư  c tiê  p va  ghi la   i ha nh tr nhdi chuyê n cu  a ca c phương tiê  n tham gia lưu thông.

Video ban đêm co   đă   c điê m thiê u, ánh sáng đèn đườ ng yếu dẫn đến độ tương phản

tổng thể của cả video r ất thấ p, hầu như chỉ thấy đèn của các phương tiện giao thông chiếu

ra bở i vậy các video ban đêm trước khi đượ c lấy dữ  liệu huấn luyện cần phải qua một

 bướ c tiền xử lý. Cụ thể quá trình tiền xử lý này sẽ đượ c trình bày ở  phần sau.

Page 47: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 47/62

 

47

Video huấn luyên ban đêm  

Video huấn luyê  n ban nga  y 

3.1.1.2.  Đô  i tươ    ng huâ  n luyê   n 

Các đối tượng đượ c sử dụng cho quá trình huấn luyện đượ c trích xuất ra từ các video

đầu vào. Cụ thể là video đầu vào sẽ đượ c trích xuất ra các khung hình, r ồi các đối tượ ng

sẽ đượ c thu thậ p từ các khung hình đó. 

 Nhưng không phải tất cả các khung hình của video đều đượ c trích xuất, mỗi ảnh

đượ c lấy ra cách nhau 5 hoặc 10 khung hình do tỷ lệ khung hình/giây của video là khá lớ nnên các đối tượng đượ c trích xuất ra từ các khung hình liên tiế p nhau sẽ gần như là giống

nhau, mà việc này thì không có lợ i cho quá trình huấn luyện khi mà việc càng phong phú

các mẫu thì k ết quả huấn luyện sẽ càng tốt.

 Như đã trình bày, trướ c khi thực hiện trích xuất đối tượng, các video ban đêm sẽ tr ải

qua một bướ c tiền xử lý, cụ thể là tất cả các khung hình sẽ đượ c xử lý sau khi lấy đượ c từ 

các video. Quá trình tiền xử lý này bao gồm các bướ c:

Page 48: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 48/62

 

48

  Chuyển đổi không gian màu của ảnh từ RGB (Red-Green-Blue) sang không gian

màu HSV (Hue-Saturation-Value).

  Tách ảnh thành 3 ảnh thành phần chứa 3 kênh H, S, V riêng biệt.

  Thực hiện thuật toán cân bằng Histogram trên kênh H.

  Ghép 3 ảnh thành phần lại về thành ảnh gốc.

  Chuyển không gian màu từ HSV về RGB.

  Tăng sáng cho kênh R của ảnh.

  Thực hiện phép làm trơn ảnh bằng Gaussian.

  Giảm sáng cho những điểm ảnh có mức xám lớ n.

Từng bướ c trong quá trình xử lý này đều có trong thư viện mà OpenCV hỗ tr ợ , nên

tốc độ chung của phần này là r ất nhanh, không đáng kể.

Trướ c và sau quá trình tiề n xử  lý ảnh ban đêm 

Sau khi đã xử lý xong các khung hình thì dữ liệu về các đối tượ ng sẽ đượ c trích xuất.

Mỗi đối tượ ng sẽ được đại diện bở i một cửa sổ hình vuông cắt ra từ các khung hình đó. 

 Mâ  u positive ban nga  y. 

Page 49: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 49/62

 

49

 Mâ  u positive ban đêm 

Đê  tăng kha  năng nhâ  n da  ng đô  i tươ   ng cho hê  thô  ng, em đa   sư   du  ng thêm ca c mẫu positivecu a Caraffi et al. (2012) va  Markus Weber (1999). Bô    dư    liê  u na y gô m bô    430 a nh vê  đô  itươ   ng ô tô miêu ta  như h nh sau: 

 Mâ  u positive theo Caraffi et al va   Markus Weber  

Đô  i tươ   ng cu a ba i toa n la  phương tiê  n ô tô vơ   i điê u kiê  n a  p du  ng cho ba i toa n đa   nêu

ơ    chương I vơ   i đă   c điê m la  đuôi xe ô tô đi trong la n đươ  ng mô   t chiê u. 

3.1.2.  Qua   tr  nh huâ  n luyê   n

3.1.2.1.  Môi trươ    ng phâ   n cư   ng huâ  n luyê   n la    

Cấu hình phần cứng phục vụ cho quá trình huấn luyện:

  Vi xư   ly : Intel Core i5 

Page 50: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 50/62

 

50

  RAM : 4GB

  Hê  điê u ha nh: Windows 10 

  Công cu    huâ n luyê  n: HaarTraining 

Thờ i gian huấn luyện cho mỗi bộ phân loại thườ ng là từ 5-6 ngày.

3.1.2.2. 

Ca  c bươ   c huâ  n luyê   n Sau khi đã có môi trườ ng huấn luyện và các dữ liệu đầu vào cần thiết thì sẽ tiến hành

thực hiện việc huấn luyện các mẫu dữ liệu đó. 

Bươ   c 1: Tạo các mẫu positive và negative cho bộ huấn luyện

 Như đã trình bày ở  chương 2, có hai loại mẫu đầu vào cần chuẩn bị để thực hiện quá

trình huấn luyện là các mẫu có chứa đối tượ ng (positive) và các mẫu không chứa đối tượ ng

(negative).

Đầu tiên là tạo ra hai tậ p tin mô tả của các mẫu positive và negative. Đưa h nh a nhva o trong thư mu  c …\training\negative  rô i cha  y file batch create_list.bat.

Khi cha  y tâ    p tin na y ba  n nhâ  n file co   ghi ca c do ng

Tiế p theo bạn cần phải tạo một tậ p tin dữ liệu chứa tên của hình ảnh positive cũngnhư vị trí của các đối tượ ng trong mỗi hình ảnh. Bạn có thể tạo ra file này thông qua mô   ttrong hai công cu   : Objectmarker or  Image Clipper. Đê  xây dư  ng nhanh cho  ng em du ngtool Objectmarker.

Ta  o thư mu  c ...\training\positive\rawdata đê  chưa như   ng h nh a nh positive 

Sau khi cha  y xong, chươnng tr nh objectmaker se   ta  o ra file info.txt là tậ p tin mô tả 

mẫu positive nằm trong thư mục positive của công cụ huấn luyện, trong đó liệt kê số lượ ng

các phương tiện giao thông trong từng ảnh và tọa độ xuất hiện của phương tiện trong ảnhđó. Trong info.txt sẽ có một số thông tin đi   nh da  ng như dưới đây: 

dir /b *.jpg >bg.txt

Page 51: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 51/62

 

51

Số đầu tiên trong mỗi dòng xác định số lượng các đối tượ ng hiện có trong các hình

ảnh được đưa ra. Ví dụ, ở  dòng thứ hai, số 3 có nghĩa là bạn đã chọn ra ba đối tượ ng xe ô

tô trong khung h nh image1201.bmp.

Bốn chữ số k ế tiế p (thể hiện trong màu xanh lá cây) xác định vị trí của đối tượng đầu

tiên trong hình ảnh (to  a đô x = 35, y = 24, chiều r ộng = 70 và chiều cao = 39). Các con số 

màu đỏ xác định các dữ liệu cho đối tượ ng thứ hai; Các con số màu xanh xa c đi   nh đốitượ ng thứ ba.

 H nh 3-4: Công cụ Object Marker giúp t ạo các mẫ u huấ n luyện

Page 52: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 52/62

 

52

T ập tin positive đầu ra của công cụ Object Marker

Bươ   c 2: Chạy bộ huấn luyện

Sau khi đã có 2 tậ p tin chứa các mẫu positive và negative cần thiết, việc tiế p theo là

tạo một tập tin lưu các vector ảnh sinh ra từ các mẫu positive thu đượ c ở   bước trướ c. Thực

hiện việc này bằng cách chạy một lệnh trong công cụ HaarTraining:

Ý nghĩa các tham số chính:

  -info: tậ p tin chứa các mẫu positive.

  -vec: tập tin lưu các vector  ảnh.

  -num: số lượ ng các mẫu positve tổng cộng trong file info.txt.

  -w, -h: kích thước đối tượ ng (các mẫu sẽ đượ c tự động chỉnh về kích thướ c này).

K ết quả thu đượ c là tậ p tin vector.vec nằm trong thư mục data của công cụ, tậ p tinnày sẽ là đầu vào cho quá trình huấn luyện. Chạy lệnh dưới đây để thực hiện quá trình

huấn luyện:

Ý nghĩa các tham số chính:

  -data: các stage của mô hình cascade sau quá trình huấn luyện sẽ nằm trong thưmục này.

 

-vec: tập tin vector đượ c sinh ra ở  trên.

  -bg : tậ p tin chứa các mẫu negative (background).

  -npos, -nneg : số lượ ng mẫu positive và negative.

  -nstages: số lượ ng stage huấn luyện.

  -mem: lượ ng RAM dành cho huấn luyện.

haartraining.exe -data data/cascade -vec data/vector.vec -bg negative/infofile.txt -npos 475 

-nneg 2865 -nstages 25 -mem 1000 -mode BASIC -w 24 -h 24 – nonsym 

Page 53: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 53/62

 

53

K ết quả của quá trình huấn luyện này chính là bộ phân loại mạnh dùng cho quá trình

nhận dạng.

 H nh 3-5: Minh họa quá trình chạ y công cụ huấ n luyện bộ nhận d ạng

Bươ   c 3: Chuyê n đô  i đi   nh da  ng bô    phân loa   i. 

Sau khi kê  t thu  c huâ n luyê  n bô    nhâ  n da  ng bă ng tool Haar-training, trong thư mu  c../training/cascades/data ta co   ca c danh mu  c đươ   c đă   t tên tư   “0” đê n “N-1”, trong đo   N la  sô   lươ   ng ca c giai đoa  n đa   đươ   c xa c đi   nh trong haartraining.bat.

Các stage trong bộ huấn luyện sinh ra được sau bướ c 2 cần phải đượ c chuyển về định

dạng khác để có thể sử dụng được trong thư viện OpenCV, ở  đây là định dạng xml. Thực

hiện điều này bằng cách chạy lệnh:

File xml sinh ra có cấu trúc tương đối tr ực quan, có chứa các stage là các bộ phân

loại mạnh bên trong có chứa các bộ phân loại yếu là các đặc trưng Haar -like, các đặc trưngna y đươ   c lưu la   i dướ i dạng các hình chữ nhật có tọa độ và kích thướ c nằm trong một

khung 24x24 pixel.

haarconv.exe data data output.xml 24 24

Page 54: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 54/62

 

54

C ấ u trúc t ậ p tin xml chứ a bộ nhận d ạng

Trong thờ i gian thực hiện đồ án có hạn nên bộ nhận dạng sử dụng đặc trưng LBP chovideo ban đêm em chưa thực hiện xong nên chưa có kết quả để so sánh. Phần lớ n thờ i gian

huấn luyện dành chủ yếu cho các video ban ngày.

3.1.3.  Thư    nghiê   p va    đa  nh gia   kê  t qua   

  Yêu câ   u hê   thô  ng 

Đê  thư nghiê  m cho ba i toa n, em cha  y ư  ng du  ng trên ma y LG-isai vơ   i câ u h nh: 

  Hê  điê u ha nh: Android 4.4.2. KitKat 

  Ch  p: Snapdragon 801 bốn nhân tốc độ 2.5 GHz

  Ram: 3GB

 

Ma y ca i ư  ng du  ng OpenCV 

  Kê t qua   thư    nghiê   m 

Đô  i vơ   i ca c phương tiê  n tham gia thao thông trên đươ  ng, hê   thô  ng câ n nhâ  n da  ngca c xe ơ    ph a trươ   c va  đo đươ   c khoa ng ca ch, trong thư  c nghiê  m ba i toa n đa   gia i quyê t vâ nđê  trên nhưng co n trễ vê  thơ   i gian. Dươ   i đây la  mô   t sô   h nh a nh ma  hê    thô  ng đa   thu đươ   c. 

Page 55: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 55/62

 

55

: Nhâ  n da  ng đối tươ   ng xe ph a trươ   c. 

: Pha  t hiê  n la  n xe 

: Pha  t hiê  n la  n xe 

Page 56: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 56/62

 

56

Trong qua   tr nh thư  c nghiê  m trong qua  ng đươ   ng gâ n 50km kê t qua  cu  a hê  thô  ng tr nh ba y ơ    ba ng dươ   i đây: 

Ba ng 1: Đô     ch nh xa  c viê    c pha  t hiê   n đô  i tươ    ng xe trong 10s đâ   u 

Thơ   i gian  Thư  c tê   Pha  t hiê  n  %

10h15 68 60 88,23

Ba ng 2: Thơ    i gian nhâ   n da   ng xe cu  a mươ    i xe trên thư    c tê   

xe Thơ   i gian pha  t hiê  n thư  c tê   (chuâ n0s)

Thơ   i gian pha  t hiê  n cu  a hê   thô  ng (s) 

1 0  1,34

2 0  1,4

3 0  0,12

4 0  4,56

5 0  1.33

6 0 5,22

7 0 1,23

8 0 1,33

9 0 4,16

10 0 2,01

Ba ng 3: Sô   đô  i tươ    ng đo đươ    c khoa  ng ca  ch trong 10s đâ   u 

Thơ   i gian  Sô   xe pha  t hiê  n đươ   c  Sô   xe xa c đi   nh đươ   c khoa ng ca ch  %

10h15 41 32 78,04

Ba 

ng 4: Thơ   

i gian đo khoa 

ng ca ch cu

 

a mươ   

i xe trong thư    c tê   

xe Thơ   i gian pha  t hiê  n thư  c tê   (chuâ n0s)

Thơ   i gian đo đươ   c khoa ng ca ch cuarhê  thô ng (s) 

1 0  2,12

2 0  3,4

3 0  1,12

4 0  1,58

Page 57: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 57/62

 

57

5 0  5.02

6 0 4,10

7 0 3,00

8 0 3,34

9 0 3,56

10 0 1,31

  Nhâ   n xe  t va    phân t ch kê  t qua   thu đươ    c 

Qua các k ết quả thu đượ c từ quá trình thực nghiệm em có một số đánh giá và nhận

xét sau:

Qua kê t qua  ba ng 1 cho thâ y, viê   c nhâ  n da  ng đô  i tươ   ng xe cu a hê  thô ng l0s đâ u đa   t88,23%, điê u na y cho thâ y ră ng viê   c nhâ  n ra  ng đô  i tươ   ng la  không kho   vơ   i ba i toa n na yv  đơn gian ba i toa n ch  nhâ  n đô  i tươ   ng xe ph a trươ   c va  trong cu ng la n xe vơ   i m nh lên

viê   c nhâ  n da  ng trơ    lên dễ da ng hơn.Mă   t kha c, vẫn co n 11,77% la  viê   c nhâ  n da  ng diễn ralâu hơn 10s, không nhâ  n da  ng đươ   c hoă   c nhâ  n da  ng nhâ m.

 Nguyên nhân chủ yếu là do đặc điểm của những video ở  thời điểm khác nhau ảnh

hưởng khác nhau đến bộ nhận dạng. Như đã biết thì bộ nhận dạng sử dụng mô hình cascade

 phụ thuộc nhiều vào yếu tố độ sáng, mà những video ở  thời điểm sáng sớm có độ sáng

khác so vớ i những video ở  thời điểm giữa trưa, ngoài ra hướ ng chiều của mặt tr ờ i lên các

 phương tiện cũng khác nhau nên kết quả nhận dạng sẽ bị ảnh hưở ng nhiều.

Độ ổn định của hệ thống có thể đượ c cải thiện bằng cách tăng độ phong phú của các

mẫu huấn luyện, cụ thể là sử dụng nhiều mẫu ở  tất cả các thời điểm khác nhau trong ngàyđể huấn luyện cho bộ nhận dạng. Hoặc một cách tiế p cận khác là có thể sử dụng riêng bộ 

nhận dạng khác nhau cho từng thời điểm khác nhau, việc lựa chọn bộ nhận dạng nào sẽ 

tùy vào độ sáng của video đó. Điê u na y ly  gia i v  sao thơ   i gian pha  t hiê  n đô  i tươ   ng se   bi   trễ như trong ba ng 2 

3.2.  Phâ   n mê  m gia  m sa  t va    ca nh ba  o va cha   m ô tô trên thiê  t bi   di đô   ng 

Ơ   chương I đa   nêu ra ca c phương pha  p, ca c ư  ng du  ng cho ba i toa n gia m sa  t va  ca nh ba o va cha  m ô tô. Nhưng no   chưa phô   biê n trong nga nh công nghê   ô tô v  đơn gia n ca c

chi ph  sa n xuâ  t ra ca c thiê t bi  râ  t đă  t ma  không pha i ngươ   i tham gia phương tiê  n na o cu  ngco   thê  sơ    hư   u đươ   c. V  ly  do na y em đa   xây dư  ng ba i toa n nêu trên trên ca c thiê  t bi  di đô  ngnhă m kiê m tra va  thư  c hiê  n t nh an toa n khi la  i xe. 

 Ngày nay, hệ điều hành Android là nền tảng phổ biến nhất cho điện thoại thông minh

và các thiết bị di động. Do thực tế này đa   co   râ  t nhiê u nha  pha  t triê n trên thê  giơ   i đa   pha  ttriê n như   ng ư  ng du  ng liên quan đê n tâ m nh n ma y t nh. Mô   t trong như   ng ư  ng du  ng na y la  ư  ng du  ng OpenCV do Bradski (2000) pha  t triê n. Thư viện mạnh mẽ này đã thực hiện các

Page 58: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 58/62

 

58

thuật toán và phương pháp phổ biến nhất hỗ trơ tiế p cận để phát hiện đối tượng v  vâ  y ư  ngdu  ng đo   hoàn toàn phù hợ  p bở i việc thực hiện của ba i toa n na y. 

Phâ n mê m cha  y trên ca c thiê t bi  di đô  ng, Ơ   version na y em xây dư  ng hê  thô  ng cha  ytrên môi trươ   ng android 4.0 trơ    lên. 

3.2.1.  Tô ng quan vê   phâ   n mê  m 

Phâ n mê m vơ   i giao diê  n đơn gia n, sư   dung camera cu a thiê  t bi  đê  thu video. Phâ nmê m co   nhiê  m vu    pha  t hiê  n la n đươ   ng ma  ô tô đang đi va  pha  t hiê  n ra ca c ô tô ph a trươ   c.Sau đo   se   đo đươ   c khoa ng ca ch tơ   i chiê c ô tô đa   pha  t hiê  n đo  , nhă m giu  p cho ngươ   i la  i xe

 biê  t đươ   c khoa ng ca ch vơ   i xe ph a trươ   c la  bao xa đê  thay đô  i tô  c đô    

3.2.2. 

Phân t ch thiê  t kê   phâ   n mê  m

: Sơ đồ khối mô ta   hoa   t đô  ng cu a phần mềm .

Bă  t đâ u 

Huâ n luyê  n bô    nhâ  n da  ngđô  i tươ   ng ô tô 

Theo do  i, đưa ca nh ba o 

 Nhâ  n da  ng đô  i tươ   ng 

Kê t thu  c 

Dư    liê  u huâ nluyê  n 

Dư    liê  u kiê mthư   

Page 59: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 59/62

 

59

: Sơ đồ chi tiết cho qua   tr nh nhâ  n da  ng đối tươ   ng  

3.2.3. 

Giao diê   n chương tr  nh 

Giao diện của chương trình đượ c thiết k ế đơn giản, thân thiện vớ i giao diê  n ch nh xư   du  ng camera cu  a ca ch thiê t bi  di đô  ng. 

Page 60: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 60/62

 

60

Giao diê  n ch nh cu a phần mềm sư    du  ng camera

Page 61: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 61/62

 

61

KÊ  T LU   N VA    HƯƠ   NG PHA  T TRIÊ  N 

Trên cơ sơ    t m hiê u va  nghiên cư  u ba i toa n gia m sa  t va  ca nh ba o va cha  m ô tô trênthiê t bi  di đô  ng cu     thê   la  viê   c xây dư  ng va  pha  t triê n ba i toa n nhâ  n da  ng đô  i tươ   ng, va  ca nh ba o dư  a trên thông tin đô  i tươ   ng đươ   c nhâ  n da  ng, đồ án đã đạt đượ c những k ết quả 

như sau: 

 

Giớ i thiệu sơ lượ c về những phương pháp đã đượ c sử dụng cho ca nh ba o va cha  mô tô trên thiê t bi  di đô  ng, từ đó đưa ra các so sánh và nhận xét để tìm được phươngán triển khai thích hợ  p nhất.

  Giớ i thiệu một cách khái quát bài toán nhận dạng đối tượ ng và bài toán ca nh ba o,,các phương pháp tiế p cận cho mỗi bài toán và việc k ết hợp hai bài toán để tạo

nên hệ thống đếm phương tiện giao thông hoàn chỉnh.

  Trình bày thuật toán học máy AdaBoost, tìm hiểu về mô hình cascade cũng nhưđặc trưng Haar -like và đặc trưng LBP để có thể xây dựng đượ c bộ nhận dạng sử 

dụng cho bài toán nhận dạng đối tượ ng cụ  thể  là nhận dạng phương tiện giao

thông.

  Trình bày thuật toán pha  t hiê  n điê m cư  c tri  Scale-space va  thiê  t lâ    p vu ng quantâm, thuâ   t toa n Canny, thuâ   t toa n Hough trong viê   c pha  t hiê  n la n đươ  ng 

  Tiến hành thực nghiệm hệ thống trên ca c thiê t bi  di đô  ng vơ    đây la  ca c thiê  t bi   android, từđó đưa ra cách đánh giá, nhận xét về k ết quả  thu đượ c cho mỗi bài

toán nhỏ và cho cả hệ thống.

Bên cạnh những k ết quả đạt đượ c thì vẫn còn những hạn chế đó là: 

 

K ết quả của hệ thống chưa ổn định, còn phụ thuộc nhiều vào điều kiện và đặcđiểm của các video đầu vào như là yếu tố  thờ i gian, thờ i tiết, số  lượng và đặc

điểm của các phương tiện giao thông… 

  Chưa ha  n chê  đươ   c vê  mă   t trễ thơ   i gian, điê u na y râ  t quan tro  ng trong thư  c tê  , va  chưa co   ca nh ba o ro   ra ng 

Qua những k ết quả và hạn chế của hệ thống đã cho thấy theo phương tiện giao thôngnói chung và đưa ra ca c ca nh ba o dư    đoa n va cha  m nói riêng đòi hỏi một quá trình nghiên

cứu và thực hiện lâu dài. Trong phạm vi đồ án em mớ i chỉ thực hiện đượ c việc gia m sa  tva  ca nh ba o va cha  m ơ    ca c vu ng ngoa   i tha nh do viê   c xe cô      t đông đu  c như trong nô   i

tha nh, để có thể xây dựng một hệ thống tổng quát, áp dụng đượ c cho nhiều nơi thì cần

 phải có thêm nhiều thời gian. Trướ c mắt hướ ng phát triển của đồ án sẽ là phải tậ p trung

cải thiện tăng độ chính xác cũng như độ ổn định của hệ thống vớ i nhiều điều kiện và hoàn

cảnh khác nhau, xây dựng và hoàn thiện những bộ nhận dạng đang còn thiếu sót, củng cố 

và phát triển thuật toán để khắc phục đượ c những lỗi còn tồn tại.

Page 62: Đồ án tốt nghiệp

7/21/2019 Đồ án tốt nghiệp

http://slidepdf.com/reader/full/do-an-tot-nghiep-56da23e75cb36 62/62

 

TÀI LIỆU THAM KHẢO

Ta   i liê   u tiê ng Viê    t:

[0] Thê  Thi  Hươ  ng. Ky   thuâ   t trư   a nh va  ư  ng du  ng. Kho  a luâ  n tô  t nghiê    p Đa   i ho  c 2015,

Đa   i ho  c Công Nghê  - Đa   i ho  c Quô  c Gia Ha  Nô   i. 

[1] Phạm Hồng Ngự, Nhận d ạng đối tượ ng sử  d ụng thuật toán AdaBoost , Luận vănThạc sĩ Khoa học công nghệ thông tin, Đại học Huế, 2009.

Ta   i liê   u tiê ng Anh:

[2] David J. Fleet, Yair Weiss. Optical flow estimation, Mathematical models for

Computer Vision: The Handbook. N. Paragios, Y. Chen, and O. Faugeras (eds.), Springer,

2005.

[3] J. L. Barron, D. J. Fleet, and S. S. Beauchemin. Performance of optical flow

techniques. International Journal of Computer Vision, 12(1):43 – 77, 2007

[4] Yoav Freund and Robert E. Schapire, A decision-theoretic generalization of on-line

learning and an application to boosting, In Computational Learning Theory: Eurocolt ’95,Springer-Verlag, 1995.

[5] Paul Viola and Michael J. Jones, Rapid Object Detection using a Boosted Cascade

of Simple feature, IEEE CVPR, 2001.

[6] Multi-part Vehicle Detection using Symmetry Derived Analysis and Active

Learning, Ravi Kumar Satzoda, Member, IEEE and Mohan M. Trivedi, Fellow, IEEE.Accepted for Publication in IEEE Transactions on Intelligent Transportation Systems

[7] Ilustrated example in the calculation of the Local Binary Pattern for a pixel

with neighborbood of size 8

Website tham kha o 

[10] CV oline: http://homepages.inf.ed.ac.uk/rbf/CVonline/Imagedbase.htm

[11] Wikipedia: http://www.wikipedia.org

[12] Youtube: https://www.youtube.com/watch?v=p5T8RzYE60M