70
Nhóm 1 – Lớp KHMT1 K3 - Văn Hinh - Bùi Duy Hùng - Bùi Văn Nam - Nguyễn Hữu Trường - Phạm Việt TRƯỜNG ĐH CÔNG NGHIỆP HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN NGHIÊN CỨU VÀ PHÁT TRIỂN CÁC KỸ THUẬT PHÁT HIỆN BÀN TAY Giảng viên Hướng dẫn : Ths. Ngô Đức Vĩnh

Nhan dang cu dong co the

Embed Size (px)

Citation preview

Page 1: Nhan dang cu dong co the

Nhóm 1 – Lớp KHMT1 K3- Lê Văn Hinh

- Bùi Duy Hùng

- Bùi Văn Nam

- Nguyễn Hữu Trường

- Phạm Việt

TRƯỜNG ĐH CÔNG NGHIỆP HÀ NỘI

KHOA CÔNG NGHỆ THÔNG TIN

NGHIÊN CỨU VÀ PHÁT TRIỂN CÁC

KỸ THUẬT PHÁT HIỆN BÀN TAY

Giảng viên Hướng dẫn : Ths. Ngô Đức Vĩnh

Page 2: Nhan dang cu dong co the

I. Video demo về ứng dụng của kỹ thuật pháthiện bàn tay

II. Giới thiệu các kỹ thuật phát hiện bàn tay

III. Tổng quan về các kỹ thuật xử lý ảnh

IV. Giải pháp phát hiện bàn tay của DST

V. Hướng nghiên cứu phát triển tương lai

Page 3: Nhan dang cu dong co the

I. Video demo về ứng dụng của kỹ thuật pháthiện bàn tay

II. Giới thiệu các kỹ thuật phát hiện bàn tay

III. Tổng quan về các kỹ thuật xử lý ảnh

IV. Giải pháp phát hiện bàn tay của DST

V. Hướng nghiên cứu phát triển tương lai

Page 4: Nhan dang cu dong co the
Page 5: Nhan dang cu dong co the

Tivi thông minh

Giải trí

Các buổi thuyết trình

Page 6: Nhan dang cu dong co the

I. Video demo về ứng dụng của kỹ thuật pháthiện bàn tay

II. Giới thiệu các kỹ thuật phát hiện bàn tay

III. Tổng quan về các kỹ thuật xử lý ảnh

IV. Giải pháp phát hiện bàn tay của DST

V. Hướng nghiên cứu phát triển tương lai

Page 7: Nhan dang cu dong co the
Page 8: Nhan dang cu dong co the
Page 9: Nhan dang cu dong co the

1. Dựa trên đặc trưng của bàn tay và các ngón

Page 10: Nhan dang cu dong co the

1. Dựa trên đặc trưng của bàn tay và các ngón

Ưu điểm:

- Linh hoạt, không bị ràng buộc bởi thuật toán nhậndạng

Nhược điểm:

- Độ phức tạp cao

Page 11: Nhan dang cu dong co the

2. Phát hiện biên ảnh và so khớp với tập mẫuhuấn luyện

Page 12: Nhan dang cu dong co the

2. Phát hiện biên ảnh và so khớp với tập mẫuhuấn luyện

Ưu điểm:- Giải thuật có tỷ lệ lỗi thấp

Nhược điểm- Khó khăn trong việc xây dựng tập mẫu

- Độ phức tạp cao

Page 13: Nhan dang cu dong co the

3. Sử dụng các đặc trưng Haar-like

Page 14: Nhan dang cu dong co the

3. Sử dụng các đặc trưng Haar-like

Ưu điểm:

- Là kỹ thuật nhận dạng tiên tiến – Object Detection

- Khoanh vùng bàn tay chính xác

Nhược điểm:

- Thời gian huấn luyện quá lâu

Page 15: Nhan dang cu dong co the

3. Sử dụng các đặc trưng Haar-like

- Độ phức tạp của giải thuật huấn luyện:

O(MNT log N)

N ~ 10.000 – Số tập mẫu huấn luyện

M ~ 4.00 – 6.000 – Số phân loại yếu

T ~ 40.000 – Số lượng các đặc trưng được sử

dụng

Page 16: Nhan dang cu dong co the

3. Sử dụng các đặc trưng Haar-like

- Fast Statboost – Phạm Minh Trí - NanyangTechnological University 2007

O(Nd2+T)N ~ 10.000 – Số tập mẫu huấn luyện

d ~ 400-600 – Kích thước cửa sổ nhận dạng

T ~ 40.000 – Số lượng các đặc trưng được sử

dụng

P.M. Trí Đã khắc phục tối đa nhược

điểm của kỹ thuật này

Page 17: Nhan dang cu dong co the

4. Tiếp cận dựa trên phân tách màu da

Page 18: Nhan dang cu dong co the

4. Tiếp cận dựa trên phân tách màu da

Ưu điểm:- Thu hẹp không gian bài toán

- Sát với thị giác con người

- Dễ cài đặt

Nhược điểm- Dễ bị nhiễu, do ảnh hưởng bởi yếu tố ánhsáng

Page 19: Nhan dang cu dong co the

5. Mạng nơ-ron nhân tạo và kỹ thuật PCA

Chưa có chính xác một tài liệu nào hoànchỉnh về kỹ thuật phát hiện bàn tay sử dụngmạng nơ-ron nhân tạo và kỹ thuật trích chọnđặc trưng PCA

Page 20: Nhan dang cu dong co the

6. Xây dựng bản đồ chiều sâu để phân tách cơthể người (Intel CES 2011, Kinect)

Page 21: Nhan dang cu dong co the

6. Xây dựng bản đồ chiều sâu để phân tách cơthể người (Intel CES 2011, Kinect)

Ưu điểm:- Độ chính xác rất cao

- Tái hiện được quá trình chuyển động của cơthể

Nhược điểm:- Chi phí đầu tư cho thiết bị

Page 22: Nhan dang cu dong co the

I. Video demo về ứng dụng của kỹ thuật pháthiện bàn tay

II. Giới thiệu các kỹ thuật phát hiện bàn tay

III. Tổng quan về các kỹ thuật xử lý ảnh

IV. Giải pháp phát hiện bàn tay của DST

V. Hướng nghiên cứu phát triển tương lai

Page 23: Nhan dang cu dong co the

1. Phát hiện biên ảnh

2. Chuyển ảnh màu về ảnh xám & cân bằngmức xám

3. Chuyển ảnh về hệ màu YCrCb, HSV

4. Giải thuật làm trơn ảnh

Page 24: Nhan dang cu dong co the

I. Video demo về ứng dụng của kỹ thuật pháthiện bàn tay

II. Giới thiệu các kỹ thuật phát hiện bàn tay

III. Tổng quan về các kỹ thuật xử lý ảnh

IV. Giải pháp phát hiện bàn tay của DSTV. Hướng nghiên cứu phát triển tương lai

Page 25: Nhan dang cu dong co the

1. Kỹ thuật tiền xử lý

2. Phát hiện bàn tay

3. Truy vết chuyển động bàn tay

4. Tái hiện hành động

Page 26: Nhan dang cu dong co the

Phát hiện màu da sử dụng không gian màuYCrCb

Page 27: Nhan dang cu dong co the

Sử dụng ngưỡng 1: Tìm pixels sai biệt

Khoanh vùng chuyển động => Thu hẹp không gian bài toán

Page 28: Nhan dang cu dong co the

Sử dụng ngưỡng 2 để loại trừ nhữngvùng nhiễu xung quanh viền bàn tay

vừa được tách

Page 29: Nhan dang cu dong co the

Khoanh vùng bàn tay trên ảnh màu da (Sử

dụng thuật toán Graham và tìm điểm cựctiểu, cực đại địa phương)

Loại bỏ

Page 30: Nhan dang cu dong co the

Khoanh vùng bàn tay trên ảnh màu da (Sử

dụng thuật toán loang và tìm điểm cựctiểu, cực đại địa phương)

Page 31: Nhan dang cu dong co the
Page 32: Nhan dang cu dong co the

Tách bàn tay khỏi ảnh => Chuyển qua module nhận dạng

Page 33: Nhan dang cu dong co the

Giải thuật phân loại dựa trên phân cấp

Page 34: Nhan dang cu dong co the

1. Kỹ thuật tiền xử lý

2. Phát hiện bàn tay

3. Truy vết chuyển động bàn tay

4. Tái hiện hành động

Page 35: Nhan dang cu dong co the

Ban đầu 2 hướng lựa chọn:◦ Sử dụng Kỹ thuật PCA

◦ Sử dụng kỹ thuật mạng nơ-ron nhân tạo

Page 36: Nhan dang cu dong co the

1) Tính toán ban đầu về kích thướcmạng nơ-ron nhân tạo

2) Xây dựng tập ảnh mẫu bàn tay

3) Huấn luyện mạng

4) Kiểm tra mạng bằng tập ảnh test

5) Tích hợp module Nhận dạng bàn tayvào phần mềm và kiểm thử kết quả

Page 37: Nhan dang cu dong co the

1) Tính toán ban đầu về kích thướcmạng nơ-ron nhân tạo

- Đầu vào: Ma trận mức xám của ảnh *

- Đầu ra:- 1 – Nếu ảnh có chứa bàn tay

- 0 – Nếu ảnh không chứa bàn tay

- Kích thước ảnh: 20x20 => 400 nơ-ronlớp input

- Số lớp ẩn: 1 lớp, gồm 100 nơ-ron lớp ẩn

Page 38: Nhan dang cu dong co the

2) Xây dựng tập ảnh mẫu- 50.952 ảnh bàn tay

- 42.041 ảnh không phải bàn tay

Tổng: 92.966 ảnh huấn luyện

- 35.774 ảnh test

Tập ảnh mẫu được lựa chọn phải có tínhđại diện cho bàn tay thực tế

Page 39: Nhan dang cu dong co the

3) Huấn luyện mạng

- Sử dụng giải thuật lan truyền ngượccho mạng truyền thẳng nhiều lớp

• P: vectơ đầu vào

• W1, W2 : ma trận trọng số

• b1, b2: độ lệch bias

• n1, n2: vectơ vào

• f1,f2: hàm kích hoạt

• a1, a2: đầu ra

Page 40: Nhan dang cu dong co the

Nếu tham số tốc độ học nhỏ thì hội tụchậm, ngượi lại tốc độ học lớn thìthiếu chính xác

Giải thuật có thể bị tắc tại các cực trịđịa phương mà không thể đạt đượccực trị toàn của của bề mặt lỗi

Page 41: Nhan dang cu dong co the

Có rất nhiều phương pháp đề

xuất các cải tiến nhằm khắc phụcnhược điểm trên như:◦ Sử dụng tham số bước đà

◦ Sử dụng hệ số học biến đổi

◦ Sử dụng gradient kết hợp

◦ Sử dụng thuật toán giả luyện kim

◦ Sử dụng giải thuật di truyền

Page 42: Nhan dang cu dong co the

Sử dụng hệ số học biến đổi

Sử dụng giải thuật di truyền

Page 43: Nhan dang cu dong co the

- E(t): tổng bình phương lỗi tại vòng lặp t

- n: số mẫu học

- Zi : đầu ra thực tế

- Yi : đầu ra mong muốn

n

i

ii YZtE0

2)()(

Page 44: Nhan dang cu dong co the

Sau mỗi lần lặp ta sẽ gán:ᵑ = ᵑ x ρ ᵑ: tốc độ học

Nếu: ∆E/ E(t) > β (0.01< β<0.05) -> 0< ρ< 1

Nếu: (E(t) – E(t-1)) / E(t) < 0 thì ρ > 1

Nếu: 0 < ∆E/ E(t) < β

)1()( tEtEE

Page 45: Nhan dang cu dong co the

Sử dụng hệ số học biến đổi

Sử dụng giải thuật di truyền

Page 46: Nhan dang cu dong co the

- Bước 1: Khởi tạo quần thể các nhiễm sắc thể. - Bước 2: Xác định giá trị thích nghi của từngnhiễm sắc thể. - Bước 3: Sao chép lại các nhiễm sắc thể dựa vàogiá trị thích nghi của chúng và tạo ra những nhiễmsắc thể mới bằng các phép toán di truyền. - Bước 4: Loại bỏ những thành viên không thíchnghi trong quần thể. - Bước 5: Chèn những nhiễm sắc thể mới vào quầnthể để hình thành một quần thể mới. - Bước 6: Nếu mục tiêu tìm kiếm đạt được thìdừng lại, nếu không trở lại bước 3

Page 47: Nhan dang cu dong co the

Để có thể sử dụng được giải thuật di truyền vào việc học của mạng nơroncần phải thực hiện một số bức nhưsau:◦ Xây dựng hàm giá

◦ Mã hóa nhiễm sắc thể

◦ Thực hiện giải thuật di truyền

Page 48: Nhan dang cu dong co the

Trong đó : n: là số mẫu huấn luyện

Xi : là đầu ra thực với mẫu i

Yi : là đầu ra mong muốn với mẫu i

n

i

ii TXn

E0

2)(1

Page 49: Nhan dang cu dong co the

Mã hóa nhị phân ( chiều dài nhiễm sắc thểlớn -> gây chậm chương trình)

Page 50: Nhan dang cu dong co the

Mã hóa số thực

Page 51: Nhan dang cu dong co the
Page 52: Nhan dang cu dong co the

Số lớp ẩn: 1 lớp

Số nơ-ron ẩn: 40 nơ-ron

Số nơ-ron lớp vào: 400 nơ-ron

Sai số cho phép: 10-10

Số vòng lặp tối đa: 10.000.000

Số lượng mẫu Lan truyền ngược Giải thuật di truyền

1.432 19’22” 8’3”

92.966 24h chưa có kết quả 5h22’18”

Page 53: Nhan dang cu dong co the

4) Kiểm tra mạng bằng tập ảnh test

Số ảnh Sai số Thời gian nhậndạng

Thời gian kiểm tra(nhóm tự test)

100 1% 0.3s 20s

1.000 1.2% 22s 2p

35.774 4% 3p14s 30p (2 người)

Page 54: Nhan dang cu dong co the

5) Tích hợp module nhận dạng bàn tayvào phần mềm

- Sai sót tương đối nhiều giữa phần mặt vàphần bàn tay

Page 55: Nhan dang cu dong co the

1. Kỹ thuật tiền xử lý

2. Phát hiện bàn tay

3. Truy vết chuyển động bàn tay

4. Tái hiện hành động

Page 56: Nhan dang cu dong co the

1) Sử dụng giải thuậtMeanshift/Camshift

2) Kết hợp bộ lọc Kalman và lọc hạt(Particle Filter)

3) Kỹ thuật lưu vết chuyển động vàchuyển qua module tái hiện sự kiện

Page 57: Nhan dang cu dong co the

B1: Thiết lập khu vực quan tâm

B2: Chọn một vị trí ban đầu của cửa sổ tìm kiếmCamShift. Vị trí được chọn là phân phối mục tiêuđược theo dõi.

B3: Tính xác suất phân phối màu sắc ở khu vực trungtâm của cửa sổ tìm kiếm.

B4: Lặp lại thuật toán CamShift để tìm ra trọng tâmxác suất của ảnh. Lưu trữ phân vùng ảnh đó và vị trítrọng tâm.

B5: Đối với mỗi khung, trung tâm của cửa sổ tìm kiếmở vị trí trung bình được tìm thấy ở bước 4 và thiết lạikích thước cửa sổ theo dõi. Trở về bước 3.

Page 58: Nhan dang cu dong co the
Page 59: Nhan dang cu dong co the

nh được mô nh a một ch rời rạc theothời gian bằng một phương nh ngẫu nhiên tuyến

nh như sau:

xk = Axk – 1 + Buk – 1 + wk – 1 (1)

va t đo c

zk = H * xk + vk (2)

Trong đo w va hai vecto n u nhiên i ncho u hê ng va u đo c.

Hai n u nhiên y c p va gia sư tuân theot phân i n với trung nh = 0 va ma trận

hiệp biến (covariance) lần lượt Q va R

Page 60: Nhan dang cu dong co the

p(w) ∼ N(0, Q) (3)

p(v) ∼ N(0, R) (4)

u vector ng i ch c n, thi ma n ch c ma trận

phụ thuộc o điều khiển tối ưu u vớich thước l. Vector đo đạc ch thước m

nên ma trận H sẽ rằng c ma trậnthể thay đổi theo thời gian (từng bước

k).

Bộ lọc Kalman mang bản chất đi m gia trị clượng va ước n của trạng i x khi ta biết đượcsự biến thiên của va ta đo được một i lượng

phụ thuộc n nh o x.

Page 61: Nhan dang cu dong co the
Page 62: Nhan dang cu dong co the

Với mỗi hình chữ nhật, ta luôn xác định đượctọa độ tâm của hình chữ nhật

Mỗi lần lấy ảnh từ Camera đưa vào nhậndạng. Nếu phát hiện được bàn tay di chuyển, ta sẽ lưu tọa độ tâm vào mảng lưu vết chuyểnđộng

Page 63: Nhan dang cu dong co the

1. Kỹ thuật tiền xử lý

2. Phát hiện bàn tay

3. Truy vết chuyển động bàn tay

4. Tái hiện hành động

Page 64: Nhan dang cu dong co the

Với tập tọa độ các điểm được lưu vết. NhómDST xây dựng các kỹ thuật nhận dạng cử

chỉ và tái hiện hành động:◦ Sử dụng mạng nơ-ron nhân tạo

◦ Sử dụng giải thuật hình học thông thường

Page 65: Nhan dang cu dong co the

Sử dụng mạng nơ-ron◦ Cho phép người dùng tự định nghĩa hành

động

◦ Tương đối đơn giản trong việc cài đặt

◦ Tìm mẫu phức tạp

Page 66: Nhan dang cu dong co the

Sử dụng giải thuật hình học◦ “Máy móc” trong quá trình nhận dạng cử

chỉ

◦ Mức độ chính xác ở mức tương đối

◦ Dễ hình dung thuật toán và dễ cài đặt

Page 67: Nhan dang cu dong co the

I. Video demo về ứng dụng của kỹ thuật pháthiện bàn tay

II. Giới thiệu các kỹ thuật phát hiện bàn tay

III. Tổng quan về các kỹ thuật xử lý ảnh

IV. Giải pháp phát hiện bàn tay của DST

V. Hướng nghiên cứu phát triển trongtương lai

Page 68: Nhan dang cu dong co the

1. Kỹ thuật Fast Statboost tăng tốcphân loại Haar-like

2. Sử dụng Particle Filter để track đốitượng chuyển động chính xác

3. Xây dựng giải pháp hoàn chỉnh chosản phẩm DST Remote Hand

Page 69: Nhan dang cu dong co the

Open Hand Detection in a Cluttered Single Image using Finger Primitives - M. Baris & Caglar Niels Lobo - University of Central Florida

Detecting and tracking faces and hands - Roberto Cipolla – University Of Cambridge

A Bayesian Framework for Human Body Pose Tracking from Depth Image Sequences - Youding Zhu , Kikuo Fujimura

Báo cáo thực tập tốt nghiệp Haar-Like với Adaboost – Nguyễn Quốc Triệu –ĐH Công nghiệp Hà Nội

Page 70: Nhan dang cu dong co the

Xin chân thành cảm ơn sự lắngnghe của thầy giáo và các bạn