85
(1) การพัฒนาระบบค้นคืนภาพแบบกระจายร่วมกับเทคนิคสามเหลี่ยมเดอลาเน Distributed Image Retrieval System with Delaunay Triangulation Technique ณัฐพล แก้วปนทอง Natthapol Kaewpontong วิทยานิพนธ์นี้สาหรับการศึกษาตามหลักสูตรปริญญา วิศวกรรมศาสตรมหาบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ มหาวิทยาลัยสงขลานครินทร์ A Thesis Submitted in Fulfillment of the Requirements for the Degree of Master of Engineering in Computer Engineering Prince of Songkla University 2559 ลิขสิทธิ ์ของมหาวิทยาลัยสงขลานครินทร

ณัฐพล แก้วปนทอง วิทยานิพนธ์นี้ ... · 2020-01-24 · (6) Thesis Title Distributed Image Retrieval System with Delaunay Triangulation

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

(1)

การพฒนาระบบคนคนภาพแบบกระจายรวมกบเทคนคสามเหลยมเดอลาเน Distributed Image Retrieval System with Delaunay Triangulation Technique

ณฐพล แกวปนทอง Natthapol Kaewpontong

วทยานพนธนส าหรบการศกษาตามหลกสตรปรญญา วศวกรรมศาสตรมหาบณฑต สาขาวชาวศวกรรมคอมพวเตอร

มหาวทยาลยสงขลานครนทร A Thesis Submitted in Fulfillment of the Requirements for the Degree of

Master of Engineering in Computer Engineering

Prince of Songkla University 2559

ลขสทธของมหาวทยาลยสงขลานครนทร

(2)

ชอวทยานพนธ การพฒนาระบบคนคนภาพแบบกระจายรวมกบเทคนคสามเหลยมเดอลาเน ผเขยน นายณฐพล แกวปนทอง สาขาวชา วศวกรรมคอมพวเตอร

บณฑตวทยาลย มหาวทยาลยสงขลานครนทร อนมตใหนบวทยานพนธฉบบน ส าหรบการศกษา ตามหลกสตรปรญญาวศวกรรมศาสตรมหาบณฑต สาขาวชาวศวกรรมคอมพวเตอร ………………………………….………….

(รองศาสตราจารย ดร.ธระพล ศรชนะ) คณบดบณฑตวทยาลย

อาจารยทปรกษาวทยานพนธหลก ………………………………… (ดร.สมชย หลมศโรรตน)

คณะกรรมการสอบ

……………….….................ประธานกรรมการ (ดร.อนนท ชกสรวงค) …........................................................กรรมการ (ดร.สมชย หลมศโรรตน) …........................................................กรรมการ (ดร.เดอนเพญ กชกรจารพงศ)

(3)

ขอรบรองวา ผลงานวจยนมาจากการศกษาวจยของนกศกษาเอง และไดแสดงความขอบคณบคคลทมสวนชวยเหลอแลว

ลงชอ………………………. (ดร.สมชย หลมศโรรตน) อาจารยทปรกษาวทยานพนธ

ลงชอ…………………….… (นายณฐพล แกวปนทอง) นกศกษา

(4)

ขาพเจาขอรบรองวา ผลงานวจยนไมเคยเปนสวนหนงในการอนมตปรญญาในระดบใดมากอน และไมไดถกใชในการยนขออนมตปรญญาในขณะน

ลงชอ…….………………… (นายณฐพล แกวปนทอง) นกศกษา

(5)

ชอวทยานพนธ การพฒนาระบบคนคนภาพแบบกระจายรวมกบเทคนคสามเหลยมเดอลาเน ผเขยน นายณฐพล แกวปนทอง สาขาวชา วศวกรรมคอมพวเตอร ปการศกษา 2558

บทคดยอ

วทยานพนธนเปนการออกแบบและพฒนาโครงสรางพนฐานส าหรบการคนคนภาพเพอรองรบการเพมขนของขอมลอนเนองมาจากความกาวหนาทางเทคโนโลยในอนาคต ซงใชระบบการประมวลผลแบบกระจาย (Distributed System) ไวรองรบการจดเกบและประมวลผลขอมลขนาดใหญ โดยประยกตใชรวมกบเทคนคสามเหลยมเดอลาเน (Delaunay Triangulation) มาใชเปนโครงขายเพอจดเกบคณลกษณะพเศษของภาพ เนองจากสามเหลยมเดอลาเนมคณสมบตพเศษในการจดกลมทสามารถลดความซบซอนของขอมลได โดยออกแบบใหมการใชสามเหลยมเดอลาเนหลาย ๆ ชนส าหรบจดเกบคณลกษณะพเศษตาง ๆ

การทดสอบประสทธภาพในการประมวลผลขอมลของระบบ โดยสกดคณลกษณะพเศษของสในระบบสแบบ RGB มาจดเกบในโครงขายสามเหลยมเดอลาเน 3 มต แบบ 2 ชน ผลการทดลองพบวาใหประสทธภาพความถกตองในการจบคภาพ 100 เปอรเซนต ซงใชเวลาโดยรวมในการประมวลผลลดลงไป 99.13 เปอรเซนต และใชหนวยความจ าในการประมวลผลลดลงไป 90.52 เปอรเซนต เมอเปรยบเทยบกบการใชสามเหลยมเดอลาเน 6 มต เพยงชนเดยว และยงพบอกวาเมอน าขนตอนดงกลาวไปประมวลผลแบบกระจายท าใหระบบมประสทธภาพมากยงขน ซงสามารถน าไปพฒนาตอยอดเพอใชกบงานอน ๆได ค าส าคญ การคนคนภาพ สามเหลยมเดอลาเน การจบคภาพ การประมวลผลแบบกระจาย

(6)

Thesis Title Distributed Image Retrieval System with Delaunay Triangulation Technique Author Mr. Natthapol Kaewpontong Major Program Computer Engineering Academic Year 2015

ABSTRACT

This thesis aims to design and develop the infrastructure for image retrieval system to handle the increase of digital images due to technological advances in the future. The system uses distributed processing system to support the storage and processing of big data by using Delaunay Triangulation technique to store feature vector of images, Because Delaunay Triangulation has special features for clustering that simplify the data by design the multiple Delaunay Triangulation for various features vector.

The performance testing of data processing system is tested by extracted features of color in RGB space for storage with double layers’ 3D Delaunay triangulation. The results showed the efficiency, accuracy in image matching 100% , the time overall process decreased 99. 13% and memory usage decreased 90. 52% to compare with single layer 6D Delaunay Triangulation. Using this approach on distributed processing system is more efficient. It can lead to further development in other applications. Keywords: Image Retrieval, Delaunay Triangulation, Image Matching, Distributed

Processing

(7)

กตตกรรมประกาศ

ขอขอบพระคณ ดร.สมชย หลมศโรรตน อาจารยทปรกษาวทยานพนธ ทไดกรณาใหการสนบสนนและฝกฝนการท าวจย ตลอดจนขดเกลากระบวนการคด ทงยงใหก าลงใจและเอาใจใสเปนอยางมาก กระตนใหผวจยไดมความมงมนในการท างานใหส าเรจลลวงดวยดเรอยมา รวมทงชวยตรวจทานแกไขวทยานพนธใหด าเนนไปจนเสรจสมบรณ

ขอขอบพระคณ ดร.อนนท ชกสรวงค ทไดกรณาอทศเวลาเปนประธานกรรมการสอบวทยานพนธ ทงยงเปนกรรมการสอบโครงรางวทยานพนธ พรอมทงใหค าปรกษาแนะน าทเปนประโยชนตอการท าวจยและตรวจทานวทยานพนธใหมความสมบรณมากยงขน

ขอขอบพระคณ ดร.เดอนเพญ กชกรจารพงศ ทไดกรณาอทศเวลาเปนกรรมการสอบวทยานพนธ และใหค าปรกษาแนะน าทเปนประโยชนตอการท าวจยรวมไปถงตรวจทานวทยานพนธใหมความสมบรณมากยงขน

ขอขอบพระคณ คณะวศวกรรมศาสตร มหาวทยาลยสงขลานครนทร ทกรณาสนบสนน “ทนบณฑตศกษาวศวกรรมศาสตร” แกผวจยระหวางการศกษา

ขอขอบพระคณ มหาวทยาลยสงขลานครนทร ทใหทนอดหนนการวจยเพอวทยานพนธ ประจ าปการศกษา 2554

สดทายนขอขอบพระคณอาจารยผสอนทกทาน ทประสทธประสาทความรดานตาง ๆ ทงในอดตและปจจบน และขอขอบคณภาควชาวศวกรรมคอมพวเตอรทใหความชวยเหลอดานตาง ๆ เปนอยางด ทขาดไมไดคอ ขอกราบขอบพระคณบดาและมารดาของขาพเจา ครอบครว เพอน ๆ ทสนบสนนและเปนก าลงในการศกษาดวยดเสมอมา รวมทงเปนก าลงใจและเปนแรงบนดาลใจ จนท าใหขาพเจาประสบความเรจ หากวทยานพนธนมความดอนใด ผวจยขอใหเปนกตเวทตาแดบดา มารดา และบรพาจารยทกทาน แตถาวทยานพนฉบบนมขอบกพรองประการใด ผวจยขอนอบรบไวแตเพยงผเดยว

ณฐพล แกวปนทอง

(8)

สารบญ หนา

สารบญ ..................................................................................................................................... (8) รายการตาราง ............................................................................................................................... (10) รายการภาพประกอบ .................................................................................................................... (11) บทท 1 บทน า ................................................................................................................................... 1

1.1 ความส าคญและทมาของหวขอวจย ................................................................................ 1 1.2 วตถประสงคในการวจย ................................................................................................ 3 1.3 ขอบเขตงานวจย ............................................................................................................ 3 1.4 ประโยชนทคาดวาจะไดรบ ........................................................................................... 3

บทท 2 ทฤษฎและหลกการ .............................................................................................................. 4

2.1 แนวคดพนฐานในการคนคนภาพ .................................................................................. 4

2.1.1 การคนคนภาพดวยพนฐานทางตวอกษร ............................................................. 4

2.1.2 การคนคนภาพดวยเนอหาของภาพ .................................................................... 4

2.2 เทคนคสามเหลยมเดอลาเน ........................................................................................... 8 2.3 การประมวลผลขอมลแบบกระจาย ............................................................................. 11 2.4 MapReduce ................................................................................................................. 12 2.5 สรปทฤษฎและหลกการ ............................................................................................... 15

บทท 3 วธด าเนนการวจย ................................................................................................................. 16

3.1 ภาพโดยรวมวธด าเนนการวจย .................................................................................... 16 3.2 เครองมอทใช ............................................................................................................... 17

3.2.1 โปรแกรมทใชท างาน ........................................................................................ 17

3.2.2 เครองทใชในการประมวลผล ........................................................................... 17

3.3 การจบคภาพ ................................................................................................................. 17

3.3.1 แนวทางการทดลอง ......................................................................................... 17

3.3.2 ขนตอนและวธการทดลอง ................................................................................ 18

(9)

สารบญ (ตอ) หนา

3.3 การทดลองการประมวลผลแบบกระจาย ...................................................................... 31

3.3.1 แนวทางการทดลอง ......................................................................................... 31

3.3.2 ขนตอนและวธการทดลอง ................................................................................ 31

บทท 4 ผลการทดลอง ...................................................................................................................... 34

4.1 ผลการทดลองการจบคภาพ ......................................................................................... 34

4.1.1 ผลการจบคภาพบนสามเหลยมเดอลาเนหลายมต .............................................. 34

4.1.2 ผลการจบคภาพบนสามเหลยมเดอลาเนมตขนาดกลางหลาย ๆ ชน .................. 46

4.1.3 ผลการจบคภาพบนสามเหลยมเดอลาเน 3 มตหลายชนแบบกระจาย ................ 50

4.2 ผลการทดลองการประมวลผลแบบกระจาย ................................................................ 51

4.2.1 ผลการทดลองการประมวลผลแบบกระจายทจ านวนเครองแตกตางกน .......... 51

4.2.2 ผลการทดลองการประมวลผลแบบกระจายโดยปรบปรงขนตอน MapReduce 52

4.3 สรป .............................................................................................................................. 54

บทท 5 บทสรป อภปรายผลและขอเสนอแนะ ................................................................................ 55

5.1 บทสรป ........................................................................................................................ 55 5.2 อภปรายผล .................................................................................................................. 56 5.3 ขอเสนอแนะ ................................................................................................................ 57

บรรณานกรม ................................................................................................................................... 58 ภาคผนวก ...................................................................................................................................... 59 ภาคผนวก ก Natthapol Kaewpontong and Somchai Limsiroratana. 2016. “Image

matching with multi medium Delaunay triangulation.” KKU ENGINEERING JOURNAL 43 (3) .......................................................................................................... 65

ประวตผเขยน ................................................................................................................................. 72

(10)

รายการตาราง หนา

ตารางท 4.1 เวลาเฉลยและหนวยความจ าเฉลยทใชประมวลผลบนสามเหลยมเดอลาเน 3 มต ......... 3 ตารางท 4.2 เวลาเฉลยและหนวยความจ าเฉลยทใชประมวลผลบนสามเหลยมเดอลาเน 6 มต ....... 37 ตารางท 4.3 เวลาเฉลยและหนวยความจ าเฉลยทใชประมวลผลบนสามเหลยมเดอลาเน 9 มต ....... 40 ตารางท 4.4 เวลาเฉลยและหนวยความจ าเฉลยทใชประมวลผลบนสามเหลยมเดอลาเน 12 มต ..... 42 ตารางท 4.5 ผลการคนคนภาพทจ านวน 64 ภาพของสามเหลยมเดอลาเนหลายมต ........................ 45 ตารางท 4.6 เวลาและหนวยความจ าเฉลยทใชประมวลผลบนสามเหลยมเดอลาเนหลายชน .......... 47 ตารางท 4.7 ผลการคนคนภาพทจ านวน 1,000 ภาพของสามเหลยมเดอลาเน 3 มตหลายชน .......... 49 ตารางท 4.8 ผลการจบคภาพบนสามเหลยมเดอลาเน 3 มตหลายชนแบบกระจาย .......................... 50 ตารางท 4.9 เวลาเฉลยทใชในการประมวลผลแบบกระจายทสภาพแวดลอมตาง ๆ ....................... 51 ตารางท 4.10 เวลาเฉลยทใชประมวลผลของ MapReduce แบบเกาและแบบทปรบปรง ................ 52

(11)

รายการภาพประกอบ หนา

ภาพท 2.1 โครงสรางระบบการคนคนภาพดวยเนอหาของภาพ ........................................................ 6 ภาพท 2.2 ลกษณะของส ................................................................................................................... 7 ภาพท 2.3 ลกษณะของรปราง ............................................................................................................ 7 ภาพท 2.4 ลกษณะของพนผว ........................................................................................................... 8 ภาพท 2.5 ลกษณะส RGB ............................................................................................................... 8 ภาพท 2.6 แผนผงโวโรนอย .............................................................................................................. 9 ภาพท 2.7 สามเหลยมเดอลาเนบนแผนผงโวโรนอย ....................................................................... 10 ภาพท 2.8 องคประกอบของสามเหลยมเดอลาเน ............................................................................ 10 ภาพท 2.9 คณลกษณะพเศษ Empty Circumcircle ........................................................................... 11 ภาพท 2.10 ตวอยางสามเหลยมเดอลาเนทสรางดวย Qhull Library ................................................. 12 ภาพท 2.11 กระแสขอมลของ MapReduce .................................................................................... 14 ภาพท 2.12 การท างานของ MapReduce ทแบงงานออกเปนชนเลก ๆ ........................................... 14 ภาพท 2.13 MapReduce ทด าเนนการกบ JobTacker และ TaskTracker .......................................... 15 ภาพท 2.14 ขนตอนการอานไฟลจาก HDFS .................................................................................. 15 ภาพท 3.1 โครงสรางโดยรวมของงานวจย ...................................................................................... 18 ภาพท 3.2 ขนตอนการสรางไฟลส าหรบการจบคภาพบนสามเหลยมเดอลาเนหลายมต ................. 20 ภาพท 3.3 ขอมลในไฟลส าหรบการจบคภาพบนสามเหลยมเดอลาเนหลายมต ............................. 21 ภาพท 3.4 ตวอยางขอมลในไฟลส าหรบการจบคภาพบนสามเหลยมเดอลาเน 3 มต ....................... 21 ภาพท 3.5 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 6 มต ..................... 22 ภาพท 3.6 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 9 มต ..................... 22 ภาพท 3.7 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 12 มต .................... 23 ภาพท 3.8 ขนตอนการทดลองการจบคภาพบนสามเหลยมเดอลาเนหลายมต ................................ 24 ภาพท 3.9 ตวอยางสามเหลยมเดอลาเน 2 มต (ก) 3 มต (ข) และ 2 มต หลาย ๆ ชน (ค) ................. 25 ภาพท 3.10 ขนตอนการสรางไฟลส าหรบการจบคภาพบนสามเหลยมเดอลาเนหลายมตหลายชน . 26 ภาพท 3.11 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 3 มต 2 ชน ........... 27 ภาพท 3.12 ตวอยางขอมลในไฟลส าหรบการจบคภาพบนสามเหลยมเดอลาเน 3 มต 2 ชน ............ 27 ภาพท 3.13 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 3 มต 4 ชน ........... 28 ภาพท 3.14 ตวอยางขอมลในไฟลส าหรบการจบคภาพบนสามเหลยมเดอลาเน 3 มต 4 ชน ............ 29

(12)

รายการภาพประกอบ (ตอ) หนา

ภาพท 3.15 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 3 มต 8 ชน ........... 29 ภาพท 3.16 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 3 มต 16 ชน ......... 30 ภาพท 3.17 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 3 มต 32 ชน ......... 30 ภาพท 3.18 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 3 มต 64 ชน ......... 30 ภาพท 3.19 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 3 มต 128 ชน ....... 31 ภาพท 3.20 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 3 มต 256 ชน ....... 31 ภาพท 3.21 ขนตอนการทดลองจบคภาพบนสามเหลยมเดอลาเนหลายมตหลายชนแบบกระจาย ... 32 ภาพท 3.22 ขนตอนทดลองการประมวลผลแบบกระจายทจ านวนเครองแตกตางกน ..................... 34 ภาพท 3.23 ขนตอนทดลองการประมวลผลแบบกระจายทปรบปรงใหม ........................................ 35 ภาพท 4.1 เวลาเฉลยทใชสรางสามเหลยมเดอลาเน 3 มต................................................................. 36 ภาพท 4.2 เวลาเฉลยทใชจบคภาพบนสามเหลยมเดอลาเน 3 มต ..................................................... 37 ภาพท 4.3 หนวยความจ าเฉลยทใชประมวลผลบนสามเหลยมเดอลาเน 3 มต ................................. 37 ภาพท 4.4 เวลาเฉลยทใชสรางสามเหลยมเดอลาเน 6 มต................................................................. 39 ภาพท 4.5 เวลาเฉลยทใชจบคภาพบนสามเหลยมเดอลาเน 6 มต ..................................................... 39 ภาพท 4.6 หนวยความจ าเฉลยทใชประมวลผลบนสามเหลยมเดอลาเน 6 มต ................................. 40 ภาพท 4.7 เวลาเฉลยทใชสรางสามเหลยมเดอลาเน 9 มต................................................................. 41 ภาพท 4.8 เวลาเฉลยทใชจบคภาพบนสามเหลยมเดอลาเน 9 มต ..................................................... 42 ภาพท 4.9 หนวยความจ าเฉลยทใชประมวลผลบนสามเหลยมเดอลาเน 9 มต ................................. 42 ภาพท 4.10 เวลาเฉลยทใชสรางสามเหลยมเดอลาเน 12 มต............................................................. 44 ภาพท 4.11 เวลาเฉลยทใชจบคภาพบนสามเหลยมเดอลาเน 12 มต ................................................. 44 ภาพท 4.12 หนวยความจ าเฉลยทใชประมวลผลบนสามเหลยมเดอลาเน 12 มต ............................. 45 ภาพท 4.13 เวลาเฉลยทใชสรางสามเหลยมเดอลาเนทมตแตกตางกน ............................................. 46 ภาพท 4.14 เวลาเฉลยทใชจบคภาพบนสามเหลยมเดอลาเนทมตแตกตางกน .................................. 46 ภาพท 4.15 หนวยความจ าเฉลยทใชประมวลผลบนสามเหลยมเดอลาเนทมตแตกตางกน .............. 47 ภาพท 4.16 เวลาเฉลยทใชสรางสามเหลยมเดอลาเนหลายชน ......................................................... 49 ภาพท 4.17 เวลาเฉลยทใชจบคภาพบนสามเหลยมเดอลาเนหลายชน .............................................. 49 ภาพท 4.18 หนวยความจ าเฉลยทใชประมวลผลบนสามเหลยมเดอลาเนหลายชน .......................... 50 ภาพท 4.19 กราฟเปรยบเทยบผลลพธการประมวลผลแบบกระจายทสภาพแวดลอมตาง ๆ ............ 53

(13)

รายการภาพประกอบ (ตอ) หนา

ภาพท 4.20 เวลาเฉลยทใชการประมวลผลแบบกระจายทสภาพแวดลอมตาง ๆ ระหวาง MapReduce แบบเกาและแบบทปรบปรงทภาพจ านวน 20,000 ภาพ ................................................ 54

ภาพท 4.21 เวลาเฉลยทใชการประมวลผลแบบกระจายทสภาพแวดลอมตาง ๆ ระหวาง MapReduce แบบเกาและแบบทปรบปรงทภาพจ านวน 200,000 ภาพ .............................................. 55

1

บทท 1 บทน ำ

ในบทนกลาวถงความส าคญและ ทมาของการวจย งานวจย ท เ ก ยวของ วตถประสงคของการวจย ขอบเขตการวจย และประโยชนทคาดวาจะไดรบ ดงรายละเอยดตอไปน

1.1 ควำมส ำคญและทมำของหวขอวจย

ในยคศตวรรษท 21 ววฒนาการทางเทคโนโลยไดพฒนาไปแบบกาวกระโดด กลาวไดวามการพฒนาอยทกวนโดยเฉพาะในดานมลตมเดย ไมวาจะเปนกลองถายรป อปกรณคอมพวเตอร อปกรณทางการแพทย กลองดจตอล รวมไปถงโทรศพทหรอทเรยกวาสมารทโฟน ซงท าใหเกดขอมลสอผสม(Multi-Media) เพราะอปกรณตาง ๆ ลวนแตสามารถถายภาพได โดยเฉพาะอยางยงภาพดจตอลสามารถพบไดมากมายทงภาพจากกลองดจตอล โทรศพทเคลอนท สแกนเนอร อนเตอรเนต เปนตน ท าใหภาพดจตอลมจ านวนเพมขนอยางรวดเรว สงผลใหฐานขอมลทใชในการจดเกบตองมพนทจดเกบขนาดใหญตามไปดวย ภาพเหลานนมการน าไปใชประโยชนในดานตาง ๆ มากมาย อาทเชน ในทางการคา เพอตรวจสอบเครองหมายทางการคาทจดทะเบยน (สาธต แสงประดษฐ, 2546) ในทางการแพทย เพอน าไปคนคนภาพฉายรงสเอกซส าหรบใชในการวเคราะหวนจฉยในผปวยทคลายกน (Avni U. et al, 2011) ในทางดาราศาสตร ใชคนคนภาพเพอหาขอมลเกยวกบลกษณะเฉพาะของกาแลกซตาง ๆ (Cui Y. et al, 2014) และในทางภมศาสตรไดใชภาพจากดาวเทยมเพอศกษาการเปลยนแปลงของโลกทงในดานภมศาสตรและอณหพลศาสตร (Espinoza-Molina D. and Detcu M., 2013) เปนตน

จากทกลาวมาขางตนท าใหเกดความทาทายทางดานเทคนคการคนคนภาพของระบบคอมพวเตอร จงไดมการประยกตน าการคนคนภาพไปสรางระบบเพอชวยในการด าเนนงาน ระบบคนคนภาพ (Image Retrieval System) เรมเปนทรจกมากขน เนองมาจากความตองการประสทธภาพในการเขาถงขอมลภาพทมปรมาณมากในฐานขอมล ระบบการคนคนภาพในอดตนนจะใชการคนคนภาพดวยพนฐานทางตวอกษร (Text-Based Image Retrieval, TBIR) โดยใชชอไฟลในการคนคนภาพ หรอใชค าอธบายเกยวกบภาพนน ๆ แตเนองจากภาพแตละภาพมองคประกอบหลายอยางท าใหผใชงานแตละทานใหค านยามไมเหมอนกน และไมเหมาะกบฐานขอมลภาพทมขนาดใหญ สงผลใหการคนคนภาพทตรงกบความตองการของผใชมประสทธภาพลดลง จงเปนขอจ ากดของระบบคนคนภาพและการจดการฐานขอมลแบบเดม

2

ปจจบนไดมการวจยพฒนาขนตอนวธการคนคนภาพออกมามากมายเชน การคนคนภาพโดยใชเทคนครวมกนของการแปลงเวฟเลตแบบไมตอเนอง (Discrete Wavelet Transform, DWT) และ Local Binary Pattern (LBP) (Mistry Y., Ingole D. and Ingole M., 2016), การคนคนภาพโดยใชเทคนค Upper-Lower of Local Binary Pattern (UL-LBP) มาอธบายคณลกษณะเฉพาะแบบภาพรวมและใช Scale Invariant Feature Transform algorithm (SIFT) มาอธบายคณลกษณะเฉพาะสวนตาง ๆ ภายในภาพ (Douik A., Abdellaoui M. and Kabbai L., 2016), การคนคนภาพโดยใชเทคนค Improving Precision Priority (IPP) (Song J. and He Z., 2015), การคนคนภาพจากบรเวณของสทเดนของภาพ (An J., Lee H. and Cho N., 2014), การคนคนภาพโดยใชเทคนคการผสมผสานกนของ Color Moment และ Local Binary Pattern (Choudhary R. et al, 2014) เปนตน ซงงานวจยดงกลาวนนไดใชการคนคนภาพโดยใชเนอหาของภาพ (Content-Based Image Retrieval, CBIR) เปนพนฐาน การคนคนภาพโดยใชเนอหาของภาพ จะใชวธการสกดคณลกษณะเฉพาะ (Feature Extraction) ทอยในภาพออกมาเปนตวแทนในการคนหา ซงคณลกษณะเฉพาะ (Feature) สวนใหญทใชไดแก ส (Color) รปราง (Shape) และ พนผวของภาพ (Texture) อยางไรกตามงานวจยทงหมดนนไดพยายามน าเสนอในสวนของคณลกษณะเฉพาะทเหมาะสมเพอน ามาใชอธบายภาพ แตยงไมมงานวจยไหนทน าเสนอขนตอนวธส าหรบจบคคณลกษณะพเศษของภาพ (Feature Matching) ซงเปนขนตอนส าคญขนตอนหนงในการคนคนภาพโดยใชเนอหาของภาพ งานวจยนจงน าเสนอการจบคคณลกษณะเฉพาะของภาพโดยใชโครงสรางพนฐานของระบบเพอจดเกบคณลกษณะสของภาพทมในฐานขอมล โดยไดน าแนวคดของ Boris Nikolaevich Delaunay ทเรยกวาสามเหลยมเดอลาเน (Delaunay Triangulation) ซงถกนยามใหเปนกราฟ เทคนคสามเหลยมเดอลาเน เปนวธการสรางสามเหลยมทไดรบความนยมมากทสดเพราะมขนตอนวธทไมซบซอน ซงสามารถจดการกบกลมของจดทกระจดกระจายไวดวยกน (Shewchuk J., 2012) มงานวจยมากมายทน าเสนอวธการนในการจบคหรอเปรยบเทยบโดยเฉพาะอยางยง งานวจยการจบคลายนวมอเพอใชระบตวบคคลโดยใชเทคนคสามเหลยมเดอลาเน (Yang W., Hu J. and Stojmenovic M. 2012), (สนนท ตนทชน, 2550), (Wang C. et al, 2006), (Liu N., Yin Y. and Zhang H., 2005) และการใชเทคนคสามเหลยมเดอลาเนรวมกบเอกสารขอมลเพอคนคนภาพ (Dang Q. et al, 2016) โดยงานวจยทกลาวมานนไดใชสามเหลยมเดอลาเนมาเปนคณลกษณะพเศษเพอจบคภาพซงด าเนนการภาพตอภาพ สวนงานวจยนไดน าเทคนคดงกลาวมาประยกตในการจดกลมภาพ ไดเปนโครงขายทมคณสมบตพเศษซงท าใหสามเหลยมทไดมเอกลกษณเฉพาะ โดยน าไปใชระบคณลกษณะพเศษของภาพทมลกษณะใกลเคยงกนใหอยในบรเวณเดยวกนไดโดยไมเกดการซอนทบ ซงจะท าใหการคนคนภาพมประสทธภาพมากยงขน

3

ทงนเพอใหการคนคนภาพจากจ านวนภาพมหาศาลในฐานขอมลทมขนาดใหญใหมความรวดเรวขนนน จ าเปนตองมระบบทถกออกแบบเพอใหมความเหมาะสมกบการท างานบนคลสเตอรขนาดใหญ ทมการประมวลผลขอมลแบบกระจาย และมคณสมบตทคงทนตอความผดพลาด โดยสามารถท างานในสภาวะแวดลอมทตางกน เพอขยายขดความสามารถในการเพมขนของขอมลในอนาคตได จงมงานวจยทไดน าเสนอระบบคนคนภาพแบบกระจายบนพนฐาน MapReduce (Zhang J. et al, 2011) แนวความคดในการคนคนภาพบนฐานขอมลทมขนาดใหญดงกลาวยงมการจดเกบขอมลทซบซอน แตกมประสทธภาพมากกวาเมอเปรยบเทยบกบการประมวลผลแบบรวมศนยทมหนวยประมวลผลเพยงเครองเดยว ซงถามขอมลภาพจ านวนมหาศาลแลวจ าเปนตองมหนวยประมวลผลทมประสทธภาพสงตามไปดวย แตเพราะมราคาแพงท าใหไมคมคาเมอเทยบกบการใชการประมวลผลแบบกระจาย ดงนนจงเหมาะอยางยงทน ามาพฒนาเพอใหไดระบบทมประสทธภาพมากขน

วทยานพนธนจงมเปาหมายในการวจยเพอพฒนาระบบทเหมาะสม ส าหรบการคนคนภาพในฐานขอมลขนาดใหญซงใชการประมวลผลขอมลแบบกระจาย โดยประยกตรวมกบเทคนคสามเหลยมเดอลาเน ทมคณสมบตพเศษในการจดกลมของขอมลภาพมาเปนโครงสรางพนฐาน เพอใหระบบนนมประสทธภาพและลดเวลาในการคนคนภาพ

1.2 วตถประสงคในกำรวจย

1.2.1 เพอศกษาและออกแบบระบบคนคนภาพทมประสทธภาพแบบกระจายรวมกบเทคนคสามเหลยมเดอลาเน

1.2.2 เพอทดสอบประสทธภาพในการประมวลผลของระบบ

1.3 ขอบเขตงำนวจย 1.3.1 พฒนาระบบการคนคนภาพแบบกระจายรวมกบเทคนคสามเหลยมเดอลาเน

โดยประยกตรวมกบสภาพแวดลอมของ Hadoop ได 1.3.2 เปรยบเทยบผลลพธของวธการทน าเสนอกบวธการคนคนภาพแบบกระจาย

บนพนฐาน MapReduce ได 1.4 ประโยชนทคำดวำจะไดรบ

ระบบคนคนภาพแบบกระจายทมประสทธภาพ สามารถลดเวลาในการคนคนภาพจากฐานขอมลทมขนาดใหญเพอรองรบการขยายตวของระบบและขอมลทเพมมากขนในอนาคต

4

บทท 2 ทฤษฎและหลกการ

ในบทนกลาวถงการออกแบบโครงสรางพนฐานของระบบและทฤษฎทเกยวของ

กบการพฒนาโครงสรางทใชในการคนคนภาพ ไดแก การออกแบบโครงสรางพนฐานโดยใชเทคนคสามเหลยมเดอลาเน เปนโครงสรางในการจดเกบคณลกษณะพเศษของภาพทงหมดไวรวมกน และการพฒนาระบบการคนคนภาพ รวมไปถงการใช Apache Hadoop (White. T, 2011) ซงเปนซอฟตแวรเฟรมเวรคส าหรบจดเกบและประมวลผลขอมลแบบกระจายและรองรบขอมลทมปรมาณมากดงรายละเอยดตอไปน 2.1 แนวคดพนฐานในการคนคนภาพ

เทคนคของการคนคนภาพในปจจบน ถาแบงตามลกษณะการคนคนภาพดวยหลกเกณฑพนฐานจะมอย 2 รปแบบดวยกนคอ การคนคนภาพดวยพนฐานทางตวอกษร และ การคนคนภาพดวยเนอหาของภาพ ซงโดยแตละรปแบบมขอดและขอเสยตางกน

2.1.1 การคนคนภาพดวยพนฐานทางตวอกษร การคนคนภาพดวยพนฐานทางตวอกษรหรอขอความนนภาพแตละภาพจะถก

อธบายดวยค าส าคญและท าการคนคนภาพโดยเปรยบเทยบหาค าส าคญทตรงกบค าหรอขอความทสอบถาม ขอเสยคอตองมการปอนค าส าคญใหกบภาพเขาสระบบกอนทจะท าการคนคนภาพ ซงผใชแตละคนระบค าส าคญใหกบรปภาพไมตรงกนท าใหการคนคนภาพดวยพนฐานทางตวอกษรนนมประสทธภาพนอยลง

2.1.2 การคนคนภาพดวยเนอหาของภาพ ภาพแตละภาพจะถกวเคราะหหาลกษณะเดนทส าคญเพอหาตวแทนของภาพ

ส าหรบใชแสดงถงภาพนน ๆ โดยอตโนมตจงสะดวกในการใชงาน ซงมงานวจยมากมายใชเทคนคการคนคนภาพดวยเนอหาของภาพ มาเปนเทคนคตนแบบเพอพฒนาการคนคนภาพ โดยระบบจะท าการแยกคณลกษณะพเศษเนอหาของภาพแตละภาพในฐานขอมลออกมา ใหอยในรปของคาตวเลขทเรยกวา เวกเตอรคณลกษณะพเศษ (Feature vector) เพอใชเปนดชนส าหรบการจดเกบภาพในฐานขอมล เมอตองการคนคนภาพ ผใชจะท าการเลอกภาพสอบถามแลวสงภาพเขาสระบบด าเนนการ จากนนระบบจะท าการดงเอาเวกเตอรคณลกษณะพเศษของภาพสอบถามมาท าการเปรยบเทยบกบเวกเตอรคณลกษณะพเศษของภาพทมอยในฐานขอมล เพอคนคนภาพทมลกษณะเฉพาะคลายกบภาพสอบถามมากทสดออกมาเปนผลลพธ วธการดงภาพท 2.1

5

ภาพท 2.1 โครงสรางระบบการคนคนภาพดวยเนอหาของภาพ

โดยคณลกษณะพเศษของภาพนน สามารถแยกสงตาง ๆ ทอยในภาพออกมาเปนตวแทนในการคนคน ซงคณลกษณะพเศษสวนใหญทใช ไดแก ส, รปราง และพนผวของภาพ

- ส เปนคณลกษณะพเศษทมบทบาทส าคญในระบบคนคนภาพ เนองจากสเปนสงทโดดเดนสามารถสงเกตเหนไดชดเจนจากการมองภาพ นอกจากนยงสามารถชวยในการแยกแยะสงตาง ๆ ภายในภาพออกจากกนไดด เชน สฟาของทองฟาหรอทะเล สเขยวของตนไมหรอใบไม สแดงของแอปเปล เปนตน ดงภาพท 2.2 ด าเนนการโดยดงเอารหสสทใกลเคยงกนออกมาจากภาพ เพอท าการจดกลม (Cluster) โดยอาศยหลากหลายทฤษฎเชน การนบความถของส (Histogram) เปนตน

6

ภาพท 2.2 ลกษณะของส (นฐพงศ สงเนยม, 2554)

- รปราง เปนคณลกษณะพเศษของภาพแบบหนงทใชอธบายถงรปรางและลกษณะรวมถงขนาดของวตถภายในภาพ ท าใหสามารถแยกแยะระหวางวตถทมรปรางแตกตางกนออกจากกนได ซงรปรางเปนสวนทแสดงถงโครงสรางทปรากฏถกก าหนดดวยขอบเขตของแสง ส หรอเงา ลกษณะของ รปราง เชน เสนขอบฟาทแบงสวนของทองฟาและพนดน สเหลยมทเปนสดสวนของตก อาคารตาง ๆ หรอสดสวนของตนไม เปนตน ดงภาพท 2.3 ซงคณสมบตในสวนนน ามาใชประโยชนมากในการดงขอมลบนพนฐานของรปรางทไมซบซอน เชน วงกลม หรอโพลกอน เปนตน ซงในการเปรยบเทยบรปภาพนนรปรางจะถกระบไปพรอม ๆ กบต าแหนง ซงมทฤษฎมากมายทสามารถน ามาใช เ ชน Wavelet Transform, Tensor Scale Descriptor with Influence Zones (F.A. Andalo’ et al, 2010) เปนตน

ภาพท 2.3 ลกษณะของรปราง (นฐพงศ สงเนยม, 2554)

7

- พนผว เปนคณลกษณะพเศษทใชอธบายความหยาบ ความละเอยด หรอความซบซอนของพนผววตถภายในภาพ ซงภาพแตละภาพอาจจะประกอบไปดวยวตถทมลกษณะพนผวทแตกตางกนออกไป เปนสวนทสอออกมาใหรบรถงความรสก การวเคราะหพนผวจะชวยใหสามารถแยกแยะความแตกตางของวตถไดดยงขน เชน การแยกแยะความแตกตางระหวางภาพเสอดาว ซงมลายเปนจด กบเสอชนดอนซงมลายเปนรวหรอแถบยาว ออกจากกนได หรอภาพทมลกษณะเปนหนงหรอเรยบ มนวาว เปนตน ดงภาพท 2.4 มหลายทฤษฎทน ามาใชในการสกดคณสมบตพนผว เชน Fuzzy color histogram, Gabor wavelet transform เปนตน

ภาพท 2.4 ลกษณะของพนผว (นฐพงศ สงเนยม, 2554)

งานวจยนไดน าเทคนคการคนคนภาพดวยเนอหาของภาพมาด าเนนการโดยใชคณสมบตของสเปนหลก เนองจากสามารถด าเนนการไดงายและมความแมนย า โดยทวไปคณลกษณะพเศษสของภาพจะอยในรปสญญาณสแดง สญญาณสเขยว และสญญาณสน าเงน หรอทเรยกวา “RGB Color space” ดงภาพท 2.5 เมอน าภาพมาประมวลผลเพอใหไดเวกเตอรของภาพทมขนาด 24 บตตอพกเซล จะท าใหแตละสมขอมลได 8 บต ดงนนแตละพกเซลสามารถแทนคาสไดถง 16,777,216 ส

ภาพท 2.5 ลกษณะส RGB (Medialooks., 2015)

8

(1)

แตถาหากน าคาสทไดมาด าเนนการ Normalization ผลลพธของคาสทไดจะมทศนยม 6 ต าแหนง จงเพมความแตกตางของแตละภาพไดมากขน โอกาสทจะซ ากนของคาสนนมนอยมาก งานวจยนจงไดเสนอคณลกษณะของสมาด าเนนการเปนหลก 2.2 เทคนคสามเหลยมเดอลาเน

เทคนคสามเหลยมเดอลาเนไดพฒนามาจากแผนผงโวโรนอย (Voronoi Diagram) แนวความคดพนฐานเกยวกบสามเหลยมเดอลาเนและแผนผงโวโรนอย นยามโดยใชการค านวณทางเรขาคณต แผนผงโวโรนอยถกคดคนโดย Georgy Fedosievych Voronoi ซงแผนผงโวโรนอยหมายถง แผนผงทไดแบงโดเมนออกเปนกลมของรปสามเหลยม โดยถาก าหนดใหมจดตอภายในโดเมน {Pk} k=1,…,n เราสามารถสรางพนทของรปสามเหลยม (Region) {Vk}, k=1,…,n ลอมรอบจดดงกลาว โดยแตละพนทของรปหลายเหลยมจะลอมรอบจดเพยงจดเดยว ซงจะท าใหระยะหางจากจดตอไปยงขอบของรปหลายเหลยมจะเปนระยะทางทสนทสด เมอเทยบกบระยะหางจากจดตอจดของพนทของรปสามเหลยมทลากมายงขอบรปสามเหลยมดงกลาวดงภาพท 2.7

ภาพท 2.6 แผนผงโวโรนอย

ดงนนจากนยามขางตนไดแสดงความหมายของแผนผงโวโรนอย ในรปแบบของสมการไดดงสมการท 1

𝑉𝑉 = {𝑉𝑉 ∶ | 𝑉 − 𝑉𝑉| < | 𝑉 − 𝑉𝑉|} ∀ 𝑉 ≠ 𝑉 จากสมการ สามารถกลาวไดวา แผนผงโวโรนอยแตละดานจะตองวางอยตรงกงกลางระหวางจดตอจดสองจดทมขอบรวมกน ถาหากทกจดตอทอยภายในแผนผงโวโรนอยถกเชอมตอกนดวยเสนตรง โดยการลากเสนตรงเชอมตอระหวางจดตอจดสองจดทมขอบรวมกน

9

Vertex

Edge

Facet

รปสามเหลยมทเกดขนจากกระบวนการดงกลาวจะถกเรยกวาสามเหลยมเดอลาเนดงภาพท 2.6 เสนหนาคอสามเหลยมเดอลาเน เสนบางคอแผนผงโวโรนอย

ภาพท 2.7 สามเหลยมเดอลาเนบนแผนผงโวโรนอย

สามเหลยมเดอลาเนถกคดคนโดย Boris Nikolaevich Delaunay ในทางทฤษฎกราฟ สามเหลยมเดอลาเนกถกนยามใหเปนกราฟแบบหนง ประกอบไปดวย จด (Vertex), เสนทเชอมกน (Edge) และหนารปสามเหลยม (Facet) ดงภาพท 2.8

ภาพท 2.8 องคประกอบของสามเหลยมเดอลาเน

เมอลากวงกลมผานจดปลายทงสามลอมรอบสามเหลยม จะตองไมมจดอนภายในวงกลมดงกลาว ยกเวนจดปลายทงสามของสามเหลยมทอยบนเสนวงกลมทลอมรอบ คณลกษณะนถกเรยกวา Empty circumcircle ดงภาพท 2.9 คณลกษณะนถกนยามใหเปนคณลกษณะพเศษของสามเหลยมเดอลาเน เพราะไมท าใหเกดการซอนทบกนของรปสามเหลยม ท าใหไดโครงขายสามเหลยมทมเอกลกษณเฉพาะน าไปใชระบใหคณลกษณะพเศษใหกบภาพ ซงมวธการสรางทไมซบซอน จงมงานวจยมากมายทน าเสนอวธการนในการจบคหรอเปรยบเทยบ โดยปจจบนมแอพพลเคชนหลายประเภททน าสามเหลยมเดอลาเนมาใช เชน การจ าลอง การประมาณพนผว การ

10

หาต าแหนงใกลเคยง เปนตน นอกจากนยงมการน ามาใชในงานทหลากหลาย อาทเชน การท า Reconstruction, Path Planning, Mashing เปนตน

ภาพท 2.9 คณลกษณะพเศษ Empty Circumcircle

เทคนคสามเหลยมเดอลาเน เปนวธการสรางสามเหลยมทไดรบความนยมมากทสดเพราะมขนตอนวธทไมซบซอน ซงมหลกการส าคญคอ สามเหลยมเดอลาเนจะตองเปนสามเหลยมทมคณลกษณะพเศษ Empty Circumcircle ดงทกลาวมาแลวขางตน ท าใหสามเหลยมทไดนนมความเปนเอกลกษณ (Unique) (Yang W., Hu J. and Stojmenovic M. 2012), (Liu N., Yin Y. and Zhang H., 2005) เทคนคนสามารถน ามาประยกตใชในการจบคไดโดยใชเปนโครงขายทรวมเอาคณลกษณะพเศษของภาพทงหมดในฐานขอมลมาจดกลม โดยคณลกษณะพเศษของภาพทคลายกนจะถกจดวางไวในต าแหนงบรเวณใกลเคยงกน ซงจะท าใหการคนคนภาพมความเรวขน และยงมงานวจยทไดน าเสนอการด าเนนการกบสามเหลยมเดอลาเนในลกษณะหลายมตในดานตาง ๆ เชน การศกษาเกยวกบขอบเขตของสามเหลยมเดอลาเนในมตใด ๆ กบการกระจายของจดตาง ๆ และความยาวของขอบในกราฟสามเหลยมเดอลาเนเพอลดพลงงานในการก าหนดเสนทางทางภมศาสตรบนเครอขายไรสาย (Esther M. et al, 2011) การศกษาขอบเขตและจ านวนแผนทรวมกนเปนแผนเดอลาเน ซงเปนฟงกชนทเกยวของกบจ านวนจดและจ านวนมต เพอมาใชในการประมาณคาความหนาแนนและการบบอดของขอมล (Shores R. and Wegman E., 2010) เปนตน เพอใหการคนคนภาพนนมประสทธภาพมากขนในการจบค จ าเปนตองด าเนนการกบสามเหลยมเดอลาเนในลกษณะหลายมต (Multidimensional) การท างานในลกษณะสองมตหรอสามมตเพยงชนเดยว ไมเพยงพอตอการด าเนนงานการจบคเพอใหมความแมนย าสงได

งานวจยนไดน าเสนอเทคนคของสามเหลยมเดอลาเนมาทดลองจบคภาพในโครงรางลกษณะตาง ๆ ทงในลกษณะสามเหลยมเดอลาเนหลายมต และสามเหลยมเดอลาเนหลาย ๆ ชน โดยใช Qhull Library มาเปนเครองมอในการสรางสามเหลยมเดอลาเน (ดงภาพท 2.10) ซงเปนโปรแกรมรหสเปด (Open source) ทถกเขยนขนดวยภาษา C และ C++ ทมการใชงานแพรหลายใน

11

การจดการกบโครงสรางขอมลทมหลายมต โดยสวนใหญมการน ามาประยกตในดานตาง ๆ เชน วทยาศาสตร วศวกรรมศาสตร คณตศาสตร และสถต เปนตน

ภาพท 2.10 ตวอยางสามเหลยมเดอลาเนทสรางดวย Qhull Library (Qhull., 2012)

2.3 การประมวลผลขอมลแบบกระจาย

เนองจากขอจ ากดของการประมวลผลแบบรวมศนยทตองใชหนวยประมวลผลประสทธภาพสงซงมราคาแพง จงตองมการกระจายขอมลและทรพยากรตาง ๆ ไปใหหนวยประมวลผลหลาย ๆ ตวชวยกนท างานท าใหการประมวลผลมความรวดเรวมากขน โดยทคอมพวเตอรทกเครองจะตองเชอมตอกนเปนเครอขายทเรยกวา เครอขายคอมพวเตอร (Network Computer) สวนใหญจะมลกษณะเปนแบบ Client / Server โดยทเครองแมขาย (Server) จะท าการแจกจายงาน การประมวลผล และขอมลใหกบคอมพวเตอรแมขายดวยกนเองหรอคอมพวเตอร ลกขายใหท างานทไดรบมอบหมาย จงท าใหการประมวลผลมความรวดเรวมากยงขน ระบบการประมวลผลแบบกระจายเปนการประมวลผลทไดรบการพฒนาในขนตอมา โดยมการกระจายภาระงานประมวลผลไปยงเครองตาง ๆ ทเชอมกนอยเปนเครอขายคอมพวเตอร แลวน าผลลพธทไดมารวมกน ซงวธนท าใหเพมประสทธภาพในการประมวลผลของระบบโดยรวม และยงสามารถลดจ านวนขอมลทสงผานเครอขาย ท าใหใชเวลาตอบสนองไดเรวขนตามค าสงของผใชงาน

เทคโนโลยประมวลผลแบบกระจาย (Distributed Computing) เปนเทคโนโลยทน าเอาคอมพวเตอรธรรมดา ๆ หลาย ๆ ตวมาเชอมตอกนแบบขนานมารวมกนท าการประมวลผล ซงมประสทธภาพเทยบเทากบเครอง Super Computer ดงนน ระบบเครอขายทกระจายหนาทเปน

12

ศนยบรการ และเชอมตอเขาดวยกนดวยจดประสงคตาง ๆ กน ในมาตรฐาน TCP/IP ซงเปนทยอมรบทวโลก ท าใหเครองทงหมดสามารถสอสารกนได ประมวลผลรวมกนได ในปจจบนมปญหาจ านวนมากทไมสามารถหาค าตอบไดดวยคอมพวเตอรเพยงเครองเดยว เนองจากปรมาณขอมลทเพมมากขนอยางมหาศาล การน าเทคโนโลยการประมวลผลแบบกระจายจงมความส าคญมากในการน ามาใชงานในปจจบน (สดใส ดลยา, 2550)

งานวจยนไดน าการประมวลผลขอมลแบบกระจายมาด าเนนการ เพอใหรองรบการคนคนภาพทมจ านวนมากและเพอใหมความยดหยนตอการเปลยนแปลงตามงานแตละประเภทตามความตองการของผใช ทงทางดานการจดเกบรปภาพทสามารถปรบขยายไดเมอตองการ และทางดานการปรบปรงเปลยนแปลงโครงสรางของระบบปฏบตการ โดยใช MapReduce ซงเปนเทคนคทมอยใน Hadoop ของ Apache 2.4 MapReduce

MapReduce เปนสวนทปฏบตงานบนระบบของ Hadoop งานวจยนไดน ามาใชเพอใหเหมาะกบการท างานดงกลาวซง Hadoop เปนเฟรมเวรคทมการท างานบนระบบคอมพวเตอรแบบกระจายส าหรบด าเนนการกบแอพพลเคชนบนคลสเตอรทมขนาดใหญ ซงสนบสนนการท างานแบบขนาน (Parallel) โดยมชดค าสง (API) เพอชวยอ านวยความสะดวกแกนกพฒนาแอพพลเคชนทจะสรางระบบคนคนหรอวเคราะหขอมลขนาดใหญ Hadoop เปนระบบทมประสทธภาพทสามารถแกไขปญหาการคนคนภาพจากฐานขอมลทมขนาดใหญได โดยการใชงานบนสภาวะแวดลอมของ Hadoop อนเนองมาจากการประมวลผลแบบกระจายของ Hadoop นนมคณสมบตทคงทนตอความผดพลาด และสามารถท างานในสภาวะแวดลอมทตางกนท าใหขยายขดความสามารถได และถอวาเปนวธการทดและมประสทธภาพมากกวาเมอเปรยบกบวธการแบบรวมศนย (Zhang J. et al, 2010) ระบบ Hadoop ท างานไดดทงในการจดเกบและการจดการกบขอมลเพอไมใหขอมลทมอยจ านวนมหาศาลสญหายไป และสามารถจดการใหมความงายตอการเรยกใชงาน โดย Hadoop จะแยกงานออกเปนชนสวนเลก ๆ เพอท าใหเวลาในการประมวลผลนอยลง (Chang F. and Huang H., 2007) Hadoop จะแบงออกเปน 2 สวนใหญ ๆ คอ MapReduce เปนสวนทปฏบตงานในการวเคราะหขอมล มลกษณะการไหลของขอมลดงภาพท 2.11 และม Hadoop Distributed File System (HDFS) ซงสามารถจดเกบและด าเนนการกบขอมลขนาดใหญไดดงภาพท 2.14

13

ภาพท 2.11 กระแสขอมลของ MapReduce (White. T, 2011)

MapReduce เ ปนการประมวลผลขอมลแบบกระจาย ซง Amazon, Google, Facebook หรอ Yahoo ไดใช MapReduce มาด า เ นนการ ผ ใชสามารถเ ขยนโปรแกรมบน MapReduce ไดหลายภาษา เชน C++, Java, Python หรอ Ruby เปนตน MapReduce ยงสามารถ ท างานแบบคขนาน ซงมประสทธภาพมากเมอจดการกบขอมลทมขนาดใหญ กระบวนการท างานของ MapReduce แบงออกเปนสองสวนคอ Map และ Reduce โดยแบงยอยงานออกเปนชนเลก ๆ ส าหรบน าไปด าเนนการตอดงภาพท 2.12

ภาพท 2.12 การท างานของ MapReduce ทแบงงานออกเปนชนเลก ๆ (White. T, 2011)

โดยงานทถกแบงเปนชนเลก ๆ นน MapReduce จะสงชนงานดงกลาวออกไปด าเนนการท างานกบโหนดอกสองโหนดคอ JobTracker และ TaskTrackers เพอควบคมขนตอนการท างานยอยของระบบดงภาพท 2.13 โดยท JobTracker ท างานบนระบบ ทสรางตารางงานเพอสงไปให TaskTrackers ด าเนนการกบงานทไดรบ เมอเสรจกจะสงรายงานกลบมายง JobTracker โดยแสดงระเบยนขอมลของแตละงานทไดด าเนนงานไปแลว หากการท างานมความผดพลาดในสวนของ TaskTrackers ทาง JobTracker จะสงเรมการท างานใหมอกครงใหกบ TaskTracker ทแตกตางกน

14

ภาพท 2.13 MapReduce ทด าเนนการกบ JobTacker และ TaskTracker (White. T, 2011)

ในสวนการจดเกบขอมลนน HDFS จะเปนตวด าเนนการจดการไฟลบนระบบแบบกระจายของ Hadoop ทมความสามารถในการจดเกบขอมลขนาดใหญ โดยการกระจายขอมลไปเกบไวยงโหนดตาง ๆ ดงภาพท 2.14

ภาพท 2.14 ขนตอนการอานไฟลจาก HDFS (White. T, 2011)

15

จากภาพท 2.14 แสดงใหเหนล าดบของการอานไฟลจาก HDFS ขนตอนท 1 เมอ Client Node ตองการอานไฟล จะเรยกใชฟงกชน Open() เพอไปด าเนนการท Distributed File System (DFS) ขนตอนท 2 DFS จะเรยกไปท NameNode ซงเปนสวนทจดเกบขอมลเกยวกบไฟลระบบของ Hadoop เพอขอต าแหนงบลอกของไฟลนน ๆ ทอยบน DataNode จากนน Client Node จะท าการคดลอกบลอกจาก DataNode จากต าแหนงทไดรบมาผาน FSData InputStream 2.5 สรปทฤษฎและหลกการ

งานวจยนไดมการออกแบบโครงสรางขอมลใหเหมาะสมกบการคนคนภาพทมจ านวนมากอนเนองมาจากความกาวหนาทางเทคโนโลย โดยใชเทคนค CBIR มาด าเนนการรวมกบเวกเตอรคณลกษณะสของภาพเพอน าไปสรางสามเหลยมเดอลาเน ส าหรบเปนโครงสรางในการรวมเอาคณลกษณะสของรปทคลายคลงกนมาอยในบรเวณใกลเคยงกน โดยจะใช MapReduce เพอประมวลผลแบบกระจายมาด าเนนงานใหรองรบกบจ านวนภาพทเพมขนในอนาคต ซงในสวนรายละเอยดการด าเนนการทดลองการคนคนภาพและการประมวลผลแบบกระจายไดน าเสนอไวในบทท 3

16

บทท 3 วธด ำเนนกำรวจย

ในบทนจะกลาวถงกรอบแนวความคดการวจย วธการทดลอง การดงคณลกษณะพเศษของรปภาพ การสรางโครงสรางของระบบในการจบคภาพ และการคนคนภาพทประมวลผลแบบกระจาย ดงรายละเอยดตอไปน 3.1 ภำพโดยรวมวธด ำเนนกำรวจย

กรอบแนวความคดการวจยทส าคญทจะน าไปสการพฒนาโครงสรางการคนคนภาพแบบกระจายรวมกบเทคนคสามเหลยมเดอลาเนนนคอการออกแบบโครงสรางพนฐานหลกใหมประสทธภาพและลดเวลาในการคนคนภาพ โดยจดเกบคณลกษณะพเศษของของรปภาพทใกลเคยงกนน ามาอยในบรเวณใกล ๆ กนเพอใหเรวตอการคนคน ซงผลลพธทไดนนจะตองมความแมนย าสง และเพอใหไดระบบคนคนภาพทมความยดหยน สามารถใชงานไดในทกสภาพแวดลอม ทนทานตอความผดพลาดทเกดขนของระบบทใชในการประมวลผล และเพอรองรบการขยายเพมของขอมลในอนาคตอนเนองมาจากววฒนาการทางเทคโนโลย ในการทดลองนนจะแบงออกเปน 2 สวนใหญ ๆ คอ การจบคภาพ (Image Matching) และการประมวลผลแบบกระจาย (Distributed Processing) มารวมกนจนเปนผลลพธของงานวจยนดงภาพท 3.1

เรมตน

อานภาพจากฐานขอมล อานภาพทตองการคนคน

สกดคณลกษณะพเศษ

สรางสามเหลยมเดอลาเน

สกดคณลกษณะพเศษ

คนคนภาพแบบกระจาย

ภาพทคนคนได

สนสด ภาพท 3.1 โครงสรางโดยรวมของงานวจย

17

3.2 เครองมอทใช 3.2.1 Data Set งำนวจยนไดใชขอมลภำพจำก 2 ฐำนขอมล ประกอบไปดวย - Corel Image Gallery ซงฐานขอมลภาพ Corel นนประกอบไปดวย 10,800 ภาพ

ไดถกน ามาใชในการประมวลผลภาพและใชกนมากในสงคมงานวจย CBIR เนองจากประกอบไปดวยภาพหลากหลายกลมเชน เครองบน เสอ ตกตา ตนไม เปนตน ซงบางภาพมเนอหาความหมายแตกตางกนแตอยในกลมเดยวกน และบางภาพเนอหาความหมายเดยวกนแตอยคนละกลมกน ในแตละกลมประกอบไปดวยภาพมากกวา 100 ภาพ ดวยเหตนฐานขอมล Corel จงถกน ามาใชประเมนผลของแนวความคดในการคนคนภาพ

- IAPR TC-12 Benchmark ทมจ านวน 20,000 ภาพ ประกอบไปดวยภาพของกฬาทแตกตางกนและการกระท า รปถายของคน สตว เมอง ทวทศนและดานอน ๆ ทงหมด 12 กลม ซงเปนภาพทมคณภาพสง

3.2.2 โปรแกรมทใชท ำงำนซงเปนโปรแกรมรหสเปด (Open source) ทงหมด

- โปรแกรม Hadoop รน 1.2.1 - โปรแกรม OpenCV - โปรแกรม Qhull Library 3.2.3 เครองทใชในกำรประมวลผล - เครองคอมพวเตอรแลปทอป Intel® Core™ i5 ความเรว 2.50GHz หนวยความจ า

16GB บนระบบปฏบตการ Windows 8 - สภาพแวดลอม เ ค ร อ ง เส ม อนของ Oracle VM VirtualBox เ พ อ ต ดต ง

ระบบปฏบตการ Ubuntu 64bit รน 14.04 เปนระบบปฏบตการทใชในการทดสอบ 3.3 กำรจบคภำพ 3.3.1 แนวทำงกำรทดลอง

แนวทางการทดลองในสวนนเพอใหไดโครงสรางพนฐานทมประสทธภาพส าหรบจดเกบคณลกษณะของภาพทคลายกนใหอยในบรเวณใกลเคยงกน โดยใชสามเหลยม เดอลาเนมาด าเนนการ เรมจากการน าสามเหลยมเดอลาเนมาจบคภาพในโครงสรางทแตกตางกน ซงการทดลองนนจะแบงเปนสองสวน สวนแรกเพอใหไดโครงสรางทเหมาะสมโดยสรางสามเหลยมเดอลาเนทมมตตาง ๆ กนส าหรบจดเกบคณลกษณะพเศษของรปภาพ สวนทสองเพอปองกนปญหา

18

(ก) (ข)

ทเรยกวาปญหาของมตขอมล (Curse of dimensionality) ซงเกดจากขอมลทมมตจ านวนมาก เมอเกดการกระจายของขอมลแลวอาจสงผลเสยตอความแมนย าในการจดกลมของขอมล รวมท งยงสนเปลองทรพยากร เชน เวลาและหนวยความจ า เปนตน จงไดสรางสามเหลยมเดอลาเนทมมตขนาดกลางหลาย ๆ ชนมาจบคภาพแทน

3.3.2 ขนตอนและวธกำรทดลอง - ขนตอนการทดลองท 1 จากสมมตฐานทวาโครงสรางพนฐานทสามารถรวมคณลกษณะพเศษของภาพทงหมดเอาไวดวยกนจะท าใหการจบคภาพนนเรวขนและมประสทธภาพ จงไดท าการสรางสามเหลยมเดอลาเนทมตตาง ๆ โดยใชคาเฉลยฮสโตแกรมของแตละภาพในฐานขอมล และใชคาฮสโตแกรมเฉลยของภาพทตองการคนคนมาด าเนนการท 3 มต, 6 มต, 9 มต และ 12 มต โดยสรางไฟลทใชในการทดลอง ประกอบไปดวย 2 สวนซงจะมวธการทแตกตางกนคอ ไฟลทใชสรางสามเหลยมเดอลาเน และไฟลของภาพทตองการคนคนซงมขนตอนดงภาพท 3.2

เรมตน

อานภาพจาก Corel

เขยนขอมลลงไฟล

สนสด

ค านวณคาฮสโตแกรม

แบงคาชวงฮสโตแกรม

นบจ านวนภาพท งหมดส าหรบเขยนลงไฟล และระบจ านวนมต

ภาพท 3.2 ขนตอนการสรางไฟลส าหรบการจบคภาพบนสามเหลยมเดอลาเนหลายมต

19

(ก) (ข)

(ก) (ข)

โดยไฟลทใชในการสรางสามเหลยมเดอลาเนนนจะตองมโครงสรางเปนไปตามเงอนไขของ Qhull ดงภาพท 3.3 (ก) โดยบรรทดแรกจะหมายถงจ านวนมต บรรทดทสองจะหมายถงจ านวนจดทงหมดส าหรบสรางสามเหลยมเดอลาเน หลงจากนนแตละบรรทดจะประกอบดวยคา ฮสโตแกรมเฉลยของภาพตาง ๆ สวนไฟลของภาพทตองการคนคนจะเกบคาฮสโตแกรมของภาพนนแยกตามบรรทดดงภาพท 3.3 (ข)

บรรทดท 1 จ านวนมตทสรางสามเหลยมเดอลาเนบรรทดท 2 จ านวนจดทงหมดทน ามาสรางสามเหลยมเดอลาเนบรรทดท 3 คาต าแหนงขนอย กบมต

...

บรรทดท 1 คาฮสโตแกรม Rบรรทดท 2 คาฮสโตแกรม Gบรรทดท 3 คาฮสโตแกรม B

...

ภาพท 3.3 ขอมลในไฟลส าหรบการจบคภาพบนสามเหลยมเดอลาเนหลายมต

ตวอยางไฟลทใชในขนตอนการทดลองท 1 โดยสมมตใหไฟลทใชทดลองมลกษณะ 3 มต (บรรทดท 1 ระบคา 3) สรางทจ านวน 32 จด (บรรทดท 2 ระบคา 32) ซงแตละจดหมายถงคาฮสโตแกรมเฉลยของภาพแตละภาพ (บรรทดท 3 หมายถง คาฮสโตแกรมเฉลยสแดง คาฮสโตแกรมเฉลยสเขยว คาฮสโตแกรมเฉลยสน าเงน ของภาพท 1 ตามล าดบ) โดยคาฮสโตแกรมของการทดลองสามเหลยมเดอลาเนท 3 มตนน ค านวณจากน าคาฮสโตแกรมเฉลยของภาพ ตงแต 0 ถง 255 จะไดคาฮสโตแกรมเฉลยส าหรบสามสามเหลยมเดอลาเน 3 มต ดงนนบรรทดท 4 หมายถงคาฮสโตแกรมของภาพท 2 ตามล าดบไปจนถงบรรทดท 34 ซงหมายถงภาพท 32 ดงภาพท 3.4 (ก) สวนไฟลของภาพทตองการคนคนกใชวธค านวณหาคาฮสโตแกรมเฉลยเชนเดยวกบไฟลทใชสรางสามเหลยมเดอลาเน 3 มต ดงภาพท 3.4 (ข)

ภาพท 3.4 ตวอยางขอมลในไฟลส าหรบการจบคภาพบนสามเหลยมเดอลาเน 3 มต

20

ถาสมมตใหไฟลทใชทดลองมลกษณะ 6 มต (บรรทดท 1 ระบคา 6) สรางทจ านวน 32 จด (บรรทดท 2 ระบคา 32) ซงแตละจดหมายถงคาฮสโตแกรมเฉลยของภาพแตละภาพ (บรรทดท 3 หมายถง คาฮสโตแกรมเฉลยสแดงชวงท 1 คาฮสโตแกรมเฉลยสเขยวชวงท 1 คาฮสโตแกรมเฉลยสน าเงนชวงท 1 คาฮสโตแกรมเฉลยสแดงชวงท 2 คาฮสโตแกรมเฉลยสเขยวชวงท 2 คา ฮสโตแกรมเฉลยสน าเงนชวงท 2 ของภาพท 1 ตามล าดบ) โดยการค านวณคาฮสโตแกรมเฉลยของการทดลองสามเหลยมเดอลาเนท 6 มตนน ค านวณจากน าคาฮสโตแกรมเฉลยของภาพ ตงแต 0 ถง 127 จะไดคาฮสโตแกรมเฉลยชวงท 1 และน าคาฮสโตแกรมเฉลยของภาพ ตงแต 128 ถง 255 จะไดคาฮสโตแกรมเฉลยชวงท 2 (ดงภาพท 3.5) แลวเพมคาฮสโตแกรมเฉลยของภาพอน ๆ เรยงบรรทด ตามล าดบไปจนถงบรรทดท 34 ซงหมายถงภาพท 32 สวนไฟลของภาพทตองการคนคนกใชวธค านวณหาคาฮสโตแกรมเฉลยเชนเดยวกบไฟลทใชสรางสามเหลยมเดอลาเน 6 มต

ภาพท 3.5 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 6 มต

กรณสรางไฟลทดลองสามเหลยมเดอลาเนท 9 มต โดยคาฮสโตแกรมเฉลยของการทดลองสามเหลยมเดอลาเนท 9 มตนน ค านวณจากน าคาฮสโตแกรมเฉลยของภาพ ตงแต 0 ถง 84 จะไดคาฮสโตแกรมเฉลยชวงท 1 น าคาฮสโตแกรมเฉลยของภาพ ต งแต 85 ถง 170 จะไดคา ฮสโตแกรมเฉลยชวงท 2 และน าคาฮสโตแกรมเฉลยของภาพ ต งแต 171 ถง 255 จะไดคา ฮสโตแกรมเฉลยชวงท 3 (ดงภาพท 3.6)

21

ภาพท 3.6 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 9 มต

กรณสรางไฟลทดลองสามเหลยมเดอลาเนท 12 มต โดยคาฮสโตแกรมเฉลยของการทดลองสามเหลยมเดอลาเนท 12 มตนน ค านวณจากน าคาฮสโตแกรมเฉลยของภาพ ตงแต 0 ถง 63 จะไดคาฮสโตแกรมเฉลยชวงท 1 น าคาฮสโตแกรมเฉลยของภาพ ตงแต 64 ถง 127 จะไดคา ฮสโตแกรมเฉลยชวงท 2 น าคาฮสโตแกรมเฉลยของภาพ ตงแต 128 ถง จะไดคาฮสโตแกรมเฉลยชวงท 3 และน าคาฮสโตแกรมเฉลยของภาพ ตงแต 192 ถง 255 จะไดคาฮสโตแกรมเฉลยชวงท 4 (ดงภาพท 3.7)

ภาพท 3.7 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 12 มต

เมอผานขนตอนการสรางไฟลตามภาพท 3.2 แลวน าไฟลทไดเขาสขนตอนการจบคภาพบนสามเหลยมเดอลาเนหลายมตซงมวธดงภาพท 3.8

22

เรมตน

เขยนขอมลลงไฟล

สนสด

สรางสามเหลยมเดอลาเน

จบคภาพ

เรมตน

สงต าแหนงทตองการคนหาไปด าเนนการ

ค านวณระยะหางของต าแหนงทคนหาได

สงคนคา

อานขอมลฮสโตแกรมจากไฟล

อานขอมลฮสโตแกรมของภาพทตองการคนหา

ภาพท 3.8 ขนตอนการทดลองการจบคภาพบนสามเหลยมเดอลาเนหลายมต

โดยเรมจากกระบวนการสรางสามเหลยมเดอลาเน ซงเรยกใชงานผาน Qhull Library ทไดแกไขรหสใหเหมาะกบการทดลองของงานวจยน ผลลพธทไดจะเปนโครงขายสามเหลยมเดอลาเนทแตละจด (Vertex) แสดงถงคาฮสโตแกรมเฉลยของภาพแตละภาพ (1 จด หมายถง 1 ภาพ) หลงจากนนน าจดของภาพทตองการคนคนสงไปในกระบวนการจบคภาพ ซงจะท าการคนคนจดดงกลาวในโครงขายสามเหลยมเดอลาเนทสรางไว ผลลพธทไดจะเปนดานของสามเหลยมเดอลาเน (Facet) ซงประกอบไปดวยจดทใกลเคยงกบจดทตองการคนคน แลวน าไปค านวณระยะหางของจดทงหมดทไดมากบจดทสงไปคนคน โดยใชวธค านวณระยะหางยคลด ผลลพธทมคานอยทสดจะหมายถงภาพทใกลเคยงกบภาพทตองการคนคนทสด หากผลลพธใดมคาเทากบศนยหมายถงผลลพธนนตรงกบภาพทตองการคนคน

23

(ก) (ข) (ค)

- ขนตอนการทดลองท 2 เมอคณลกษณะพเศษของภาพเพมขนท าใหจ านวนมตของสามเหลยมเดอลาเนกเพมขนตามไปดวยอาจเกดปญหาของมตขอมล จงไดมการทดลองใชสามเหลยมเดอลาเนทมตขนาดกลางจ านวนหลาย ๆ ชน มาเปนโครงสรางพนฐานเพอปองกนปญหาดงกลาวในการจบคภาพ ดงภาพท 3.9

ภาพท 3.9 ตวอยางสามเหลยมเดอลาเน 2 มต (ก) 3 มต (ข) และ 2 มต หลาย ๆ ชน (ค)

จากภาพขางตนแสดงใหเหนสามเหลยมเดอลาเนในลกษณะตาง ๆ แสดงใหเหนถงการเชอมกนของจดตาง ๆ เปนโครงขาย ภาพท 3.9 (ก) คอสามเหลยมเดอลาเน 2 มตท 100 จด ภาพท 3.9 (ข) คอสามเหลยมเดอลาเน 3 มตท 100 จดเชนเดยวกน จะมองเหนถงความซบซอนของภาพเมอมจ านวนมตสงขนอาจจะดซบซอนแตขอมลของจดทเชอมระหวางกนภายในโครงขายไมไดซบซอนอยางทเหนในภาพ ภาพท 3.9 (ค) เปนสามเหลยมเดอลาเน 2 มตทมจ านวน 3 ชน โดยแตละชนประกอบไปดวยจด 100 จด จงท าใหภาพท 3.10 (ค) มจดทงหมด 300 จด ส าหรบการทดลองทดลองท 2 ของงานวจยนไดใชสามเหลยมเดอลาเน 3 มต หลาย ๆ ชน มาเปนโครงขายส าหรบใชในการจบคภาพ เพอใหสามารถจดเกบคณลกษณะพเศษของภาพไดมากขน ส าหรบไฟลทใชในการทดลองประกอบไปดวย 2 สวน ซงจะมวธการสรางทแตกตางกนคอ ไฟลทใชสรางสามเหลยมเดอลาเน 3 มต หลาย ๆ ชนมขนตอนดงภาพท 3.10 (ก) และไฟลของภาพทตองการคนคนมขนตอนดงภาพท 3.10 (ข)

24

(ก) (ข)

Corel

0-255

ภาพท 3.10 ขนตอนการสรางไฟลส าหรบการจบคภาพบนสามเหลยมเดอลาเนหลายมตหลายชน

โดยใชคาฮสโตแกรมเฉลยของภาพทงหมด และใชคาฮสโตแกรมเฉลยของภาพทตองการคนคนมาด าเนนการทดลองท 3 มต จ านวนหลาย ๆ ชน โดยค านวณหาคาฮสโตแกรมเฉลยตงแต 0 ถง 255 ของสแดง สเขยว และสน าเงนของภาพทงหมดตามล าดบ จดเกบไวในไฟลตาม แตละชวงความถ ซงไฟลทใชในการสรางสามเหลยมเดอลาเนนนจะตองมโครงสรางเปนไปตามเงอนไขของ Qhull เชนเดยวกบภาพท 3.3 แตกตางตรงทใชจ านวนมตทใชในการทดลอง เทากบ 3 เมอไฟลทใชทดลองมลกษณะ 3 มต (บรรทดท 1 ระบคา 3) สรางทจ านวน 1,000 จด (บรรทดท 2 ระบคา 1000) ซงแตละจดหมายถงคาฮสโตแกรมเฉลยของภาพแตละภาพ (บรรทดท 3 หมายถง คาฮสโตแกรมเฉลยสแดงชวงท 1 คาฮสโตแกรมเฉลยสเขยวชวงท 1 คาฮสโตแกรมเฉลยสน าเงนชวงท 1 ของภาพท 1 ตามล าดบ)

25

(ก) (ข) (ค)

ภาพท 3.11 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 3 มต 2 ชน

โดยคาฮสโตแกรมเฉลยของการทดลองสามเหลยมเดอลาเน 3 มต 2 ชนน น ค านวณจากน าคาฮสโตแกรมเฉลยของภาพ ตงแต 0 ถง 127 (ดงภาพท 3.12) จะไดคาฮสโตแกรมเฉลยชวงท 1 เปนของสามเหลยมเดอลาเนชนท 1 ดงภาพท 3.13 (ก) และน าคาฮสโตแกรมเฉลยของภาพ ตงแต 128 ถง 255 ไดคาฮสโตแกรมเฉลยชวงท 2 เปนของสามเหลยมเดอลาเนชนท 2 โดยแตละไฟลจะเรยงบรรทดตามล าดบไปจนถงบรรทดท 1002 ซงหมายถงภาพท 1,000 ดงภาพท 3.12 (ข) สวนไฟลของภาพทตองการคนคนมขนตอนดงภาพท 3.10 (ข) ซงตวอยางไฟลของภาพทตองการคนคนนนดงภาพท 3.12 (ค)

ภาพท 3.12 ตวอยางขอมลในไฟลส าหรบการจบคภาพบนสามเหลยมเดอลาเน 3 มต 2 ชน

ถาสมมตใหไฟลทใชทดลองมลกษณะ 3 มต 4 ชน โดยไฟลทใชทดลองมลกษณะ 3 มต (บรรทดท 1 ระบคา 3) สรางทจ านวน 1,000 จด (บรรทดท 2 ระบคา 1000) ซงแตละจด

26

หมายถงคาฮสโตแกรมเฉลยของภาพแตละภาพ (บรรทดท 3 หมายถง คาฮสโตแกรมเฉลยสแดงชวงท 1 คาฮสโตแกรมเฉลยสเขยวชวงท 1 คาฮสโตแกรมเฉลยสน าเงนชวงท 1 ของภาพท 1 ตามล าดบ)

ภาพท 3.13 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 3 มต 4 ชน

โดยคาฮสโตแกรมเฉลยของการทดลองสามเหลยมเดอลาเน 3 มต 4 ชนน น ค านวณจากน าคาฮสโตแกรมเฉลยของภาพ ตงแต 0 ถง 63 (ดงภาพท 3.13) จะไดคาฮสโตแกรมเฉลยชวงท 1 เปนของสามเหลยมเดอลาเนชนท 1 ดงภาพท 3.14 (ก) น าคาฮสโตแกรมเฉลยของภาพตงแต 64 ถง 127 จะไดคาฮสโตแกรมเฉลยชวงท 2 เปนของสามเหลยมเดอลาเนชนท 2 ดงภาพท 3.14 (ข) น าคาฮสโตแกรมเฉลยของภาพต งแต 128 ถง 191 จะไดคาฮสโตแกรมเฉลยชวงท 3 เปนของสามเหลยมเดอลาเนชนท 3 ดงภาพท 3.14 (ค) และน าคาฮสโตแกรมเฉลยของภาพตงแต 192 ถง 255 จะไดคาฮสโตแกรมเฉลยชวงท 4 เปนของสามเหลยมเดอลาเนชนท 4 ดงภาพท 3.14 (ง) โดยแตละไฟลจะเรยงบรรทดตามล าดบไปจนถงบรรทดท 1002 ซงหมายถงภาพท 1,000 สวนไฟลของภาพทตองการคนคนมขนตอนดงภาพท 3.10 (ข) ซงตวอยางไฟลของภาพทตองการคนคนนนดงภาพท 3.14 (จ)

27

ภาพท 3.14 ตวอยางขอมลในไฟลส าหรบการจบคภาพบนสามเหลยมเดอลาเน 3 มต 4 ชน

กรณสรางไฟลทดลองสามเหลยมเดอลาเน 3 มต 8 ชน, 16 ชน, 32 ชน, 64 ชน และ 128 ชน ค านวณหาคาฮสโตแกรมเฉลยของแตละชนโดยใช 256 หารดวย n, เมอ n คอจ านวนชนของสามเหลยมเดอลาเน ดงภาพท 3.15, 3.16, 3.17, 3.17 และ 3.19 ตามล าดบ สวนสามเหลยม เดอลาเน 3 มต 256 ชน ใชทกคาฮสโตแกรม ดงภาพท 3.20

ภาพท 3.15 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 3 มต 8 ชน

(ก)

(ค) (ง)

(จ)

(ข)

28

ภาพท 3.16 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 3 มต 16 ชน

ภาพท 3.17 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 3 มต 32 ชน

ภาพท 3.18 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 3 มต 64 ชน

29

ภาพท 3.19 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 3 มต 128 ชน

ภาพท 3.20 การแบงชวงคาฮสโตแกรมของแตละสส าหรบสามเหลยมเดอลาเน 3 มต 256 ชน

หลงจากนนน าไฟลทไดเขาสขนตอนการจบคภาพบนสามเหลยมเดอลาเน 3 มตหลาย ๆ ชน ซงมกระบวนการคลายกบขนตอนท 1 ตางกนตรงมขนตอนทตองท าซ าในการสรางสามเหลยมเดอลาเนเพราะมหลายชน หลงจากนนรวมคาระยะหางทค านวณได โดยแบงตามต าแหนงของจด ผลลพธทมคานอยทสดจะหมายถงภาพทใกลเคยงกบภาพทตองการคนคนทสด หากผลลพธใดมคาเทากบศนยหมายถงผลลพธนนตรงกบภาพทตองการคนคน

30

- ขนตอนการทดลองท 3 เพอใหระบบมประสทธภาพจงไดน าวธจากขนตอนท 2 มาเขาสสภาพแวดลอมการประมวลผลแบบกระจายบน Hadoop ด าเนนการโดยใช MapReduce มาด าเนนการจบค เพอลดเวลาในการด าเนนการโดยมขนตอนดงภาพท 3.21

Map Reduce

ภาพท 3.21 ขนตอนการทดลองการจบคภาพบนสามเหลยมเดอลาเนหลายมตหลายชนแบบกระจาย

โดยใชไฟลขอมลและขนตอนจากการทดลองท 2 สงผลลพธทไดให Map อานชอไฟลและรวมจ านวนชนของสามเหลยมเดอลาเนทคนเจอภาพทตองการคนคน แลวสงคาดงกลาวไปให Reduce เปรยบเทยบผลรวมของจ านวนชนสามเหลยมเดอลาเนแลวแสดงผลลพธ ผลลพธทมคามากทสดจะหมายถงภาพทใกลเคยงกบภาพทตองการคนคนทสด

31

3.4 กำรทดลองกำรประมวลผลแบบกระจำย 3.4.1 แนวทำงกำรทดลอง แนวทางการทดลองในสวนนเพอใหไดสภาพแวดลอมส าหรบการประมวลผลแบบกระจายทมประสทธภาพ จงไดสรางระบบการประมวลผลแบบกระจายโดยใช Hadoop และเพอเปรยบเทยบประสทธภาพทใชในการด าเนนงาน จงไดทดลองใชจ านวนเครองในการประมวลทแตกตางกนรวมกบจ านวนขอมลทมมากขนเรอย ๆ โดยแบงออกเปน 2 การทดลอง การทดลองแรกเพอใหไดระบบประมวลผลแบบกระจายทมประสทธภาพโดยพจารณาจากจ านวนเครองทใชมาประมวลผลบนสภาพแวดลอมเสมอน การทดลองทสองเพอพฒนาขนตอนของ MapReduce ใหไดผลลพธเรวขน 3.4.2 ขนตอนและวธกำรทดลอง - ขนตอนการทดลองท 4 จากสมมตฐานทวาเมอจ านวนเครองมมากขนการประมวลผลแบบกระจายจะมความเรวขนไปดวย โดยทดลองใช Hadoop เวอรชน 1.2.1 บนสภาพแวดลอมเสมอน VirtualBox ซงแตละเครองท างานบนระบบปฏบตการ Ubuntu 64bit รน14.04 ทใชหนวยความจ า 1 GB ทดสอบดวยฐานขอมลภาพ IAPR TC-12 Benchmark โดยทดลองประมวลผลแบบกระจายทมจ านวนเครอง 2 เครอง, 4 เครอง และ 8 เครอง ซงการทดลองนนใชขอมลภาพทจ านวน 20,000 40,000 80,000 100,000 160,000 และ 200,000 ภาพ ทสรางระบบประมวลผลแบบกระจายโดยใช Hadoop มาด าเนนการ ซงสรางบน VirtualBox ทมจ านวนเครอง 2 เครอง, 4 เครอง และ 8 เครอง รวมเปน 3 สภาพแวดลอมการทดลอง แตละสภาพแวดลอมนนสามารถตดตอถงกนไดผานระบบเครอขาย หลงจากนนน าไฟลทสรางไวสงไปจดเกบใน HDFS ของแตละสภาพแวดลอม แลวทดลองการประมวลผลแบบกระจายบนจ านวนเครองแตกตางกน ซงมขนตอนดงภาพท 3.22

32

Map Reduce

ภาพท 3.22 ขนตอนทดลองการประมวลผลแบบกระจายทจ านวนเครองแตกตางกน

เมอสงด าเนนการ ระบบจะอานไฟลจาก HDFS และคาของภาพทน ามาทดสอบ

หลงจากนนสงให Map ค านวณหาระยะหางยคลดของคาดงกลาว จากนนสงผลลพธทไดไปให Reduce รวมคาระยะหางยคลดทเกยวของกนของแตละไฟล และเปรยบเทยบผลรวมทได แลวเขยนผลลพธลงไฟล การทดลองนด าเนนการเพอทดสอบเวลาทใชประมวลผลในแตละสภาพแวดลอม

33

- ข นตอนการทดลอง ท 5 เพ อใหการด า เ นนการของ MapReduce น น มประสทธภาพมากขน ตองกระจายงานเพอใหสวนของ Reduce ท างานนอยลง จงจะสงผลใหเวลาทใชด าเนนการลดลงไปดวย การทดลองนใชสภาพแวดลอมเหมอนขนตอนการทดลองท 4 แตปรบปรงการท างานของ MapReduce ใหมซงมขนตอนดงภาพท 3.23 ในสวนบรเวณทแรเงา

Map Reduce

ภาพท 3.23 ขนตอนทดลองการประมวลผลแบบกระจายทปรบปรงใหม

โดยเมอสงด าเนนการ ระบบจะอานไฟลจาก HDFS และคาของภาพทน ามาทดสอบ หลงจากนนสงให Map ค านวณระยะหางยคลดของคาดงกลาวและรวมคาระยะหางยคลดทเกยวของกนของแตละไฟล แลวสงผลลพธทไดไปให Reduce เพอเปรยบเทยบผลรวม หลงจากนนเขยนผลลพธลงไฟลทระบ การทดลองนด าเนนการเพอเปรยบเทยบเวลาทใชประมวลผล ของวธ MapReduce ทปรบปรงใหมกบวธ MapReduce แบบเกา ทจ านวนภาพ 20,000 และ 200,000 ภาพ โดยผลลพธของการทดลองจะแสดงในบทท 4

34

บทท 4 ผลการทดลอง

ส ำหรบเนอหำในบทนจะน ำเสนอผลกำรทดลองกำรจบคภำพและกำรประมวลผลแบบกระจำยตำมวธด ำเนนกำรวจยในบทท 3 ซงมรำยละเอยดดงตอไปน 4.1 ผลการทดลองการจบคภาพ กำรทดลองในสวนนด ำเนนกำรบนเครองคอมพวเตอรแลปทอปทใชหนวยประมวลผล Intel® Core™ i5 ควำมเรว 2.50GHz หนวยควำมจ ำ 16GB บนระบบปฏบตกำร Windows 8 โดยใชสภำพแวดลอมเสมอน Oracle VM VirtualBox เพอตดต งระบบปฏบตกำร Ubuntu 64bit รน 14.04 เปนระบบปฏบตกำรทใชในกำรทดลอง โดยมหนวยควำมจ ำ 8GB และใชฐำนขอมลภำพจำก Corel Image Gallery ทไดสมเลอกภำพจำกทกกลม 1,000 ภำพเพอเปนขอมลในกำรทดลองวดควำมสมพนธระหวำงควำมเรวกบจ ำนวนภำพ 4.1.1 ผลการจบคภาพบนสามเหลยมเดอลาเนหลายมต หลงจำกน ำภำพทเลอกไวมำสกดคณลกษณะพเศษโดยใชสของภำพ เพอทดลองบนสำมเหลยมเดอลำเน 3 มต หลงด ำเนนกำรตำมขนตอนกำรทดลองท 1 ในบทท 3 แลวไดผลลพธดงตำรำงท 4.1

ตำรำงท 4.1 เวลำเฉลยและหนวยควำมจ ำเฉลยทใชประมวลผลบนสำมเหลยมเดอลำเน 3 มต

จ ำนวนภำพ เวลำเฉลยทใชในกำรสรำง DT (วนำท)

เวลำเฉลยทใชในกำรจบคภำพ (วนำท)

หนวยควำมจ ำเฉลยทใช (กโลไบต)

32 0.00317 0.00001160 13,196 50 0.00456 0.00001250 13,196 64 0.00286 0.00001740 13,196

100 0.00432 0.00005760 13,196 128 0.00469 0.00009093 13,348 500 0.02268 0.00013644 14,011

1,000 0.05012 0.00020635 14,704

35

จำกผลกำรทดลองจบคภำพจ ำนวน 100 ครงบนสำมเหลยมเดอลำเน 3 มต เวลำเฉลยทใชสรำงสำมเหลยมเดอลำเน 3 มตดงภำพท 4.1 เวลำเฉลยทใชในกำรจบคภำพบนสำมเหลยมเดอลำเน 3 มตดงภำพท 4.2 สวนหนวยควำมจ ำเฉลยทใชในกำรประมวลผลบนสำมเหลยมเดอลำเน 3 มตดงภำพท 4.3

ภำพท 4.1 เวลำเฉลยทใชสรำงสำมเหลยมเดอลำเน 3 มต

0

0.01

0.02

0.03

0.04

0.05

0.06

0 200 400 600 800 1,000

เวลำเฉ

ลย (วนำ

ท)

จ ำนวนภำพ

สำมเหลยมเดอลำเน 3 มต

36

ภำพท 4.2 เวลำเฉลยทใชจบคภำพบนสำมเหลยมเดอลำเน 3 มต

ภำพท 4.3 หนวยควำมจ ำเฉลยทใชประมวลผลบนสำมเหลยมเดอลำเน 3 มต

0.00000

0.00005

0.00010

0.00015

0.00020

0.00025

0 200 400 600 800 1,000

เวลำเฉ

ลย (วนำ

ท)

จ ำนวนภำพ

สำมเหลยมเดอลำเน 3 มต

13,000

13,500

14,000

14,500

15,000

0 200 400 600 800 1,000

หนวยคว

ำมจ ำเฉลย (ก

โลไบ

ต)

จ ำนวนภำพ

สำมเหลยมเดอลำเน 3 มต

37

ส ำหรบกำรทดลองบนสำมเหลยมเดอลำเน 6 มต หลงด ำเนนกำรตำมขนตอนกำรทดลองท 1 ในบทท 3 แลวไดผลลพธดงตำรำงท 4.2

ตำรำงท 4.2 เวลำเฉลยและหนวยควำมจ ำเฉลยทใชประมวลผลบนสำมเหลยมเดอลำเน 6 มต

จ ำนวนภำพ เวลำเฉลยทใชในกำรสรำง DT (วนำท)

เวลำเฉลยทใชในกำรจบคภำพ (วนำท)

หนวยควำมจ ำเฉลยทใช (กโลไบต)

32 0.20788 0.0002170 13,882 50 0.06071 0.0005865 15,373 64 0.11120 0.0008915 16,408

100 0.35043 0.0025044 20,800 128 0.56099 0.0034064 24,812 500 4.90665 0.0133058 85,739

1,000 22.46190 0.0392300 176,616

จำกผลกำรทดลองจบคภำพจ ำนวน 100 ครงบนสำมเหลยมเดอลำเน 6 มต เวลำเฉลยทใชสรำงสำมเหลยมเดอลำเน 6 มตดงภำพท 4.4 เวลำเฉลยทใชในกำรจบคภำพบนสำมเหลยมเดอลำเน 6 มตดงภำพท 4.5 สวนหนวยควำมจ ำเฉลยทใชในกำรประมวลผลบนสำมเหลยมเดอลำเน 6 มตดงภำพท 4.6

38

ภำพท 4.4 เวลำเฉลยทใชสรำงสำมเหลยมเดอลำเน 6 มต

ภำพท 4.5 เวลำเฉลยทใชจบคภำพบนสำมเหลยมเดอลำเน 6 มต

0

5

10

15

20

25

0 200 400 600 800 1,000

เวลำเฉ

ลย (วนำ

ท)

จ ำนวนภำพ

สำมเหลยมเดอลำเน 6 มต

0

0.01

0.02

0.03

0.04

0.05

0 200 400 600 800 1,000

เวลำเฉ

ลย (วนำ

ท)

จ ำนวนภำพ

สำมเหลยมเดอลำเน 6 มต

39

ภำพท 4.6 หนวยควำมจ ำเฉลยทใชประมวลผลบนสำมเหลยมเดอลำเน 6 มต

ส ำหรบกำรทดลองบนสำมเหลยมเดอลำเน 9 มต หลงด ำเนนกำรตำมขนตอนกำรทดลองท 1 ในบทท 3 แลวไดผลลพธดงตำรำงท 4.3

ตำรำงท 4.3 เวลำเฉลยและหนวยควำมจ ำเฉลยทใชประมวลผลบนสำมเหลยมเดอลำเน 9 มต

จ ำนวนภำพ เวลำเฉลยทใชในกำรสรำง DT (วนำท)

เวลำเฉลยทใชในกำรจบคภำพ (วนำท)

หนวยควำมจ ำเฉลยทใช (กโลไบต)

32 0.39919 0.00325 24,629 50 3.13085 0.02687 71,863 64 7.82038 0.04461 135,671

100 33.62465 0.01347 385,624 128 60.33285 0.37515 748,446 500 ไมสำมำรถประมวลผลได ไมสำมำรถประมวลผลได เกนหนวยควำมจ ำ

1,000 ไมสำมำรถประมวลผลได ไมสำมำรถประมวลผลได เกนหนวยควำมจ ำ

0

50,000

100,000

150,000

200,000

0 200 400 600 800 1,000

หนวยคว

ำมจ ำเฉลย (ก

โลไบ

ต)

จ ำนวนภำพ

สำมเหลยมเดอลำเน 6 มต

40

จำกผลกำรทดลองจบคภำพจ ำนวน 100 ครงบนสำมเหลยมเดอลำเน 9 มต เวลำเฉลยทใชสรำงสำมเหลยมเดอลำเน 9 มตดงภำพท 4.7 เวลำเฉลยทใชในกำรจบคภำพบนสำมเหลยมเดอลำเน 9 มตดงภำพท 4.8 สวนหนวยควำมจ ำเฉลยทใชในกำรประมวลผลบนสำมเหลยมเดอลำเน 9 มตดงภำพท 4.9

ภำพท 4.7 เวลำเฉลยทใชสรำงสำมเหลยมเดอลำเน 9 มต

0

10

20

30

40

50

60

70

0 20 40 60 80 100 120 140

เวลำเฉ

ลย (วนำ

ท)

จ ำนวนภำพ

สำมเหลยมเดอลำเน 9 มต

41

ภำพท 4.8 เวลำเฉลยทใชจบคภำพบนสำมเหลยมเดอลำเน 9 มต

ภำพท 4.9 หนวยควำมจ ำเฉลยทใชประมวลผลบนสำมเหลยมเดอลำเน 9 มต

0

0.1

0.2

0.3

0.4

0 20 40 60 80 100 120 140

เวลำเฉ

ลย (วนำ

ท)

จ ำนวนภำพ

สำมเหลยมเดอลำเน 9 มต

0100,000200,000300,000400,000500,000600,000700,000800,000

0 20 40 60 80 100 120 140

หนวยคว

ำมจ ำเฉลย (ก

โลไบ

ต)

จ ำนวนภำพ

สำมเหลยมเดอลำเน 9 มต

42

ส ำหรบกำรทดลองบนสำมเหลยมเดอลำเน 12 มต หลงด ำเนนกำรตำมขนตอนกำรทดลองท 1 ในบทท 3 แลวไดผลลพธดงตำรำงท 4.4

ตำรำงท 4.4 เวลำเฉลยและหนวยควำมจ ำเฉลยทใชประมวลผลบนสำมเหลยมเดอลำเน 12 มต

จ ำนวนภำพ เวลำเฉลยทใชในกำรสรำง DT (วนำท)

เวลำเฉลยทใชในกำรจบคภำพ (วนำท)

หนวยควำมจ ำเฉลยทใช (กโลไบต)

32 3.97172 0.02530 96,445 50 71.62430 0.05136 1,163,900 64 210.98196 0.11917 2,371,277

100 ไมสำมำรถประมวลผลได ไมสำมำรถประมวลผลได เกนหนวยควำมจ ำ 128 ไมสำมำรถประมวลผลได ไมสำมำรถประมวลผลได เกนหนวยควำมจ ำ 500 ไมสำมำรถประมวลผลได ไมสำมำรถประมวลผลได เกนหนวยควำมจ ำ

1,000 ไมสำมำรถประมวลผลได ไมสำมำรถประมวลผลได เกนหนวยควำมจ ำ จำกผลกำรทดลองจบคภำพจ ำนวน 100 ครงบนสำมเหลยมเดอลำเน 12 มต เวลำเฉลยทใชสรำงสำมเหลยมเดอลำเน 12 มตดงภำพท 4.10 เวลำเฉลยทใชในกำรจบคภำพบนสำมเหลยมเดอลำเน 12 มตดงภำพท 4.11 สวนหนวยควำมจ ำเฉลยทใชในกำรประมวลผลบนสำมเหลยมเดอลำเน 12 มตดงภำพท 4.12

43

ภำพท 4.10 เวลำเฉลยทใชสรำงสำมเหลยมเดอลำเน 12 มต

ภำพท 4.11 เวลำเฉลยทใชจบคภำพบนสำมเหลยมเดอลำเน 12 มต

0

50

100

150

200

250

0 10 20 30 40 50 60 70

เวลำเฉ

ลย (วนำ

ท)

จ ำนวนภำพ

สำมเหลยมเดอลำเน 12 มต

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

0 10 20 30 40 50 60 70

เวลำเฉ

ลย (วนำ

ท)

จ ำนวนภำพ

สำมเหลยมเดอลำเน 12 มต

44

ภำพท 4.12 หนวยควำมจ ำเฉลยทใชประมวลผลบนสำมเหลยมเดอลำเน 12 มต

เมอน ำผลกำรทดลองจบคภำพของสำมเหลยมเดอลำเนท 3 มต 6 มต 9 มต และ 12 มต โดยใชภำพจ ำนวน 64 ภำพ มำเปรยบเทยบแลวพบวำจำกกำรทดลอง 100 ครง คนคนไดภำพทถกตอง 100 ครง ดงตำรำงท 4.5 สวนหนวยควำมจ ำ เวลำเฉลยทใชในกำรสรำงสำมเหลยมเดอลำเนและเวลำเฉลยทใชในกำรจบคภำพในทกมตมแนวโนมสงขน โดยเมอเปรยบเทยบเวลำเฉลยทใชในกำรจบคภำพของมตตำง ๆ น นไดผลของกำรทดลองดงภำพท 4.13 และเวลำเฉลยทใชสรำงสำมเหลยมเดอลำเนทมตตำง ๆ ไดผลกำรทดลองดงภำพท 4.14 สวนหนวยควำมจ ำเฉลยทใชในกำรประมวลผลบนสำมเหลยมเดอลำเนของแตละมตนนไดผลกำรทดลองดงภำพท 4.15

ตำรำงท 4.5 ผลกำรคนคนภำพทจ ำนวน 64 ภำพของสำมเหลยมเดอลำเนหลำยมต

จ ำนวนมต ในกำรทดลองแตละครงคนคนภำพมำได (ภำพ)

ในกำรทดลอง 100 ครงพบภำพทตรงกบภำพทตองกำรคนคน (ครง)

3 8 100 6 7 100 9 10 100

12 13 100

0

500,000

1,000,000

1,500,000

2,000,000

2,500,000

0 10 20 30 40 50 60 70

หนวยคว

ำมจ ำเฉลย (ก

โลไบ

ต)

จ ำนวนภำพ

สำมเหลยมเดอลำเน 12 มต

45

ภำพท 4.13 เวลำเฉลยทใชสรำงสำมเหลยมเดอลำเนทมตแตกตำงกน

ภำพท 4.14 เวลำเฉลยทใชจบคภำพบนสำมเหลยมเดอลำเนทมตแตกตำงกน

-50

0

50

100

150

200

250

0 2 4 6 8 10 12

เวลำเฉ

ลย (วนำ

ท)

จ ำนวนมตของสำมเหลยมเดอลำเน

ภำพจ ำนวน 64 ภำพ

-0.02

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

0 2 4 6 8 10 12

เวลำเฉ

ลย (วนำ

ท)

จ ำนวนมตของสำมเหลยมเดอลำเน

ภำพจ ำนวน 64 ภำพ

46

ภำพท 4.15 หนวยควำมจ ำเฉลยทใชประมวลผลบนสำมเหลยมเดอลำเนทมตแตกตำงกน

สรปแลวกำรทดลองนแสดงใหเหนวำ เมอจ ำนวนมตของสำมเหลยมเดอลำเนสงขนโดยเฉพำะกำรทดลองบนสำมเหลยมเดอลำเน 12 มต สงผลใหหนวยควำมจ ำและเวลำทใชนนเพมขนมำกไปดวย ดงนนกำรใชสำมเหลยมเดอลำเนทมตสง ๆ ไมเหมำะน ำมำด ำเนนกำรกบงำนวจยนเนองจำกทรพยำกรทใชในกำรทดลองไมเพยงพอตอกำรสรำงสำมเหลยมเดอลำเนทมตสง ๆ โดยเฉพำะหนวยควำมจ ำของเครอง 4.1.2 ผลการจบคภาพบนสามเหลยมเดอลาเนมตขนาดกลางหลาย ๆ ชน หลงจำกน ำภำพทเลอกไวมำสกดคณลกษณะพเศษทำงสของภำพ เพอทดลองบนสำมเหลยมเดอลำเนทมมตขนำดกลำงหลำย ๆ ชน ในกำรทดลองนใชสำมเหลยมเดอลำเนทมขนำด 3 มต เมอน ำไปด ำเนนกำรตำมขนตอนท 2 ในบทท 3 แลวไดผลลพธดงตำรำงท 4.6

-500,000

0

500,000

1,000,000

1,500,000

2,000,000

2,500,000

0 2 4 6 8 10 12

หนวยคว

ำมจ ำเฉลยทใ

ช (กโลไบต

)

จ ำนวนมตของสำมเหลยมเดอลำเน

ภำพจ ำนวน 64 ภำพ

47

ตำรำงท 4.6 เวลำและหนวยควำมจ ำเฉลยทใชประมวลผลบนสำมเหลยมเดอลำเนหลำยชน

จ ำนวนชนของ สำมเหลยมเดอลำเน 3 มต

เวลำเฉลยทใชสรำงสำมเหลยมเดอลำเน (วนำท)

เวลำเฉลยทใชจบคภำพ (วนำท)

หนวยควำมจ ำเฉลยทใช (กโลไบต)

2 0.096 0.100 16,332 4 0.198 0.203 19,684 8 0.409 0.422 26,236

16 0.963 0.973 42,356 32 2.305 2.323 71,444 64 5.395 5.416 131,944

128 11.795 11.824 253,780 256 23.119 23.141 505,844

จำกผลกำรทดลองจบคภำพจ ำนวน 100 ครงบนสำมเหลยมเดอลำเน 3 มตหลำย ๆ ชน เวลำเฉลยทใชสรำงสำมเหลยมเดอลำเน 3 มตหลำย ๆ ชน ดงภำพท 4.16 เวลำเฉลยทใชในกำรจบคภำพบนสำมเหลยมเดอลำเน 3 มตหลำย ๆ ช น ดงภำพท 4.17 สวนหนวยควำมจ ำเฉลยทใชในกำรประมวลผลบนสำมเหลยมเดอลำเน 3 มตหลำย ๆ ชน ดงภำพท 4.18

48

ภำพท 4.16 เวลำเฉลยทใชสรำงสำมเหลยมเดอลำเนหลำยชน

ภำพท 4.17 เวลำเฉลยทใชจบคภำพบนสำมเหลยมเดอลำเนหลำยชน

0

5

10

15

20

25

0 50 100 150 200 250 300

เวลำเฉ

ลย (วนำ

ท)

จ ำนวนชนของสำมเหลยมเดอลำเน

สำมเหลยมเดอลำเนหลำยชน

0

5

10

15

20

25

0 50 100 150 200 250 300

เวลำเฉ

ลย (วนำ

ท)

จ ำนวนชนของสำมเหลยมเดอลำเน

สำมเหลยมเดอลำเนหลำยชน

49

ภำพท 4.18 หนวยควำมจ ำเฉลยทใชประมวลผลบนสำมเหลยมเดอลำเนหลำยชน

เมอน ำผลกำรทดลองจบคภำพของสำมเหลยมเดอลำเนท 3 มต หลำย ๆ ชนมำเปรยบเทยบ โดยใชภำพจ ำนวน 1,000 ภำพ พบวำจำกกำรทดลอง 100 ครง คนคนไดภำพทถกตอง 100 ครง ดงตำรำงท 4.7

ตำรำงท 4.7 ผลกำรคนคนภำพทจ ำนวน 1,000 ภำพของสำมเหลยมเดอลำเน 3 มตหลำยชน

จ ำนวนชน ในกำรทดลองแตละครงคนคนภำพมำได (ภำพ)

ในกำรทดลอง 100 ครงพบภำพทตรงกบภำพทตองกำรคนคน (ครง)

2 7 100 4 13 100 8 24 100

16 44 100 32 79 100 64 168 100

128 225 100 256 322 100

0

100,000

200,000

300,000

400,000

500,000

600,000

0 50 100 150 200 250 300

หนวยคว

ำมจ ำเฉลย

(กโลไบ

ต)

จ ำนวนชนของสำมเหลยมเดอลำเน

สำมเหลยมเดอลำเนหลำยชน

50

สรปแลวกำรทดลองนแสดงใหเหนวำ เมอจ ำนวนชนของสำมเหลยมเดอลำเนเพมขนอนเนองมำจำกคณลกษณะพเศษของภำพทมำกขน สงผลใหหนวยควำมจ ำและเวลำทใชนนมแนวโนมเพมขนเรอย ๆ ดงนนกำรใชสำมเหลยมเดอลำเนทมตขนำดกลำงจ ำนวนหลำย ๆ ชนจงเหมำะสมทจะน ำมำใชเปนโครงสรำงพนฐำนของงำนวจยนมำกกวำสำมเหลยมเดอลำเนทมมตสงๆเพยงชนเดยว แตไมวำจะใชสำมเหลยมเดอลำเนแบบไหนกสำมำรถคนคนภำพไดถกตองทกครง

4.1.3 ผลการจบคภาพบนสามเหลยมเดอลาเน 3 มตหลายชนแบบกระจาย

หลงจำกน ำภำพทเลอกไวมำสกดคณลกษณะพเศษทำงสของภำพ เพอทดลองประมวลผลแบบกระจำยเบองตนบน Hadoop รน 1.2.1 ดวยสำมเหลยมเดอลำเน 3 มต 256 ชน โดยใชไฟลททดลองเชนเดยวกบกำรทดลองท 2 และเมอน ำไมด ำเนนกำรตำมขนตอนท 3 ในบทท 3 แลวไดผลลพธกำรทดลองดงตำรำงท 4.8 ตำรำงท 4.8 ผลกำรจบคภำพบนสำมเหลยมเดอลำเน 3 มตหลำยชนโดยประมวลผลแบบกระจำย

จ ำนวนชนของ สำมเหลยมเดอลำเน 3 มต 256 จ ำนวนภำพทงหมดทใชทดลอง (ภำพ) 2,500 จ ำนวนครงทคนคนภำพ (ครง) 100 เวลำเฉลยทใชสรำงสำมเหลยมเดอลำเน (วนำท) 69.410 เวลำเฉลยทใชจบคภำพ (วนำท) 0.077 หนวยควำมจ ำเฉลยทใช (กโลไบต) 1,259,408 จ ำนวนภำพทคนคนไดในแตละครง (ภำพ) 5 ภำพทตรงกบภำพทตองกำรคนคน (ครง) 100

สรปแลวกำรทดลองนแสดงใหเหนวำ เมอน ำสำมเหลยมเดอลำเน 3 มต 256 ชนมำด ำเนนกำรประมวลผลแบบกระจำย ประสทธภำพในกำรคนคนภำพมควำมถกตอง 100% โดยระบบจะประมวลผลทเครองตำง ๆ แลวสงผลลพธไปแสดงยงไฟลยงแตละเครองทประมวลผลกำรคนคนภำพแบบกระจำยจงเหมำะสมทจะน ำมำใชเปนโครงสรำงพนฐำนเพอรองรบกำรเพมขนของภำพในอนำคต

51

4.2 ผลการทดลองการประมวลผลแบบกระจาย ผลกำรทดลองในสวนนด ำเนนกำรบนเครองคอมพวเตอรแลปทอปทใชหนวยประมวลผลรน Intel® Core™ i5 ควำมเรว 2.50GHz หนวยควำมจ ำ 16GB บนระบบปฏบตกำร Windows 8 โดยใช Oracle VM VirtualBox เพอตดตง Ubuntu 64bit รน 12.04 เปนระบบปฏบตกำรทใชในกำรทดลอง โดยก ำหนดใหหนวยควำมจ ำของแตละเครองเทำกบ 1GB ด ำเนนกำรโดยใชระบบของ Hadoop รน 1.2.1 ทประมวลผลแบบกระจำยในสภำพแวดลอมแบบ 1 เครอง 2 เครอง 4 เครอง และ 8 เครอง ทสำมำรถเชอมตอและสอสำรกนผำนเครอขำยในแตละสภำพแวดลอมได และใชฐำนขอมลภำพจำก IAPR TC-12 Benchmark 20,000 ภำพ ซงมกำรคดลอกซ ำเปน 40,000 ภำพ 80,000 ภำพ 100,000 ภำพ 160,000 ภำพ และ 200,000 ภำพ เพอใช ในกำรทดสอบกรณทมภำพจ ำนวนมำก 4.2.1 ผลการประมวลผลแบบกระจายทจ านวนเครองแตกตางกน หลงจำกน ำภำพมำสกดคณลกษณะพเศษทำงสของภำพเพอน ำคำทไดไปค ำนวนหำระยะหำงยคลดบนสภำพแวดลอมกำรประมวลผลแบบกระจำย หลงด ำเนนกำรแลวไดผลลพธดงตำรำงท 4.9

ตำรำงท 4.9 เวลำเฉลยทใชในกำรประมวลผลแบบกระจำยทสภำพแวดลอมตำง ๆ

จ ำนวนภำพ

จ ำนวนเครอง

เวลำเฉลยทใชในกำรประมวลผลแบบกระจำย (นำท)

20,000 40,000 80,000 100,000 160,000 200,000

2 1.04 1.26 2.52 4.56 6.32 7.59

4 0.52 1.22 2.47 3.32 5.36 7.52

8 0.48 1.11 2.27 3.14 5.36 7.10

จำกผลกำรทดลองประมวลผลแบบกระจำยทจ ำนวนเครองและจ ำนวนภำพทแตกตำงกน พบวำเมอจ ำนวนเครองทใชในกำรประมวลผลมำกขน เหมำะกบจ ำนวนขอมลทมปรมำณมำก ๆ ดวยเชนกน ในสวนของเวลำยงแปรผนตำมปรมำณขอมลดงภำพท 4.19

52

ภำพท 4.19 กรำฟเปรยบเทยบผลลพธกำรประมวลผลแบบกระจำยทสภำพแวดลอมตำง ๆ

4.2.2 ผลการประมวลผลแบบกระจายโดยปรบปรงขนตอน MapReduce

ตำรำงท 4.10 เวลำเฉลยทใชประมวลผลของ MapReduce แบบเกำและแบบทปรบปรง

จ ำนวนภำพ

จ ำนวนเครอง

เวลำเฉลยแบบเกำ (นำท)

เวลำเฉลยแบบทปรบปรง (นำท)

เวลำลดลงเฉลย (รอยละ)

20,000 200,000 20,000 200,000 20,000 200,000

1 3.29 18.33 1.33 10.09 59.57 44.95

4 1.64 11.88 0.55 8.17 66.46 31.23

8 0.56 7.32 0.52 7.26 7.14 0.82

012345678

0 50,000 100,000 150,000 200,000

เวลำเฉ

ลย (น

ำท)

จ ำนวนภำพ

ประมวลผลแบบกระจำยแบงตำมจ ำนวนเครอง

2 เครอง 4 เครอง 8 เครอง

53

จำกผลกำรทดลองประมวลผลแบบกระจำยทจ ำนวนเครองและจ ำนวนภำพทแตกตำงกนโดยปรบปรงขนตอนในกำร MapReduce ใหมพบวำเวลำทใชลดลงมำกเมอน ำเวลำมำเปรยบเทยบดงภำพท 4.20 และภำพท 4.21

ภำพท 4.20 เวลำเฉลยทใชกำรประมวลผลแบบกระจำยทสภำพแวดลอมตำง ๆ ระหวำง MapReduce

แบบเกำและแบบทปรบปรงทภำพจ ำนวน 20,000 ภำพ

0

1

2

3

4

0 1 2 3 4 5 6 7 8

เวลำเฉ

ลย (น

ำท)

จ ำนวนเครอง

ภำพจ ำนวน 20,000 ภำพ

แบบเกำ แบบทปรบปรง

54

ภำพท 4.21 เวลำเฉลยทใชกำรประมวลผลแบบกระจำยทสภำพแวดลอมตำง ๆ ระหวำง MapReduce

แบบเกำและแบบทปรบปรงทภำพจ ำนวน 200,000 ภำพ

4.3 สรป เนอหำในบทนไดกลำวถงกำรทดลองกำรจบคภำพทงแบบหลำยมต แบบ 3 มตหลำย ๆ ชนและกำรประมวลผลแบบกระจำย ตำมวธด ำเนนกำรวจยทไดกลำวไวในบทท 3 โดยไดทดลองเพอหำโครงสรำงพนฐำนทเหมำะสมกบสภำพแวดลอมเพอน ำมำใชในงำนวจย จำกผลกำรทดลองทไดพบวำกำรใชสำมเหลยมเดอลำเน 3 มตหลำย ๆ ชน เหมำะส ำหรบเปนโครงสรำงเพอใชในกำรจดเกบคณลกษณะพเศษของภำพ เมอจ ำนวนชนเพมขนกหมำยถงคณลกษณะพเศษของภำพทใชด ำเนนกำรคนคนภำพมเพมขนไปดวย และเมอน ำมำประมวลผลในสภำพแวดลอมแบบกระจำยกจะชวยใหกำรคนคนภำพนนมประสทธภำพมำกขน ในสวนขอผดพลำดของกำรประมวลผลจะน ำเสนอตอไปในบทท 5 ซงประกอบดวยบทสรป อภปรำยผลและขอเสนอแนะ

0

5

10

15

20

0 1 2 3 4 5 6 7 8

เวลำเฉ

ลย (น

ำท)

จ ำนวนเครอง

ภำพจ ำนวน 200,000 ภำพ

แบบเกำ แบบทปรบปรง

55

บทท 5 บทสรป อภปรายผลและขอเสนอแนะ

ส ำหรบบทนกลำวถงผลสรป อภปรำยผลของกำรด ำเนนงำนวทยำนพนธฉบบน รวมไปถงขอเสนอแนะตำง ๆ ทเปนประโยชนตอกำรวจยเรองกำรคนคนภำพบนสภำพแวดลอมแบบกระจำยทด ำเนนกำรรวมกบเทคนคสำมเหลยมเดอลำเนไปประยกตใช หรอน ำไปพฒนำตอ ซงมรำยละเอยดดงตอไปน 5.1 บทสรป งำนวจยนเปนกำรศกษำและออกแบบระบบคนคนภำพแบบกระจำยรวมกบเทคนคสำมเหลยมเดอลำเนทน ำมำใชเปนโครงสรำงพนฐำนเพอจดเกบคณลกษณะพเศษของภำพ โดยมกำรจดเกบและประมวลผลขอมลดวยเทคโนโลยกำรประมวลผลแบบกระจำย เพอใหสำมำรถรองรบกำรเพมขนของขอมลในอนำคต ส ำหรบสรปผลกำรทดลองของงำนวจยนไดแบงออกเปน 2 สวนเชนเดยวกบกำรทดลอง สวนแรกคอสรปผลกำรทดลองกำรจบคภำพโดยใชเทคนคของสำมเหลยมเดอลำเนเพอลดควำมซบซอนในกำรจบเกบคณลกษณะพเศษของภำพ สวนทสองคอกำรประมวลผลแบบกระจำยโดยใชซอฟตแวรเฟรมเวรคของ Hadoop เพอเพมควำมเรวในกำรประมวลผล

ในกำรออกแบบและพฒนำโครงสรำงพนฐำนโดยใชเทคนคสำมเหลยมเดอลำเนนน งำนวจยนไดน ำเสนอกำรจบคภำพดวยเทคนคสำมเหลยมเดอลำเนทมตขนำดตำง ๆ เพอใหไดสภำพแวดลอมทเหมำะสมในกำรจบคภำพและเพอลดควำมซบซอนในกำรจบเกบคณลกษณะพเศษอกทงไวรองรบกำรเพมจ ำนวนของภำพในอนำคต ซงผลกำรเปรยบเทยบกำรจบคภำพระหวำงกำรใชสำมเหลยมเดอลำเนทมตสง ๆ เพยงชนเดยวกบกำรใชสำมเหลยมเดอลำเน 3 มตหลำย ๆ ชนมำเปนโครงสรำงทมลกษณะเปนโครงขำยส ำหรบจดเกบคณลกษณะพเศษพบวำ ผลกำรทดลองของทงสองวธใหผลดและมประสทธภำพในเรองควำมถกตอง 100% ดงตำรำงท 4.5, 4.7 ในบทท 4 แตมควำมแตกตำงกนตรงทเวลำและหนวยควำมจ ำทใชในกำรประมวลผล ซงกำรจบคภำพโดยใชสำมเหลยมเดอลำเนหลำย ๆ ชนนนมประสทธภำพดกวำทงเวลำและหนวยควำมจ ำทใช โดยเมอเปรยบเทยบผลกำรทดลองกำรคนคนภำพของสำมเหลยมเดอลำเน 3 มต 2 ชนกบสำมเหลยม เดอลำเน 6 มตเพยงชนเดยว ทจ ำนวนภำพทงหมด 1,000 ภำพ พบวำเวลำทใชในกำรสรำงสำมเหลยมเดอลำเนลดลง 99.57% สวนเวลำทใชในกำรจบคภำพเพมขน 155.10% เนองจำกในกำรจบคภำพของสำมเหลยมเดอลำเนหลำยชนนนมขนตอนกำรท ำงำนมำกกวำ แตอยำงไรกตำมเวลำทใชในกำร

56

ประมวลผลโดยรวมลดลง 99.13% และหนวยควำมจ ำทใชในกำรประมวลผลโดยรวมลดลง 90.52% ซงไดทดลองเปนจ ำนวน 100 ครง เพอหำคำเฉลยทมควำมถกตองมำกยงขน

ในกำรใชเทคโนโลยประมวลผลแบบกระจำยมำเปนโครงสรำงของระบบในกำรด ำเนนกำรดวยนนไดใชซอฟตแวรเฟรมเวรคของ Hadoop ซงผลกำรประมวลผลแบบกระจำยบนสภำพแวดลอมของ Hadoop งำนวจยนไดน ำเสนอออกแบบกำรประมวลผลแบบกระจำยในสภำพแวดลอมทเหมำะสมส ำหรบน ำไปใชในกำรคนคนภำพ โดยทเมอระบบมหนวยประมวลผลเพมขนท ำใหเวลำทใชในกำรประมวลผลลดลงไปดวย ผลกำรเปรยบเทยบกำรประมวลผลแบบกระจำยระหวำงจ ำนวนเครองทแตกตำงกนและวธกำร MapReduce ทแตกตำงกนนนพบวำ ในสภำพแวดลอมของเครองมอทใชในกำรทดลองนน กำรใชเครองจ ำนวน 8 เครองมำประมวลผลแบบกระจำยมประสทธภำพมำกทสด โดยทขนตอนกำร MapReduce นนตองออกแบบใหมกำรค ำนวณอยในสวนของ Map จนสนสดกระบวนกำรกอนทสงไปใหสวนของ Reduce ท ำงำนตอ ผลลพธทไดกจะมประสทธภำพมำกกวำกำรแบงภำระงำนใหไปค ำนวณในสวนของ Reduce เปนจ ำนวนมำก ๆ

ปญหำทพบในกำรทดลองของงำนวจยนก คอโครงสรำงของระบบทเปนสำมเหลยมเดอลำเนไดถกแยกกำรท ำงำนออกมำ โดยกระจำยไปท ำงำนในแตละโหนด เมอแตละโหนดประมวลผลไดเปนชดขอมลออกมำแลว จะสงชดขอมลดงกลำวไปด ำเนนกำรตอในขนตอนกำร Map แลวจงน ำผลลพธทไดเขำสขนตอนกำร Reduce สำเหตทแยกกำรด ำเนนงำนออกไปยงแตละโหนดนนเนองจำกภำษำทใชในกำรสรำงและประมวลผลบนสำมเหลยมเดอลำเนแตกตำงจำกสวน MapReduce ซงสงผลใหประสทธภำพในกำรประมวลผลแบบกระจำยยงไมดเทำทควร จงควรใชภำษำเดยวกนในกำรเขยนรหสของทงระบบ

จำกผลงำนวจยดงกลำวพบวำ โครงสรำงพนฐำนสำมำรถรองรบกำรเพมขนของขอมลภำพและกำรเพมขนของคณลกษณะพเศษดำนตำง ๆ ไดอกมำกมำย เพอตอบสนองควำมตองกำรของผใชในกำรคนคนภำพ อกทงยงลดควำมซบซอนในกำรจดเกบคณลกษณะพเศษของภำพไดอกโดยใชเทคนคของสำมเหลยมเดอลำเนด ำเนนกำรแจกแจงออกเปนชน ๆ ในสวนของกำรประมวลผลแบบกระจำยนนท ำใหชวยลดเวลำในกำรคนคนภำพของระบบทมขนำดใหญไดอกดวย

5.2 อภปรายผล จำกทไดทบทวนวรรณกรรมของงำนวจยเกยวกบระบบคนคนภำพไปแลวนน งำนวจยหลำยชนไดน ำเสนอเกยวกบคณลกษณะพเศษทเหมำะสมเพอน ำมำอธบำยภำพวำเปนภำพอะไร แตสวนงำนวจยนไดมงเนนไปทขนตอนกำรจบคภำพทเปนขนตอนหนงของระบบคนคน

57

ภำพ ทด ำเนนกำรจบคภำพจำกฐำนขอมลเพอใหไดภำพตรงหรอใกลเคยงกบภำพทตองกำรคนคน โดยน ำคณลกษณะพเศษดำนสของภำพมำเปนตวแทน และใชเทคนคสำมเหลยมเดอลำเนเพอเปนโครงรำงในกำรคนคนภำพ ซงยงไมพบงำนวจยใดทน ำเสนอเทคนคดงกลำวเหมอนกบงำนวจยชนน และนบเปนงำนวจยชนหนงทพรอมรองรบกำรเพมขนของขอมลภำพในอนำคต โดยไดด ำเนนกำรประมวลผลแบบกระจำยทเหมำะสมกบฐำนขอมลขนำดใหญอกดวย 5.3 ขอเสนอแนะ

5.3.1 กำรใชเทคนคสำมเหลยมเดอลำเนมำด ำเนนกำรในสภำพแวดลอมของ Hadoop นน ควรใชภำษำ Java เพอใหสะดวกในกำรประมวลผล เนองจำก Hadoop นนถกเขยนดวยภำษำ Java เปนพนฐำน ท ำใหในขนตอนตำง ๆ ทด ำเนนกำรเกยวกบสำมเหลยมเดอลำเน สำมำรถแบงงำนไปใหหนวยประมวลผลตำง ๆ ชวยด ำเนนกำรเพอลดเวลำไดมำกขน

5.3.2 เทคนคสำมเหลยมเดอลำเนทน ำมำใชควรเพมขนตอนกำรเพมและกำรลบของขอมลทมประสทธภำพใหกบระบบ จงจะไดเปนระบบกำรคนคนภำพทสมบรณ

5.3.3 ขอจ ำกดของเทคนคสำมเหลยมเดอลำเน เมอน ำมำด ำเนนกำรสรำงทจ ำนวนมตสง ๆ และจ ำนวนจดทมำกขน จำกตวอยำงกำรทดลองท 9 มต และ 12 มต ท ำใหใชหนวยควำมจ ำและเวลำในกำรประมวลผลมำก จนบำงครงอำจเกดกำร Swap ของหนวยควำมจ ำ ท ำใหผลกำรทดลองผดพลำดได

5.3.4 ในกำรทดลองของงำนวจยนไดใชแคคณลกษณะพเศษดำนสของภำพมำด ำเนนกำรเพอเปนกรณศกษำกำรท ำงำนบนโครงสรำงพนฐำนของระบบนเทำนน ซงในกำรใชงำนจรงสำมำรถเพมคณลกษณะพเศษดำนอน ๆ ของภำพไดอก เชน รปรำงของภำพ พนผวของภำพ เปนตน เพอใหไดระบบกำรคนคนภำพทมประสทธภำพมำกยงขน

5.3.5 กำรใชซอฟตแวรเฟรมเวรคของ Hadoop มำด ำเนนกำรนน ในสวนของ Hadoop ยงมกำรพฒนำและแกไขขอผดพลำดอย ท ำใหประสทธภำพบำงสวนของระบบขนอยกบรนของซอฟตแวรดวย

58

บรรณานกรม “ Advanced Chroma Key Settings. ” 2016. Medialooks. https: / / www. medialooks. com/

(Accessed July 20, 2016) An, J., S. H. Lee, and N. I. Cho. 2014. “Content-Based Image Retrieval Using Color Features of

Salient Regions. ” In 2014 IEEE International Conference on Image Processing ( ICIP) , 3042–46.

Andaló, F. A., P. A. V. Miranda, R. da S. Torres, and A. X. Falcão. 2010. “Shape Feature Extraction

and Description Based on Tensor Scale.” Pattern Recognition 43 (1): 26–36. Ariyoshi, Y. , J. Kamahara, N. Tanaka, K. Hirayama, T. Nagamatsu, and Y. Teranishi. 2013.

“ Location-Dependent Content-Based Image Retrieval System Based on a P2P Mobile Agent Framework.” In 2013 IEEE International Conference on Pervasive Computing and Communications Workshops (PERCOM Workshops), 72–77.

Arkin, Esther M., Antonio Fernández Anta, Joseph S. B. Mitchell, and Miguel A. Mosteiro. 2015.

“ Probabilistic Bounds on the Length of a Longest Edge in Delaunay Graphs of Random Points in D-Dimensions.” Computational Geometry 48 (2): 134–46.

Avni, U., H. Greenspan, E. Konen, M. Sharon, and J. Goldberger. 2011. “X-Ray Categorization

and Retrieval on the Organ and Pathology Level, Using Patch-Based Visual Words.” IEEE Transactions on Medical Imaging 30 (3): 733–46.

Bebis, G., T. Deaconu, and M. Georgiopoulos. 1999. “Fingerprint Identification Using Delaunay

Triangulation. ” In 1999 International Conference on Information Intelligence and Systems, 1999. Proceedings, 452–59.

59

Chang, F. C. , and H. C. Huang. 2007. “ A Programming Model for Distributed Content-Based Image Retrieval. ” In Third International Conference on Intelligent Information Hiding and Multimedia Signal Processing, 2007. IIHMSP 2007, 1:210–13.

Chen, Y. L., T. W. Chen, and S. Y. Chien. 2009. “Fast Texture Feature Extraction Method Based

on Segmentation for Image Retrieval. ” In 2009 IEEE 13th International Symposium on Consumer Electronics, 941–42.

Choudhary, R. , N. Raina, N. Chaudhary, R. Chauhan, and R. H. Goudar. 2014. “An Integrated

Approach to Content Based Image Retrieval. ” In 2014 International Conference on Advances in Computing, Communications and Informatics (ICACCI), 2404–10.

Cui, Yin, Yongzhou Xiang, Kun Rong, R. Feris, and L. Cao. 2014. “A Spatial-Color Layout Feature

for Representing Galaxy Images. ” In IEEE Winter Conference on Applications of Computer Vision, 213–19.

Dang, Q. B. , M. Rusiñol, M. Coustaty, M. M. Luqman, C. D. Tran, and J. M. Ogier. 2016.

“ Delaunay Triangulation-Based Features for Camera-Based Document Image Retrieval System.” In 2016 12th IAPR Workshop on Document Analysis Systems (DAS), 1–6.

“ Delaunay_1. pdf. ” 2016. http: / / graphics. stanford. edu/ courses/ cs368- 06-

spring/handouts/Delaunay_1.pdf. (Accessed July 4, 2016) Douik, A., M. Abdellaoui, and L. Kabbai. 2016a. “Content Based Image Retrieval Using Local and

Global Features Descriptor. ” In 2016 2nd International Conference on Advanced Technologies for Signal and Image Processing (ATSIP), 151–54.

Cheng Dey Shewchuk. “Delaunay Mesh Generation.” 2012. CRC Press.

60

“ EE381K- 14 Multidimensional DSP - Spring 2008 Projects. ” 2016. Accessed July 4. http://users.ece.utexas.edu/~bevans/courses/ee381k/projects/spring08/.

Espinoza-Molina, D., and M. Datcu. 2013. “Earth-Observation Image Retrieval Based on Content,

Semantics, and Metadata.” IEEE Transactions on Geoscience and Remote Sensing 51 (11): 5145–59.

“ IAPR TC-12 Benchmark | ImageCLEF / LifeCLEF - Multimedia Retrieval in CLEF. ” 2016.

http://imageclef.org/photodata. (Accessed July 4,2016) Jianming, Sun, and Li Junling. 2012. “ The Star Database Built on Delaunay Triangulation. ” In

2012 International Conference on Measurement, Information and Control (MIC), 1:322–26.

Lee, D. Y. , and S. S. Lam. 2008. “ Efficient and Accurate Protocols for Distributed Delaunay

Triangulation under Churn. ” In IEEE International Conference on Network Protocols, 2008. ICNP 2008, 124–36.

Liu, Ning, Yilong Yin, and Hongwei Zhang. 2005. “A Fingerprint Matching Algorithm Based On

Delaunay Triangulation Net. ” In The Fifth International Conference on Computer and Information Technology (CIT’05), 591–95.

Mistry, Y., D. T. Ingole, and M. D. Ingole. 2016. “Efficient Content Based Image Retrieval Using

Transform and Spatial Feature Level Fusion. ” In 2016 2nd International Conference on Control, Automation and Robotics (ICCAR), 299–303.

“ Qhull Code for Convex Hull, Delaunay Triangulation, Voronoi Diagram, and Halfspace

Intersection about a Point.” 2016. http://www.qhull.org/. (Accessed July 4, 2015)

61

Quynh, Nguyen Huu, Ngo Quoc Tao, and Ngo Truong Giang. 2008. “ An Efficient Method for Content Based Image Retrieval Using Histogram Graph. ” In 10th International Conference on Control, Automation, Robotics and Vision, 2008. ICARCV 2008, 874–78.

“ Scale- Invariant Feature Transform. ” 2016. Wikipedia, the Free Encyclopedia.

https://en.wikipedia.org/w/index.php?title=Scale-invariant_feature_transform Shores, Roger W. , and Edward J. Wegman. 2010a. “Bounds on Delaunay Tessellations. ” Wiley

Interdisciplinary Reviews: Computational Statistics 2 (5): 571–80. Song, J. , and Z. He. 2015. “ Content Based Image Retrieval by IPP Algorithm. ” In 2015 IEEE

International Conference on Computational Intelligence and Virtual Environments for Measurement Systems and Applications (CIVEMSA), 1–4.

Taewon Yoo, Sunghee Choi, Hyonik Lee, and Jinwon Lee. 2005. “ Distributed Kinetic Delaunay

Triangulation.” 32 (2): 964–66. “The COREL Database for Content Based Image Retrieval - Dct-Research.” 2016. Accessed July

4. https://sites.google.com/site/dctresearch/Home/content-based-image-retrieval. Wang, Chengfeng, M. Gavrilova, Yuan Luo, and J. Rokne. 2006. “ An Efficient Algorithm for

Fingerprint Matching. ” In 18th International Conference on Pattern Recognition (ICPR’06), 1:1034–37.

Wang, Z., K. Jia, and P. Liu. 2008. “A Novel Image Retrieval Algorithm Based on ROI by Using

SIFT Feature Matching. ” In International Conference on MultiMedia and Information Technology, 2008. MMIT ’08, 338–41.

Wangming, X., W. Jin, L. Xinhai, Z. Lei, and S. Gang. 2008. “Application of Image SIFT Features

to the Context of CBIR. ” In 2008 International Conference on Computer Science and

62

Software Engineering, 4:552–55. White, Tom. 2016. “Hadoop: The Definitive Guide”. 2nd Edition. O'Reilly Media. Yahoo Press. Yang, Wencheng, J. Hu, and M. Stojmenovic. 2012. “NDTC: A Novel Topology-Based Fingerprint

Matching Algorithm Using N-Layer Delaunay Triangulation Net Check. ” In 2012 7th IEEE Conference on Industrial Electronics and Applications (ICIEA), 866–70.

Zhang, J., X. Liu, J. Luo, and B. Lang. 2010. “DIRS: Distributed Image Retrieval System Based

on MapReduce. ” In 2010 5th International Conference on Pervasive Computing and Applications (ICPCA), 93–98.

นฐพงศ สงเนยม. 2016. “http://www.siam2dev.com, นกพฒนาโปรแกรม , เขยนโปรแกรม ,

อ เ ล ร น น ง , Vb. net, Java, C#, Php. ” http: / / www. siam2dev. com/ siam2dev_PL. php. (สบคนเมอ 20 กรกฎาคม 2554)

สาธต แสงประดษฐ. 2546. “การสบคนภาพเครองหมายการคาโดยใชเทคนคการสบคนขอมลภาพ

ตามลกษณะรปราง.” สถาบนเทคโนโลยพระจอมเกลาพระนครเหนอ. สนนท ตนทชน. 2550. “การระบตวบคคลดวยลายนวมอโดยใชวธการสามเหลยม Delaunay.”

สถาบนเทคโนโลยพระจอมเกลาเจาคณทหารลาดกระบง. สดใส ดลยา. 2550. “ เทคโนโลยการประมวลผลแบบกระจาย ( Distributed Computing) .”

http://www.vcharkarn.com/varticle/32730. (สบคนเมอ 20 มถนายน 2556)

63

ภาคผนวก

64

ภาคผนวก ก

บทความทางวชาการ

Image matching with multi medium Delaunay triangulation

Natthapol Kaewpontong* and Somchai Limsiroratana

Department of Computer Engineering, Faculty of Engineering,

Prince of Songkla University, Songkhla, 90110, Thailand.

*Corresponding author. Tel.: +66-86966-6362; Email address: [email protected]

Abstract

The Delaunay triangulation is well-known in the field of computational geometry, holography,

networking and fingerprint matching. In our case, a matching image from the image database

is proposed by using the Delaunay triangulation, which has the ability to perform

multidimensional in matching. To prevent problems on the complexity of the dimensions, we

proposed a method for the Delaunay triangulation matching with several medium dimensions

from all feature vectors. Then, apply to match all the image’s databases. In this paper, we use

the color histogram as a representation of multidimensional feature vectors to test the matching

in several environments and illustrate the main issues. The results in matching accuracy are

satisfactory.

Keywords: Delaunay triangulation, Image matching, Multidimensional, Image processing.

1. Introduction

The Delaunay triangulation approach has been interested in various areas of research, such

as computational geometry, network topology especially in images matching. The image

matching is mainly applied in biometrics whether face recognition, iris synthesis, hand

geometry detection, fingerprint detection, and signature recognition most of which as one-to-

one matching [ 1- 2] . And also for a variety of advancement of digital image technological

evolutions, such as image retrieval [3].

The Delaunay triangulation brings dimension challenges and advantages, it is ideal to be

used in images matching. Since adding up feature vectors, which makes the result even more

2

effective. While dimension increases, the several facets and ridges in a convex hull grow rapidly

for the identical number of vertices, including time and memory requirements.

This paper attempts to propose the construction the multiple of medium dimensional

Delaunay triangulation that extends to higher dimensions for the structure of image feature

vectors. For the present the ability of this method, we use the color histogram, which is well

known to extract color features of images for a representation of multidimensional feature

vectors.

2. Materials and methods

2.1 Delaunay triangulation

The Delaunay triangulation (DT) introduced by Boris Nikolaevich Delaunay in 1934, is

characterized by the empty circum disk property, it is no point in set P lies in the interior of

any triangle circumscribing disk. Each scattered points of the triangle are vertex and the

segment connecting the two vertices is an edge of a DT. Each triangle of the DT of a set of

vertices in multidimensional spaces corresponds to a facet. The circumcircle of each Delaunay

triangle does not contain any other vertex in the plane, which is a special characteristic for

constructing a DT. Incidentally, property maximizes the minimum angle. Among the triangular

the smallest angle in the DT is at least as large as the smallest angle in any other [4] , as shown

in figure 1.

Figure 1. Left is scattered points, the center is Delaunay triangulate and right is circumcircle.

The DT has a good simple structure, minimal data redundancy, and high storage efficiency.

These properties ensure that are stable and the accurate geometric relationship of the vertices

extracted could be constructed in triangles, even when the amount and position of vertex varies.

3

2.2 Multidimensional Delaunay triangulation

The Qhull library is an extensively used high- dimensional convex hulls and Delaunay

implementation [5] . These structures have applications in science, engineering, mathematics,

and statistics. It can approximate a convex hull and construct the DT by all vertices are within

roundoff error of a paraboloid and triangulated output should produce good results. The Qhull

library is used to construct for illustrating the dimensions and limit the ability of the DT. Firstly,

extract the color histogram of each channel of RGB image. Secondly, determine to each vertex

on the DT is the vector from the feature extraction. Thirdly, construct a DT by bringing the

feature vectors of all images in the database. The last step is matching (See also 2.4). The results

show that, when the number of dimensions increases, the factors, memory and time of the

execution are exponentially increased as shown in figure 2.

Figure 2. Comparison constructing multidimensional Delaunay triangulation (64 images).

In the dimension refers to the characteristics of DT. Each dimension represents the histogram

RGB color space extracted from images, such as DT 3-D. Each vertex is (R,G,B). It demonstrates

the effectiveness of high-dimensional DT construction. It brings to the method which we are

present.

2.3 Multi medium Delaunay triangulation

To reduce the limitation of multidimensional DT as described, we propose the multiple of

medium dimensional DT (MMDT) for image matching. The MMDT is constructed by dividing

4

features (the values of the color histogram) into small groups for the construction of medium

dimensions DT as shown in figure 3.

Figure 3. Multi medium Delaunay triangulation process.

2.4 Multi medium Delaunay triangulation matching algorithm

After generating MMDT, the matching process is a scoring and sorting the best matched as

described follow. The matching method is carried out by four steps.

The first step is finding the nearest vertex in all MMDT, it is a function that identifies the

nearest point on each DT to the feature vectors of a query image. The result is the facet, nearest

neighbor vertices to a vertex. Repeat all of the DT constructed with query feature vector image

of each DT.

The second step is to compute each nearest MMDT Euclidean distance, the result

representing the distance of vertex (query image vector) and vertices of facet from step 1.

The third step is summary distance all vertices in step 2. And the last step, sorting distance

and show results, when it is nearest to zero, that image is the best matched.

3. Results

Experiments for performance evaluation of the proposed method are run on the Intel®

Core™ [email protected], RAM 8GB. The test images in the database are from the Corel Image

Gallery [6] consists of randomly selected 1,000 images from all categories. The sample images

are shown in figure 4. The test query images also are randomly selected 100 images from the

database.

5

Figure 4. Typical images from the test database.

In our experiments, MMDT is constructed. Firstly the feature was extracted three 256-bin

color histogram from each image in the RGB color space. Secondly, MMDT were constructed

by the proposed method in section 2.3. So, MMDT is a three-dimensional DT as color histogram

are red, green and blue of 1000 images in a database according to the bin. For each test query

image was extracted feature by three color histogram matching by the proposed method in

section 2.4. The number of DT that tests are the bin of color histogram extracted.

To evaluate the overall performance of the proposed image matching, a number of

experiments were performed on various size of MMDT. The average results of memory and

time usage over 100 test query images matching is shown in figure 5.

Figure 5. The cost of the construct and matching execution.

6

From above experiments, we have presented an image matching MMDT of different sizes.

In all experiments, the results are always accurate. But there are significantly difference in terms

of memory and time spent in the operation will vary depending on the number of MMDT used.

4. Discussion

We have presented such a way as to match the image. The results have shown that the time

to perform is satisfied, but the constructing still requires a lot of memory in higher dimensions.

Our proposed method can be applied to increase the number of dimensions.

5. Conclusions

In this paper, we proposed an image matching method that is called the MMDT. This method

has proposed the reduction of dimensions of the DT by multiple medium dimensions DT. The

experiments were conducted using a color histogram which is well-known to perform feature

extraction images to construct MMDT for matching. In all experiments, the results are shown

that our method can reduce memory and time and can construct higher dimensions. However,

significant differences in terms of memory and time spent in the operation will vary depending

on the number of MMDT used.

6. Acknowledgements

The work described in this paper is a part of the thesis was supported by the Graduate

Engineering Scholarship, Prince of Songkla University, Thailand.

7. References

[1] Wang C, Gavrilova ML. Delaunay Triangulation Algorithm for Fingerprint Matching. In:

3rd International Symposium on Voronoi Diagrams in Science and Engineering, 2006

ISVD ’06. 2006. p. 208–16.

7

[2] Yang W, Hu J, Stojmenovic M. NDTC: A novel topology- based fingerprint matching

algorithm using N-layer Delaunay triangulation net check. In: 2012 7th IEEE Conference

on Industrial Electronics and Applications (ICIEA). 2012. p. 866–70.

[3] Quynh NH, Tao NQ, Giang NT. An efficient method for content based image retrieval

using histogram graph. In: 10th International Conference on Control, Automation, Robotics

and Vision, 2008 ICARCV 2008. 2008. p. 874–8.

[4] Cheng S-W, Dey TK, Shewchuk J. Delaunay Mesh Generation. CRC Press; 2012. 412 p.

[5] Qhull code for Convex Hull, Delaunay Triangulation, Voronoi Diagram, and Halfspace

Intersection about a Point [ Internet] . [ cited 2015 Oct 10] . Available from:

http://www.qhull.org/

[6] The COREL Database for Content based Image Retrieval - dct-research [Internet] . [cited

2015 Nov 10]. Available from: https://sites.google.com/site/dctresearch/Home/content-based-

image-retrieval

72

ประวตผเขยน

ชอ สกล นายณฐพล แกวปนทอง รหสประจ ำตวนกศกษำ 5410120070 วฒกำรศกษำ วฒ ชอสถำบน ปทส ำเรจกำรศกษำ วทยาศาสตรบณฑต มหาวทยาลยสงขลานครนทร 2551 (วทยาการคอมพวเตอร) ทนกำรศกษำ ทนบณฑตศกษาวศวกรรมศาสตร คณะวศวกรรมศาสตร มหาวทยาลยสงขลานครนทร ทนอดหนนการวจยเพอวทยานพนธ คณะวศวกรรมศาสตร มหาวทยาลยสงขลานครนทร กำรตพมพเผยแพรผลงำน Natthapol Kaewpontong and Somchai Limsiroratana. 2016. “Image Matching with multi medium Delaunay triangulation.” KKU ENGINEERING JOURNAL 43 (3).