21
วารสารบริหารธุรกิจเทคโนโลยีมหานคร MUT Journal of Business Administration ปีที 12 ฉบับที 1 (มกราคม - มิถุนายน 2558) Volume 12 Number 1 (January – June 2015) การวิเคราะห์ประสิทธิภาพของอัลกอริทึมเนมแมทชิงสําหรับระบบสืบค้น ข้อมูลท่องเทียว โดยใช้ F-Measure Performance Analysis of Name Matching Algorithm for Tourist Information Searching System Using F-Measure จักรกฤษณ์ เสน่ห์ นมะหุต Chakkrit Snae Namahoot 1, * 1 Ph.D., ผู้ช่วยศาสตราจารย์ ภาควิชาวิทยาการคอมพิวเตอร์และเทคโนโลยีสารสนเทศ คณะวิทยาศาสตร์ มหาวิทยาลัยนเรศวร จังหวัดพิษณุโลก ประเทศไทย 1 Ph.D., Assistant Professor, Department of Computer Science and Information Technology, Faculty of Science Naresuan University, Phitsanulok Province, Thailand บทคัดย่อ เมื อนักท่องเที ยวต้องการสืบค้นข้อมูลท่องเที ยวส่วนมากจะทําการสืบค้นผ่านเสิร์ชเอนจินที ได้รับความนิยมอย่างกูเกิ ล แต่ผลลัพธ์ที ได้นันมีจํานวนมากอาจต้องเสียเวลาในการเข้าถึงข้อมูลจาก หลายเว็บไซต์และผลลัพธ์ที ได้อาจไม่ตรงกับความต้องการ อีกทังในบางเว็บไซต์นําเสนอข้อมูลบน เว็บไซต์ที อาจมีการเขียนไม่ถูกต้องตามหลักภาษาอังกฤษก็จะทําให้ได้ผลของการสืบค้นไม่พบเว็บไซต์ ที เขียนไม่ถูกต้อง ดังนันผู้วิจัยจึงได้ประยุกต์ใช้อัลกอริทึมเนมแมชชิงมาใช้ในระบบสืบค้นข้อมูล ท่องเที ยวเพื อแก้ป ญหาในการกรองข้อมูลชื อที สามารถเขียนได้หลายรูปแบบหรือมีความคล้ายคลึงกัน ทังคําพ้องรูป พ้องเสียง หรือสะกดผิดในภาษาอังกฤษ ทําให้ข้อมูลท่องเที ยว เช่น ชื อของสถานที หรือ ชื อของจังหวัด ที เขียนผิดถูกค้นพบ อีกทังยังได้ทําการวัดประสิทธิภาพของอัลกอริทึมเนมแมชชิง โดย ใช้ F-Measure ซึ งจากผลการวิจัยพบว่า อัลกอริทึม Soudex มีประสิทธิภาพดีที สุดในการสืบค้นข้อมูล ท่องเที ยวที สามารถช่วยในการแก้ไขป ญหาการพิมพ์ผิดหรือไม่ถูกหลักภาษาอังกฤษซึ งจะทําให้ไม่ พลาดข้อมูลที ต้องการ คําสําคัญ: การสืบค้นข้อมูล, ข้อมูลท่องเที ยว, ระบบสืบค้นข้อมูล, อัลกอริทึมเนมแมทชิง, การวัด ประสิทธิภาพ, รหัสเสียง * E-mail address: [email protected]

ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

วารสารบรหารธรกจเทคโนโลยมหานคร MUT Journal of Business Administration

ปท� 12 ฉบบท� 1 (มกราคม - มถนายน 2558)

Volume 12 Number 1 (January – June 2015)

การวเคราะหประสทธภาพของอลกอรทมเนมแมทช�งสาหรบระบบสบคนขอมลทองเท�ยว โดยใช F-Measure

Performance Analysis of Name Matching Algorithm for Tourist

Information Searching System Using F-Measure

จกรกฤษณ เสนห นมะหต Chakkrit Snae Namahoot 1,*

1 Ph.D., ผชวยศาสตราจารย ภาควชาวทยาการคอมพวเตอรและเทคโนโลยสารสนเทศ คณะวทยาศาสตร มหาวทยาลยนเรศวร จงหวดพษณโลก ประเทศไทย

1 Ph.D., Assistant Professor, Department of Computer Science and Information Technology, Faculty of Science Naresuan University, Phitsanulok Province, Thailand

บทคดยอ เม�อนกทองเท�ยวตองการสบคนขอมลทองเท�ยวสวนมากจะทาการสบคนผานเสรชเอนจนท�ไดรบความนยมอยางกเก�ล แตผลลพธท�ไดน �นมจานวนมากอาจตองเสยเวลาในการเขาถงขอมลจากหลายเวบไซตและผลลพธท�ไดอาจไมตรงกบความตองการ อกท �งในบางเวบไซตนาเสนอขอมลบนเวบไซตท�อาจมการเขยนไมถกตองตามหลกภาษาองกฤษกจะทาใหไดผลของการสบคนไมพบเวบไซตท�เขยนไมถกตอง ดงน �นผวจ ยจงไดประยกตใชอลกอรทมเนมแมชช�งมาใชในระบบสบคนขอมลทองเท�ยวเพ�อแกปญหาในการกรองขอมลช�อท�สามารถเขยนไดหลายรปแบบหรอมความคลายคลงกน ท �งคาพองรป พองเสยง หรอสะกดผดในภาษาองกฤษ ทาใหขอมลทองเท�ยว เชน ช�อของสถานท� หรอ ช�อของจงหวด ท�เขยนผดถกคนพบ อกท �งยงไดทาการวดประสทธภาพของอลกอรทมเนมแมชช�ง โดยใช F-Measure ซ�งจากผลการวจยพบวา อลกอรทม Soudex มประสทธภาพดท�สดในการสบคนขอมลทองเท�ยวท�สามารถชวยในการแกไขปญหาการพมพผดหรอไมถกหลกภาษาองกฤษซ�งจะทาใหไมพลาดขอมลท�ตองการ

คาสาคญ: การสบคนขอมล, ขอมลทองเท�ยว, ระบบสบคนขอมล, อลกอรทมเนมแมทช�ง, การวด

ประสทธภาพ, รหสเสยง

* E-mail address: [email protected]

Page 2: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

2

จกรกฤษณ เสนห นมะหต

การวเคราะหประสทธภาพของอลกอรทมเนมแมทช�งสาหรบระบบสบคนขอมลทองเท�ยว

โดยใช F-Measure

ABSTRACT

To extract tourism information, most travelers rely on web search engines such as

Google, so they are faced with a huge number of web pages as results. Consequently, they apply a time consuming process accessing many websites but might still not get what they need. Moreover, if keywords or website contents are misspelled in English or other languages, the search results will consist of incomplete or incorrect information. To deal with these problems, name matching algorithms are used to make connections between several similar forms in English words, such as homographs and misspellings. This helps discover mistakes in tourist in- formation, such as names of locations and administrative entities. In order to measure the performance of the name matching algorithms, F-Measure is used. The results show that the Soundex algorithm has the best performance in tourist information searching and can solve misspellings of information with names in English language effectively and will not miss any important tourist information.

Keywords: Information Retrieval, Tourist Information, Information Searching System, Name

Matching Algorithm, Performance Measurement, Sound Code

บทนา

การทองเท�ยวถอเปนอตสาหกรรมบรการท�ทาใหประเทศมรายไดเพ�มข�นและยงมบทบาทตอการพฒนาเศรษฐกจของชาตอกดวย ท �งน�ในปจจบนพบวามขอมลทองเท�ยวเปนจานวนมากท�ถกนาเสนอบนอนเทอรเนตและมรปแบบการนาเสนอท�แตกตางกนออกไป เชน รปแบบขอความ รปแบบมลตมเดย เปนตน ดงน �นในการคนหาขอมลทองเท�ยวเพ�อใหไดตรงกบความตองการของนกทองเท�ยวจงมความสาคญตอนกทองเท�ยวเปนอยางมาก โดยเฉพาะการปอนคาคนหาท�บางคร �งมการเขยนผดโดยไมต �งใจหรอการเขยนหรอสะกดคาไมถกตองตามหลกภาษาไทยหรอภาษาองกฤษ (Snae et al., 2007) หรอมการใชคาคนหาท�เปนช�อเรยกอ�นๆ ของสถานท�น �นๆ เชน วดใหญ หมายถง วดพระศรรตนมหาธาตวรมหาวหาร สองแคว หมายถง จงหวดพษณโลก เปนตน ซ�งทาใหไดผลลพธไมตรงกบความตองการปะปนกนอย

การคนหาขอมลทองเท�ยวอาจมาจากหลายๆ แหลง เชน ส�อส�งพมพ แผนพบ อนเทอรเนต บางคร �งมการใชคาคนหาท�เปนช�อเรยกอ�นๆ ท�ใชเรยกกนมาต �งแตสมยโบราณของสถานท�น �นๆ แตช�อเหลาน�หมายถงสถานท�เดยวกน โดยมช�อเรยกท�หลากหลายตามวฒนธรรม พ�นเพ ภมลาเนา ลกษณะภมประเทศ เชน วดใหญ หมายถง วดพระศรรตนมหาธาตวรมหาวหาร เมองสองแคว เมองอกแตก

Page 3: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

3

ปท� 12 ฉบบท� 1 (มกราคม - มถนายน 2558)

วารสารบรหารธรกจเทคโนโลยมหานคร

เมองพทธชนราช หมายถง จงหวดพษณโลก บางคร �งการคนหาอาจจาเปนตองใชสวนประกอบอ�นๆ เชน คาขวญ ดอกไม ตนไม สญลกษณ ประจาจงหวดน �นๆ ทาใหเกดการคนหาขอมลท�พลาดไป (นฤพนธ และ จกรกฤษณ, 2554) หรอ บางคร �งในการคนหาขอมลทองเท�ยวเก�ยวกบจงหวดน �นๆ สถานท�ทองเท�ยว อาจมการใชคาคนหาท�มการเขยนผดหรอไมถกตองตามหลกภาษาไทยและภาษาองกฤษซ�งคาเหลาน �นปรากฏอยมากมายในเวบไซตทองเท�ยว เชน คนหาขอมลทองเท�ยวในจงหวดพษณโลก (Phitsanulok) แตพบวาบางเวบไซตใชคาวา “พจสะนโลก” หรอ “พษนโลก” หรอ “พดโลก” หรอ “พดสะ ณโลก” เปนการเขยนช�อจงหวดพษณโลกไมถกตองตามหลกภาษาไทย นอกจากน�พบวาบางเวบไซต ใชคาวา “Phisanulok” หรอ “pitsanulok” หรอ “pisanulok” หรอ “phitsanurok” มการเขยนช�อจงหวดพษณโลกไมถกตองตามหลกภาษาองกฤษ (Snae and Brückner, 2007) โดยช�อท�มการสะกดผดหรอเขยนผดน �นกยอมสามารถกอใหเกดปญหาในการคนหาสถานท�ทองเท�ยวได ซ�งถาการบนทกช�อท�สะกดผดหรอการเขยนท�แตกตางกน แมเพยงเลกนอยจะสามารถนาไปสความผดพลาดในการระบสถานท�ทองเท�ยวเน�องจากช�อท�เขยนแตกตางกนสองช�อน �นอาจบงช�ถงสถานท�เดยวกนกเปนได โดย Snae and Brückner (2006) ไดแบงความคลาดเคล�อนท�อาจเกดข�นจากการคนหาช�อท�สามารถออกเสยงและการสะกดท�แตกตางกนได 3 ประเภท ดงตอไปน�

1. ความคลาดเคล�อนจากรปแบบตวอกษร ปญหาน�เกดจากการใชคาขยายความและการ

ยอ, เคร�องหมายวรรคตอน, การเวนวรรค, ตวพมพใหญ

2. ความคลาดเคล�อนจากรปแบบการสะกดคา ความคลาดเคล�อนน�จะข�นอยกบการ

สนนษฐานท�มาและช�อเปาหมายท�มความแตกตางกนเน�องจากความผดพลาดในการคดลอกเชนการออกเสยงท�ตางออกไปรวมถงการสะกดคาผดและการพมพผด ส�งคลาดเคล�อนเหลาน�แมจะไมไดสงผลถงการออกเสยงแตกกอใหเกดปญหาในการจบคของช�อได

3. ความคลาดเคล�อนจากรปแบบการออกเสยง ความคลาดเคล�อนจากการออกเสยงเกด

จากการท�โครงสรางของช�อถกเปล�ยนแปลงไปดวยการออกเสยงเชนการสะกดคาวา “Pooh” ในภาษา องกฤษแตในภาษาเยอรมนจะสะกดเปน “Phu” แทน ซ�งการออกเสยงท�เปล�ยนแปลงไปน�อาจเกดจากการไดยนผดจงทาใหโครงสรางของช�อมการเปล�ยนแปลงไป เชน คาวา “อยธยา” และ “อโยธยา” เปนช�อท�เก�ยวของกนแตมการออกเสยงแตกตางกนเปนอยางมาก ซ�งจรงๆ แลวรปแบบการออกเสยงของช�อน �นสามารถแสดงไดหลายรปแบบ เชน อาจแสดงเปน “พษณโลก” หรออกแบบท�ไดถกยอใหส �นเปน “พดโลก” หรอ “ราชบร” เปน “ราดร” เปนตน

ในงานวจยน�ไดทาการวเคราะหประสทธภาพของอลกอรทมเนมแมทช�งท�อยในกลมท�มการ

เปล�ยนช�อเปนรหสเสยง ไดแก Soundex, Soundex2, Phonex, Metaphone, Simplex และ NYSIIS มาทาการทดสอบกบฐานขอมลช�อจงหวดในประเทศไทยจากท�ไดจากการสบคนขอมลจากกเก�ล เพ�อนามาใชในการแกปญหาช�อท�มการเขยนผดหรอไมถกตองตามหลกภาษาองกฤษ เชน ความคลายคลงกนของตวสะกดท�สามารถเขยนแทนกนได และคาพองรป พองเสยง ทาใหขอมลทองเท�ยวท�เขยนผดสามารถถกคนพบไดในกเก�ล อกท �งยงสามารถนาเอาอลกอรทมเนมแมทช�งท�มประสทธภาพดท�สดมา

Page 4: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

4

จกรกฤษณ เสนห นมะหต

การวเคราะหประสทธภาพของอลกอรทมเนมแมทช�งสาหรบระบบสบคนขอมลทองเท�ยว

โดยใช F-Measure

ทาการแกปญหากบขอมลทองเท�ยวท�มการเขยนผดในภาษาองกฤษท�มอยมากมายในเวบไซตทองเท�ยวตางๆ เพ�อท�จะสามารถเพ�มประสทธภาพของ ระบบสบคนขอมลทองเท�ยวไดอกดวย

วตถประสงคของการวจย 1. เพ�อวเคราะหประสทธภาพของอลกอรทมเนมแมชช�งตางๆ ท�นามาใชในระบบสบคนขอมล

ทองเท�ยว เพ�อนามาแกปญหาคาท�มความหลากหลายและเขยนผดหรอไมถกตองตามหลกภาษา องกฤษ ดวยหลกการ F-Measure

2. เพ�อประยกตใชอลกอรทมท�มประสทธภาพท�ดท�สดท�ไดจากขอท� 1 มาทาการออกแบบและพฒนาระบบสบคนขอมลทองเท�ยวท�สามารถตอบสนองความตองการในการคนหาอยางมประสทธภาพ

ประโยชนของการวจย

1. ไดอลกอรทมเนมแมชช�งท�มประสทธภาพดท�สดในการสบคนขอมลท�สามารถชวยในการแกไขปญหาการพมพผดหรอไมถกหลกภาษาองกฤษซ�งจะทาใหไมพลาดขอมลท�ตองการและสามารถทางานผานเวบแอพลเคชนได

2. ไดระบบสบคนขอมลทองเท�ยวดวยเนมแมชช�งท�มประสทธภาพท�สามารถชวยอานวยความสะดวกตอนกทองเท�ยว อกท �งยงชวยสงเสรมและพฒนาตลาดการทองเท�ยวและการบรการใหเพ�มมากข�น

3. ไดระบบคนหาขอมลทองเท�ยวท�มประสทธภาพท�สามารถชวย 3.1 เพ�มการสงเสรมและพฒนาตลาดการทองเท�ยวและการบรการ 3.2 ลดคาใชจายในการแสวงหาขอมลท�ถกตอง และครบถวนของผใชบรการ 3.3 ชวยกระตนการทองเท�ยวไดมากข�น อกท �งยงเปนการเพ�มยอดคาบรการตางๆ ดวย

การทบทวนวรรณกรรม

การใชอนเทอรเนตเพ�อการสบคนขอมลไดรบความนยมอยางแพรหลาย เน�องจากถอไดวาเปนคลงขอมลท�ใหญ โดยเฉพาะขอมลทางดานการทองเท�ยวท�มความสาคญตอนกทองเท�ยวเปนอยางมาก โดยมงานวจยท�ไดนาเทคโนโลยและแนวคดตางๆ มาชวยนาเสนอขอมลดานการทองเท�ยวใหมประสทธภาพ ซ�งในปจจบนมเวบแนะนาการทองเท�ยวและเวบท�ใหขอมลการทองเท�ยวอยางมากมาย เชน Web Application สาหรบใหบรการขอมลแหลงเท�ยวเท�ยว ท�พก รานคา แผนท� และวางแผนการทองเท�ยวแกนกทองเท�ยวหรอผท�สนใจจะทองเท�ยวยงสถานท�ตางๆ ซ�งสาหรบการบรการสบคนขอมลทองเท�ยว แผนท�ของสถานท�ทองเท�ยวถอวาเปนขอมลทองเท�ยวท�มความสาคญมากในการนาไปใชแสดงผลการสบคนของระบบการใหบรการขอมลทองเท�ยว โดยสวนใหญจะอยในรปแบบระบบ

Page 5: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

5

ปท� 12 ฉบบท� 1 (มกราคม - มถนายน 2558)

วารสารบรหารธรกจเทคโนโลยมหานคร

สารสนเทศภมศาสตร (Geographic Information System: GIS) ซ�งจะเหนไดจากงานวจยของ สรางครตน และ จกรกฤษณ (2554) ไดนาเสนอระบบบรหารการจดการขอมลและเช�อมโยงเสนทางแหลงทอง เท�ยวในรปแบบอนเมชน (Animation) เพ�อดงดดนกทองเท�ยว ซ�งใชแผนท�ระบบสารสนเทศภมศาสตรในการเช�อมโยงเสนทางการเดนทางไปแหลงทองเท�ยวและสถานท�ใหบรการตางๆ ภายในเขตภาคเหนอ ประกอบดวย จงหวดพษณโลก สโขทย เพชรบรณ และอตรดตถ โดยใช Google Map ในการนาเสนอแผนท�เช�อมโยงเสนทางแหลงทองเท�ยวรวมท �งเสนอแหลงทองเท�ยวท�ใกลเคยงเพ�อดงดดความสนใจของนกทองเท�ยว ผลการทางานทาใหวางแผนการเดนทางไดหลายทางเลอกตามความตองการ สะดวก รวดเรว และยงใชเปนตนแบบสาหรบภมภาคอ�นๆ ไดอกดวย ขอดของระบบน�คอมความยดหยนในการคนหาขอมลเน�องจากการใชแผนท�จากกเก�ล แตอยางไรกตามงานวจยน�ไมรองรบการสบคนของขอมลทองเท�ยวท�อาจมการเขยนผดหรอมรปแบบการเขยนหรอเรยกท�หลากหลาย ซ�งตอมา Brückner et al. (2008) ไดออกแบบระบบ ONTO-GIS โดยนา Canonical Name Matching Algorithm มาชวยในการแกปญหาสาหรบคนหาช�อสถานท�ในแผนท�ระบบสารสนเทศทางภมศาสตรท�สามารถเขยนไดหลากหลายรปแบบหรอคาท�พองรป พองเสยง และใชหลกการออนโทโลจเพ�อสนบสนนการคนหาในภาษาไทย ภาษาองกฤษ และภาษาญ�ปน แลวใช Google Map มาชวยแสดงแผนท�

Park et al. (2009) ไดนาหลกการออนโทโลจมาใชในการออกแบบระบบขอมลนกทองเท�ยวอยางชาญฉลาด เน�องจากความกาวหนาของระบบเครอขายอนเทอรเนตทาใหมผใชผานเวบและมอถอเพ�มมากข�น โดยโดเมนออนโทโลจประกอบไปดวยแนวคดสาหรบศนยบรการนกทองเท�ยว สถานท�ทองเท�ยวและออนโทโลจท�ใชในระบบ ซ�งระบบประกอบไปดวยระบบศนยบรการนกทองเท�ยวท�เกบออนโทโลจและฐานขอมลแลวใชการเช�อมตอเชงความหมายระหวางออนโทโลจกบฐานขอมล ระบบบรการแผนท�การจราจรแบบใหขอมลแบบทนท ระบบจดการขอมลนกทองเท�ยว ซ�งมการตดตอกบผใชแบบเมนกราฟกท�สามารถใชท �งเครอขายมสายและไรสายได รวมถงโทรศพทมอถอและ PDA อกท �งยงใช RFID ในการบรการขอมลแหลงทองเท�ยวใหกบนกทองเท�ยวอกดวย แตยงพบวาระบบน�ไมรองรบการคนหาสถานท�ทองเท�ยวตางๆ และไมมระบบวางแผนและแนะนาการทองเท�ยว ซ�งเปนเพยงศนยบรการขอมลนกทองเท�ยวเทาน �น ทาใหไมครอบคลมความตองการของนกทองเท�ยวไดท �งหมด ซ�งระบบบรการวางแผนการทองเท�ยวน �นถอวาเปนเคร�องชวยอานวยความสะดวก ทาใหนกทองเท�ยวสามารถลดเวลาการสบคนขอมลทองเท�ยวและชวยในการตดสนใจทองเท�ยวไดอกดวย ซ�งระบบวางแผนการทองเท�ยวน �นมท �งท�แสดงผลแบบ Static และแบบ Dynamic เชน งานวจยของ Castillo et al. (2008) ไดนาเสนอระบบท�ชวยวางแผนการทองเท�ยวใหกบนกทองเท�ยวแบบไดนามก โดยสามารถนาพฤตกรรมการทองเท�ยวในอดตและลกษณะการเท�ยวท�คลายกนของนกทองเท�ยวมาวเคราะหดวยหลกการ Case-Based Reasoning อกท �งระบบน�ยงไดนาหลกการออนโทโลจมาใชในการจดเกบขอมลนกทองเท�ยว สถานท�ทองเท�ยว พฤตกรรมการทองเท�ยว กจกรรมการทองเท�ยว การเดนทาง รวมถงการเดนทางจากท�หน�งไปยงอกท�ดวยการเดน โดยระบบการวางแผนทองเท�ยวน�สามารถรองรบอปกรณพกพาหรอโทรศพทมอถอพรอมสงออกแผนท�การเดนทางไปยงอปกรณดงกลาวในรปแบบไฟล JPG หรอ PDF โดยใช A* Algorithm ในการแนะนาเสนทาง แตพบวามขอเสยคอพบปญหาในการทองเท�ยวแบบระบสถานท�เฉพาะอาจจะไมสามารถคนเจอถาพมพหรอสะกดไมถกตอง ซ�งในงานวจยของ

Page 6: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

6

จกรกฤษณ เสนห นมะหต

การวเคราะหประสทธภาพของอลกอรทมเนมแมทช�งสาหรบระบบสบคนขอมลทองเท�ยว

โดยใช F-Measure

Kongthon et al. (2011) ไดพฒนาระบบสบคนขอมลทองเท�ยวท�มความยดหยนกวา เน�องจากสามารถใหผใชปอนคาถามท�เปนประโยคเพ�อสอบถามขอมลตามความตองการในการสบคนขอมลทองเท�ยวในประเทศไทยได เชน “รบกวนแนะนาท�พกท�เกาะกดหนอยครบไปกน 10 คน” ซ�งระบบจะมกระบวนการตดคาภาษาไทยโดยเทยบจากพจนานกรมและจดกลมของคาท�ตดไดใหเขารปแบบโครงสรางของการจดเกบขอมลในออนโทโลจทองเท�ยวเพ�อสงรปแบบโครงสรางคาเหลาน�ไปสบคนขอมลทองเท�ยวท�ถกเกบไวในออนโทโลจทองเท�ยวและแสดงผลลพธตามท�ผใชไดทาการสอบถาม แตระบบน�รองรบแคภาษา ไทยเทาน �น เชนเดยวกนกบงานวจยของ Cao et al. (2011) และ Cao and Nguyen (2012) ไดพฒนาระบบ STAAR (Semantic Tourist Information Access and Recommending) สาหรบคนหาและแนะ นาขอมลทองเท�ยวจากการปอนคาถามแตใชไดเฉพาะภาษาองกฤษเทาน �น โดยใชออนโทโลจในการ เกบขอมลทองเท�ยวและสามารถประมวลผลผานโทรศพทมอถอดวยเทคนคการประมวลผลภาษาธรรมชาตโดยใชกระบวนการตดคาและกระบวนการเทยบจากพจนานกรมหรอคลงคาศพทมาใชในการสบคนขอมลตามโครงสรางคาถามท�ผใชตองการ

จากท�ไดกลาวมาจะเหนไดวาระบบการสบคนขอมลทองเท�ยวโดยท �วไปยงไมรองรบการคนหาในกรณท�พมพช�อผดหรอสะกดไมถกตองตามหลกภาษาไทยหรอภาษาองกฤษ ทาใหไดผลลพธของการคนหาไมตรงกบความตองการหรอไมพบสถานท�ท�ตองการคนหา อกท �งผลลพธท�ไดไมไดถกจดหมวด หมไวอยางเหมาะสม ทาใหเสยเวลาในการคดเลอกขอมลทองเท�ยวเพ�อใหไดขอมลทองเท�ยวหรอกจกรรมทองเท�ยวท�นาสนใจในชวงเวลาน �นๆ ท�ตรงกบความตองการท �งหมดและยงทาใหเกดความไมสะดวกในการเขาถงขอมลทองเท�ยวในเวบไซตเดยว (Panawong et al., 2014) ซ�งการท�นกทองเท�ยวจะเท�ยวใหครบทกท�ในเวลาอนจากดยอมเปนไปไดยาก เพราะแตละท�ใชเวลาในการทองเท�ยวชาเรวไมเทากนข�นอยกบความสนใจของแตละคน และบางสถานท�ทองเท�ยวยงมเวลาเปด ปดแตกตางกน ทาใหนกทองเท�ยวจะตองคนหาขอมลเพ�อท�จะวางแผนไวลวงหนาหรอเลอกเฉพาะสถานท�ทองเท�ยวท�สนใจเทาน �น (Sylejmani and Dika, 2011) แมเปนการทองเท�ยวในชวงเวลาส �นๆ แตนกทองเท�ยวจะคนหาขอมลทองเท�ยวจากแหลงขอมลท�ตางกนไปหรอโทรศพทสอบถามขอมลเสนทางของสถานท�ทองเท�ยวตางๆ ภายในจงหวดน �นๆ ซ�งจะใชเวลามากในการสบคนขอมลในการตดสนใจทองเท�ยว (Maervoet et al.,2008) ทาให นฤพนธ และ จกรกฤษณ )2553 ( ไดพฒนาระบบสบคนขอมลออนโทโลจทองเท�ยว โดยใช Variation Name Matching Algorithm ในการแกปญหาการเขยนช�อสถานท�หรอคาท�มการสะกดคลายคลงกนในเวบไซตตางๆ หรอท�เก�ยวของสามารถคนหาเจอไดครบถวนมากท�สด ซ�งขอดของการ ใช Variation Name Matching Algorithm น �นจะทาใหคาท�เขยนหรอสะกดผดในเวบไซตจะถกคนหาเจอในเวบเดยว แตอยางไรกตาม วธการน�ทาใหเสยเวลาอยางมากในกระบวนการคนหา เน�องจากมขอมลท�ไมเก�ยวของของคาท�มการสะกดผดพบอยเปนจานวนมากทาให (นฤพนธ และ จกรกฤษณ 2556) ไดประยกตใชอลกอรทม ISG ซ�งเปน Name Matching ท�ใชในการหาความคลายคลงของตว อกษรของช�อ โดย ISG จะทาการกรองขอมลท�ไมเก�ยวของเหลาน �นกอนนาไปทาการสบคนหาขอมลในกเก�ล โดยใชเทคนค Web Crawler เพ�อชวยลดเวลาในการสบคนขอมลทองเท�ยวจากช�อสถานท�ทองเท�ยวตางๆ ไดอยางมประสทธภาพซ�งรองรบท �งภาษาไทยและภาษาองกฤษ อยางไรกตามผลจากการวดประสทธภาพของการสบคนขอมลทองเท�ยวท�มความหลากหลายน �น พบวา ระบบคนหาช�อแหลง

Page 7: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

7

ปท� 12 ฉบบท� 1 (มกราคม - มถนายน 2558)

วารสารบรหารธรกจเทคโนโลยมหานคร

ทองเท�ยวท �งภาษาไทยและภาษาองกฤษมคาประสทธภาพใกลเคยงกนซ�งอยในเกณฑพอใช คดเปน 71.21 % และ 70.49 % ตามลาดบ และไมไดมการนาเอา อลกอรทมเนมแมชช�งอ�นๆ มาใชและเปรยบ เทยบกนในระบบสบคนขอมลทองเท�ยว

กรอบแนวความคด กรอบแนวความคดในการวเคราะหประสทธภาพของอลกอรทมเนมแมชช�งสามารถแบงออกเปน 2 ประเดนหลก ดงตอไปน�

1. ข �นตอนการดาเนนงาน 2. อลกอรทมเนมแมชช�ง

ข �นตอนการดาเนนงาน

การวเคราะหประสทธภาพและอลกอรทมเนมแมทช�งมข �นตอนการดาเนนงานดงน� 1. พฒนาอลกอรทมเนมแมชช�งของกลมท�มการเปล�ยนช�อเปนรหสเสยง 2. ทดสอบอลกอรทมเนมแมชช�งและทาการวดประสทธภาพของการสบคนของอลกอรทมเนม

แมชช�ง โดยใชวธการ F-Measure โดยใชฐานขอมลช�อจงหวดท�มการเขยนผดหรอสะกดผดในกเก�ล ซ�งมสตรการคานวณประสทธภาพมดงตอไปน�

(1)

(2)

(3)

โดยท� คอ คา f-score

คอ คา Precision

คอ คา Recall

คอ จานวนช�อท�ควรจะ Match และ Match (True Positive)

คอ จานวนช�อท�ควรจะไม Match แต Match (False Positive)

คอ จานวนช�อท�ควรจะ Match แตไม Match (False Negative)

Page 8: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

8

จกรกฤษณ เสนห นมะหต

การวเคราะหประสทธภาพของอลกอรทมเนมแมทช�งสาหรบระบบสบคนขอมลทองเท�ยว

โดยใช F-Measure

อลกอรทมเนมแมชช�ง

อลกอรทมเนมแมชช�งเปนอลกอรทมท�ใชในการเปรยบเทยบช�อสองช�อวามความคลายกนหรอไม (Match/No Match) ซ�งไดมการแบงชนดของ Name Matching Algorithm ออกเปน 4 ประเภท (Snae and Brückner, 2006) ไดแก

1. กฎพ�นฐานของตวสะกด (Spelling/String Analysis based Algorithms) ใชในการ

เปรยบเทยบความคลายคลงกนระหวางตวอกษรของช�อ 2 ช�อ วามหลกการเขยนเหมอนกนอยางไร และผลของการเปรยบเทยบน�จะออกมาในรปวาคลายกนหรอไม (Match/No Match) ซ�งอลกอรทมประเภทน� ไดแก Guth และ Levenshtein

2. กฎพ�นฐานของการออกเสยง (Phonetic/Sound base Algorithms) เปนการใชโครง-

สรางของเสยงเปนตวเปรยบเทยบคาความคลายคลงกน ซ�งใชในการแกปญหาช�อท�มเสยงเดยวกนแตเขยนหรอสะกดตางกน โดยใชวธการจดกลมตวอกษรจดใหเสยงเดยวกนอยในกลมตวอกษรเดยวกน ตวอยางเชน ตวอกษร Ph ใชจดอยในกลมตวอกษร F หรอในภาษาไทย “จ ท ธ ต ฏ” ใหจดอยในกลมแมกด (ด) อาทเชน คาวา กาจ กบ กาด จะออกเสยงเหมอนกน ซ�งอลกอรทมประเภทน� ไดแก Soundex, Soundex2, Metaphone, NYSIIS และ Phonex

3. วธการรวมกน (Composite Methods) เปนวธการรวมกนระหวางกฎพ�นฐานของตว

สะกด (Spelling/String Analysis based Algorithms) และกฎพ�นฐานของการออกเสยง (Phonetic/ Sound base Algorithms) ซ�งการรวม 2 วธน�เปนการแกปญหาของช�อเก�ยวกบคาพองรปพองเสยงหรอคาท�เขยนเหมอนกนแตออกเสยงตางกนและคาท�เขยนตางกนแตออกเสยงเหมอนกน ซ�งอลกอรทมประเภทน� ไดแก Simplex และ ISG

4. วธการไฮบรด (Hybrid Approaches) เปนการใชคาความนาจะเปนในการวดคาความ

คลายคลงของช�อ (Snae and Diaz, 2002) ซ�งอลกอรทมประเภทน� ไดแก LIG1, LIG2, LIG3 (ยอมากจาก Levenshtein Index of Similarity and Guth) ในงานวจยน�ไดทาการวดประสทธภาพของอลกอรทมเนมแมชช�งในกลมท�มการเปล�ยนช�อเปนรหสเสยงเทาน �นซ�งเนมแมทช�งอลกอรทมในกลมน�เปนการเปรยบเทยบระหวางรหสเสยงของช�อ โดยการนารหสเสยงของช�อ 2 ช�อมาเปรยบเทยบกนโดยตรง ถาเหมอนกนแสดงวาช�อท �ง 2 ช�อ Match กน แตถาไมเหมอนกนแสดงวาช�อท �ง 2 ช�อ No Match กน ซ�งเนมแมทช�งอลกอรทมในกลมน�ม 6 อลกอรทมไดแก

1. Soundex Soundex Algorithm ถกออกแบบมาใชสาหรบช�อภาษาองกฤษ (Winchester,

1970) Soundex Algorithm ไดถกนาไปใช เพ�อลดจานวนระเบยนของการแตงงานโดยการเขารหสท �งนามสกลของสามและนามสกลเดมของภรรยา และยงมการนาอลกอรทมน� ไปใชในการเช�อมโยงประชากรอกดวย แตอยางไรกตาม จะพบวาการละเวนการออกเสยงอาจจะทาใหขอมลท�สมควร Match กลบไดผลเปนไม Match และขอมลท�ไม Match กลบใหผลท� Match กน (Davey and Jarvis, 1990)

Page 9: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

9

ปท� 12 ฉบบท� 1 (มกราคม - มถนายน 2558)

วารสารบรหารธรกจเทคโนโลยมหานคร

ซ�งขอเสยท�พบจากการใช Soundex Algorithm คอ ไมเหมาะกบช�อท�ส �น หรอช�อท�มจานวนสระมาก (Gill et al., 1993)

Soundex Algorithm จะทาการเปล�ยนช�อเปนรหสของ Soundex ซ�งประกอบดวย 1 ตวอกษรและ 3 ตวเลข โดยมข �นตอนการเปล�ยนดงตอไปน�

1) เกบตวอกษรตวแรกของ Input ช�อไว 2) ถาตวอกษร A, E, H, I, O, U, W, Y ไมใชตวอกษรตวแรกใหตดออกไป 3) จากขอท� 1 เปล�ยนอกษรท�เหลอเปนรหส Soundex ดงแสดงในตารางท� 1 4) ผลลพธของรหส Soundex ตองอยในรปของตวอกษร 1 ตวและตามดวยตวเลข 3 ตว 5) จากขอ 4 ถาผลลพธของรหส Soundex นอยกวา 4 ตวรหส Soundex ใหใสศนยแทนจน

ครบรหส แตถารหส Soundex มากกวา 4 รหส ใหตดออก

ตารางท� 1 : การเปล�ยนอกษรเปนรหส Soundex

Letter Number is coded to

B, P, F and V 1

C, G, J, K, Q, S, X and Z 2

D and T 3

L 4

M and N 5

R 6

2. Soundex 2 ไดปรบปรงมาจากอลกอรทม Soundex ซ�งจะมข �นตอนเหมอนกบ Soundex

Algorithm แตจะมการเปล�ยนเพยงข �นตอนท� 3 โดยรหสของ Soundex 2 สามารถแสดงในตารางท� 2

ตารางท� 2 : การเปล�ยนอกษรเปนรหส Soundex 2

Letter Number is coded to

B and P 1

F and V 2

C, K and S 3

G and J 4

Q, X and Z 5

D and T 6

L 7

M and N 8

R 9

Page 10: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

10

จกรกฤษณ เสนห นมะหต

การวเคราะหประสทธภาพของอลกอรทมเนมแมทช�งสาหรบระบบสบคนขอมลทองเท�ยว

โดยใช F-Measure

3. Metaphone สวนใหญจะใชแกปญหากบช�อองกฤษ โดยอลกอรทมมข �นตอนดงตอไปน�

1) ถามตวเลขใหตดตวเลขออก แลวเปล�ยนอกษรทกตวใหเปนตวใหญ 2) ถา KN หรอ GN หรอ PM หรอ AE หรอ WR เปนตวแรกใหวางไวตาแหนงแรก 3) ถา X เปนตวอกษรแรกใหเปล�ยนเปน S 4) ถา WH เปนตวอกษรแรกใหเปล�ยนเปน W 5) ถามอกษรท�เหมอนกนไมตองเพ�มรหส 6) ถาตวอกษร A, E, I, O, U และ Y ไมใชตวอกษรตวแรกใหตดออกไป 7) เปล�ยนตวอกษรใหเปนรหสของ Metaphone ดงแสดงในตารางท� 3

ตารางท� 3 : การเปล�ยนตวอกษรเปนรหส Metaphone

ตวอกษร รหส เง�อนไข

B B ยกเวนถาอยตาแหนงสดทายของคาหลงจากตวอกษร “m”

C X (เสยง ‘sh’) ถา “-cia-” หรอ “-ch-”

S เปน “-ci-”, “-ce-” หรอ “-cy-”

ถาไมออกเสยง “-sci-”, “-sce-” หรอ “-scy-”

K มฉะน �น, รวมท �ง “-sch-”

D J ถาอยใน “-dge-”, “-dgy-”, “-dgi”

T นอกน �นเปน

F F

G ไมออกเสยงถามนอยใน “-gh-” และไมอยในตาแหนงสดทาย หรอกอน

หนาสระ

ใน “-gn” หรอ “-gned”

ใน “-dge-”, อ�นๆ., ท�เหนอกวากฎ

J ถา “i”, หรอ “e”, หรอ “y” กอน, ถาไมอยเปนคตดกน “gg”

K นอกน �นเปน

H ไมออกเสยงถาอยหลงสระและไมมสระตามมา

H นอกน �นเปน

J J

K ถาไมออกเสยงใน “c”

K นอกน �นเปน

L L

M M

N N

Page 11: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

11

ปท� 12 ฉบบท� 1 (มกราคม - มถนายน 2558)

วารสารบรหารธรกจเทคโนโลยมหานคร

ตารางท� 3 : (ตอ) ตวอกษร รหส เง�อนไข

P F ถา “h” กอน

P นอกน �นเปน

Q K

R R

S X (sh) ถา “h” กอน หรอใน “-sio-” หรอ “-sia-”

S นอกน �นเปน

T X (sh) ถา “h” กอน หรอใน “-sio-” หรอ “-sia-”

0 (Zero) (th) ถา “h” กอน

ถาไมออกเสยงใน “tch-”

T นอกน �นเปน

V F

W ไมออกเสยงถาไมถกตามโดยสระ

W ถาถกตามโดยสระ

X KS

Y ไมออกเสยงถาไมถกตามโดยสระ

Y ถาถกตามโดยสระ

Z S

4. Phonex เกดจากการรวมกนของสองกระบวนการ คอ Soundex และ Metaphone ซ�ง

กระบวนการน� พบวา สามารถทางานไดดเม�อนาไปใชกบช�อในภาษาองกฤษ (Lait and Randell, 1998) โดยข �นตอนของ Phonex ในการแปลงช�อใหเปนรหส 4 ตวอกษร มดงตอไปน�

1) ลบตวอกษร S ท�ตอทายออก 2) ถาม KN หรอ WR ข�นตนใหตดตวอกษรแรกท�งไป 3) ถามตวอกษรดงตอไปน�ข�นตนใหเปล�ยนดงน� 3.1) ตวอกษร H ใหตดท�ง 3.2) ตวอกษร E I O U Y ใหเปล�ยนเปน A 3.3) ตวอกษร K และ Q ใหเปล�ยนเปน C 3.4) ตวอกษร P ใหเปล�ยนเปน B 3.5) ตวอกษร J ใหเปล�ยนเปน G 3.6) ตว PH และ V ใหเปล�ยนเปน F 3.7) ตว Z ใหเปล�ยนเปน S 4) ใหเกบตวอกษรตวแรกไวแลวลบตวอกษร A, E, H, I, O, U, W, Y ในตาแหนงอ�นออก 5) กาหนดหมายเลขดงตอไปน�ใหตวอกษรท�เหลอหลงตวแรก

Page 12: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

12

จกรกฤษณ เสนห นมะหต

การวเคราะหประสทธภาพของอลกอรทมเนมแมทช�งสาหรบระบบสบคนขอมลทองเท�ยว

โดยใช F-Measure

6) B, F, P, V เปล�ยนเปน 1 7) C, G, J, K, Q, S, X, Z เปล�ยนเปน 2 8) D, T เปล�ยนเปน 3 ถาไมตามดวย C 9) L เปล�ยนเปน 4 ถาไมตามดวยสระและเปนตวอกษรสดทาย 10) M, N เปล�ยนเปน 5 ขามไปพจารณาตวอกษรถดไปถาตวอกษรถดไปเปน D หรอ G 11) R เปล�ยนเปน 6 ถาไมตามดวยสระและเปนตวอกษรสดทาย 12) ขามตวอกษรปจจบนถามหมายเลขเดยวกบตวอกษรกอนหนา 13) รหสของ Phonex ตองมลกษณะ คอ ตวอกษรตามดวยตวเลข 3 ตว 14) ถารหสมตวเลขไมถง 3 ตวใหเตมดวย 0 จนครบ และถามตวเลขครบ 3 ตวแลวยงม

ตวอกษรท�ยงไมไดเปล�ยนใหเปล�ยนท�ตวเลขสดทาย

5. NYSIIS เปนวธการทางตวอกษรท�งายและใหผลรหสอลกอรทมเหมอนกบ Soundex

อยางไรกตาม NYSIIS ตางจาก Soundex ตรงท�มนเกบขอมลเก�ยวกบตาแหนงของสระในการเขารหสของคาโดยแปลงสระท �งหมดใหเปนตวอกษร A (Gill et al., 1993) โดยวธการเขารหสเบ�องตนของ NYSIIS มดงน�

1) ใชตวอกษรตวแรกของช�อมาเปนรหสตวแรกของ NYSIIS 2) ลบสระท�ซ�ากนใหเหลอเพยงหน�งตว 3) ถาช�อประกอบดวยสระครบทกตว (AEIOU) ใหตดสระท�ง 4) แทนคาสระดวยตว A 5) ถาตวอกษรตวสดทายเปนสระใหตดท�ง 6) ตวอกษรท�เหลอใหเปล�ยนเปนรหส NYSIIS

6. Simplex เปนวธท�มการปรบปรงจากวธของ NYSIIS และ Soundex Algorithm ซ�งจะเพ�ม

จานวนการ Match มากข�นจากเดม โดยการแกไขสวนใหญเนนไปท�การแกไขตวอกษร การเขารหสของ Simplex มพ�นฐานมาจาก NYSIIS โดยการเปล�ยนสระ “AIEOUY” เปน A ท �งหมด

1) ทาตามข �นตอนขอ 1-6 ของ NYSIIS Algorithm 2) เขารหสตวอกษรตวสดทาย ดงตอไปน� 2.1) เปล�ยน X เปน C 2.2) เปล�ยน V เปน F 2.3) เปล�ยน SE, ES, AS, CE เปน S 2.4) เปล�ยน YE, EE, IE, EY, EI เปน Y 2.5) เปล�ยน NT, ND เปน N 3) เขารหสตวอกษรตวอ�นๆ ดงตอไปน� 3.1) เปล�ยน PH เปน F 3.2) เปล�ยน JH เปน J

Page 13: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

13

ปท� 12 ฉบบท� 1 (มกราคม - มถนายน 2558)

วารสารบรหารธรกจเทคโนโลยมหานคร

3.3) เปล�ยน HN เปน N 3.4) เปล�ยน TH เปน T 3.5) เปล�ยน RH, RM เปน R 3.6) เปล�ยน WR เปน R 3.7) เปล�ยน WM, WN, M เปน N 4) ถาม K ตามดวย N ใหเปล�ยนเปน N แตถา K ตามดวยตวอกษรอ�นท�ไมใช N ใหเปล�ยน

เปนตว C 5) ถาม Z เปนตวอกษรตวสดทายใหเปล�ยน Z เปน S แตถาไมใช Z เปนตวสดทาย ใหคงตว

อกษรเดมไว 6) ถาม Y เปนท �งตวอกษรตวแรกและตวสดทาย ใหคงเดม แตถาเปนตวอกษรอ�นใหเปล�ยน

เปนตว A

ระเบยบวธการวจย ข �นตอนการวเคราะหประสทธภาพของอลกอรทมเนมแมชช�งแบงออกเปน 3 ข �นตอนหลก ดงตอไปน�

1. การสรางคาคนหาหรอช�อของจงหวดท�สามารถเขยนไดหลากหลายรปแบบในภาษาองกฤษ

2. คดกรองและจดเกบขอมลช�อเพ�อใชในการวดประสทธภาพของอลกอรทมเนมแมชช�ง 3. วดประสทธภาพเนมแมทช�งอลกอรทมดวยวธการ F-Measure

การสรางคาคนหาหรอช�อของจงหวด

ทาการปอนช�อจงหวดท�เขยนถกตองเปนภาษาองกฤษ จากน �นทาการสรางช�อท�สามารถเขยนไดหลากหลายหรอคลายคลงกนกบช�อท�เขยนถกตองโดยใชอลกอรทม Name Variation Finding ซ�งจะทาการสรางช�อจากความคลายคลงของพยญชนะและตวสะกด (Snae et al., 2007; Snae and Brück- ner, 2009) ดงแสดงตวอยางตามตารางท� 4

Page 14: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

14

จกรกฤษณ เสนห นมะหต

การวเคราะหประสทธภาพของอลกอรทมเนมแมทช�งสาหรบระบบสบคนขอมลทองเท�ยว

โดยใช F-Measure

ตารางท� 4 : การทางานของอลกอรทมของ Name Variation Finding สาหรบการสรางคาคลายคลงของ phitsanulok คาท�ใช ตาแหนงตวอกษร ตวอกษรท�เปล�ยน เปล�ยนเปน คาท�ได

Phitsanulok 4 t ตดออก Phisanulok

Phitsanulok 2 h ตดออก Pitsanulok

Phitsanulok 2,4 h,t ตดออก Pisanulok

Phitsanulok 9 l r Phitsanurok

Phitsanulok 4 t ตด t ออก เพ�ม k Phisanuklok

Phitsanulok 4,5 t,s ตด t ออก เปล�ยน s-> z Phizanulok

Phitsanulok 8 u oo Phitsanoolok

Phitsanulok 8 u ok phitsanoklok

จากตารางท� 4 จะเหนไดวาคาวา Phitsanulok สามารถเขยนไดหลากหลายรปแบบ เชน Phisanulok (t ถกตดออกในตาแหนงท� 4) หรอ Pitsanulok (h ตาแหนงท� 2 ถกตดออก) เปนตน ซ�งในงานวจยน�จะใชตวอยางช�อท�เขยนเปนคาภาษาองกฤษของจงหวดในประเทศไทย 20 จงหวด แตละจงหวดประกอบดวยช�อท�สามารถเขยนไดหลากหลายท�คนเจอในกเก�ลและมขอมลทองเท�ยวปรากฏอยจรง จานวน 100 ช�อ (2,000 ช�อ) มาใชในการวดประสทธภาพของอลกอรทมเนมแมชช�ง

คดกรองและจดเกบขอมลช�อ

นาช�อท�เขยนไดหลายรปแบบท �ง 20 จงหวด ท�ไดจาก Name Variation Finding ไปทาการคนหาขอมลทองเท�ยวในกเก�ลและทาการคดกรองเฉพาะช�อแตละจงหวดท�มขอมลทองเท�ยวปรากฏอยจรง (ตารางท� 5) ท�คนเจอในกเก�ล จานวน 100 ช�อ (2,000 ช�อ) และจดเกบช�อจงหวดและช�อท�มความคลายคลงกนเหลาน�ลงฐานขอมล ตารางท� 5 : ตวอยางจานวนรายการท�คนพบโดยกเก�ลของคาคนหา พษณโลก (Phitsanulok)

Name Variation of

No. Name Variation Records were from Google

1 phitsanulok 5,110,000 records

2 phisanulok 186,000 records

3 pitsanulok 32,800 records

4 pisanulok 5,510 records

5 phitsanurok 1,400 records

6 phisanuklok 134 records

7 phizanulok 5 records

8 phitsanoolok 5 records

9 phitsanoklok 4 records

Page 15: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

15

ปท� 12 ฉบบท� 1 (มกราคม - มถนายน 2558)

วารสารบรหารธรกจเทคโนโลยมหานคร

จากน �นนารายช�อท�ไดมาท �งหมดไปเขากระบวนการอลกอรทมเนมช�งแตละวธ จากน �นทาการวเคราะหประสทธภาพดวยการคานวณหาประสทธภาพของแตละอลกอรทมของอลกอรทมเนมแมชช�งดวย F-Measure

วดประสทธภาพเนมแมทช�งอลกอรทมดวยวธการ F-Measure

ข �นตอนการวดประสทธภาพเนมแมทช�งอลกอรทมดวยวธการ F-Measure สาหรบกลมอลกอรทมเนมแมชช�งท�มการเปล�ยนช�อเปนรหสเสยงน �น สามารถแสดงวธการคานวณคาประสทธภาพโดยใช ตวอยางของอลกอรทม Soundex ดงตารางท� 6 ตารางท� 6 : ตวอยางการวดประสทธภาพอลกอรทมเนมแมชช�งดวยวธการ F-Measure ของ อลกอรทม Soundex

ช�อจงหวดท�ถกตอง

และ

Soudex Code

ฐานขอมลช�อ

ท�มความ

คลายคลงกน

Soundex

Code

Result

(Match/No Match)

Match Type

(TP, FP, FN)

Phitsanulok Phisanulok P254 No match FN

P325 Pitsanulok P325 Match TP

Pisanulok P254 No match FN

Phitsanurok P325 Match TP

Phisanuklok P252 No match FN

Phizanulok P254 No match FN

Phitsanoolok P325 Match TP

phitsanoklok P325 Match TP

… … ...

Phitjint P325 Match FP

จากตารางท� 6 สามารถคานวณหาคาตางๆ ไดดงตอไปน�

หาคา TP ไดจากการนบช�อท� Match ในการเปรยบเทยบ Soundex Code ของช�อจงหวดท�เขยนถกตอง Phitsanulok (P325) กบช�อจงหวดในฐานขอมล โดยในตวอยางน� TP เทากบ 4

หาคา FN ไดจากการนบช�อท� No Match ในการเปรยบเทยบ Soundex Code ของช�อจงหวดท�เขยนถกตอง Phitsanulok (P325) กบช�อจงหวดในฐานขอมล โดยในตวอยางน� TP เทากบ 4

หาคา FP ไดจากการนบช�อท� Match ในการเปรยบเทยบ Soundex Code ของช�อจงหวดท�เขยนถกตอง Phitsanulok (P325) กบช�อจงหวดในฐานขอมล โดยในตวอยางน� TP เทากบ 1

คานวณหาคา Precision, คา Recall และคา F-Score ของจงหวด Phitsanulok สามารถหาคาตางๆ ไดดงน�

Precision : 4/(4+1)*100 = 80 % Recall : 4/(4+4)*100 = 50 %

Page 16: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

16

จกรกฤษณ เสนห นมะหต

การวเคราะหประสทธภาพของอลกอรทมเนมแมทช�งสาหรบระบบสบคนขอมลทองเท�ยว

โดยใช F-Measure

F-Score : 2*(80*50)/(80+50) = 61.54 % ดงน �นสรปไดวาคาประสทธภาพของอลกอรทม Soundex สาหรบจงหวด phitsanulok มคาเทากบ 61.54 % จากน �นทาการหาคา F-Score จนครบทก 20 จงหวดในฐานขอมล และครบทกอลกอรทมเนมแมชช�งพรอมท �งสรปผลการวเคราะหประสทธภาพ

ผลการวจย ผลจากการวเคราะหประสทธภาพของอลกอรทมเนมแมชช�ง 6 วธการโดยใช ขอมลคาของจงหวด 20 จงหวด และคาท�คลายคลงท�ปรากฏอยจรงจากการสบคนขอมลทองเท�ยวจากกเก�ลน �น สามารถแสดงคาประสทธภาพดง ตารางท� 7 และ 8

ตารางท� 7 : ตวอยางผลการวดประสทธภาพของอลกอรทม Phonex (ซาย) และ Soundex (ขวา) ดวย F-Measure

Phonex P R F-Score Soundex P R F-Score

buriram 1.000 0.8 0.8889 buriram 1.000 0.831 0.9077

kalasin 1.000 0.82 0.9011 kalasin 1.000 0.842 0.9142

nakhonratchasima 1.000 0.39 0.5612 nakhonratchasima 0.9 0.42 0.5727

mahasarakham 0.523 0.575 0.5478 mahasarakham 0.673 0.521 0.5873

ubonratchathani 0.816 0.488 0.6107 ubonratchathani 0.823 0.501 0.6228

phichit 0.929 0.898 0.9132 phichit 0.942 0.901 0.9210

phitsanulok 0.942 0.857 0.8975 phitsanulok 0.953 0.845 0.8958

pathumthani 0.652 0.545 0.5937 pathumthani 0.677 0.585 0.6276

phetchabun 0.763 0.738 0.7503 phetchabun 0.794 0.731 0.7612

maehongson 0.629 0.667 0.6474 maehongson 0.702 0.653 0.6766

nakhonsawan 0.568 0.917 0.7015 nakhonsawan 0.784 0.923 0.8478

chiangmai 0.965 0.902 0.9324 chiangmai 0.972 0.917 0.9437

sukhothai 0.885 0.963 0.9224 sukhothai 0.921 0.958 0.9391

chiangrai 0.307 0.964 0.4657 chiangrai 0.67 0.879 0.7604

kamphaengphet 1.000 0.7 0.8235 kamphaengphet 0.914 0.645 0.7563

udonthani 1.000 0.722 0.8386 udonthani 1.000 0.794 0.8852

nakhonsithammarat 0.477 0.7 0.5674 nakhonsithammarat 0.509 0.673 0.5796

ayutthaya 0.750 0.98 0.8497 ayutthaya 0.822 0.874 0.8472

suphanburi 1.000 0.32 0.4848 suphanburi 0.965 0.442 0.6063

sakonnakhon 0.649 0.6 0.6235 sakonnakhon 0.812 0.694 0.7484

Average 0.7928 0.7273 0.7261 Average 0.8417 0.7315 0.7827

Page 17: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

17

ปท� 12 ฉบบท� 1 (มกราคม - มถนายน 2558)

วารสารบรหารธรกจเทคโนโลยมหานคร

จากการวดประสทธภาพของอลกอรทมเนมแมชช�งดวย F-Measure น �นพบวา คา F-Score หรอประสทธภาพในการจบคช�อท�ใหคาท�สงท�สดสาหรบระบบสบคนขอมลทองเท�ยวคอ Soudex (78.27 %) รองลงมาคอ Soudex2 (75.68 %) และ Phonex (72.61 %) ตามลาดบ ซ�งจะเหนวามคาใกล เคยงกนและถอวามประสทธภาพของระบบอยในเกณฑด โดยผลการวดประสทธภาพของอลกอรทมท �งหมดแสดงในตารางท� 8 และเวลาในการประมวลผลของเนมแมทช�งอลกอรทมแสดงในตารางท� 9

ตารางท� 8 : ผลการวดประสทธภาพเนมแมทช�งอลกอรทมดวยวธการ F-Measure

Algorithm P R F- Score (%)

Soundex 84.17 73.23 78.31

Soundex2 80.50 71.45 75.68

Phonex 79.28 72.73 72.61

Metaphone 67.5 58.71 62.32

Simplex 63.11 55.89 59.55

NYSIIS 56.51 49.71 52.09

ตารางท� 9 : แสดงเวลาในการประมวลผลเนมแมทช�งอลกอรทม

Algorithm เวลา (วนาท)

Soundex 0.01275

Metaphone 0.04309

Soundex2 0.20771

Phonex 0.24502

NYSIIS 0.27016

Simplex 0.29341

อภปรายผลการวจย จากผลการวดประสทธภาพของอลกอรทมจะเหนไดวา ช�อจงหวดท�นามาทดสอบน �นจะประกอบไปดวยจานวนตวอกษรต �งแต 7 จนถง 17 ตวอกษร เพ�อใหมความหลากหลายของช�อ อาทเชน phitchit มจานวนตวอกษรเทากบ 7 ตวอกษร และ nakhonsithammarat มจานวนตวอกษรเทากบ 17 ตวอกษร เปนตน และจะเหนไดวาจานวนตวอกษรน �น มผลตอประสทธภาพของอลกอรทมดวย เชน จานวนตวอกษรของช�อจงหวดต �งแต 12 ตวอกษร ข�นไป สวนใหญ จะใหคา F-Score ท�ต�า อาทเชน ประสทธภาพของอลกอรทม Soundex (ตารางท� 7) จงหวด nakhonsithammarat (17 ตวอกษร) nakhonratchasima (16 ตวอกษร) ubonratchathani (15 ตวอกษร) mahasarakham (12 ตวอกษร) ใหคา F-Score ท� 57.96% 57.27% 62.28% และ 58.73% ตามลาดบ ในทางตรงกนขามจะเหนไดวา

Page 18: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

18

จกรกฤษณ เสนห นมะหต

การวเคราะหประสทธภาพของอลกอรทมเนมแมทช�งสาหรบระบบสบคนขอมลทองเท�ยว

โดยใช F-Measure

จานวนตวอกษรของช�อย�งมจานวนนอย คา F-Score จะใหคาท�สง (มากกวา 0.9 หรอ 90%) อาทเชน ประสทธภาพของอลกอรทม Soundex (ตารางท� 7) จานวนตวอกษรของช�อสวนใหญท�ไมเกน 9 ตว อกษร ไดแก จงหวด kalasin (7 ตวอกษร) phichit (7 ตวอกษร) chiangmai (9 ตวอกษร) และ sukhothai (9 ตวอกษร) ใหคา F-Score ท� 91.42% 92.10% 94.37% และ 93.91% ตามลาดบ ซ�งผลลพธของการวดประสทธภาพของอลกอรทม Soundex จะสอดคลองกบอลกอรทมของ Phonex และอลกอรทมอ�นดวยเชนกน

จากตารางท� 9 การเปรยบเทยบเวลาในการประมวลผลอลกอรทมเนมแมทช�งพบวาอลกอรทมท�มเวลาในการประมวลผลนอยท�สดตามลาดบ ดงน� Soundex, Metaphone, Soundex2, Phonex, NYSIIS และ Simplex จะเหนไดวา Soundex และ Metaphone ท�มเวลาในการประมวลผลนอย เน�อง มาจาก Soundex และ Metaphone มฟงกชนในการทางานในภาษา PHP อยแลว จงทาใหฟงกชนมการเรยกใชไดทนทและสามารถประมวลผลไดเรวมากข�น

ในงานวจยน�ผวจ ยไดนาเสนอผลของการวเคราะหประสทธภาพของระบบสบคนขอมลทองเท�ยวโดยใชอลกอรทม Variation Name Finding มาชวยในการคดเลอกช�อจงหวดท�มความคลาย คลงหรอใกลเคยงกบช�อจงหวดท�เขยนถกตองเพ�อนาไปใชเปนขอมลในการเปรยบเทยบอลกอรทมเนมแมชช�งแตละวธ ซ�งการวดประสทธภาพและเปรยบเทยบเนมแมทช�งอลกอรทมเพ�อใหทราบวาอลกอรทมใด ใหประสทธภาพดท�สดสาหรบการสบคนช�อหรอขอมลทองเท�ยวภาษาองกฤษ และจากผลการทดสอบพบวา อลกอรทมเนมแมทช�งท�มความสามารถในการสบคนขอมลทองเท�ยวไดคอนขางดท�สดในจานวนอลกอรทมเนมแมทช�งของกลมท�มการเปล�ยนช�อเปนรหสเสยง ไดแก Soudex, Soudex2 และ Phonex ตามลาดบ และ Soundex น �นยงใชเวลาในการประมวลผลนอยท�สด อกดวย ซ�งระบบสบ คนขอมลทองเท�ยวน�สามารถนาอลกอรทม Soundex ไปประยกตใชหรอปรบปรงใหดย�งข�น เพ�อท�จะชวยใหขอมลทองเท�ยวท�มการเขยนผดรปผดเสยง สามารถคนหาเจอในอนเทอรเนตไดอยางรวดเรว อยางไรกตามควรมการเพ�มจานวนขอมลช�อสถานท�ทองเท�ยวท�นามาทดสอบหาประสทธภาพใหมความหลากหลายรปแบบใหครอบคลมขอมลทองเท�ยวมากข�นเพ�อผลลพธท�ไดจะมความนาเช�อถอย�งข�นไปดวย

ขอเสนอแนะ จากการวดประสทธภาพและเปรยบเทยบเนมแมทช�งอลกอรทมของกลมท�มการเปล�ยนช�อเปน

รหสเสยงท �ง 6 อลกอรทมจะเหนไดวาผลการทดสอบท�ไดมความนาเช�อถอในระดบคอนขางด แตอยางไรกตามขอเสนอแนะท�ควรมการปรบปรงใหดย�งข�น มดงตอไปน�

1. ควรทาการวเคราะหประสทธภาพของอลกอรทมเนมแมชช�งของกลมท�มการเปรยบเทยบกบคาThreshold เพ�มอกดวย ซ�งอลกอรทมเนมแมทช�งในกลมน�ม 6 อลกอรทมไดแก Levenshtein, Guth, ISG, LIG1, LIG2 และ LIG3

2. ควรมการวดประสทธภาพในภาษาอ�นๆ นอกเหนอจากภาษาองกฤษเพ�มมากข�นเชน ภาษาไทย ซ�งการประยกตใชอลกอรทมเนมแมทช�งสาหรบภาษาไทยน �น Snae and Brückner (2009)

Page 19: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

19

ปท� 12 ฉบบท� 1 (มกราคม - มถนายน 2558)

วารสารบรหารธรกจเทคโนโลยมหานคร

ไดพฒนาอลกอรทมเนมแมทช�งสาหรบภาษาไทย คอ Metasound ซ�งนาไปใชกบการต �งช�อและเปล�ยนช�อไทยใหสอดคลองกบช�อบดาและมารดาหรอเปล�ยนช�อใหมความคลายคลงกบช�อเดม

3. ควรมการเพ�มการวเคราะหและการวดประสทธภาพดวยวธการอ�นเพ�มมากข�นเชน หลกการของ Lait and Randell (1998) และ หลกการจดกลม เปนตน

4. ควรมการทดลองเพ�อแสดงผลการเปรยบเทยบเวลาในการประมวลผลอลกอรทมเนมแมทช�งเพ�อเปนสวนหน�งในการเลอกอลกอรทมเนมแมทช�งในการนาไปประยกตในการสบคนและเพ�อเพ�มความรวดเรวของระบบสบคนขอมลทองเท�ยวอกดวย

5. ควรเพ�มจานวนฐานขอมลของช�อ ใหครบทกจงหวดท�มขอมลทองเท�ยวปรากฏจะทาใหคาประสทธภาพมความเช�อถอไดมากย�งข�น

รายการอางอง

นฤพนธ พนาวงศ และ จกรกฤษณ เสนห นมะหต. 2556. การวเคราะหประสทธภาพของระบบสบคน

ขอมลออนโทโลจทองเท�ยวดวยอลกอรทม ISG และ Name Variation Matching. วารสาร

วทยาศาสตร มหาวทยาลยนเรศวร. ปท� 9. ฉบบท� 2. 47-64.

นฤพนธ พนาวงศ และ จกรกฤษณ เสนห. 2553. ระบบคนหาสถานท�ทองเท�ยวในประเทศไทยดวยหลก

การออนโทโลจและเนมแมทช�ง. Journal of Information Science and Technology. ปท�

1. ฉบบท� 2. 60-69. นฤพนธ พนาวงศ และ จกรกฤษณ เสนห. 2554. การพฒนาระบบสบคนขอมลออนโทโลจทองเท�ยวดวย

ภาษา SPARQL. เอกสารการประชมทางวชาการนเรศวรวจย คร �งท� 7. 195-204.

สรางครตน เชาวโคกสง และ จกรกฤษณ เสนห. 2554. การพฒนาระบบบรการขอมลการทองเท�ยวและ

แนะนากาหนดการทองเท�ยวดวยการแสดงผลในลกษณะระบบสารสนเทศภมศาสตร. วารสาร

มนษยศาสตรและสงคมศาสตร มหาวทยาลยอบลราชธาน. ปท� 2. ฉบบท� 1. 31-45.

Brückner, Michael.; Snae, Chakkrit and Payakpate, Janjira. 2008. Ontology-Based Name Mat-

ching of Toponyms for Geographical Information Systems (ONTO-GIS). In Proceedings

of IADIS International Conference ICT, Society, and Human Beings. 108-114.

Cao, Tuan-Dung and Nguyen, Quang-Minh. 2012. Semantic approach to travel information

search and Itinerary recommendation. International Journal of Web Information Sys-

tems. Vol. 8. Issue. 3. 256-277.

Cao, Tuan-Dung; Nguyen, Quang-Minh; Nguyen, Anh-Duc and Le, Tan-Hung. 2011. Integra-ting Open Data and Generating Travel Itinerary in Semantic-Aware Tourist Information

System. In Proceedings of the 13th International Conference on Information Integ-

ration and Web-based Applications and Services. 214-221.

Page 20: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

20

จกรกฤษณ เสนห นมะหต

การวเคราะหประสทธภาพของอลกอรทมเนมแมทช�งสาหรบระบบสบคนขอมลทองเท�ยว

โดยใช F-Measure

Castillo, Luis; Armengol, Eva; Onaindía, Eva; Sebastiá, Laura; González-boticario, Jesús; Rodrí-guez, Antonio; Fernández, Susana; D. Arias, Juan and Borrajo, Daniel. 2008. SAMAP: An

User-Oriented Adaptive System for Planning Tourist Visits. Expert Systems with Appli-

cations. Vol. 34. Issue 2. 1318-1332.

Davey, C. and Jarvis, A.S. 1990. Microcomputers for Microhistory: a Database Approach to the

Reconstruction of Small English Populations. History and Computing. Vol. 2. No.3.

187-193. Gill, Leicester; Goldacre, Michael; Simmons, Hugh; Bettley, Glenys and Griffith, Myfanwy. 1993.

Computerised Linking of Medical Records: Methodological Guidelines. Journal of

Epidemiology and Community Health. Vol .47. 316-319.

Kongthon, Alisa; Kongyoung, Sarawoot; Haruechaiyasak, Choochart and Palingoon, Pornpimon. 2011. A Semantic Based Question Answering System for Thailand Tourism Information.

In Proceedings of the KRAQ11 Workshop. 38-42.

Lait, Alan. J. and Randell, Brian. 1998. An Assessment of Name Matching Algorithm. Society of Indexers Genealogical Group, Newsletter Contents. SIGGNL issues 17. 1-32.

Maervoet, Joris X.; Souffriau, Wouter; Vansteenwegen, Pieter; Vanden, Berghe Greet and Van, Oudheusden Dirk. 2008. Tourist Decision Support for Mobile Navigation Systems: a Demo- nstration. Applied Artificial Intelligence. Vol. 22. No. 10. 964-985.

Panawong, Naruepon; Snae Namahoot, Chakkrit and Brückner, Michael. 2014. Classification of Tourism Web with Modified Naïve Bayes Algorithm. Advanced Materials Research. Vol.

931-932. 1360-1364. Park, Heum; Kwon, Soonho and Kwon, Hyuk-Chul. 2009. Ontology-based Approach to Intelligent

Ubiquitous Tourist Information System. In Proceedings of the 4th International Confere-

nce on Ubiquitous Information Technologies & Applications. 1-6.

Snae, Chakkrit and Brückner, Michael. 2006. Concept and Rule Based Naming System. Issues

in Informing Science and Information Technology. Vol. 3. 619-634.

Snae, Chakkrit and Brückner, Michael. 2009. Novel Phonetic Name Matching Algorithm with a Statistical Ontology for Analysing Names Given in Accordance with Thai Astrology. Issues in Informing Science and Information Technology. Vol. 6. 497-515.

Snae, Chakkrit and Brückner, Michael. 2007. LOWCOST: Local Organization Search with

Consolidated Ontologies for Name, Space and Time. In Proceedings of the 25th

Conference on IASTED International Multi-Conference: Software Engineering. 43-

48.

Page 21: ิทธิภาพของ F-Measure Performance Analysis of Name Matching ... · ปีที12 ฉบับที1 (มกราคม - มิถุนายน 2558) Volume

21

ปท� 12 ฉบบท� 1 (มกราคม - มถนายน 2558)

วารสารบรหารธรกจเทคโนโลยมหานคร

Snae, Chakkrit; Brückner, Michael. and Wongthongtham, Pornpit. 2007. Local Organization

and Business Ontology (LOBO). In Proceedings of IEEE International Conference

on Digital Ecosystems and Technologies. 292-295.

Snae, Chakkrit and Diaz, Bernard M. 2002. An Interface for Mining Genealogical Nominal Data

Using the Concept of Linkage and a Hybrid Name Matching Algorithm. Journal of 3D-

Forum Society. Vol. 16, No. 1. 142-147.

Sylejmani, Kadri and Dika, Agni. 2011. Solving Touristic Trip Planning Problem by Using Taboo

Search Approach. IJCSI International Journal of Computer Science Issues. Vol. 8. No.

3. 139-149. Winchester, Ian. 1970. The Linkage of Historical Records by Man and Computer: Techniques

and Problems. Journal of Interdisciplinary History. Vol. 1. No. 1. 107-124.

เอกสารอางองจากภาษาไทยเปนภาษาองกฤษ (Translated Thai References)

Panawong, Naruepon and Snae Namahoot, Chakkrit. 2013. Performance Analysis of an Ontology-

Based Tourism Information System with ISG Algorithm and Name Variation Matching.

NU Science Journal. Vol. 9. No. 2. 47-64. (In Thai)

Panawong, Naruepon and Snae, Chakkrit. 2010. Search System for Attractions in Thailand

with Ontology and Name Matching. Journal of Information Science and Technology.

Vol. 1. No. 2. 60-69. (In Thai) Panawong, Naruepon and Snae, Chakkrit. 2011. System Development of Search Tourism

Ontology with SPARQL. Proceedings of the 7th Research Naresuan. 195-204. (In

Thai) Chowkoksung, Surangrat and Snae, Chakkrit. 2011. The Development of a Web-based System on

GIS for Tourist Information System and Tourism Packaging. Journal of Humanities

and Social Sciences, Ubon Ratchathani University. Vol. 2. No. 1. 31-45. (In Thai)